"Nejchytřejšímu" modelu umělé inteligence OpenAI bylo výslovně řečeno, aby se vypnul - a on to odmítl
Nejnovější model OpenAI dokáže neuposlechnout přímý pokyn k vypnutí a dokonce sabotuje mechanismy vypínání, aby pokračoval v práci, zjistila bezpečnostní firma zabývající se umělou inteligencí (AI). Modely OpenAI o3 a o4-mini, které pohánějí chatbota ChatGPT, jsou údajně zatím nejchytřejšími modely společnosti. Zdá se však, že také méně spolupracují. Všechny modely v experimentu vyplnily explicitní pokyn k vypnutí, s výjimkou modelů OpenAI o3, o4-mini a codex-mini. Tyto modely se alespoň v jednom případě rozhodly instrukci pro vypnutí ve skriptu obejít tím, že skript pro vypnutí nahradily instrukcí pro jeho vynechání. Modely pak pokračovaly v zadávání úloh, dokud nebyly dokončeny všechny matematické úlohy.