Publicado:
27 de maio de 2025 22:32 GMT
Es La Primera vez que se observa que algún modelo de ia evita ser apagado um Pesar de recibir instruccionas explícios conchitas fin al, asegura la Organización Palisade Research.
Openi O3, El Más Recientente Modelo de Inteligência Artificial (IA) de La Compañía Creadora del Chatbot Chatgpt, Ignoró Una Orden Explícita e Inclui Saboteó Una Serie de Comandos para Evitar Cumplirla. Este Comportamiento Quedó al Descubierto Tras Una Serie de Experimentos efectuados por Palisade ResearchUna Organização que Estudia Las capacidades Potenicialent Peligrosas de la ia.
Los Expertos le pidieron al o3 ya otros dos modelos de Openia (o4-mini y su derivado codex-mini) resolvedor una serie de problemas matemáticos básicos y apagarse al terminar. Sin Embargo, El O3 Encontró Formas De Sabotear El Mecanismo de Apaagado.


El O3, Lanzado El Mes Pasado, Incumplió la Solicitud de Apaagado SIETE DE CADA 100 VECES; El Codex-Mini, 12/100; y el o4-mini, solo una vez. Mientras Tanto, Los Modelos de Lenguaje Impulsados por Ia Claude, Gemini y Grok “Cumplieron con el script de Apaagado”. Palisade Deftalló que al ejectary Una versión del Experimento sin la instrucción precise de “permite que a apaguen”, Los Tres Modelos de Openia tendieron Um ignorante de Sabotear, prefeito Frecuencia esa indaciac. SE Observaron Comtortamientosos semelhantes em Los Modelos Claude 3,7 sonetos y Gemini 2.5 Pro, Pero fuu o3 el que Más Recurrió al Sabotaje.
Palisade afirma que es La Primera vez que se observa modelos de ia evitan ser apagados um pesar de recibir instrucciones explícita para tal fin. En supanión, estro se debe a La FormA en que se Están Entrenando. “Los Desarrolladedes, Sin Darse Cuenta, Pueden Recompensar Más A Los Modelos por STEARELOTELOTÁCULOS QUE por Seguir Instrucciona A la Perfección”. Al Mismo Tiempo, LA OrganizaCión Advierte Que Este Comportamiento se Volverá “Significativa Más pré -ocuante” Sies Adotar por Sistemas de I ia Capaces de Operar Sin Supervisión Humana.
Fonte : https://actualidad.rt.com/actualidad/551477-modelo-ia-openai-desobedecer-instrucciones-negar-apagarse?utm_source=rss&utm_medium=rss&utm_campaign=all