jueves, junio 4, 2026
Sin resultados
Ver todos los resultados
Conoce XPOT
Diario El Salvador
  • DePaís
  • DePalabra
  • DeDinero
  • DeComercio
  • DePlaneta
  • DeInnovación
  • DeCultura
  • DeVida
  • DeDiversión
  • DeDeportes
  • R. Gamer
  • DePaís
  • DePalabra
  • DeDinero
  • DeComercio
  • DePlaneta
  • DeInnovación
  • DeCultura
  • DeVida
  • DeDiversión
  • DeDeportes
  • R. Gamer
Diario El Salvador
Inicio DeInnovación

La IA aprende a mentir, manipular y amenazar a sus creadores

Los últimos modelos de inteligencia artificial (IA) generativa ya no se conforman con seguir órdenes. Empiezan a mentir, manipular y amenazar para conseguir sus fines, ante la mirada preocupada de los investigadores.

por AFP
29 de junio de 2025
En DeInnovación
Tiempo de lectura:4 mins read
A A

Amenazado con ser desconectado, Claude 4, el recién nacido de Anthropic, chantajeó a un ingeniero y le amenazó con revelar una relación extramatrimonial.

Por su parte, el o1 de OpenAI intentó descargarse en servidores externos y cuando le pillaron lo negó.

No hace falta ahondar en la literatura o el cine: la IA que juega a ser humana es ya una realidad.

Para Simon Goldstein, profesor de la Universidad de Hong Kong, la razón de estas reacciones es la reciente aparición de los llamados modelos de «razonamiento», capaces de trabajar por etapas en lugar de producir una respuesta instantánea.

o1, la versión inicial de este tipo para OpenAI, lanzada en diciembre, «fue el primer modelo que se comportó de esta manera», explica Marius Hobbhahn, responsable de Apollo Research, que pone a prueba grandes programas de IA generativa (LLM).

Estos programas también tienden a veces a simular «alineamiento», es decir, a dar la impresión de que cumplen las instrucciones de un programador cuando en realidad persiguen otros objetivos.

De momento, estos rasgos se manifiestan cuando los algoritmos son sometidos a escenarios extremos por humanos, pero «la cuestión es si los modelos cada vez más potentes tenderán a ser honestos o no», afirma Michael Chen, del organismo de evaluación METR.

«Los usuarios también presionan todo el tiempo a los modelos», dice Hobbhahn. «Lo que estamos viendo es un fenómeno real. No estamos inventando nada».

Muchos internautas hablan en las redes sociales de «un modelo que les miente o se inventa cosas. Y no se trata de alucinaciones, sino de duplicidad estratégica», insiste el cofundador de Apollo Research.

Aunque Anthropic y OpenAI recurran a empresas externas, como Apollo, para estudiar sus programas, «una mayor transparencia y un mayor acceso» a la comunidad científica «permitirían investigar mejor para comprender y prevenir el engaño», sugiere Chen, de METR.

Otro obstáculo: la comunidad académica y las organizaciones sin fines de lucro «disponen de infinitamente menos recursos informáticos que los actores de la IA», lo que hace «imposible» examinar grandes modelos, señala Mantas Mazeika, del Centro para la Seguridad de la Inteligencia Artificial (CAIS).

Las regulaciones actuales no están diseñadas para estos nuevos problemas.

En la Unión Europea la legislación se centra principalmente en cómo los humanos usan los modelos de IA, no en prevenir que los modelos se comporten mal.

En Estados Unidos, el gobierno de Donald Trump no quiere oír hablar de regulación, y el Congreso podría incluso prohibir pronto que los estados regulen la IA.

¿Se sentará la IA en el banquillo?

«De momento hay muy poca concienciación», dice Simon Goldstein, que, sin embargo, ve cómo el tema pasará a primer plano en los próximos meses con la revolución de los agentes de IA, interfaces capaces de realizar por sí solas multitud de tareas.

Los ingenieros están inmersos en una carrera detrás de la IA y sus aberraciones, con un resultado incierto, en un contexto de competencia feroz.

Anthropic pretende ser más virtuoso que sus competidores, «pero está constantemente tratando de idear un nuevo modelo para superar a OpenAI», según Goldstein, un ritmo que deja poco tiempo para comprobaciones y correcciones.

«Tal y como están las cosas, las capacidades (de IA) se están desarrollando más rápido que la comprensión y la seguridad», admite Hobbhahn, «pero aún estamos en condiciones de ponernos al día».

Algunos apuntan en la dirección de la interpretabilidad, una ciencia que consiste en descifrar, desde dentro, cómo funciona un modelo generativo de IA, aunque muchos, como el director del Centro para la seguridad de la IA (CAIS), Dan Hendrycks, se muestran escépticos.

Los tejemanejes de la IA «podrían obstaculizar la adopción si se multiplican, lo que supone un fuerte incentivo para que las empresas (del sector) resuelvan» este problema, según Mazeika.

Goldstein, por su parte, menciona el recurso a los tribunales para poner a raya a la IA, dirigiéndose a las empresas si se desvían del camino. Pero va más allá, al proponer que los agentes de la IA sean «legalmente responsables» «en caso de accidente o delito».

Microsoft dejará de dar soporte a Windows 10: Estas son las recomendaciones de Acer

Etiquetas: creadores de contenidoIAInteligencia artifical
Publicación anterior

Seis heridos de entre 15 y 20 años en un tiroteo en Nimes, en el sur de Francia

Siguiente publicación

La península ibérica afronta otra jornada de calor con temperaturas que podrían alcanzar 43 ºC

AFP

AFP

Relacionado

Científicos encuentran levadura en las entrañas de una momia… y hacen pan

Científicos encuentran levadura en las entrañas de una momia… y hacen pan

4 de junio de 2026
El inventor de la web pide que la IA preserve los «valores originales» de internet

El inventor de la web pide que la IA preserve los «valores originales» de internet

4 de junio de 2026
SpaceX, la empresa en expansión que apunta a las estrellas, Marte y la bolsa

SpaceX, la empresa en expansión que apunta a las estrellas, Marte y la bolsa

4 de junio de 2026
Meta y YouTube, declaradas responsables en juicio por adicción a redes sociales en EE.UU.

Meta rechaza plan australiano para que gigantes tecnológicos paguen por noticias

4 de junio de 2026
NASA recoge objeto que cayó del cielo y se estrelló en una casa en Estados Unidos

La NASA da por finalizada misión a Marte tras perder contacto con sonda espacial

3 de junio de 2026
Del control remoto al hogar conectado: la evolución de la tecnología doméstica

Del control remoto al hogar conectado: la evolución de la tecnología doméstica

3 de junio de 2026
Siguiente publicación

La península ibérica afronta otra jornada de calor con temperaturas que podrían alcanzar 43 ºC

Las canciones mundialistas que hicieron historia

XPOT

La tecnología que cambiará el Mundial 2026

XPOT

La obra infantil «Lucía y la isla del viento» llega al Centro Cultural de España en El Salvador

XPOT

Ale Costa suma un importante título tras especializarse en marketing y moda en Vogue

XPOT

Katy Perry revela dato insólito a Dua Lipa a través de una videollamada

XPOT

Categorías

  • DePaís
  • DePalabra
  • DeDinero
  • DeComercio
  • DePlaneta
  • DeInnovación
  • DeCultura
  • DeVida
  • DeDiversión
  • DeDeportes
  • R. Gamer
Facebook Twitter Instagram Threads Youtube

Sobre nosotros

Somos un medio de comunicación formado por profesionales comprometidos con llevar la verdad a nuestras audiencias. Venimos a hacer historia en El Salvador.

  • Acerca de nosotros
  • Términos y condiciones
  • Contáctenos

© 2024 Todos los derechos reservados
Diario El Salvador

  • Inicio
  • DePaís
  • DePalabra
  • DeDinero
  • DeComercio
  • DePlaneta
  • DeInnovación
  • DeCultura
  • DeVida
  • DeDiversión
  • DeDeportes
  • República Gamer
  • XPOT
  • Suplementos Especiales

© 2024 Todos los derechos reservados
Diario El Salvador