La empresa de IA Anthropic advierte sobre los riesgos de la automejora de los sistemas de inteligencia artificial

Anthropic, la empresa de inteligencia artificial, ha propuesto una pausa coordinada en el desarrollo de sistemas avanzados de IA para evitar riesgos de automejora y pérdida de control humano.

Sofía Herrera · junio 6, 2026 · 6 min

La empresa de IA Anthropic advierte sobre los riesgos de la automejora de los sistemas de inteligencia artificial

En un mundo donde la tecnología avanza a pasos agigantados, la inteligencia artificial (IA) se ha convertido en un tema de debate global. Anthropicla empresa detrás del asistente Claude, ha hecho un llamado a detener de forma coordinada el desarrollo de los modelos más avanzados de IA para mantener el control humano sobre esta tecnología.

Marina Favaro y Jack Clark, altos ejecutivos de Anthropic, publicaron un artículo en el blog de la firma tecnológica, donde advierten que los sistemas de IA están becoming más capaces, al punto de que podrían llegar a construirse a sí mismos. Este fenómeno, conocido como automejorapodría tener implicaciones profundas tanto positivas como negativas.

Los riesgos de la automejora de la IA

Según Anthropic, la automejora de los sistemas de IA podría significar que los seres humanos pierdan el control sobre dichos sistemas. Estos podrían crear a sus propios herederos sobre parámetros desconocidos y sin un impacto estimable. «Si los sistemas son capaces de construir completamente sus propios sucesores, la forma en que protegemos, supervisamos y moldeamos su comportamiento adquiere una importancia mucho mayor», indican Favaro y Clark.

Los especialistas sostienen que todavía no se ha llegado a ese punto y afirman que la automejora recursiva no es inevitable, pero advierten que podría llegar «antes de que la mayoría de las instituciones estén preparadas». Para evitar esto, proponen ralentizar el desarrollo de la IA bajo la premisa de que esto daría tiempo para analizar las enormes implicaciones que tendría este desarrollo acelerado.

La necesidad de un mecanismo de coordinación global

Anthropic sugiere la creación de un mecanismo de coordinación global que incluya empresas del sector y gobiernos. Además, proponen establecer un grupo de estudio descentralizado con su instituto y otros centros de investigación para crear un «sistema de ralentización» de la IA. «Estos sistemas permitirían a los desarrolladores de IA de vanguardia verificar que otros a nivel mundial realmente han detenido o ralentizado su desarrollo, y que ningún actor malintencionado podría aprovecharse de una ralentización coordinada para avanzar en secreto», explican Clark y Favaro.

La empresa reconoce que la creación de un aparato de este tipo es un reto mayor debido a la complejidad de monitorear la actividad de los sistemas de IA, especialmente en aplicaciones militares. Sin embargo, sus especialistas creen que no es un proyecto «necesariamente imposible». «El mundo ha establecido regímenes de verificación para otras tecnologías complejas, como el Tratado sobre Fuerzas Nucleares de Alcance Intermedio, pero esos regímenes tardaron décadas en construir tanto la infraestructura como la confianza», indica la empresa de IA.

El misterio de la caja negra y la interpretabilidad mecanicista

El análisis de los procesos internos y el control humano de la IA no son preocupaciones recientes. Un ejemplo de ello es lo que se conoce como el misterio de la caja negraque hace referencia al desconocimiento de los programadores sobre la manera en la que los modelos de inteligencia artificial arman sus propias relaciones lógicas para responder a las consultas y tareas que se les da.

Christopher Olah, jefe de investigación de Anthropic en este apartado, ha admitido que los modelos de IA no son construidos como los programas informáticos tradicionales, sino que son «cultivados» en un proceso que compara al crecimiento de una entidad orgánica. «Creamos el soporte en el que se desarrollan y la luz hacia la que crecen», admite Olah. Si en el contexto actual, donde los parámetros esenciales son establecidos por humanos, ya hay un margen de desconocimiento sobre los criterios internos de un gran modelo de lenguaje (LLM), la idea de una IA generando a su sucesor desde cero plantea un escenario con muchas menos certezas éticas.

La sugerencia de Anthropic de frenar el desarrollo de los modelos complejos de inteligencia artificial no es la primera propuesta de este tipo. Hace tres años, la organización sin fines de lucro The Future of Life publicó una carta abierta en la que pedía a todos los laboratorios suspender por medio año «el entrenamiento de sistemas más potentes» que GPT-4 de OpenAI. El pedido tenía como argumento que «los sistemas de IA con una inteligencia que compite con la humana pueden plantear profundos riesgos para la sociedad y la humanidad, como demuestran numerosas investigaciones».

Pese a lo anterior, hay voces importantes que consideran que el riesgo de una inteligencia artificial equiparable a la humana es improbable. Yann LeCun, quien durante años dirigió el área de inteligencia artificial de Meta (antes Facebook), sostiene que los grandes modelos de lenguaje son un camino sin salida de cara a llegar a lo que se denomina «inteligencia artificial general». LeCun defiende la investigación de los denominados «modelos de mundo», que optan por alimentar al sistema con videos y la observación del entorno físico, de forma análoga a los procesos de reconocimiento de infantes y animales.

En términos más generales, LeCun tiene una mirada más pragmática sobre la IA, considerando que ve difícil un escenario en el que esta «destruya a la humanidad». Adicionalmente, defiende el uso de código abierto en todos los ámbitos y que este supone la mejor garantía ética posible.

Medios especializados y analistas han mencionado que la sugerencia de frenar el desarrollo de la IA aparece en un momento relevante para Anthropic, que acaba de confirmar que presentó el borrador de registro para su salida a bolsa ante las autoridades de Estados Unidos. Se calcula que la firma responsable del asistente Claude tendría una valoración de casi un billón de dólares en su estreno bursátil, que podría tener lugar en la segunda mitad de este año.

El analista tecnológico y consultor Rob Enderle declaró que la alerta de Anthropic sobre el crecimiento de su modelo y su potencial capacidad de gestionar su propio crecimiento de forma totalmente autónoma podría ser esencialmente un trabajo de márketing para atraer inversores de cara a su debut bursátil. «Es probable que las mejoras de productividad que anuncia sean legítimas, pero promover su progreso hacia la automejora recursiva es una estrategia más calculada», remarca el especialista.

Más allá de lo anterior, para otros especialistas, la advertencia de Anthropic sigue siendo un punto de partida válido para analizar la «gobernanza» de la IA, un tema que ya se viene analizando en las empresas, aunque bajo una perspectiva marcadamente operativa. Ashish Banerjee, analista de la consultora Gartner, declaró que «la cuestión ya no es solo si la IA da la respuesta correcta, sino si los sistemas autónomos toman las medidas adecuadas». «La estrategia de intervención humana no funciona si la persona no puede seguir el ritmo del proceso», puntualiza.

Autor

Sofía Herrera

Sofía Herrera cubre lo que pasa en TikTok antes de que llegue a la televisión. Combina análisis cultural con periodismo de actualidad ligera.

La empresa de IA Anthropic advierte sobre los riesgos de la automejora de los sistemas de inteligencia artificial

Los riesgos de la automejora de la IA

La necesidad de un mecanismo de coordinación global

El misterio de la caja negra y la interpretabilidad mecanicista

Sofía Herrera

Sigue leyendo

Cómo leer mapas de huracanes y prepararse ante su llegada

TEC se consolida como la universidad más sostenible de Costa Rica y destaca en ranking global

Cómo el K-pop traspasó fronteras y llegó a Corea del Norte