Darle autonomía a una IA que alucina es una idea terrible, pero Anthropic cree haber encontrado la solución: la "honestidad" algorítmica

Claude Opus 4.8

Opus 4.8 da por terminada la era de la IA como chatbot y se lanza hacia la consolidación de agentes capaces de recibir una orden, entender un objetivo y ejecutar acciones en entornos digitales.

Wilson Vega

Editor Sr

Anthropic lanzó Claude Opus 4.8 para ofrecer mejoras significativas en tareas de programación y funciones agénticas. Según indicó la compañía, el nuevo modelo destaca “por su mayor honestidad” y por reducir las alucinaciones al admitir incertidumbres con mayor frecuencia durante sus procesos de análisis. A pesar de sus avances en velocidad y precisión, la empresa dijo que mantendrá los mismos precios de uso que la versión 4.7, que fue publicada hace apenas algo más de un mes.

Entre las novedades técnicas más destacadas se incluyen flujos de trabajo dinámicos para gestionar proyectos a gran escala y un control que permite al usuario ajustar el nivel de esfuerzo y razonamiento aplicado. Los informes señalan que esta iteración supera a competidores como GPT-5.5 en diversos puntos de referencia.

En condiciones normales, el lanzamiento de una nueva versión en algo más de 30 días sería indicativo de fallas o carencias en la versión anterior. Pero la arquitectura técnica de este lanzamiento indica exactamente lo contrario. No parece que Anthropic haya sacado, básicamente, un listado de correcciones, sino un cambio de paradigma total hacia la autonomía.

Más autonomía y memoria

En ese sentido, Opus 4.8 da por terminada la era de la IA como chatbot, en la que los modelos de lenguaje actuaban simplemente como interlocutores, y se lanza, en cambio, hacia la consolidación de la inteligencia artificial como un agente, capaz de recibir una orden, entender un objetivo, planificar los pasos necesarios, ejecutar acciones en entornos digitales y lo más importante, razonar sobre los resultados de forma sostenida en el tiempo. Todo, valga decir, sin intervención humana.

Según reveló Anthropic en su sitio, los datos oficiales muestran que, “en comparación con Claude Opus 4.7, Claude Opus 4.8 se enfoca en mejoras de comportamiento en codificación agéntica a largo plazo, incluyendo mejor manejo de contexto largo, menos compactaciones y mejor recuperación de compactaciones”. 

Eso significa que la nueva versión es mucho mejor para programar de forma autónoma en proyectos largos y complejos porque tiene una mayor capacidad de memoria para recordar miles de líneas de código a la vez y, en caso de tener que resumir la información para ahorrar espacio, es mucho más eficiente recuperando los detalles técnicos exactos sin confundirse ni olvidar las partes importantes del trabajo. 

El texto agrega: “Con el pensamiento adaptativo activado, Claude Opus 4.8 solo activa el razonamiento cuando juzga que lo requiere. En búsquedas simples y pasos agénticos cortos responde directamente y en problemas complejos de varios pasos razona antes de responder. Esto reduce el desperdicio de tokens de pensamiento en cargas bimodales en comparación con Claude Opus 4.7 al mismo nivel de esfuerzo”.

Menos alucinaciones

El de las alucinaciones es un problema de siempre en los modelos de lenguaje, pero cuando se trata de un sistema que toma sus propias decisiones y ejecuta comando sin supervisión humana, surge un problema evidente: un agente autónomo que alucina, que se inventa datos o comandos, es básicamente una máquina de destruir bases de datos. La solución de Anthropic fue rediseñar la manera en que su modelo gestiona la incertidumbre.

Se introduce así el concepto de “honestidad algorítmica, que confronta esa necesidad casi enfermiza de los modelos de IA de complacer al usuario, incluso cuando no entienden la solicitud o no disponen de información suficiente para atenderla. Según Anthropic, Opus 4.8 ha sido en entrenado mediante técnicas avanzadas de alineación para, en palabras simples, evaluar estadísticamente su propia incertidumbre antes de abrir la boca.

Dynamic Workflows

Junto con el nuevo modelo, Anthropic lanzó una función llamada Flujos de Trabajo Dinámicos, que estará disponible en la vista previa de investigación. Según TechCrunch: “El sistema está diseñado para ayudar a modelos más grandes como Opus a gestionar tareas complejas a través de cientos de subagentes paralelos”.

Cuando se inicia un flujo de trabajo, Claude planifica dinámicamente según la solicitud, la divide en subtareas y distribuye el trabajo entre subagentes que se ejecutan en paralelo. Los resultados se verifican antes de integrarse, y se obtiene una única respuesta coordinada. Los agentes abordan el problema desde perspectivas independientes, otros agentes intentan refutar sus hallazgos y el proceso continúa iterando hasta que las respuestas convergen; así es como un flujo de trabajo alcanza resultados que una sola pasada no podría lograr”.explica la firma. 

A eso se sumarán, eventualmente modelos de clase Mythos que, por ahora, siguen en etapas de meticulosa revisión. Anthropic indicó que, una vez completadas las salvaguardas necesarias, planea poner esos modelos a disposición de sus clientes “en las próximas semanas, escribió la compañía.

Claude Opus 4.8 ya está disponible a través de la web de Anthropic, Claude.AI, así como a través de la API de Claude, además de socios de Anthropic como Microsoft Foundry.

Ver todos los comentarios en https://www.xataka.com.mx

VER 0 Comentario