Mientras México lucha por las 40 horas, una empresa presume que su IA puede trabajar de forma automática por casi 8 horas

Que las IAs trabajen por nosotros está cada vez más cerca de convertirse en una realidad, sobre todo con las últimas actualizaciones presentadas en esta área, como las nuevas funciones de ChatGPT por parte de OpenAI, las mejoras de Google con Gemini, o ahora la introducción de la nueva versión de Claude por parte de Anthropic. Este modelo es capaz de trabajar de forma autónoma durante periodos que equivalen a una jornada de ocho horas, sin necesidad de descansos ni restricciones como el máximo de 40 horas semanales, que México quiere implementar de forma generalizada.

De acuerdo con la propia Anthropic, esto es posible gracias a sus nuevos modelos de IA Claude 4, disponibles en dos variantes: Claude Opus 4 y Claude Sonnet 4, que la compañía clasifica como su “nuevo estándar” en agentes de inteligencia artificial. Ambos son capaces de analizar miles de fuentes de datos, escribir contenido con calidad humana, realizar acciones complejas y ejecutar tareas de larga duración.

Claude Opus 4 y Sonnet 4: las mejoras

Claude Opus 4 es considerado por Anthropic como su modelo “más potente hasta la fecha” y “el mejor del mundo en codificación”, con un rendimiento sostenido en tareas complejas de larga duración y flujos de trabajo continuos. Por su parte, Claude Sonnet 4 representa una actualización significativa de la versión 3.7, con mejoras notables en codificación, razonamiento y precisión al seguir instrucciones.

Según la empresa, Claude Opus 4 destaca especialmente en tareas que requieren concentración durante horas, como la resolución de problemas complejos o el desarrollo de software. Entre los casos de uso citados están Cursos y Replit, donde se ha observado una mejor comprensión de código y manejo preciso de múltiples archivos.

Uno de los ejemplos más destacados lo ofrece Rakuten, que validó las capacidades del modelo con tareas de refactorización de código abierto. Estas actividades, destinadas a mejorar el diseño interno, la legibilidad y la mantenibilidad del código sin alterar su funcionalidad externa, se ejecutaron de forma autónoma durante siete horas continuas, con un rendimiento constante.

En cuanto a Claude Sonnet 4, Anthropic lo describe como un modelo más equilibrado, que busca optimizar rendimiento y eficiencia sin llegar al nivel de Opus 4 en todos los aspectos. Aun así, ambos modelos lideran distintas pruebas de ingeniería de software, razonamiento y trabajo multimodal, superando incluso a competidores como Codex-1, o3, GPT-4.1 de OpenAI y Gemini 2.5 Pro de Google.

Los modelos Claude 4 son líderes en SWE-bench Verified, un referente de rendimiento en tareas reales de ingeniería de software.

Gracias al uso de herramientas externas, ejecución paralela y mejoras en memoria, los modelos han reducido significativamente el uso de atajos o “lagunas” en el cumplimiento de tareas. En el caso de Opus 4, destaca su capacidad para crear y mantener archivos de memoria que almacenan información clave, lo que se traduce en una mejor comprensión de tareas a largo plazo, mayor coherencia y mejor rendimiento. De acuerdo con Anthropic, incluso sería capaz de generar guías detalladas, por ejemplo, para navegar en un videojuego como Pokémon.

Pensamiento extendido y más novedades

Una de las funciones nuevas es la inclusión de resúmenes de pensamiento, que permiten visualizar el proceso de razonamiento del modelo. Esto se logra mediante un modelo adicional más pequeño que condensa la lógica y los pasos utilizados.

Además de Claude Opus y Sonnet 4, Anthropic anunció más herramientas relacionadas con sus modelos, como Claude Code, una versión especializada en programación. También se añadieron funciones como el pensamiento extendido con el uso de herramientas, búsqueda web, ejecución en paralelo y capacidades ampliadas para el público general.

Cortesía de Xataka



Dejanos un comentario: