OpenAI ha presentado su nuevo modelo de inteligencia artificial: GPT-4.5. Según la compañía, se trata de su “modelo más grande y mejor para chat” hasta el momento. Destaca principalmente por su capacidad para reconocer patrones, establecer conexiones y generar conocimientos creativos, todo sin necesidad de razonar, a diferencia de los modelos anteriores de la serie.
La empresa señala que interactuar con GPT-4.5 “es más natural” gracias a diversas mejoras. Entre ellas, una base de conocimiento más amplia, una mayor capacidad para seguir el hilo de las interacciones y un “coeficiente emocional” optimizado. Estas características lo hacen especialmente útil en tareas como la mejora de la escritura, la programación y la resolución de problemas prácticos, además de presentar menos alucinaciones que versiones previas.
Para entrenar esta IA, OpenAI empleó dos métodos principales. El primero es el razonamiento escalable, que enseña al modelo a generar una cadena de pensamientos antes de responder. Esto le permite abordar problemas complejos en áreas como STEM y lógica, donde modelos anteriores, como GPT-4.0 y GPT-4.3, ya exploraban esta capacidad.
Además, se utilizó el aprendizaje no supervisado, un proceso en el que el propio modelo analiza sus observaciones para descubrir patrones ocultos o agrupar datos sin intervención humana. De esta manera, se mejora la precisión y la “intuición” del sistema.
Como resultado, GPT-4.5 demuestra cómo el aprendizaje no supervisado, combinado con innovaciones en arquitectura y optimización, permite desarrollar modelos con conocimientos más amplios, una mejor comprensión del mundo, menos alucinaciones y mayor fiabilidad en múltiples tareas.
Las ventajas del nuevo modelo
Según cifras de la compañía, GPT-4.5 supera a GPT-4.0 en solicitudes generales, tareas profesionales e inteligencia creativa, con base en evaluaciones realizadas por expertos humanos. Su comprensión profunda del mundo y su capacidad de colaboración mejorada permiten integrar ideas de forma natural en conversaciones “cálidas e intuitivas“, lo que también optimiza la interacción con los usuarios.

OpenAI afirma que GPT-4.5 mejora en la interpretación de las intenciones de los usuarios, ya que es capaz de captar señales sutiles o expectativas implícitas con mayor precisión. Además, incorpora un mejor reconocimiento de la emoción en el lenguaje, lo que lo hace especialmente adecuado para tareas de escritura y diseño.
A diferencia de los modelos de la serie anterior, GPT-4.5 no necesita razonar antes de responder, lo que lo distingue de los modelos de razonamiento tradicionales. Está diseñado para propósitos más generales, siguiendo una línea de desarrollo en la que OpenAI considera que el razonamiento será una de las capacidades centrales de los modelos futuros. Por ello, el entrenamiento previo y el razonamiento escalado son técnicas complementarias en su evolución.
Además, la compañía sostiene que a medida que modelos como GPT-4.5 sean más inteligentes, potentes y acumulen más conocimientos mediante el entrenamiento previo, servirán como base para desarrollar nuevos procesos de razonamiento.

Para ello, se han implementado nuevas técnicas de supervisión que combinan métodos tradicionales de ajuste fino supervisado (STF) con aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF), similares a los empleados en GPT-4.0. Se espera que estas técnicas optimicen aún más los modelos en el futuro.
Disponibilidad en ChatGPT y funciones integradas
Por el momento, y como es habitual en sus lanzamientos, GPT-4.5 estará disponible inicialmente para los usuarios del plan ChatGPT Pro a través del selector de modelos en la web, así como en aplicaciones para smartphones y computadoras de escritorio.
El siguiente paso será su llegada a los suscriptores de los planes Plus y Team a partir de la primera semana de marzo, y posteriormente, a los miembros de las versiones Enterprise y Edu a mediados del mes.

Entre sus capacidades, GPT-4.5 ofrece compatibilidad para búsquedas de información actualizada, soporte para archivos e imágenes, además de integración con los canvas de la plataforma para tareas de escritura y programación.
Sin embargo, en su lanzamiento inicial no contará con soporte para funciones multimodales como modo de voz, video y pantalla compartida, aunque se espera que estas características se implementen en futuras actualizaciones.
Cortesía de Xataka
Dejanos un comentario: