Home Tecnología Primeras impresiones de GPT-5.2: una actualización poderosa, especialmente para tareas y flujos...

Primeras impresiones de GPT-5.2: una actualización poderosa, especialmente para tareas y flujos de trabajo comerciales

33
0

OpenAI ha lanzado oficialmente GPT-5.2, y las reacciones de los primeros evaluadores, entre los cuales OpenAI sembró el modelo varios días antes del lanzamiento público, en algunos casos hace semanas, pintan una imagen de dos tonos: es un avance monumental para el razonamiento y la codificación profundos y autónomos, pero potencialmente una actualización “incremental” decepcionante para los conversadores ocasionales.

Luego de los períodos de acceso temprano y el lanzamiento más amplio de hoy, los ejecutivos, desarrolladores y analistas han recurrido a X (anteriormente Twitter) y a los blogs de la empresa para compartir los primeros resultados de sus pruebas.

Aquí hay un resumen de las primeras reacciones al último modelo insignia de OpenAI.

“La IA como analista serio”

El elogio más fuerte para GPT-5.2 se centra en su capacidad para manejar “problemas difíciles” que requieren más tiempo para pensar.

Matt Shumer, director ejecutivo de HyperWriteAI, no se anduvo con rodeos su reseñacalificando al GPT-5.2 Professional como “el mejor modelo del mundo”.

Shumer destacó la tenacidad del modelo y señaló que “piensa durante **más de una hora** en problemas difíciles. Y concreta tareas que ningún otro modelo puede abordar”.

Este sentimiento fue repetido por Allie K. Milleremprendedor de inteligencia synthetic y ex ejecutivo de AWS. Miller describió el modelo como un paso hacia “la IA como un analista serio” en lugar de un “compañero amistoso”.

“El pensamiento y la resolución de problemas se sienten notablemente más fuertes”, escribió Miller en X. “Ofrece explicaciones mucho más profundas de lo que estoy acostumbrado a ver. En un momento, literalmente escribió código para mejorar su propio OCR en medio de una tarea”.

Ganancias empresariales: Field informa claros saltos en el rendimiento

Para el sector empresarial, la actualización parece ser aún más significativa.

Aaron Levie, director ejecutivo de Box, revelado en X que su empresa ha estado probando GPT-5.2 en acceso temprano. Levie informó que el modelo funciona “7 puntos mejor que GPT-5.1” en sus pruebas de razonamiento ampliado, que se aproximan al trabajo de conocimiento del mundo actual en servicios financieros y ciencias de la vida.

“El modelo también realizó la mayoría de las tareas mucho más rápido que GPT-5.1 y GPT-5”, señaló Levie, confirmando que Field AI implementará la integración de GPT-5.2 en breve.

Rutuja Rajwade, directora senior de advertising and marketing de productos de Field, amplió esto en una publicación de blog de la empresacitando mejoras específicas de latencia.

Las tareas de “extracción compleja” se redujeron de 46 segundos en GPT-5 a solo 12 segundos con GPT-5.2.

Rajwade también notó un salto en las capacidades de razonamiento para la vertical de Medios y Entretenimiento, pasando del 76% de precisión en GPT-5.1 al 81% en el nuevo modelo.

Un “gran salto” para la codificación y la simulación

Los desarrolladores consideran que GPT-5.2 es particularmente potente para la generación “de una sola vez” de estructuras de código complejas.

Pietro Schirano, director common de magicpathai, compartió un vídeo del modelo construyendo un motor de gráficos 3D completo en un solo archivo con controles interactivos. “Es un gran avance en razonamiento complejo, matemáticas, codificación y simulaciones”, publicó Schirano. “El ritmo del progreso es irreal”.

SDe manera related, Ethan Mollick, profesor de la Wharton College of Enterprise de la Universidad de Pensilvania y escritor y usuario avanzado de LLM e IA desde hace mucho tiempo, demostró la capacidad del modelo para crear un sombreador visualmente complejo—una ciudad neogótica infinita en un océano tormentoso—a través de un solo mensaje.

La Period Agentic: Autonomía de largo plazo

Quizás el cambio más funcional sea la capacidad del modelo para permanecer concentrado durante horas sin perder el hilo.

Dan Shipper, director ejecutivo del boletín informativo sobre pruebas de inteligencia artificial Everyinformó que el modelo realizó con éxito un análisis de pérdidas y ganancias (P&L) que requirió que funcionara de forma autónoma durante dos horas. “Hizo un análisis de pérdidas y ganancias en el que funcionó durante 2 horas y me dio excelentes resultados”, escribió Shipper.

Sin embargo, Shipper también señaló que para las tareas diarias, la actualización parece “mayormente incremental”.

En un artículo para cadaKatie Parrott escribió que si bien GPT-5.2 sobresale en el seguimiento de instrucciones, es “menos ingenioso” que competidores como Claude Opus 4.5 en ciertos contextos, como deducir la ubicación de un usuario a partir de datos de correo electrónico.

Las desventajas: velocidad y rigidez

A pesar de la capacidad de razonamiento, la “sensación” del modelo ha generado críticas.

Shumer destacó una importante “penalización de velocidad” al utilizar el modo Pensamiento del modelo. “En mi experiencia, el modo Pensamiento es muy lento para la mayoría de las preguntas”, escribió Shumer en su revisión profunda. “Casi nunca uso Immediate.”

Allie Miller también señaló problemas con el comportamiento predeterminado del modelo. “La desventaja es el tono y el formato”, señaló. “La voz predeterminada se sintió un poco más rígida y el comportamiento de longitud/rebaja es extremo: una pregunta easy convertida en 58 viñetas y puntos numerados”.

El veredicto

La reacción inicial sugiere que GPT-5.2 es una herramienta optimizada para usuarios avanzados, desarrolladores y agentes empresariales en lugar de un chat casual. Como resumió Shumer en su reseña: “Para investigaciones profundas, razonamientos complejos y tareas que se benefician de una reflexión cuidadosa, GPT-5.2 Professional es la mejor opción disponible en este momento”.

Sin embargo, para los usuarios que buscan escritura creativa o respuestas rápidas y fluidas, modelos como Claude Opus 4.5 siguen siendo fuertes competidores. “Mi modelo favorito sigue siendo Claude Opus 4.5”, admitió Miller, “pero mi complejo trabajo ChatGPT recibirá un buen impulso incremental”.

avotas