Home Tecnología Google lanza Gemini 3.1 Professional, retomando la corona de la IA con...

Google lanza Gemini 3.1 Professional, retomando la corona de la IA con un aumento del doble en el rendimiento del razonamiento

20
0

A finales del año pasado, Google se llevó brevemente la corona del modelo de IA más potente del mundo con el lanzamiento de Gemini 3 Professional, solo para ser superado en cuestión de semanas por OpenAI y Anthropic que lanzaron nuevos modelos, algo común en la ferozmente competitiva carrera de la IA.

Ahora Google vuelve a retomar el trono con una versión actualizada de ese modelo insignia: Gemini 3.1 Proposicionado como una base más inteligente para tareas donde una respuesta easy es insuficiente, dirigida a flujos de trabajo de ciencia, investigación e ingeniería que exigen una planificación y síntesis profundas.

Ya, Evaluaciones realizadas por una empresa externa de Análisis Artificial. muestran que Gemini 3.1 Professional de Google ha saltado al frente del grupo y es una vez más el modelo de IA más potente y eficaz del mundo.

Un gran salto en el razonamiento central

El avance más significativo en Gemini 3.1 Professional radica en su desempeño en rigurosos puntos de referencia lógicos. En explicit, el modelo logró una puntuación verificada del 77,1 % en ARC-AGI-2.

Este punto de referencia específico está diseñado para evaluar la capacidad de un modelo para resolver patrones lógicos completamente nuevos que no encontró durante el entrenamiento.

Este resultado representa más del doble del rendimiento de razonamiento del modelo anterior Gemini 3 Professional.

Gráfico de referencia de Google Gemini 3.1 Professional. Crédito: Google

Más allá de la lógica abstracta, los puntos de referencia internos indican que 3.1 Professional es altamente competitivo en dominios especializados:

  • Conocimiento científico: Obtuvo una puntuación del 94,3% en GPQA Diamond.

  • Codificación: Alcanzó un Elo de 2887 en LiveCodeBench Professional y obtuvo una puntuación del 80,6 % en SWE-Bench Verified.

  • Comprensión multimodal: Logró un 92,6% en MMMLU.

Estos avances técnicos no son sólo incrementales; representan un refinamiento en la forma en que el modelo maneja tokens “pensantes” y tareas de largo plazo, proporcionando una base más confiable para los desarrolladores que crean agentes autónomos.

Codificación de vibración mejorada y síntesis 3D.

Google está demostrando la utilidad del modelo a través de la “inteligencia aplicada”, cambiando el enfoque de las interfaces de chat a los resultados funcionales.

Una de las características más destacadas es la capacidad del modelo para generar SVG animados “codificados por vibración” directamente a partir de indicaciones de texto. Debido a que están basados ​​en código en lugar de píxeles, siguen siendo escalables y mantienen tamaños de archivo pequeños en comparación con el video tradicional, y cuentan con imágenes mucho más detalladas, presentables y profesionales para sitios internet, presentaciones y otras aplicaciones empresariales.

Otras aplicaciones mostradas incluyen:

  • Síntesis de sistemas complejos: El modelo configuró con éxito un flujo de telemetría público para construir un tablero aeroespacial en vivo que visualiza la órbita de la Estación Espacial Internacional.

  • Diseño interactivo: En una demostración, 3.1 Professional codificó un complejo murmullo de estornino en 3D que los usuarios pueden manipular mediante seguimiento handbook, acompañado de una partitura de audio generativa.

  • Codificación creativa: La modelo tradujo los temas atmosféricos de Emily Brontë. Cumbres borrascosas en un diseño internet funcional y moderno, demostrando la capacidad de razonar a través del tono y el estilo en lugar de simplemente texto literal.

Impacto empresarial y reacciones de la comunidad

Los socios empresariales ya han comenzado a integrar la versión preliminar de 3.1 Professional, informando mejoras notables en confiabilidad y eficiencia.

Vladislav Tankov, director de IA de JetBrains, notó una mejora de calidad del 15% con respecto a las versiones anteriores, afirmando que el modelo es “más fuerte, más rápido… y más eficiente, y requiere menos tokens de salida”. Otras reacciones de la industria incluyen:

  • Ladrillos de datos: El CTO Hanlin Tang informó que el modelo logró los “mejores resultados de su clase” en OfficeQA, un punto de referencia para el razonamiento fundamentado en datos tabulares y no estructurados.

  • Rueda de carro: El cofundador Andrew Carr destacó la “comprensión sustancialmente mejorada de las transformaciones 3D” del modelo, señalando que resolvió errores de orden de rotación de larga information en los procesos de animación 3D.

  • Horizontes de Hostinger: El jefe de producto, Dainius Kavoliunas, observó que el modelo comprende la “ambiente” detrás de un mensaje, traduciendo la intención en un código con estilo preciso para quienes no son desarrolladores.

Precios, licencias y disponibilidad

Para los desarrolladores, el aspecto más sorprendente de la versión 3.1 Professional es la relación “razonamiento-dólar”. Cuando se lanzó Gemini 3 Professional, se posicionó en el rango de precio medio-alto con 2,00 dólares por millón de tokens de entrada para indicaciones estándar. Gemini 3.1 Professional mantiene exactamente esta estructura de precios, ofreciendo efectivamente una mejora masiva del rendimiento sin costo adicional para los usuarios de API.

  • Precio de entrada: $2.00 por 1 millón de tokens para mensajes de hasta 200k; $4.00 por 1 millón de tokens para solicitudes de más de 200k.

  • Precio de salida: $12.00 por 1 millón de tokens para mensajes de hasta 200k; $18.00 por 1 millón de tokens para solicitudes de más de 200k.

  • Almacenamiento en caché de contexto: Se factura entre 0,20 y 0,40 dólares por 1 millón de tokens, según el tamaño del mensaje, más una tarifa de almacenamiento de 4,50 dólares por 1 millón de tokens por hora.

  • Búsqueda de conexión a tierra: 5.000 consultas al mes son gratuitas, seguidas de un cargo de 14 dólares por cada 1.000 consultas de búsqueda.

Para los consumidores, el modelo se está implementando en la aplicación Gemini y NotebookLM con límites más altos para los suscriptores de Google AI Professional y Extremely.

Implicaciones de licencia

Como modelo propietario ofrecido a través de Estudio Vértice en Nube de Google y el API de Géminis3.1 Professional sigue un modelo comercial estándar SaaS (software program como servicio) en lugar de una licencia de código abierto.

Para los usuarios empresariales, esto proporciona un “razonamiento fundamentado” dentro del perímetro de seguridad de Vertex AI, lo que permite a las empresas operar con sus propios datos con confianza.

El estado “Vista previa” permite a Google refinar la seguridad y el rendimiento del modelo antes de su disponibilidad common, una práctica común en la implementación de IA de alto riesgo.

Al duplicar el razonamiento central y los puntos de referencia especializados como ARC-AGI-2, Google está indicando que la próxima fase de la carrera de la IA la ganarán modelos que puedan pensar en un problema, no solo predecir la siguiente palabra.

avotas

LEAVE A REPLY

Please enter your comment!
Please enter your name here