Home Tecnología El Proyecto Genie de Google no es para ti

El Proyecto Genie de Google no es para ti

19
0

Google tiene un mundo completamente nuevo en el que la gente puede jugar, pero sólo por un minuto. Esta semana, la empresa Lanzado Proyecto Genioque la empresa llama su “modelo mundial de propósito basic” que es capaz de generar entornos interactivos. Presentado por primera vez a un pequeño grupo de probadores solo por invitación en agosto del año pasado, el modelo, conocido como Genie 3, ahora se está implementando para los suscriptores de Google AI Extremely en los EE. UU., por lo que puedes tenerlo en tus manos por el bajo precio de $ 250 por mes.

El hecho de que Google esté mostrando un modelo mundial es interesante en sí mismo. A diferencia de un modelo de lenguaje grande (LLM), la tecnología subyacente que impulsa la mayoría de las herramientas de inteligencia synthetic orientadas al consumidor, incluido el propio Gemini de Google, que utiliza la gran cantidad de datos de entrenamiento que reciben para predecir la siguiente parte más possible de una secuencia, los modelos mundiales se entrenan en la dinámica del mundo actual, incluidas la física y las propiedades espaciales, para crear una simulación de cómo operan los entornos físicos.

Los modelos mundiales son el enfoque de la IA preferido por Yann LeCun, ex científico jefe de Meta AI. LeCun cree (probablemente correctamente) que los LLM nunca podrán lograr la inteligencia synthetic basic, el punto en el que la IA puede igualar o superar las capacidades humanas en todos los dominios. En cambio, cree que los modelos mundiales pueden trazar un camino hacia ese objetivo remaining, y está recientemente se unió a una startup eso es apostar todo por esa apuesta. Es una simplificación excesiva, pero la concept es esencialmente que los LLM solo pueden reconocer patrones, mientras que los modelos mundiales permitirían a la IA ejecutar toneladas de simulaciones para comprender cómo funciona el mundo y extrapolar nuevas conclusiones.

Google jugando en este mundo ciertamente proporciona cierta legitimidad a la concept de que los modelos mundiales ofrecen algo que los LLM no pueden, y no se puede negar que los movies de vista previa que han surgido de los primeros días del Proyecto Genie son bastante impresionantes visualmente, aunque breves. Google está limitando a los usuarios a generar 60 segundos de su mundo, lo que, según la compañía, “podría no parecer completamente actual o no adherirse siempre a indicaciones o imágenes, o a la física del mundo actual”, es decir, podría no funcionar. Actualmente, las salidas son vídeos de 720p renderizados a 24 fotogramas por segundo, por Ars Technicay los usuarios se han quejado en ocasiones de que es bastante lento en la práctica.

Eso está bien para algo en versión beta, aunque habla de las limitaciones del modelo de la compañía, lo que sugiere que el mundo podría ser más pequeño de lo que imagina. Si bien los usuarios han estado promocionando la función como si estuviera a punto de sacar a los desarrolladores de videojuegos del negocio, probablemente valga la pena frenar esa preocupación por el momento.

Genie 3 de Google también adopta un enfoque diferente a los modelos mundiales de lo que LeCun había imaginado. El modelo, disponible a través de Venture Genie, esencialmente crea un mundo continuo basado en video. Los usuarios pueden navegar como en un videojuego, pero en teoría, los agentes de IA también podrían recorrer esos mundos sin cesar para comprender cómo funcionan las cosas. La idea de LeCun cuando estaba en Meta fue crear Joint Embedding Predictive Structure (JEPA), que incorpora un modelo del mundo exterior en un agente de IA.

Pero, de nuevo, el hecho de que Google esté impulsando un modelo mundial cube algo. Sí, la compañía se encontrará con los mismos problemas que surgieron con el lanzamiento de otros modelos de generación de imágenes y movies como Sora 2 de OpenAI, que se utilizó para cometer todo tipo de posibles infracciones de derechos de autor. Los primeros resultados de Venture Genie son replicar de manera confiable los mundos de Nintendopor ejemplo, y eso probablemente causará algunos problemas. Pero también sugiere que incluso los actores más importantes en este espacio de la IA reconocen que los LLM pueden eventualmente chocar contra una pared.

Dicho esto, hay una razón por la que Google ha puesto un límite estricto al Proyecto Genie por el momento. Si cree que cuesta mucho entrenar y operar un modelo basado en texto, imagínese lo que requiere la creación de una simulación del mundo completamente generada. Necesita toneladas de datos de alta dimensión para comprender todo, desde cómo se ve un mundo hasta cómo funciona la física, y requiere mucha potencia de procesamiento para funcionar. Es por eso que, por ahora, los mundos pueden parecer vastos, pero en la práctica se mantienen bastante pequeños.



avotas