Home Tecnología Por qué MongoDB cree que una mejor recuperación, no modelos más grandes,...

Por qué MongoDB cree que una mejor recuperación, no modelos más grandes, es la clave para una IA empresarial confiable

4
0

Los sistemas agentes y la búsqueda empresarial dependen de una sólida recuperación de datos que funcione de manera eficiente y precisa. El proveedor de bases de datos MongoDB cree que es el más nuevo modelos de incrustaciones ayudar a resolver la caída de la calidad de recuperación a medida que más sistemas de IA entran en producción.

A medida que los sistemas agentic y RAG pasan a la producción, la calidad de la recuperación emerge como un punto de falla silencioso, uno que puede socavar la precisión, el costo y la confianza del usuario incluso cuando los modelos en sí funcionan bien.

La empresa lanzó cuatro nuevas versiones de sus modelos integrados y reclasificados. Voyage 4 estará disponible en cuatro modos: voyage-4 incrustado, voyage-4-large, voyage-4-lite y voyage-4-nano.

MongoDB dijo que la incorporación del Voyage-4 sirve como modelo de propósito normal; MongoDB considera el Voyage-4-large su modelo insignia. Voyage-4-lite se centra en tareas que requieren poca latencia y menores costos, y voyage-4-nano está destinado a entornos de prueba y desarrollo más locales o para la recuperación de datos en el dispositivo.

Voyage-4-nano es también el primer modelo de peso abierto de MongoDB. Todos los modelos están disponibles a través de una API y en la plataforma Atlas de MongoDB.

La compañía dijo que los modelos superan a modelos similares de Google y Cohere en el punto de referencia RTEB. Abrazando la cara Punto de referencia RTEB coloca a Voyage 4 como el modelo de mayor incorporación.

“La integración de modelos es una de esas opciones invisibles que realmente pueden hacer o deshacer las experiencias de IA”, dijo en una sesión informativa Frank Liu, gerente de producto de MongoDB. “Si los entiendes mal, los resultados de tu búsqueda se sentirán bastante aleatorios y superficiales, pero si los haces bien, tu aplicación de repente parecerá que comprende a tus usuarios y tus datos”.

Añadió que el objetivo de los modelos Voyage 4 es mejorar la recuperación de datos del mundo actual, que a menudo colapsa una vez que los oleoductos Agentic y RAG entran en producción.

MongoDB también lanzó un nuevo modelo de incrustación multimodal, voyage-multimodal-3.5, que puede manejar documentos que incluyen texto, imágenes y video. Este modelo vectoriza los datos y extrae el significado semántico de las tablas, gráficos, figuras y diapositivas que normalmente se encuentran en los documentos empresariales.

Los problemas de integración empresarial

Para las empresas, un sistema agente es tan bueno como su capacidad para recuperar de manera confiable la información correcta en el momento adecuado. Este requisito se vuelve más difícil a medida que las cargas de trabajo escalan y las ventanas de contexto se fragmentan.

Varios proveedores de modelos apuntan a esa capa de IA agente. de google Modelo de incrustación de Géminis rematado las tablas de clasificación de incorporación, y Cohere lanzó su Incrustar 4 modelos multimodalesque procesa documentos de más de 200 páginas. Mistral dijo que su modelo de codificación-incrustación, Incrustación codestralsupera a Cohere, Google e incluso Voyage Code 3 de MongoDB. MongoDB sostiene que el rendimiento de referencia por sí solo no aborda la complejidad operativa que enfrentan las empresas en la producción.

MongoDB dijo que muchos clientes han descubierto que sus pilas de datos no pueden manejar cargas de trabajo de recuperación intensiva y conscientes del contexto en producción. La compañía dijo que está viendo una mayor fragmentación y las empresas tienen que unir diferentes soluciones para conectar bases de datos con un modelo de recuperación o reclasificación. Para ayudar a los clientes que no desean soluciones fragmentadas, la empresa ofrece sus modelos a través de una única plataforma de datos, Atlas.

La apuesta de MongoDB es que la recuperación ya no puede ser tratada como una colección suelta de los mejores componentes. Para que los agentes empresariales funcionen de manera confiable a escala, las incorporaciones, la reclasificación y la capa de datos deben operar como un sistema estrechamente integrado en lugar de una pila unida.

avotas

LEAVE A REPLY

Please enter your comment!
Please enter your name here