Home Tecnología La period de la IA agente exige una constitución de datos, no...

La period de la IA agente exige una constitución de datos, no mejores indicaciones

29
0

El consenso de la industria es que 2026 será el año de la “IA agente”. Estamos dejando atrás rápidamente los chatbots que simplemente resumen texto. Estamos entrando en la period de agentes autónomos que ejecutan tareas. Esperamos que reserven vuelos, diagnostiquen interrupciones del sistema, administren la infraestructura de la nube y personalicen los flujos de medios en tiempo actual.

Como ejecutivo de tecnología que supervisa plataformas que atienden a 30 millones de usuarios simultáneos durante eventos globales masivos como los Juegos Olímpicos y el Tremendous Bowl, he visto la realidad poco atractiva detrás de tanta exageración: los agentes son increíblemente frágiles.

Los ejecutivos y los capitalistas de riesgo están obsesionados con los puntos de referencia de los modelos. Debaten sobre Llama 3 versus GPT-4. Se centran en maximizar el tamaño de las ventanas de contexto. Sin embargo, están ignorando el verdadero punto de falla. La razón principal por la que los agentes autónomos fallan en la producción suele deberse a problemas de higiene de los datos.

En la period anterior del análisis “humano en el circuito”, la calidad de los datos period una molestia manejable. Si un proceso de ETL experimenta un problema, un panel puede mostrar un número de ingresos incorrecto. Un analista humano detectaría la anomalía, la señalaría y la solucionaría. El radio de la explosión fue contenido.

En el nuevo mundo de agentes autónomos, esa purple de seguridad ha desaparecido.

Si hoy en día una canalización de datos se desvía, un agente no se limita a informar el número equivocado. toma el mal acción. Aprovisiona el tipo de servidor incorrecto. Recomienda una película de terror a un usuario que ve dibujos animados. Alucina una respuesta de servicio al cliente basada en incrustaciones de vectores corruptos.

Para ejecutar IA a la escala de la NFL o los Juegos Olímpicos, me di cuenta de que la limpieza de datos estándar es insuficiente. No podemos simplemente “monitorear” los datos. Debemos legislarlo.

Una solución a este problema específico podría adoptar la forma de un marco de “calidad de datos – credo”. Funciona como una “constitución de datos”. Aplica miles de reglas automatizadas antes de que se permita que un solo byte de datos toque un modelo de IA. Si bien apliqué esto específicamente a la arquitectura de transmisión en NBCUniversal, la metodología es common para cualquier empresa que busque poner en funcionamiento agentes de IA.

He aquí por qué la “ingeniería de datos defensiva” y la Filosofía del credo son las únicas formas de sobrevivir a la period Agentic.

La trampa de la base de datos vectorial

El principal problema con los agentes de IA es que confían implícitamente en el contexto que les brindas. Si está utilizando RAG, su base de datos vectorial es la memoria a largo plazo del agente.

Los problemas de calidad de los datos estándar son catastróficos para las bases de datos vectoriales. En las bases de datos SQL tradicionales, un valor nulo es simplemente un valor nulo. En una base de datos vectorial, un valor nulo o una discrepancia en el esquema pueden distorsionar el significado semántico de toda la incrustación.

Considere un escenario en el que los metadatos se desvían. Supongamos que su canalización ingiere metadatos de video, pero una condición de carrera hace que la etiqueta “género” se deslice. Es posible que sus metadatos etiqueten un vídeo como “deportes en vivo”, pero la inserción se generó a partir de un “clip de noticias”. Cuando un agente consulta la base de datos en busca de “lo más destacado del landing”, recupera el clip de noticias porque la búsqueda de similitud de vectores está operando con una señal corrupta. Luego, el agente entrega ese clip a millones de usuarios.

A escala, no se puede confiar en el monitoreo posterior para detectar esto. Cuando suena una alarma de anomalía, el agente ya ha tomado miles de malas decisiones. Los controles de calidad deben desplazarse hacia la “izquierda” absoluta del oleoducto.

El marco del “Creedo”: 3 principios para la supervivencia

El Credo Se espera que el marco actúe como guardián. Es una arquitectura de calidad multiinquilino que se ubica entre las fuentes de ingesta y los modelos de IA.

Para los líderes tecnológicos que buscan construir su propia “constitución”, estos son los tres principios no negociables que recomiendo.

1. La pauta “cuarentena” es obligatoria: En muchas organizaciones de datos modernas, los ingenieros prefieren el enfoque “ELT”. Vuelcan datos sin procesar en un lago y los limpian más tarde. Para los agentes de IA, esto es inaceptable. No se puede permitir que un agente beba de un lago contaminado.

El Credo La metodología impone una estricta “cola de mensajes no entregados”. Si un paquete de datos viola un contrato, se pone en cuarentena inmediatamente. Nunca llega a la base de datos de vectores. Es mucho mejor para un agente decir “No sé” debido a datos faltantes que mentir con confianza debido a datos incorrectos. Este patrón de “disyuntor” es esencial para prevenir alucinaciones de alto perfil.

2. El esquema es ley: Durante años, la industria avanzó hacia una flexibilidad “sin esquemas” para avanzar con rapidez. Debemos revertir esa tendencia en los canales centrales de IA. Debemos aplicar una tipificación estricta y una integridad referencial.

En mi experiencia, un sistema robusto requiere escala. La implementación que superviso actualmente aplica más de 1.000 reglas activas corriendo a través de transmisiones en tiempo actual. Estos no son solo verificar si hay nulos. Comprueban la coherencia de la lógica empresarial.

  • Ejemplo: ¿El “user_segment” en la secuencia de eventos coincide con la taxonomía activa en el almacén de funciones? Si no, bloquéalo.

  • Ejemplo: ¿La marca de tiempo está dentro de la ventana de latencia aceptable para la inferencia en tiempo actual? Si no, déjalo.

3. Comprobaciones de coherencia de vectores Esta es la nueva frontera para las SRE. Debemos implementar comprobaciones automatizadas para garantizar que los fragmentos de texto almacenados en una base de datos de vectores realmente coincidan con los vectores de incrustación asociados con ellos. Las fallas “silenciosas” en una API de modelo de inserción a menudo dejan vectores que no apuntan a nada. Esto hace que los agentes recuperen ruido puro.

La guerra cultural: ingenieros versus gobernanza

Implementar un marco como Credo No es sólo un desafío técnico. Es cultural.

Los ingenieros generalmente odian las barandillas. Consideran que los esquemas estrictos y los contratos de datos son obstáculos burocráticos que ralentizan la velocidad de implementación. Al introducir una constitución de datos, los líderes a menudo enfrentan resistencia. Los equipos sienten que están regresando a la period de la “cascada” de administración rígida de bases de datos.

Para tener éxito, debe invertir la estructura de incentivos. Demostramos que Credo En realidad period un acelerador. Al garantizar la pureza de los datos de entrada, eliminamos las semanas que los científicos de datos dedicaban a depurar las alucinaciones del modelo. Convertimos el gobierno de datos de una tarea de cumplimiento a una garantía de “calidad de servicio”.

La lección para los tomadores de decisiones sobre datos

Si está creando una estrategia de IA para 2026, deje de comprar más GPU. Deja de preocuparte por qué modelo de base está ligeramente más alto en la clasificación esta semana.

Comience a auditar sus contratos de datos.

Un agente de IA es tan autónomo como confiables sus datos. Sin una constitución de datos estricta y automatizada como la Credo marco, sus agentes eventualmente se volverán deshonestos. En el mundo de un SRE, un agente deshonesto es mucho peor que un tablero roto. Es un asesino silencioso de la confianza, los ingresos y la experiencia del cliente.

Manoj Yerrasani es un alto ejecutivo de tecnología.

¡Bienvenido a la comunidad VentureBeat!

Nuestro programa de publicaciones invitadas es donde los expertos técnicos comparten conocimientos y brindan análisis profundos neutrales y no adquiridos sobre inteligencia synthetic, infraestructura de datos, ciberseguridad y otras tecnologías de vanguardia que dan forma al futuro de las empresas.

Leer más de nuestro programa de publicaciones de invitados y consulte nuestro pautas ¡Si estás interesado en contribuir con un artículo propio!

avotas