Casi un año después de lanzar Rerank 3.5, Cohere lanzó la última versión de su modelo de búsqueda, ahora con una ventana contextual más grande para ayudar a los agentes a encontrar la información que necesitan para completar sus tareas.
Cohere dijo en una publicación de blog que Rerank 4 tiene una ventana de contexto de 32K, lo que representa un aumento de cuatro veces en comparación con 3,5.
“Esto permite que el modelo maneje documentos más largos, evalúe múltiples pasajes simultáneamente y seize relaciones entre secciones que ventanas más cortas pasarían por alto”, según la publicación del weblog. “Por lo tanto, esta capacidad ampliada mejora la precisión de la clasificación para tipos de documentos realistas y aumenta la confianza en la relevancia de los resultados recuperados”.
Rerank 4 viene en dos versiones: Rápido y Professional. Como modelo más pequeño, Quick es más adecuado para casos de uso que requieren velocidad y precisión, como el comercio electrónico, la programación y el servicio al cliente. Professional está optimizado para tareas que requieren un razonamiento, precisión y análisis más profundos, como generar modelos de riesgo y realizar análisis de datos.
La búsqueda empresarial ganó mayor importancia este año, especialmente porque los agentes de IA tienen que acceder a más información y contexto sobre la organización para la que trabajan. Cohere dijo que los rerankers “mejoran significativamente la precisión de la búsqueda de IA empresarial al refinar los resultados de recuperación iniciales”. Rerank 4 aborda la brecha de matices creada por algunas incorporaciones de codificadores duales (modelos que ayudan a facilitar las tareas de generación aumentada de recuperación (RAG)) mediante el uso de una arquitectura de codificadores cruzados “que procesa consultas y candidatos de manera conjunta, captura relaciones semánticas sutiles y reordena los resultados para mostrar los elementos más relevantes”, dijo Cohere.
Rendimiento y puntos de referencia
Cohere comparó los modelos con otros modelos de reclasificación, como Qwen Reranker 8B, Jina Rerank v3 de Elasticsearch y Voyage Rerank 2.5 de MongoDB, en tareas de los dominios de finanzas, atención médica y fabricación. Rerank 4 tuvo un desempeño sólido, si no superó, a sus competidores.
Rerank 3.5 se destacó por su capacidad de admitir varios idiomas y Cohere dijo que Rerank 4 continúa esa tendencia. Entiende más de 100 idiomas, incluida la recuperación de última generación en 10 idiomas comerciales importantes.
Agentes y modelos de reranking
Rerank 4 tiene como objetivo hacer que las tareas de agencia comprendan qué datos se adaptan mejor a sus tareas y proporcionar más contexto.
Cohere señaló que el modelo es un componente clave de su plataforma de IA agente, North, ya que “se integra perfectamente en las soluciones de búsqueda de IA existentes, incluidos sistemas híbridos, vectoriales y basados en palabras clave, con cambios mínimos de código”.
A medida que más empresas buscan utilizar agentes para investigaciones y conocimientos, como lo demuestra el aumento de las funciones de investigación profunda, los modelos que ayudan a filtrar contenido irrelevante, como los reclasificadores, se vuelven más esenciales.
“Esto es especialmente impactante para la IA agente, donde las interacciones complejas y de varios pasos pueden aumentar rápidamente las llamadas de modelo y saturar las ventanas de contexto”, dijo Cohere.
La compañía sostiene que Rerank 4 ayuda a reducir el uso de tokens y la cantidad de reintentos que un agente necesita para hacer las cosas bien al evitar que información de baja calidad llegue al LLM.
Autoaprendizaje
Cohere dijo que Rerank 4 se destaca no solo por sus sólidas capacidades de reclasificación, sino también por ser el primer modelo de reclasificación que aprende por sí solo.
Los usuarios pueden personalizar Rerank 4 para los casos de uso que encuentran con más frecuencia sin ningún dato anotado adicional. Al igual que los modelos básicos como GPT-5.2, donde las personas pueden indicar sus preferencias y el modelo las recuerda, los usuarios de Rerank 4 pueden decirle al modelo sus tipos de contenido preferidos y corpus de documentos.
Si se usa con Rerank 4 Quick, por ejemplo, el modelo se vuelve más competitivo con los modelos más grandes porque es más preciso y aprovecha los datos específicos que los usuarios desean.
“Mirando más allá, también exploramos cómo funciona la capacidad de autoaprendizaje de Rerank 4 en dominios de búsqueda completamente nuevos”, dijo Cohere. “Al utilizar conjuntos de datos centrados en la atención médica que imitan la necesidad de un médico de recuperar información específica del paciente, no solo experiencia de una disciplina médica determinada, descubrimos que permitir el autoaprendizaje produjo ganancias consistentes y sustanciales. El resultado: un aumento claro y significativo en la calidad de la recuperación para Rerank 4 Quick, en todos los ámbitos”.










