Cohere 发布 Embed 4:企业级多模态(文本+图像)嵌入模型,专为增强 AI 应用中的搜索和检索功能而设计

Embed 4 的主要特点:
1. 先进的多模态能力:能够精确搜索包含文本、图像、表格、图表、代码和图表的复杂文档,如 PDF 报告和演示幻灯片。
2. 突破性的上下文长度:可处理长达 128K tokens(约 200 页)的文档,适用于年度财务报告、产品手册或详细法律合同。
3. 强大的多语言能力:支持 100 多种语言,包括阿拉伯语、日语、韩语和法语等重要商业语言。
4. 安全性增强:针对金融、医疗保健和制造业等受监管行业进行了优化,可部署在虚拟私有云环境或本地环境中。
解决的问题
现有的嵌入模型无法原生理解复杂的多模态商业资料,这导致公司需要开发繁琐的数据预处理流程,却只能略微提高准确性。Embed 4 解决了这一问题,使企业能够高效地从大量不可搜索的信息中发现洞见。
适用场景
Embed 4 特别适合在受监管行业中发挥作用:
– 金融:投资者演示文稿、年度财务报告、并购尽职调查文件
– 医疗保健:医疗记录、程序图表、临床试验报告
– 制造业:产品规格文档、维修指南、供应链计划
技术优势
1. 处理不完美数据:能够处理拼写错误、格式问题或方向不正确的页面,无需复杂的数据准备流程。
2. 支持 Agentic AI 应用:为企业 AI 助手和 Agent 提供最佳的搜索引擎,通过 RAG 提高回答的有用性并减少幻觉。
3. 压缩嵌入:输出压缩嵌入,帮助组织节省高达 83% 的存储成本,同时保持搜索准确性。
可用性
Embed 4 现已在 Cohere 平台和 Microsoft Azure AI Foundry 上提供。它也可在 Amazon SageMaker 上使用,并可部署到任何 VPC 或本地环境中。
这项技术与 Cohere 的 North 平台无缝集成,为其 Compass 中的端到端搜索系统提供语义搜索功能,使企业能够跨工作场所工具集成数据,构建满足其独特需求的自定义 AI Agent.