Mistral AI 发布 OCR 4 文档识别模型
法国初创企业 Mistral AI 在本月 23 日正式推出文档内容识别模型 OCR 4。该模型覆盖 10 个语族,支持多达 170 种语言。在 OmniDocBench 基准测试中,OCR 4 获得 93.07 分。人工评审对其输出质量的认可度高于 GPT 5.5 Pro 与 Gemini 3.1 Pro Preview。
模型并未追求庞大的参数规模,而是专注于文档识别效率。除了提取文本,它还能返回边框定位、区域分类结果与置信度评分。这些结构化数据可直接用于 RAG 语义分块、智能体基础单元处理或内容连接器格式化。
定价策略已同步公布。标准 API 调用费用为每千页 4 美元。采用批处理方式可享受 50% 折扣。文档人工智能服务的定价为每千页 5 美元。
Mistral AI 此前以通用大语言模型策略进入市场,此次上线 OCR 4 意味着业务线正式延伸至文档智能处理领域。欧洲这家代表性初创公司由此在基础工具层,与 OpenAI 及 Google 展开直接竞争。