Mistral AI发布OCR4模型：支持170种语言，输出质量超越GPT与Gemini

Mistral AI 发布 OCR 4 文档识别模型

法国初创企业 Mistral AI 在本月 23 日正式推出文档内容识别模型 OCR 4。该模型覆盖 10 个语族，支持多达 170 种语言。在 OmniDocBench 基准测试中，OCR 4 获得 93.07 分。人工评审对其输出质量的认可度高于 GPT 5.5 Pro 与 Gemini 3.1 Pro Preview。

模型并未追求庞大的参数规模，而是专注于文档识别效率。除了提取文本，它还能返回边框定位、区域分类结果与置信度评分。这些结构化数据可直接用于 RAG 语义分块、智能体基础单元处理或内容连接器格式化。

定价策略已同步公布。标准 API 调用费用为每千页 4 美元。采用批处理方式可享受 50% 折扣。文档人工智能服务的定价为每千页 5 美元。

Mistral AI 此前以通用大语言模型策略进入市场，此次上线 OCR 4 意味着业务线正式延伸至文档智能处理领域。欧洲这家代表性初创公司由此在基础工具层，与 OpenAI 及 Google 展开直接竞争。

人工智能文档识别 Mistral AI OCR模型

CB科技站

Mistral AI发布OCR4模型：支持170种语言，输出质量超越GPT与Gemini

Mistral AI 发布 OCR 4 文档识别模型

与本文相关的文章