虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

百度千帆Qianfan-OCR模型发布:4B参数实现文档智能解析,多项评测成绩领先

2026-03-20来源:互联网编辑:瑞雪

百度千帆近日宣布推出全新端到端文档智能模型Qianfan-OCR,该模型采用统一的视觉语言架构,以40亿参数规模实现了文档解析、版面分析、文字识别与语义理解的一体化融合。在多项权威评测中,该模型展现出显著优势,标志着文档智能技术从多阶段流程向统一模型架构的跨越式发展。

在核心基准测试中,Qianfan-OCR表现尤为亮眼。在OmniDocBench v1.5评测中以93.12分位居端到端模型榜首,OCRBench评测成绩显著超越同规模通用视觉语言模型和专用OCR模型。在关键信息提取(KIE)领域,该模型在多个公开榜单总分上力压Google Gemini 3-Pro等国际商用模型,展现出强大的技术竞争力。

针对图表理解等复杂场景,Qianfan-OCR在ChartQA、ChartBench等6项国际权威评测中斩获5项最佳成绩。其独特的结构理解与多模态推理能力,能够精准解析包含复杂表格、混合图表的文档内容,在金融报表、科研论文等场景中具有显著应用价值。

传统OCR系统普遍采用"检测-识别-大模型"三段式架构,这种串联处理方式容易导致误差累积,且在文本分块提取过程中会破坏原始文档的空间结构与视觉上下文。例如复杂表格的行列关系、图表的坐标对应等关键信息,在传统流程中往往出现理解偏差。

Qianfan-OCR通过底层架构创新,构建了端到端的视觉语言模型。该模型直接从文档图像生成结构化输出,完整保留视觉信息与空间关系,实现从像素到语义的直接映射。这种技术路径不仅提升了处理效率,更在结构理解与推理任务中达到更高精度,有效解决了传统方案的固有缺陷。

目前,Qianfan-OCR已在百度千帆平台全面开放,同时通过HuggingFace开源模型权重。开发者与企业用户可自由调用该模型,应用于金融、医疗、教育等领域的文档智能化处理,推动行业数字化转型进程。

iPhone16Pro升级iOS26.4RC实测:信号续航双提升,流畅音质更出色
很多人会关心信号问题,那我们就先从网络信号来看看实际表现吧,凌晨更新后,早上就去地铁上进行了一番体验,大部分时间信号都是3格左右,偶尔能到满格,在1小时的通勤时间里,玩了半小时王者荣耀,延迟大多都控制在50毫…

2026-03-19

OPPO Find N6折叠屏体验:折痕难题被攻克,折叠屏真的变好用了
于是乎,大家就见到了这台 OPPO Find N6 ,一台折痕确实相当浅,甚至你都不太会注意到折痕的折叠屏手机。 其实到了折叠屏时代,笔和更大的屏幕应该是更加适配的,可是折叠屏由于太过轻薄,已经放不下笔了,…

2026-03-19

前苹果设计大师Jony Ive与巴慕达联手 打造极简美学桌面时钟The Clock
IT之家 3 月 19 日消息,日本设计制造公司 Balmuda(巴慕达)近日携手 Jony Ive 离开苹果后成立的设计工作室LoveFrom 推出了一款 The Clock 桌面时钟,定价 59400 …

2026-03-19

小米新一代SU7正式登场:三版本定价揭晓,性能续航亮点纷呈
3月19日,在小米春季新品发布会,小米新一代SU7正式发布。新一代SU7包括标准版、Pro版、Max版三种配置。售价方面,新一代SU7标准版定价21.99万元;新一代SU7 Pro版定价24.99万元;新一…

2026-03-19

武汉大学科研新突破:世界最小芯片原子钟问世,精度超高打破垄断
快科技3月19日消息,武汉大学科研团队在量子精密测量领域取得重大突破,成功研制出世界体积最小的芯片原子钟。 其体积仅2.3立方厘米,大小接近指甲盖,计时精度达到3万多年误差不超过1秒,为国家关键领域筑牢高精度…

2026-03-19