虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

百川医疗大模型M4登顶全球榜单:以精准医疗能力重塑智能诊疗新范式

2026-06-23来源:互联网编辑:瑞雪

在医疗人工智能领域,百川智能与清华大学研究团队携手推出的新一代医疗增强大模型Baichuan-M4,近日在国际权威评测平台HealthBench上斩获三项世界第一。该模型不仅在综合榜单中以68.6分领先第二名GPT-5.5超10分,更在复杂临床决策的Hard子集评测中以15.9分的优势刷新纪录。其事实性幻觉率低至3.3%,较同类模型降低60%以上,标志着医疗AI从"答题机器"向"临床助手"的关键跨越。

区别于传统医疗模型被动等待信息输入的模式,M4展现出主动问诊的临床思维。当用户深夜反馈脚趾疼痛时,模型通过十轮动态追问锁定关键信息:疼痛部位、持续时间、外伤史、饮酒记录及血尿酸水平,最终精准判断为急性痛风并生成结构化问诊卡。这种基于真实诊疗场景的交互设计,使模型在SCAN-bench动态评测体系中取得初诊79.0分、复诊74.7分的领先成绩,该体系由150位三甲医院医生参与构建,通过多轮对话完整模拟临床决策流程。

全病程记忆功能是M4的另一突破性创新。通过打通历史病历、多轮问诊记录、检验指标变化及用药反馈,模型可建立患者360度健康画像。在长上下文记忆评测中,M4以86.9分刷新行业纪录,较前代提升21.1分。这种持续更新的健康档案使模型能提供个性化诊疗建议,例如针对糖尿病患者的血糖波动趋势,模型会结合用药史和饮食记录,生成比通用方案精准度提升40%的干预策略。

在医学证据应用层面,百川首创的"证据锚定"技术要求每项结论必须定位至原始文献的具体段落。通过构建包含权威指南、专家共识的六源循证库,M4将200余种疾病的诊疗流程拆解为超1000个标准化临床路径单元。在Baichuan-EBM评测中,其循证引用精度达90.0%,较GPT-5.5提升64%。某三甲医院临床验证显示,M4开具的处方与专家共识符合率达92%,较传统模型提升35个百分点。

作为医疗智能体的核心调度系统,M4实现了诊疗流程的自主决策。模型可根据实时场景自动选择追问病史、检索证据或调取既往记录,面对复杂任务时自动拆解为并行子任务。在安全防护方面,系统内置2000余条临床规范约束,可实时拦截越权操作,确保诊疗建议符合医学伦理。该系统通过持续吸收线上问诊数据、医生反馈及脱敏病例进行迭代优化,目前已形成"问诊-记忆-循证"的闭环能力体系,推动医疗AI从单点功能向全流程服务进化。

小米YU7 GT纽北自动驾驶圈速破纪录,第一视角揭秘性能与科技魅力
IT之家 6 月 22 日消息,小米汽车今日官宣,小米 YU7 GT 达成全球首个纽北自动驾驶圈速纪录,时间为 10 分 29 秒483。官方现已公布小米 YU7 GT 第一视角,感受全球首个纽北自动驾驶圈…

2026-06-22

京东全球首开源全栈实时视频视觉语言交互模型JoyAI-VL-Interaction 赋能多场景AI助手
官方表示,它让大模型从“一问一答”走向“边看边说”,开发者基于这套框架,可以快速搭建能持续观察、自主判断、即时响应的实景 AI 助手。 实时响应,而非事后总结:传统视频理解更多是上传完整视频后再分析,但在安…

2026-06-22

博主爆料:某子系小屏性能机或用骁龙8 Elite Gen6,网友猜测为一加16T
IT之家 6 月 22 日消息,博主 @数码闲聊站 今日透露,某子系小屏性能机目前正常开案中,评估骁龙 8 Elite Gen6 2nm旗舰芯,6.3 级别超高刷小直屏。评论区有网友推测为一加 16T。 目…

2026-06-22

Keychron V6 Ultra HE键盘来袭:机械轴与TMR磁轴双兼容 7月众筹将启
IT之家 6 月 22 日消息,Keychron(渴创)现已正式在其官网上线同时兼容机械轴与 TMR 磁轴的 V6 Ultra HE 键盘。这一全配列型号预计将于 7 月 22 日上架众筹平台 Kickst…

2026-06-22

高通SM8975应用处理器曝光:移动连接系统可选高配WCN8851与低配WCN8841
IT之家 6 月 21 日消息,X 平台用户 @Reptalicant 北京时间昨日爆料称,根据 Qualcomm(高通)今年 1月的文档,该企业代号 SM8975 的新一代旗舰智能手机应用处理器(可能会被…

2026-06-22