OpenAI新模型o1-preview在医疗诊断上超越人类医生？-手机产品-虎科技

近期，一项由哈佛医学院携手斯坦福大学开展的医学研究揭示了人工智能在医疗诊断领域的潜力。研究显示，OpenAI的o1-preview模型在应对复杂医疗案例时，其诊断能力超越了人类医生。

研究报告详细指出，o1-preview模型在测试案例中实现了78.3%的正确诊断率。特别是在70个特定案例的对比中，该模型的准确率飙升至88.6%，这一成绩明显优于其前身GPT-4的72.9%准确率。这一发现标志着AI在医疗诊断领域取得了显著进步。

进一步的研究采用医学推理质量评估标准量表R-IDEA进行衡量，结果显示o1-preview在80个测试案例中取得了78个满分。相比之下，经验丰富的医生仅在28个案例中获得满分，而住院医生更是仅在16个案例中获得满分。这一对比凸显了o1-preview在医学推理方面的卓越表现。

在由25位医学专家设计的复杂案例中，o1-preview的得分高达86%。这一成绩是使用GPT-4的医生（41%得分）和使用传统诊断工具的医生（34%得分）的两倍多。这一发现进一步证明了o1-preview在处理复杂医疗问题时的优势。

然而，研究人员也指出了研究的局限性。部分测试案例可能包含在o1-preview的训练数据中，这可能对结果产生一定影响。研究主要关注模型单独工作的情况，未充分考虑其与人类医生协同工作的场景。同时，o1-preview建议的诊断测试成本高昂，在实际应用中可能面临一定的局限性。