虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

谷歌AI同声传译新突破:任意耳机秒变翻译神器,情绪语调全保留

2025-12-19来源:快讯编辑:瑞雪

科技巨头谷歌近日在翻译领域迈出重要一步,将升级后的Gemini 2.5 Flash原生语音模型整合至Google翻译,推出耳机实时语音翻译测试版功能。这项创新突破传统硬件限制,用户无需购买专用设备,只需佩戴任意耳机并连接安装Google翻译的安卓设备,即可开启实时翻译服务,实现单向聆听与双向对话的无缝切换。

该功能的核心优势在于"零硬件成本"与"情绪传递"技术。区别于苹果AirPods Pro 3需绑定特定iPhone机型的限制,谷歌方案支持所有有线、蓝牙及AI耳机,覆盖超过70种语言和2000个语言对。更引人注目的是其语音处理能力——通过Gemini 2.5 Flash模型,翻译不仅能保留说话者的语调、重音和节奏,还能在学术会议、跨国谈判等场景中区分不同发言者。演示视频显示,四位使用者分别使用韩语、英语、中文和德语交流,系统可精准识别主要说话者并在对话中动态切换语言。

技术层面,新模型将准确率提升至71.5%,多轮对话质量从62%跃升至83%。尽管海外用户反馈仍存在识别误差,尤其在专业术语翻译方面,但谷歌披露的数据显示其性能已显著优于前代。产品管理副总裁Rose Yao强调,这项技术突破使机器翻译从"信息传递"升级为"情感共鸣",例如西班牙语的热情重音或中文的含蓄语速都能被完整保留。

市场格局因此面临重构。当前同声传译领域存在三类主要方案:一是科大讯飞、时空壶等厂商的专用硬件,翻译准确率高达95%但售价昂贵;二是苹果生态的封闭方案,仅支持5种语言且需特定设备;三是Nebulabuds等轻量化APP,依赖第三方AI模型且需商业合作激活。谷歌的入局打破了这种平衡——其方案既无需硬件投入,又突破生态限制,虽在专业领域仍不及专用设备,但已实现"所有耳机皆可翻译"的普及化目标。

目前该功能已向美国、墨西哥和印度的安卓用户推送,计划2026年扩展至iOS生态及更多地区。行业观察者指出,这将对翻译耳机、AI眼镜等智能硬件造成冲击——当实时翻译成为基础功能而非产品卖点,厂商需重新思考差异化竞争策略。尽管谷歌方案尚不能完全替代专业设备,但其普惠性已为翻译技术普及开辟新路径。

谷歌英伟达领投3.3亿美元,AI编程创企Lovable估值飙升至464亿
2023年创立于瑞典斯德哥尔摩的Lovable,由Anton Osika和Fabian Hedin联合创办,定位于“vibecoding”赛道,即通过类自然语言提示构建软件应用的AI工具平台。 Alpha…

2025-12-19

摩根士丹利预测:2050年人形机器人或迎爆发,核心供应商将成大赢家
来源:环球网 同时,参与人形机器人智能技术增长潜力的方式多样,硬件和半导体是关键切入点。 摩根士丹利预计,随着AI模型进步、组件成本下降、规模化制造和更优设计,人形机器人半导体TAM到2045年有望达到305…

2025-12-19

三星Exynos 2600规格揭晓:全球首款2nm芯片,性能提升引期待
Galaxy S26 - 2nm Exynos 2600关键参数 按照以往的爆料来看,三星Galaxy S26系列将搭载Exynos 2600芯片,不过并不会在所有市场销售,国行版本应该仍是搭载来自高通的骁…

2025-12-19

深圳龙岗首现开源鸿蒙智慧泵房:降本增效,加速构建全区智慧水务体系
IT之家 12 月 18日消息,全国首个基于开源鸿蒙操作系统的智慧泵房日前落地深圳市龙岗区,通过搭载基于开源鸿蒙自主研发的“华龙工鸿”工业操作系统与全栈国产 PLC 控制器,这座泵房实现了无人值守、能耗下降…

2025-12-19

微星FORGE GK300 WIRELESS评测:199元真Gasket键盘,办公游戏全能之选
Gasket架构通过PCB板与外壳间的硅胶垫片连接,配合5层填充方案带来了三大核心优势:一是大幅减少按键共振与空响,敲击声音浑厚清脆,无传统机械键盘的刺耳杂音;二是按压手感更Q弹,触底反馈扎实不肉;三是整体…

2025-12-18

安卓16 QPR3将优化原生长截图:自动清理冗余图 提升存储管理体验
该媒体深入挖掘 Android Canary 2512 版本,发现谷歌引入了一项自动清理机制,一旦用户点击长截图界面的“保存”或“分享”按钮后,系统将自动删除原始截图,仅保留最终的长截图版本;若用户选择“取…

2025-12-18