虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

海螺语音挑战ElevenLabs,多语言合成能力究竟如何?

2025-01-22来源:ITBEAR编辑:瑞雪

在职场沟通中,一个意外的挑战让一位员工不得不面对香港客户的质疑——因项目延期,他急需在线上以完美的解释挽回信任。而这段解释中的粤语与英语自如切换的语音,却并非出自人类之口,而是由海螺语音这一AI技术所生成。这一技术的出现,不仅令人惊叹,更预示着AI语音领域的一次重大突破。

海螺语音的背后,是MiniMax公司强大的技术支持。今年1月,MiniMax在推出基础语言大模型和视觉多模态大模型后,再次升级了其语音大模型T2A-01系列。这一系列的推出,标志着海螺AI语音板块的正式开启。相较于旧版本,T2A-01系列在语音生成能力上有了显著提升,不仅音质清晰、韵律自然,还能精准表达情绪,且支持包括中文、粤语、英语在内的17种语言及上百种预置音色。

从海螺语音生成的音频中,可以清晰感受到其处理不同语种的能力,以及接近人声的自然度。无需抽卡,就能达到如此稳定的水平,这无疑是对当前AI语音技术的一次革新。为了更直观地展示海螺语音的实力,我们不妨将其与其他语音生成产品进行对比。

以难度极高的绕口令“施氏食狮史”为例,ChatTTS生成的内容粘连感强,几乎听不出在读什么;而ElevenLabs虽然字与字之间能够区分开,但存在“呱呱叫”的模型幻觉问题。相比之下,海螺语音的表现则更为出色。整段声音自然流畅,虽然部分词语存在断句问题,但在大部分短句中已有显著惊艳的表现,对音调、分词错落、节奏和断句的处理都反映出其背后的理解能力。

海螺语音的多语言合成能力,足以与ElevenLabs等领先产品相媲美。MiniMax团队采用与Seed-TTS论文相同的评测集和评测工具进行计算,结果显示,海螺语音在中文的字错率和相似度上表现最佳,英文的字错率、相似度也接近真实录音。海螺语音还建立了多语种评测集,对17个语种进行客观评测,结果显示其在多个语种上的相似度、正确率均大幅领先。

海螺语音不仅在多语言合成上表现出色,其精准的情绪控制和音色选择更是令人称奇。为了让声音更加鲜活、情感表达更加精准,MiniMax对长达超千万小时的高质量音频数据进行加工训练,实现了高音质、情感丰富的声音效果。用户既可以让系统自动检测情绪,也可以明确指定情绪,从而生成能够精准捕捉人类深层情感的语音输出。海螺语音还预置了300+音色供用户选择,风格多变,满足有声书、ASMR耳语、新闻播报等多种场景需求。

海螺语音还实现了分段控制不同情绪的功能。例如,在表达老人害怕的情绪时,可以进一步从声音中感受到从害怕到难过再到开心的完整情绪变化。这种对输入文字的精准理解和对输出声音的精细控制,使得海螺语音在商业化场景和日常对话表达中都能游刃有余。

海螺语音的成功,离不开MiniMax公司对多模态模型能力的长期投入和持续发力。虽然音频在多模态模型能力开发顺序上似乎难以排在文字、图片、视频之前,但MiniMax却凭借其在语音大模型上的深厚积累和技术突破,成功推出了海螺语音这一领先产品。从文本、视频到语音能力的全面更新,MiniMax和海螺AI正不断给人带来惊喜,推动着AI技术的不断前进。

小米再拓欧洲版图:巴黎首家直营门店即将开业 开启法国市场新篇章
近日,小米法国副国家经理“产品逸飞”发文官宣,小米将在巴黎开设首家直营门店。针对网友提问“之前不是在香街有一个吗?”,他进一步回应称,该店为客户运营的授权店,后因疫情因素暂时退出市场。 此前,小米集团总裁卢…

2025-11-15

华为Mate80 Pro Max来袭:自研双长焦加持,配置拉满对标苹果小米!
并且一直在曝光的Mate80系列具体机型也得到了最终确认,首先是依然有4款机型全名华为Mate80 ProMax,这也是继苹果小米之后,又一款Pro Max顶级旗舰。接下来直到发布前,华为Mate80系列还…

2025-11-15

TCL华星全球显示生态大会:四款新品亮相,AI赋能制造,印刷OLED节能显著
智东西11月14日苏州现场报道,今天上午,国内显示产业头部玩家TCL华星召开了自家一年一度的全球显示生态大会(DTC2025),发布了覆盖LCD、OLED和MLED等技术领域的多款旗舰新品,以及《视觉健康白…

2025-11-15

华为Mate 80系列新料:20GB国产内存搭配麒麟9030 配置亮点多
根据近期华为新机规划以及各方爆料,这款机型预计为华为 Mate 80 系列,有爆料称该系列新品将在 11 月 25 日发布。其中,ProMax 并非简单的名称更换,而是定位与 Pro 版差距更大的新增机型…

2025-11-14

全RGB排列屏幕成新趋势,vivo新机或搭载,小米17 Pro Max已率先应用
据CNMO了解,近期发布的小米17 ProMax就搭载了全RGB排列屏幕。凭借超级像素技术,其子像素总数高达938万,与传统2K屏约920万的子像素数量基本持平。 小米总裁卢伟冰曾表示,在友商同级产品纷纷…

2025-11-14

小米斩获国际大奖,OPPO新机参数曝光,荣耀500系列真机设计吸睛
官方放出了荣耀500系列真机的渲染视频,从视频中可以看出荣耀500系列外观设计非常有特点,大家都说像iPhoneAir,甚至有人讲荣耀提前发布“iPhone Air 2”。另外行业信息显示荣耀500全系是…

2025-11-13

iPhone 17系列线上线下热销,苹果2025年有喜有忧未来可期
在此情况下,原本不被看好的苹果 iPhone 17 系列成为一匹黑马,上市后销售极为火爆,尤其是中国市场的表现远超预期:首发 10天销量同比增长 14%,第三季度出货量达 1010 万台,成为头部厂商中唯…

2025-11-13

iPhone16Pro升级iOS26.2beta2实测:续航提升,发热改善,流畅与信号双飞跃
苹果今天凌晨突然发布了iOS26.2第二个预览版,有很多凌晨熬夜更新的小伙伴表示优化非常好,各方面体验要比第一版更好用,也获得了不少老果粉们的认可,那么最适合更新iOS26.2beta2的是哪款机型呢?下面就…

2025-11-13

大疆新品亮点频现:Avata 360无人机配旋转云台,Osmo Action 6相机可变光圈
在镜头和视频规格方面,Action 6 将配备全新的 F2.0-F4.0 可变光圈镜头,等效焦距为 16mm;支持录制带有 HDR 和ProRes 编码的 8K / 30fps 视频,还支持 5.3K /…

2025-11-13

原DeepSeek核心成员罗福莉加盟小米MiMo团队 疑聚焦世界模型与具身智能领域
智东西11月12日消息,今天上午,原DeepSeek核心成员、被业内称为“天才少女”的罗福莉在朋友圈正式官宣加盟XiaomiMiMo团队,并宣告“全力奔赴心中的AGI(通用人工智能)”。 罗福莉一条简单的…

2025-11-13