智谱公司今日揭晓了其最新研发成果——GLM-4-Voice,一款端到端情感语音模型。该模型不仅具备情感理解与表达能力,还能实现情感共鸣,为用户带来更为真实的交互体验。用户现在即可通过“智谱清言”App,亲身体验这一创新技术。
GLM-4-Voice的亮点在于其丰富的情感表达和细腻的变化,能够准确传达高兴、悲伤、生气、害怕等多种情绪。同时,它还支持语速调节,用户可根据需要随时要求加快或放慢语速。该模型还具备随时打断和灵活输入指令的功能,使得对话互动更加自然流畅。
在语言支持方面,GLM-4-Voice表现出色,不仅支持中英文语音,还能识别中国各地方言,如粤语、重庆话、北京话等。该模型还即将上线视频通话功能,实现边看边说的全新交互体验。
智谱的另一大亮点AutoGLM也备受瞩目,它具备phone use能力,能够模拟人类操作手机,无需用户手动搭建复杂工作流,操作逻辑与人类相似。
GLM-4-Voice已同期对外开源,成为智谱首个开源的端到端多模态模型。感兴趣的用户可访问以下代码仓库了解更多详情:
https://github.com/THUDM/GLM-4-Voice
GLM-4-Voice的开源将有助于推动相关领域的进一步研究与发展,为行业注入新的活力。