微软发布突破性“实时翻译员API” 实现多语言即时沟通

2025年09月13日 17:28 次阅读 稿源:cnBeta.COM 条评论

微软近日发布了“实时翻译员API”,这是Azure语音翻译服务中的一项新能力。该API旨在为用户提供无需手动选择输入语言的无障碍、实时、多语言沟通体验。其核心特性包括自动和连续的语言识别(LID),支持76种输入语言和143个地区,延迟大幅缩短,已可媲美人工翻译员,并具备“个人声音”功能,能够保留说话者的风格与语气。目前该API已开启公开预览。

微软指出,这一全新API拥有多元应用场景,例如多语言呼叫中心、在线会议和活动、多语言课堂及社交电商直播等。用户无需在菜单中切换语言,软件即可在对话中实现无缝切换,极大提升沟通效率。

值得一提的是,“个人声音”功能能够保留原始说话者的风格和语调,还能维持语音的抑扬顿挫,并具备企业级的授权控制能力。

“实时翻译员API”基于Azure语音翻译服务打造,能够实现持续的语言识别、全面的语言覆盖及低延迟的语音到语音翻译。微软官方还援引安克创新的案例表示:

“我们很高兴与微软合作,展示AI如何与日常科技结合。以Azure语音翻译实时翻译员能力为基础,我们能够为全球用户带来更智能、更直观、更具沉浸感的视听体验。”

微软面向开发者提供了快速入门指南,方便其集成和使用该新API。而对于普通用户来说,这一API并不直接面向终端个体,而是通过集成该功能的应用或网站间接体验。

了解更多:

https://techcommunity.microsoft.com/blog/azure-ai-foundry-blog/announcing-live-interpreter-api---now-in-public-preview/4453649

https://learn.microsoft.com/en-us/azure/ai-services/speech-service/how-to-translate-speech?tabs=terminal&pivots=programming-language-csharp#using-live-interpreter-preview-for-real-time-speech-to-speech-translation-with-personal-voice

对文章打分

微软发布突破性“实时翻译员API” 实现多语言即时沟通

1 (50%)
已有 条意见

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      Top 10

      招聘

      created by ceallan