即构 RTC 助力新译 AI 翻译机跨语言实时沟通

IT资讯 2025-05-14 12:05:09 6小时前

近日，电影《流浪地球 3》官宣开机，该电影已定档 2027 年大年初一上映！2023 年，《流浪地球 2》掀起了国产科幻片的热潮，电影中的智能量子计算机 MOSS 也一举成名。它是趋于完美的智能体，没有生命期限，没有认知局限，剔除了感性思维意识，独留理性算法。新译科技选择以 MOSS 命名自己最新的翻译机 MossTalk，将这份科幻叙事转化为温暖现实 —— 用技术消融语言壁垒，让跨语言实时沟通无处不在。

MossTalk AI 大模型翻译机突破传统翻译设备笨重形态，采用磁吸式超薄机身设计，可无缝贴合手机背面，重量仅 35g，厚度约 5mm，具备文本 / 语音翻译、拍照翻译、实时音视频通话翻译、同声传译多种功能，支持 140 多个语种。

MossTalk 适配商务会议、跨境旅行、学术交流等多元场景：商务人士可将其吸附于手机，借助实时音视频翻译通话功能，与客户实时沟通产品亮点、合同报价；背包客通过一键触发翻译功能，拍照菜单即刻获取本地美食文化解读；留学生通过 MossTalk 的同声传译功能，轻松听懂课堂内容，还可以将课堂录音转文本存档复习，度过留学初期的语言关。

相比其他形式的翻译工具，MossTalk AI 大模型翻译机具备实时语音 / 视频通话翻译功能。您可在 MossTalk 创建视频 / 语音专属聊天室，将生成的聊天链接通过微信、X、Meta 等社交软件发送给对方，对方无需翻译机也可通过点击链接一键接通视频或语音会议，开启一场双语字幕实时呈现的跨国通话新体验。

依托即构科技提供的 RTC 技术，MossTalk 实现翻译场景下的“感官无界”实时体验。即构 RTC 在实时音视频、高频数据传输能力上的优势，能无缝融合多模态大模型技术，为用户带来更自然的实时互动体验。

・极低延迟，让翻译实时互动：MossTalk 要实现实时的语音 / 视频通话翻译功能，既要调用大模型的翻译功能，“实时”也是关键，延迟超过 400ms，沟通反馈就很不及时了。即构 RTC 最低 60ms、平均 200ms 的端到端时延，能支持 MossTalk 流畅完成实时音视频通话翻译。

・Purio AI 音频引擎，让每一句翻译“听得清、听得真”：自 2015 年成立以来，即构科技就走上了音视频技术持续创新的自研之路。2024 年 11 月，即构推出新一代自研 Purio AI 音频引擎，具备三大核心技术 ——AI 降噪技术、AI 回声消除技术和音量均衡技术。用户使用 MossTalk 翻译机的场景多元，包括户外、办公室、会议大厅、餐厅、课堂等多种场景，可能会面临各种噪音干扰。大到公共场所、户外闹市的人车嘈杂，室内场所的电视、音乐声，小到键盘敲击、插拔耳机、咳嗽声等，都会影响通话质量。即构 Purio AI 音频引擎具有全场景 400 + 噪音种类识别与消除技术，其具备的场景化 AI 降噪技术能够智能调节 AI 降噪策略，令通话人声纯净保真。同时，Purio 的 AI 算法能够智能识别并消除高达 99.9% 的音频回声，尤其适用于外放声音场景，让通话人声更保真。

・抗弱网，让实时翻译更流畅：随时随地的实时互动中弱网环境下保持稳定传输是关键，即构 RTC 在音频 90%、视频 80% 丢包下依旧能保证流畅的互动翻译体验。

此外，更高保真的信息有利于大模型做出更正确的理解和决策，即构 RTC 自研视频编码器、视频画质增强算法、48kHz 全频带音频采样等能力保证用户音视频数据高保真传输。更靠近大模型的算力中心的传输节点可以进一步压缩传输时延，即构 RTC 500 + 多云动态伸缩节点，可根据算力中心针对性部署，打造更可靠、低延时的互动体验。

从 2024 年亮相深圳高交会，到 2025 年赋能深圳机场对外提供多语实时翻译服务，MossTalk 翻译机正以 140 种语言互译、实时音视频通话翻译等硬核能力，创新跨语言沟通的互动方式。这背后是新译科技十年磨一剑的语言翻译积累，以及即构科技在实时音视频领域的持续探索。展望未来，我们相信 RTC+AI 技术将带来更多的创新应用，让世界听见每一种语言的力量。

实时翻译机音视频互动技术场景

即构 RTC 助力新译 AI 翻译机跨语言实时沟通

即构 RTC 助力新译 AI 翻译机跨语言实时沟通

相关阅读

最新资讯

热门资讯