即构 RTC 助力新译 AI 翻译机跨语言实时沟通
近日,电影《流浪地球 3》官宣开机,该电影已定档 2027 年大年初一上映!2023 年,《流浪地球 2》掀起了国产科幻片的热潮,电影中的智能量子计算机 MOSS 也一举成名。它是趋于完美的智能体,没有生命期限,没有认知局限,剔除了感性思维意识,独留理性算法。新译科技选择以 MOSS 命名自己最新的翻译机 MossTalk,将这份科幻叙事转化为温暖现实 —— 用技术消融语言壁垒,让跨语言实时沟通无处不在。
MossTalk AI 大模型翻译机突破传统翻译设备笨重形态,采用磁吸式超薄机身设计,可无缝贴合手机背面,重量仅 35g,厚度约 5mm,具备文本 / 语音翻译、拍照翻译、实时音视频通话翻译、同声传译多种功能,支持 140 多个语种。
MossTalk 适配商务会议、跨境旅行、学术交流等多元场景:商务人士可将其吸附于手机,借助实时音视频翻译通话功能,与客户实时沟通产品亮点、合同报价;背包客通过一键触发翻译功能,拍照菜单即刻获取本地美食文化解读;留学生通过 MossTalk 的同声传译功能,轻松听懂课堂内容,还可以将课堂录音转文本存档复习,度过留学初期的语言关。
相比其他形式的翻译工具,MossTalk AI 大模型翻译机具备实时语音 / 视频通话翻译功能。您可在 MossTalk 创建视频 / 语音专属聊天室,将生成的聊天链接通过微信、X、Meta 等社交软件发送给对方,对方无需翻译机也可通过点击链接一键接通视频或语音会议,开启一场双语字幕实时呈现的跨国通话新体验。
依托即构科技提供的 RTC 技术,MossTalk 实现翻译场景下的“感官无界”实时体验。即构 RTC 在实时音视频、高频数据传输能力上的优势,能无缝融合多模态大模型技术,为用户带来更自然的实时互动体验。
・极低延迟,让翻译实时互动:MossTalk 要实现实时的语音 / 视频通话翻译功能,既要调用大模型的翻译功能,“实时”也是关键,延迟超过 400ms,沟通反馈就很不及时了。即构 RTC 最低 60ms、平均 200ms 的端到端时延,能支持 MossTalk 流畅完成实时音视频通话翻译。
・Purio AI 音频引擎,让每一句翻译“听得清、听得真”:自 2015 年成立以来,即构科技就走上了音视频技术持续创新的自研之路。2024 年 11 月,即构推出新一代自研 Purio AI 音频引擎,具备三大核心技术 ——AI 降噪技术、AI 回声消除技术和音量均衡技术。用户使用 MossTalk 翻译机的场景多元,包括户外、办公室、会议大厅、餐厅、课堂等多种场景,可能会面临各种噪音干扰。大到公共场所、户外闹市的人车嘈杂,室内场所的电视、音乐声,小到键盘敲击、插拔耳机、咳嗽声等,都会影响通话质量。即构 Purio AI 音频引擎具有全场景 400 + 噪音种类识别与消除技术,其具备的场景化 AI 降噪技术能够智能调节 AI 降噪策略,令通话人声纯净保真。同时,Purio 的 AI 算法能够智能识别并消除高达 99.9% 的音频回声,尤其适用于外放声音场景,让通话人声更保真。
・抗弱网,让实时翻译更流畅:随时随地的实时互动中弱网环境下保持稳定传输是关键,即构 RTC 在音频 90%、视频 80% 丢包下依旧能保证流畅的互动翻译体验。
此外,更高保真的信息有利于大模型做出更正确的理解和决策,即构 RTC 自研视频编码器、视频画质增强算法、48kHz 全频带音频采样等能力保证用户音视频数据高保真传输。更靠近大模型的算力中心的传输节点可以进一步压缩传输时延,即构 RTC 500 + 多云动态伸缩节点,可根据算力中心针对性部署,打造更可靠、低延时的互动体验。
从 2024 年亮相深圳高交会,到 2025 年赋能深圳机场对外提供多语实时翻译服务,MossTalk 翻译机正以 140 种语言互译、实时音视频通话翻译等硬核能力,创新跨语言沟通的互动方式。这背后是新译科技十年磨一剑的语言翻译积累,以及即构科技在实时音视频领域的持续探索。展望未来,我们相信 RTC+AI 技术将带来更多的创新应用,让世界听见每一种语言的力量。