Soul 创始人张璐:借 AI 东风,重构年轻人的社交版图
近年来,人工智能技术席卷全球产业,社交领域也不例外。AI 浪潮的涌起,为社交模式的创新带来无限可能。Soul 创始人张璐凭借对行业趋势的敏锐洞察与深刻理解,早早将 AI 技术融入 Soul App 的发展战略中,致力于为用户打造独一无二、充满情感温度的社交体验。近期,Soul 在 AI 领域又取得新的重大进展,其在学术和技术应用层面的成果备受瞩目。
在计算机视觉领域的国际顶级会议 CVPR 2025 公布的论文录用结果中,Soul App 的技术论文《Teller: Real - Time Streaming Audio - Driven Portrait Animation with Autoregressive Motion Generation》成功入选。Soul App 团队在这篇论文中提出面向实时音频驱动人像动画的自回归框架,成功攻克视频画面生成耗时久这一长期困扰行业的难题。不仅如此,该框架还显著提升了说话时头部及人体各部位运动的自然度和逼真度,为未来的虚拟社交场景提供更真实、更沉浸式的视觉体验基础。
十年磨剑:Soul 的 AI 技术演进图谱
回顾 Soul 的 AI 发展历程,可谓是一部不断探索与创新的奋斗史。早在 2016 年 Soul 上线后,便迅速推出基于 AI 算法的灵犀引擎。对此,Soul 创始人张璐介绍,“通过算法挖掘有效特征,重构用户画像,做好人与人、人与内容的实时匹配。”在当时的社交环境下,大多数社交平台的用户匹配机制较为单一,往往只注重表面的信息,如地理位置、年龄等。而灵犀引擎打破这种传统模式,通过对用户在站内的全场景画像进行深入分析,运用去中心化的独特算法,能够精准地将拥有共同兴趣、价值观和生活态度的人连接在一起,为用户带来全新的关系网络发现模式,让用户能够更高效地找到志同道合的伙伴,平等地开启社交之旅,收获及时的情感共鸣。
自 2020 年启动 AIGC 技术研发以来,Soul 在多模态领域持续深耕。2023 年,自研语言大模型 Soul X 的推出,成为 Soul AI 大模型发展历程中的一个重要里程碑。Soul X 具有独特的交互能力,能够理解用户语言背后的情感和意图,让每一次对话都充满温度与情感,不再是机械的问答。随后,语音生成、语音通话、音乐生成等大模型能力相继上线。如今,Soul AI 已升级为多模态端到端大模型,支持文字对话、语音通话、多语种交流、多模态理解以及真实拟人的交互等多样化功能,让社交交互更加贴近真实生活场景。无论是与远方的朋友进行文字聊天,还是通过语音通话分享生活点滴,亦或是与不同语言背景的用户交流,Soul 的多模态端到端大模型都能提供流畅、自然的交互体验。
情绪价值:AI 社交的核心竞争力
Soul AI 大模型被称为“原生情绪价值第一大模型”,这并非虚名。其背后依托的是海量的高关联、高质量的公域社交数据。与通用大模型不同,Soul 基于自身平台多年积累的垂类社交数据进行训练,这些数据包含了用户在社交过程中的各种情绪表达、兴趣爱好、交流习惯等信息。通过对这些数据的深入挖掘和分析,Soul AI 大模型能够精准把握平台用户的需求,训练成更能精准为年轻人提供情绪价值的 AI 大模型。它能够更好地理解用户的喜怒哀乐,在用户开心时一起分享喜悦,在用户烦恼时给予贴心的安慰和建议,最大程度还原真实社交中的互动体验,让用户在与 AI 的交流中感受到被理解、被关怀。
在 AI 浪潮的推动下,Soul 在张璐的带领下不断前行,为年轻人的社交生活带来更多的可能性。从构建基于深度学习的灵犀引擎重塑关系匹配逻辑,到自研多模态大模型 SoulX 实现情感化交互的突破,技术团队始终围绕 "情绪价值" 核心需求展开创新布局。近期入选 CVPR 2025 的实时音频驱动人像动画技术,通过自回归运动生成框架将虚拟形象的自然度提升至行业领先水平,这些技术成果正逐步落地于 "AI 苟蛋" 智能陪伴、狼人魅影实时互动等场景,形成覆盖文本、语音、视觉的全维度交互生态。正如张璐在近期访谈中强调:"以 AI 辅助社交,真正的提升交互效率和质量。"