Soul App多模驱动方案引领3D虚拟人交互创新
2024.12.03 10:59浏览量:8简介:Soul App在ICCGV 2025上展示的3D虚拟人交互方案获认可,其研究论文成功入选。该方案利用大语言模型实现多模态驱动,提供沉浸、自然、流畅的社交体验,标志着Soul在AI与虚拟人技术上的重大突破。
在科技日新月异的今天,人工智能与虚拟现实技术的融合正引领着新一轮的交互革命。近日,2025年第八届计算机图形和虚拟国际会议(ICCGV 2025)公布了论文收录结果,社交平台Soul App的研究成果《LLM Gesticulator: Leveraging Large Language Models for Scalable and Controllable Co-Speech Gesture Synthesis》成功入选,这一创新3D虚拟人交互方案再次引起了业界的广泛关注。
计算机图形和虚拟国际会议一直是计算机图形学与虚拟现实技术领域的风向标,吸引着全球顶尖学者、行业精英及创新先锋共同探讨技术的进步。本次大会聚焦于虚拟现实环境/增强现实/混合现实、人机交互和高级交互等领域,旨在探讨计算机图形学与虚拟现实技术的最新科研成果和产业发展对人类认知世界、交互体验的深刻影响。
Soul App的研究成果《LLM Gesticulator》之所以能够在众多论文中脱颖而出,关键在于其首次提出了使用大模型作为基底模型实现虚拟人的多模态驱动方案。这一方案不仅展现出了极高的可控性和可拓展性,而且在动画质量、动画相关性、节奏匹配度和文本匹配度等多个指标上都超过了以往的最佳方案。这一创新性的突破,无疑为3D虚拟人交互技术的发展开辟了新的道路。
事实上,Soul App自2016年上线以来,就始终坚持以技术驱动创新,注重AI、虚拟人、虚拟与现实融合等方向的技术能力建设。为了降低用户的社交压力,Soul不支持用户上传真实头像,而是提供了捏脸系统,让用户能够自主创造个性化的虚拟形象。此外,Soul还集成了AI、渲染和图像处理等技术,推出了自研的NAWA引擎,为用户创建个性化的3D社交形象和场景提供技术支持。
2020年,Soul正式启动了对AIGC的技术研发工作,系统推进了智能对话、语音技术、3D虚拟人等AIGC关键技术能力的研发,并推动了AI能力在社交场景的快速落地。目前,Soul已经先后上线了自研语言大模型Soul X,以及语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等语音大模型能力。2024年,Soul的AI大模型能力更是整体升级为多模态端到端大模型,支持文字对话、语音通话、多语种、多模态理解、真实拟人等特性,真正实现了更接近生活日常的交互对话和“类真人”的情感陪伴体验。
沿着多模态融合的方向,Soul团队希望能够集成3D虚拟人能力,创新多模态AI交互方案,为用户提供更加沉浸、自然、流畅、智能的互动体验。相关负责人表示:“3D虚拟人是多模态中的重要组成部分和效果的丰富化呈现,社交则是3D虚拟人落地的最佳自然场景之一。Soul自身具备完整的多模态团队、3D虚拟人/AI能力积累和深耕社交场景的洞察,团队有机会在此领域形成创新方案和竞争壁垒。”
除了《LLM Gesticulator》之外,Soul在2024年的多个技术研究成果也获得了学界和行业的肯定。例如,其研究成果《Multimodal Emotion Recognition with Vision-language Prompting and Modality Dropout》就入选了ACM国际多媒体会议(ACM MM 2024)上组织的多模态与可靠性情感计算研讨会MRAC 24。该论文重点介绍了Soul团队为提高情绪识别的准确性和泛化性能,提出的多模态情绪识别方法。
在推动技术能力建设的同时,Soul也始终强调将AI能力快速落地到社交场景中。目前,Soul的大模型能力和创新互动方案已经在智能对话机器人“AI苟蛋”、狼人杀Agent、数字分身和最新的AI虚拟人智能陪伴功能等场景得到了应用。在今年10月举办的全球三大IT展之一——GITEX GLOBAL海湾信息技术博览会上,Soul更是携集成3D虚拟人能力的多模态AI交互方案亮相,让观众通过数字装置即时生成3D虚拟数字分身,体验自然、流畅、沉浸式的多模态互动。
未来,Soul将继续沿着多模态融合的方向探索,将3D虚拟人的多模态交互能力陆续在站内虚拟陪伴、群聊派对、游戏等多个场景落地。让用户通过创新技术的应用在社交中充分展现自身鲜明的个性,精准传递情绪温度,在各种虚实融合的场景中与他人自在交流、互动,感受全新的互动体验。在这一过程中,曦灵数字人作为Soul在3D虚拟人技术上的重要布局,将发挥关键作用。曦灵数字人不仅拥有高度逼真的外观和动作,还能够通过多模态交互技术与用户进行自然流畅的对话和互动。这一技术的应用将进一步提升Soul用户的社交体验,推动社交平台向更加智能化、人性化的方向发展。
综上所述,Soul App在3D虚拟人交互方案上的创新不仅得到了行业和学界的认可,更为用户带来了更加沉浸、自然、流畅、智能的社交体验。随着技术的不断进步和应用场景的不断拓展,Soul有望在未来成为引领社交平台交互革命的重要力量。
发表评论
登录后可评论,请前往 登录 或 注册