Soul App多模驱动研究突破 入选ICCGV彰显技术实力
2024.12.03 11:34浏览量:13简介:Soul App的3D虚拟人交互方案研究论文入选ICCGV 2025,展示了其在利用大语言模型实现虚拟人多模态驱动方面的创新成果,标志着Soul在AI和虚拟人技术上的领先地位,并将推动多模态AI交互方案的发展。
近日,2025年第八届计算机图形和虚拟国际会议(ICCGV 2025)公布了论文收录结果,社交平台Soul App的研究成果《LLM Gesticulator: Leveraging Large Language Models for Scalable and Controllable Co-Speech Gesture Synthesis》(LLM Gesticulator:利用大语言模型实现可扩展且可控的协同手势合成)成功入选。这一消息不仅标志着Soul在3D虚拟人交互方案领域的创新得到了国际认可,也彰显了其在AI和虚拟人技术方面的深厚积累。
计算机图形和虚拟国际会议(ICCGV)作为计算机图形学与虚拟现实技术领域的顶级盛会,每年都会吸引全球顶尖学者、行业精英及创新先锋共聚一堂,共同探讨技术的进步,携手助力产学研联动。此次Soul的论文能够入选,无疑是对其底层技术能力建设和探索方向的高度肯定。
Soul自2016年上线以来,便坚持以技术驱动创新,注重AI、虚拟人、虚拟与现实融合等方向的技术能力建设。为了降低用户社交压力,Soul不允许用户上传真实头像,而是提供了捏脸系统,让用户可以自主创造个性化虚拟形象。这一设定不仅为用户带来了全新的社交体验,也为Soul后续在3D虚拟人技术方面的探索奠定了坚实基础。
在AI技术方面,Soul更是不断推陈出新。早在2020年,Soul便正式启动了对AIGC的技术研发工作,系统推进在智能对话、语音技术、3D虚拟人等AIGC关键技术能力方面的研发,并推动AI能力在社交场景的快速落地。目前,Soul已先后上线了自研语言大模型Soul X,以及语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等语音大模型能力。这些技术成果不仅提升了Soul平台的智能化水平,也为用户带来了更加自然、流畅的交互体验。
而此次入选ICCGV的论文,更是Soul在3D虚拟人交互方案领域的一次重大突破。论文中,Soul团队首次提出使用大语言模型作为基座模型实现3D虚拟人的多模态驱动方案,并展现出了极高的可控性和可拓展性。实验表明,该模型在动画质量、动画相关性、节奏匹配度和文本匹配度等多个指标上都超过了以往方案。此外,Soul团队还对模型进行了特殊设计,使其可以同时支持文本+音频的输入,并能够生成和音频节奏和文本语意都符合的动画数据。这一创新不仅丰富了3D虚拟人的交互方式,也为用户带来了更加沉浸、自然、流畅的社交体验。
值得一提的是,Soul在推动技术创新的同时,也非常注重技术的落地应用。目前,Soul的大模型能力和创新互动方案已在智能对话机器人“AI苟蛋”、狼人杀Agent、数字分身和最新的AI虚拟人智能陪伴功能等场景得到了广泛应用。这些应用不仅提升了Soul平台的趣味性和互动性,也为用户带来了更加多元化的社交选择。
在未来,Soul将继续沿着多模态融合的方向探索前行,集成3D虚拟人能力创新多模态AI交互方案,为用户提供更加沉浸、自然、流畅、智能的互动体验。同时,Soul也将继续加强与产学研各方的合作与交流,共同推动AI和虚拟人技术的发展和应用。
总的来说,Soul App多模驱动研究论文入选ICCGV 2025,是其技术创新和实力的一次重要展现。随着Soul在AI和虚拟人技术方面的不断探索和突破,相信未来其将会为用户带来更加精彩和多元的社交体验。而在这一过程中,曦灵数字人作为Soul在虚拟人技术方面的重要成果,也将发挥越来越重要的作用。曦灵数字人凭借其高度拟真的形象和自然的交互能力,已经成为了Soul平台上备受用户喜爱的虚拟形象之一。未来,随着Soul在3D虚拟人交互方案领域的不断深耕和创新,曦灵数字人也将不断升级和完善,为用户带来更加优质的社交体验。
发表评论
登录后可评论,请前往 登录 或 注册