在2023年以前,数字人在影视、游戏等领域的应用较为广泛,主要采用视频技术和动画技术。然而,这些数字人无法与人类进行交互,或者只能实现预设好的交互方式,这无疑限制了它们的实用性和发展潜力。
然而,2023年的到来带来了转机。这年初AIGC由美国席卷全球,强势崛起,为数字人产业带来了新的发展机遇。
“2023年,数字人产品在市场逐渐增多,呈现爆发性趋势。”八点八数字创始人兼CEO耿广星感慨,在过去的一年里,随着一系列AI大模型的发布,AI在模拟人类思维方面取得了显著进展,让数字人在不同场景中的落地成为可能。
AI大模型凸显数字人思维层的核心价值
因此,耿广星认为,数字人的终极形态一定是具备全栈式交互能力的3D数字人。3D数字人不仅具备人类的思维和行为能力,而且能够根据环境变化和情感变化进行表演,从而提供更加真实、生动的用户体验。
3D数字人将成为,下一代互联网的交互入口
数字人技术是一种高度综合的技术领域,涉及图形图像、人工智能等多个领域的尖端技术。在图形图像方面,数字人技术包括图像建模技术、自动化绑定技术、动力学模拟技术、智能动画技术、实时渲染技术以及空间模拟技术。而在人工智能方面,数字人技术涵盖垂类个性化模型训练技术、声音复刻技术、动作行为生成技术、图像识别跟踪技术以及视频解析动作技术等等。
耿广星指出数字人面临的最大挑战和要求之一是不断满足用户的苛刻体验标准。为了突破数字人体验的限制,实现真实人类的完美模拟,他认为需要整个行业的公司共同努力,以开放的心态共享技术标准,促进合作,才能更好地发展和创新。
据耿广星介绍,八点八数字作为专注于3D数字人技术的公司,坚信3D数字人将成为下一代互联网的交互入口。他表示,用户需要一种全新、高效的交互方式,无论是在信息获取、内容生成、服务模式还是电商产品销售方面,而这种全新的交互载体就是AI数字人。
为了满足数字人的核心需求,八点八数字在数字人领域深耕多年,建立起了自己的技术优势。
首先,八点八数字已经完整搭建了数字人的技术和美术生态,为数字人生成大量高精度的训练素材,包括口型数据、表情数据和肢体动作数据。
其次,八点八数字采用了Transformer+TCN的神经网络架构训练出参数量达两亿的模型——AI运动行为生成系统。这套系统能模拟数字人在不同状态、不同语境情绪、不同空间环境下的行为和表情变化,实现虚拟人智能化表演。
最后,八点八数字采用了双引擎架构,以满足数字人在多场景、多终端和多平台应用的需求。既能满足虚拟数字人高精度的交互表现,又能满足数字人在某些场景下大规模高并发的一对一对话服务。
评论