知我数字人
国内首家仿真人数字人技术公司
真人视频复刻
利用计算机视觉、图像处理、动作捕捉等人工智能技术,在外观形象、行为表达、传播交互等维度创建看起来完全真实的场景和角色形象
嘴型音画对齐
将数字人的嘴部动作与所说的话的声音相匹配,保证人物说话时嘴型与声音同步,肢体动作自然,声音和本人相仿,普通观众难辨真假
情感语音生成
数字人情感语音生成技术通常采用深度学习技术,达到不同情感下语音的声学特征,并根据这些特征生成相应的语音,增强文本演绎的生动性和感染力
智能对话引擎
采用自然语言处理技术和机器学习算法来实现对话过程,捕捉到用户的情感表达的同时,使得对话更加贴近用户的情感状态,从而更好地理解用户需求,提供更个性化的服务
智能知识图谱
用人工智能技术的知识表示和语义分析方法,旨在通过将知识组织成图形化结构,实现多维度、全面的知识表达和联结
把普通用户变为可互动的数智人
产品以100亿参数的大语言模型为智能问答基础,支持用户快速植入自定义知识
仅用 分钟
0
独特的pre-trained人物视频合成模型
可以在消费级PC上实现任何人的“数字分身1分钟创作”;知我科技之所以能完成pre-trained模型,除了多年的模型开发积累,还得益于过去数年内真实人物数据的积累。
视频+声音模型深度工程化升级
知我科技对人物视频合成模型和声音合成模型进行了深度工程化升级,通过网络重新设计、蒸馏、剪枝等方式,使得AI人物嘴型、动作、和声音数据的推理合成可以在消费级PC上实时实现。通过这种方式我们极大的降低了用户的使用成本
数字人端到端方式的模型驱动
知我科技原创的数字人驱动模型,不同于简单的模型级联,是一种端到端的模型实现,可以保留各个模型中全部的推理信息,做到意图情感不丢失。通过这种方式,可以让单张图片,实现唇形、面部表情、头部、和上半身协调运动。
基于 RLHF技术的大语言模型训练
Human feedback是知我已有用户的使用行为数据,包括产品使用、停留时长、互动问答、下单转化。知我科技已经实现了不依赖于openAI接口的百亿参数的大语言模型finetuning。和openAI模型相比,知我科技的LLM模型可以以更符合中国直播场景的方式合成语言,也可以植入客户的专属知识,实现“每个客户都有自己的GPT”。
技术优势
TECHNICAL ADVANTAGES
数字人+美容美发
数字人全场景渗透
数字人+在线教育
数字人+本地生活
数字人+电商销售
数字人+旅游酒店
数字人+影视娱乐
数字人+地产装修
数字人+动画设计
数字人+知识付费
|
|