AI数字人主播是怎么实现的?

武松
• 阅读 143

AI数字人就是把主播形象或者IP形象通过克隆系统克隆出来,他跟你的微表情、动作、音色都是一样的,就是克隆出一个数字化的主播和IP。

作为商家,以后要拍摄短视频,要直播带货,就不再需要真人主播了,真人主播对企业来讲不仅成本高,每天工作时间也有限,只需要把你的主播和IP形象克隆出一个数字人就可以了,一天出几百条视频,也可以7*24小时直播。

随着元宇宙概念的兴起,数字人变得更加引人注目,吸引了众多企业和资本的广泛兴趣和投资。

因为他们具有独特的优势:比如不需要休息,不会情绪波动,不请假,不需要薪水,也不会离职。可以全天候工作,成为代替真人出镜,或者帮助企业直播的忠实助手。也有很多公司、品牌把数字人做为自己的品牌代言人,以减少与真人代言人相关的风险。

比如天猫数字主理人AYAYI,百度发布的数字虚拟人希加加,与快餐巨头麦当劳展开了合作,一夜爆火的柳夜熙与娇韵诗合作等等。
数字人越来越多的走进了直播间,走到镜头前,那么,这些数字人都是如何实现的呢?

第一步:您需要录制主播正视镜头说话的5分钟高清视频,上传到青否数字人saas系统的克隆端(这里:zhibo175)

包括两种训练素材和推理素材

一、训练素材录制要求

1、视频时长

训练素材要求5-10分钟;

2、拍摄要求

推荐直接用剪映录制,如果用相机更好;

分辨率要求 >= 1080*1920(推荐分辨率为4K),fps不能低于25帧;

拍摄主要影响因素是噪音,其次是灯光。

3、噪音

录制时要求环境安静不能有噪音,爆音,回音,最好选择安静的环境拍摄,有降噪麦克风。

4、灯光

灯光要求保证人物脸部,嘴巴,牙齿等五官细节清晰可见,光线均匀,无阴影。

5、视频画面

人物头像不能超过屏幕1/3,人脸尺寸大于300*300px;录制时推荐绿幕背景,后期可以更换各种背景;绿幕平整无褶皱,人距离绿幕2米远。
AI数字人主播是怎么实现的?
6、口播内容

内容不限,推荐选模特熟悉的内容,准备6000字文稿;讲的过程说错也没关系,继续讲就可以;千万不要一直说重复的内容。

7、服饰妆造注意事项

避免反光材质衣物;避免半透丝纱材质衣物;避免蕾丝材质的衣物;避免与绿幕相近的衣物以及绿色元素;

首饰:避免佩戴宽松易滑动晃动的首饰,比如项链、容易晃动的耳环(耳钉是可以的)、带链子的眼镜;

妆发:妆容自然得体,头发整理好避免出现散发碎发以及发缝;

8、人物动作

动作自然,与应用场景匹配;动作尽量通用,避免指向性动作;手不挡脸,抬手不过肩;表情动作自然,避免大角度侧脸;避免身体晃动,避免大幅度和迅速的动作;

口播时,嘴巴注意张开,口齿清晰,发音标准,说话速度不能太快;避免舔嘴,吞咽,撅嘴,皱眉,摸头,摸脸等小动作。

9、其他注意事项

人物面部不能有遮挡,灯光要求脸部轮廓,牙齿嘴唇清晰可见;人物不能过分瘦脸,美白,可能造成轮廓不清晰

二、推理素材录制要求

1、 拍摄要求同训练视频一致;

2、 素材要求20-30s;

3、录制过程中全程静默,不说话,前5s不动,中间做通用手势,肢体动作,表情动作自然,后5s不动。

拍摄完成之后,将视频上传到青否数字人SaaS系统的克隆端。

第二步:根据青否数字人SaaS系统(🌏:zhibo175)提供的超详细课程,针对主播形象自动进行克隆训练。

克隆出的数字人主播妆容、神情、动作与真人主播100%一致,完美还原真人主播的微表情,动作和声音。克隆后的数字人保证了企业IP的唯一性和稳定性。

以上就是克隆数字人的详细教程。

二.数字人的声音也很重要,数字人一般有两种驱动方式,一种是文本驱动,一种是真人声音驱动。

1.文本驱动是用AI合成的声音输出来配合数字人,青否数字人系统可以输出最多140种语言,服务全球用户,可选择301种音色,还可以克隆出来你的专属音色,满足不同类型的主播需求。

2.AI合成的声音还有一种更高级的存在,就是克隆自己的声音,用自己克隆的声音匹配自己的数字人模型,口型匹配度非常高,数字人更容易达到以假乱真的水平,但声音克隆的成本在时面上比较高,一般费用要8000元或更多,而青否数字人独立部署之后无限克隆声音,没有其他的收费。

以上是通过青否数字人系统源码克隆数字人的步骤,可以是用数字人进行24小时不间断直播,成为众多数字人主播的一员!

点赞
收藏
评论区
推荐文章
Aidan075 Aidan075
4年前
2000万条直播数据,揭秘斗鱼主播生存现状
前言:《凹凸数读》新文章已发,可以先看数据分析结果再回来看过程:2019年7月17日游戏直播平台斗鱼在美国纳斯达克股票交易所成功上市,成为继虎牙直播之后第二家赴美上市的国内直播平台。7月底斗鱼因为平台主播“乔碧萝殿下”事件再次被推上热搜。段子手们纷纷调侃成为主播的门槛之低:只需要变声软件盗图超级美颜。那么直播行业真的如同网友们所说的这
巨量星图发布直播间业务流程让买卖更简易
巨量星图直播间业务流程将聚集抖音短视频、今日今日头条和西瓜小视频所有主播资源。此次发布为1.0版本号,早期对外开放抖音主播。现阶段,第一批抖音短视频Top直播间大咖已进驻。顾客根据「我的星图」「直播主播」「抖音主播」点一下,就可以进到。直播间买卖步骤和小视频买卖同样,顾客在网络主播城市广场挑选大咖、选购网络主播并填好每日任务规定,即进行提交订单。履单全过程中
Wesley13 Wesley13
3年前
P2P技术如何拯救一家直播网站
!(https://oscimg.oschina.net/oscnet/23810a4a1fef4d659388100f4228782b.jpg)众所周知运维成本是直播网站最大的成本组成,运维成本则主要体现在带宽,而伴随主播与用户对视频清晰度以及连麦的需求不断提升,直播带宽也在与日俱增。本文整理自学霸君音视频技术负责人袁荣喜在LiveVi
Wesley13 Wesley13
3年前
IP地址分类
IP地址编址方案:IP地址编址方案将IP地址空间划分为A、B、C、D、E五类,其中A、B、C是基本类,D、E类作为多播和保留使用。介绍:Internet上的每台主机(Host)都有一个唯一的IP地址。IP协议就是使用这个地址在主机之间传递信息,这是Internet能够运行的基础。IP地址的长度为32位(共有2^32个
Wesley13 Wesley13
3年前
P2P技术如何将实时视频直播带宽降低75%?
本文内容来自学霸君资深架构师袁荣喜的技术分享。1、前言实时视频直播经过去年的千播大战后已经成为互联网应用的标配技术,但直播平台的成本却一直居高不下,各个平台除了挖主播、挖网红以外,其背后高额的带宽费用也是他们最大的一块成本。现阶段直播技术在传输方面分为两块:CDN:负责流媒体的分发传输;连麦系统:负责解
Stella981 Stella981
3年前
B站的“前浪” idol,为快手喊了一声“奥利给”
我是在B站的“土味视频”中看到“奥利给”,阿里的朋友前阵子频繁发我看奥利给,这位自称是“朝阳怪鸽”的快手主播,脸型和说话都像我们的一位共同朋友。没有青春,没有MCN机构资源,所以许多快手主播,为了博出位,几乎是不疯癫不成活。我不玩快手,因为自己和太太都是农村出来的,农村有根,也在湖南几处乡村做助学,我们深知快手上许多主播背后的乡土辛酸,生活不易。
虚拟数字人开发哪家好?广州华锐互动元宇宙定制助力品牌营销!
近两年,元宇宙概念下的虚拟数字人不断崛起。虚拟数字人是利用计算机数字建模技术模拟人物形象;利用动作捕捉,面部捕捉等技术模拟真实人物表情,眼神与嘴形;并具有语音识别、语义理解,模拟真人发音说话的AI能力的机器人。“十八般武艺”的虚拟数字人吸引了数以亿
虚拟人物多少钱能做出来?虚拟数字人定制广州华锐互动
近几年,元宇宙(https://www.xrnew3d.com/yyz.html)相关产业迎来大爆发,“虚拟人”的概念也由之催生。虚拟主播、虚拟偶像、虚拟游戏角色相继出现,并受到人们的追捧,越来越多的虚拟数字人进入了大众视野,似乎已成融入到我们的生
音视频直播场景下不同的观众如何获取合流布局中各主播的位置
主要思路步骤:1、设置合流布局的操作由主播完成,当主播合流布局设置成功后,可以将各个主播在合流布局中的位置尺寸存放在房间的KV属性中;2、主播每次设置合流都去更新这个KV并通知给房间内的其他人,观众获取到KV后,根据KV中的尺寸数据与观众手机上渲染视图的大
胡赤儿 胡赤儿
1年前
AI主播:未来媒体的颠覆者
人工智能技术的迅猛发展正在为各行各业带来革命性的变革,其中包括传媒领域。AI主播作为传统主播的新兴形式,已经逐渐引起了人们的关注。它不仅能够准确地模仿人类主播的语音和表情,还能够借助深度学习和自然语言处理技术,自动生成新闻报道、解说比赛以及进行其他形式的节
组播基本概念
组播传输作为IP数据传输的三种方式之一,是指接收者的数量和位置在源端主机不知道的情况下,仅由源发出一份组播报文,向目标组播IP地址发送数据的过程。其特点有:
武松
武松
Lv1
如果哪天可不可以把我给你的温柔还给我
文章
5
粉丝
0
获赞
0