「蚂蚁呀嘿」克星来了!中科院23岁博士生开发「听音识人」,准确率近90%
转自:新智元
看脸和声音是否匹配,这种黑科技如今走向了现实。中科院计算所23岁的博士生温佩松主导开发出一种「听音识人」的 AI 技术,只需1秒就能将声音和正确人脸进行匹配,准确率接近 90%。
「AI换脸」技术实际上蕴含着巨大的风险,只需上传一张照片,就可以让你的脸随着音乐蚂蚁呀嘿,欢乐的同时,也让人无从判断视频的真伪。
阿里安全图灵实验室的资深算法专家认为这项工作能够有效地降低伪造视频的风险,帮助公众进行辨别,保护用户的财产和信息安全。目前该研究成果已被 CVPR2021接收。
据温博士说,灵感来源于一个综艺节目,节目里川大教授听声音就可以判断长相。
经过调研以后,发现事情可行,当即开展了工作,主要研究方法就是找数据,搭模型。
主要创新点在于
1、引入一个两阶段模态对齐的损失函数,把局部信息和全局信息都引入进来
2、引入动态reweighting 模式来发现不同对象之间的多样性
对于不同的匹配对来说,难度也是不同的(声优伪装?)。
主要的模型架构也是首先对face和voice分别进行编码,然后通过三个损失函数进行训练。
用到的数据集主要从VoxCeleb和VGGFace中构造。
道高一尺魔高一丈,如今声音也是可以通过模拟,例如高德导航的各种明星语音,也许未来还会有更强大技术的出现来对抗。
后台回复:voice 获取论文链接
重磅!DLer-AI顶会交流群已成立!
大家好,这是DLer-AI顶会交流群!首先非常感谢大家的支持和鼓励,欢迎各位加入DLer-AI顶会交流群!本群旨在学习交流人工智能顶会(CVPR/ICCV/ECCV/NIPS/ICML/ICLR/AAAI等)、顶刊(IJCV/TPAMI/TIP等)写作与投稿事宜。包括第一时间发布论文信息和公开演讲视频,以及各大会议的workshop等等。希望能给大家提供一个更精准的研讨交流平台!!!
添加请备注:AI顶会+学校/公司+昵称(如CVPR+上交+小明)
??长按识别添加,即可进群!
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线