龙空技术网

没指纹DNA,只有音频能抓对人吗?卡耐基梅隆大学音频分析AI可以

量子位 49

前言:

如今咱们对“音频指纹技术”大致比较珍视,兄弟们都需要知道一些“音频指纹技术”的相关知识。那么小编也在网上网罗了一些关于“音频指纹技术””的相关内容,希望我们能喜欢,看官们快快来了解一下吧!

原作Simon Brandon

Root 编译自 World Economic Forum

量子位 出品 | 公众号 QbitAI

2014年有恶作剧的人不停打给美国海岸警卫队报假警。

那些人以为,没有指纹和DNA,只是个很短的电话录音,警方根本来不及找出打电话的位置。他们是不可能会被抓的。

然鹅,现在有了AI,音频分析技术已经到了前所未有的高度。

Rita Singh,是这一领域的顶尖科学家,工作于卡内基·梅隆大学的语言技术研究所。通过电话录音,她们团队可以准确地预测出打电话人的所有物理特征,包括身高、体重、年龄、面部特征等。甚至连对方的社会经济背景,收入水平,生理和精神健康都能判断出来。

△ 音频分析专家 Rita Singh

当美国海岸警卫队把2014年的报假警电话发给Singh的时候,Singh已经在音频识别这一领域研究了20年。

△ 美国海岸警卫队找到Singh团队前的公开求助信

美国海岸警卫队找到Singh后问,“告诉我们,(拿到这段音频)你可以干什么。”

“这启发了我,我开始思考,除了音频信号,我还可以用这个分析来做些什么?我可以给海岸警卫队多少关于这个假警的人什么样的有效信息?”Singh在接受Women in Tech Show播客采访时说。

你的声音会“出卖”你

Singh和她卡耐基梅隆的同事所研发的这套音频分析技术,可以找出人都听不出来的细微差别。

她们可以把音频切成毫秒的片段,然后用AI技术来梳理处理这些片段以寻找独特的标识。

比如说,你的声音透露了环境的信息。当你说话的时候,AI可以猜出你所在房间的大小,房间是否有窗户,墙体是什么材质的。

更不可思议的是,AI还可以根据当地电网的电压波动,判断出打电话的人的物理位置,以及是一天当中什么时间段打出的电话。

AI技术的引入,对于那些总是爱报假警的人来说是个坏消息。要知道,在美国报假警触犯了联邦法律,处罚很重而且还要进去蹲好几年。

Singh的技术大大减少了这类事件的发生,还快速准确地锁定了罪犯。现在这些人很快要面临庭审。

这些技术不仅仅用于抓报假警的人,还已经帮忙找出了骚扰儿童的联邦罪犯。

“那些被抓到的人在审讯的过程中,所说的信息和我们技术判断的结果高度吻合。”Singh说。

面部3D重构

Singh的团队最近解锁了新的技能:仅仅根据音频,预判罪犯的面部画像。

不过,现在她们还需要更努力,才能让庭审接受音频分析得到的结果。

目前,大家对音频分析依然存在很多质疑,所以音频无法作为可靠的证据。“现在,就像是1987年美国首个因DNA定罪的审判时期一样。”Singh说。

AI技术的发展速度都是指数级别的,可以预见到未来,音频分析将会用于法律定罪以外的领域。

最后,附原文链接:

— 完 —

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

标签: #音频指纹技术