没指纹DNA，只有音频能抓对人吗？卡耐基梅隆大学音频分析AI可以

量子位 09-25 49

前言：

如今咱们对“音频指纹技术”大致比较珍视，兄弟们都需要知道一些“音频指纹技术”的相关知识。那么小编也在网上网罗了一些关于“音频指纹技术””的相关内容，希望我们能喜欢，看官们快快来了解一下吧！

原作Simon Brandon

Root 编译自 World Economic Forum

量子位出品 | 公众号 QbitAI

2014年有恶作剧的人不停打给美国海岸警卫队报假警。

那些人以为，没有指纹和DNA，只是个很短的电话录音，警方根本来不及找出打电话的位置。他们是不可能会被抓的。

然鹅，现在有了AI，音频分析技术已经到了前所未有的高度。

Rita Singh，是这一领域的顶尖科学家，工作于卡内基·梅隆大学的语言技术研究所。通过电话录音，她们团队可以准确地预测出打电话人的所有物理特征，包括身高、体重、年龄、面部特征等。甚至连对方的社会经济背景，收入水平，生理和精神健康都能判断出来。

△ 音频分析专家 Rita Singh

当美国海岸警卫队把2014年的报假警电话发给Singh的时候，Singh已经在音频识别这一领域研究了20年。

△ 美国海岸警卫队找到Singh团队前的公开求助信

美国海岸警卫队找到Singh后问，“告诉我们，（拿到这段音频）你可以干什么。”

“这启发了我，我开始思考，除了音频信号，我还可以用这个分析来做些什么？我可以给海岸警卫队多少关于这个假警的人什么样的有效信息？”Singh在接受Women in Tech Show播客采访时说。

你的声音会“出卖”你

Singh和她卡耐基梅隆的同事所研发的这套音频分析技术，可以找出人都听不出来的细微差别。

她们可以把音频切成毫秒的片段，然后用AI技术来梳理处理这些片段以寻找独特的标识。

比如说，你的声音透露了环境的信息。当你说话的时候，AI可以猜出你所在房间的大小，房间是否有窗户，墙体是什么材质的。

更不可思议的是，AI还可以根据当地电网的电压波动，判断出打电话的人的物理位置，以及是一天当中什么时间段打出的电话。

AI技术的引入，对于那些总是爱报假警的人来说是个坏消息。要知道，在美国报假警触犯了联邦法律，处罚很重而且还要进去蹲好几年。

Singh的技术大大减少了这类事件的发生，还快速准确地锁定了罪犯。现在这些人很快要面临庭审。

这些技术不仅仅用于抓报假警的人，还已经帮忙找出了骚扰儿童的联邦罪犯。

“那些被抓到的人在审讯的过程中，所说的信息和我们技术判断的结果高度吻合。”Singh说。

面部3D重构

Singh的团队最近解锁了新的技能：仅仅根据音频，预判罪犯的面部画像。

不过，现在她们还需要更努力，才能让庭审接受音频分析得到的结果。

目前，大家对音频分析依然存在很多质疑，所以音频无法作为可靠的证据。“现在，就像是1987年美国首个因DNA定罪的审判时期一样。”Singh说。

AI技术的发展速度都是指数级别的，可以预见到未来，音频分析将会用于法律定罪以外的领域。

最后，附原文链接：

— 完 —

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

屏下光学指纹识别方案介绍和展望「刘延」