龙空技术网

计算机如何“长眼睛耳朵”的?

码上咖啡馆 93

前言:

目前姐妹们对“每一秒钟声音60”大概比较关心,大家都需要分析一些“每一秒钟声音60”的相关资讯。那么小编也在网络上收集了一些关于“每一秒钟声音60””的相关知识,希望大家能喜欢,你们一起来了解一下吧!

大家好,我们都知道,对于计算机来讲,所有东西都是由0和1组成的,那么,这一堆0和1是怎么成了我们看到的文字,视频和图片的呢?

其实这堆0和1和我们的语言是一个道理,比如说我们生活中的一个水果”苹果”在中文里面的表示是“苹果“,在英文里面是用”apple“来表示的而在日文里面是用”りんご”来表示的。

现实实物

虽然他们表示方式不一样但是“苹果“,”apple”和”りんご”都是指水果”苹果“。

也就是说虽然语言不同,表示一个东西的形式不同,但是这些语言都有自己的规则,比如中文里苹果就是苹果,英文里面苹果就是apple。那么计算机也一样,虽然在我们看来是一堆毫无规律组合起来的0和1但是它们也有相应的规则,这个规则相对于计算机来说就是编码表,这个编码表就像我们小时候用的识字表一样,这个编码表就包含了我们看到的文字,标点符号等等所对应的各种信息。

编码表

虽然他们表示方式不一样但是“苹果“,”apple”和”りんご”都是指水果”苹果“。

也就是说虽然语言不同,表示一个东西的形式不同,但是这些语言都有自己的规则,比如中文里苹果就是苹果,英文里面苹果就是apple。那么计算机也一样,虽然在我们看来是一堆毫无规律组合起来的0和1但是它们也有相应的规则,这个规则相对于计算机来说就是编码表,这个编码表就像我们小时候用的识字表一样,这个编码表就包含了我们看到的文字,标点符号等等所对应的各种信息。

黑白图片

所以图片像素点的二进制位越多的话这个像素点可以表示的颜色就越丰富,比如一个像素点是两个进制位的,那么对于计算机来说这个像素点要么是00要么是11要么是10要么是01这几种情况,也就是说这个像素点可以表示4种颜色。

每个像素点8个二进制位

然后以此类推,当一个像素点是8个二进制位的时候,这个图片每个像素点都有256种颜色可以显示,这个就是图片在计算机内部的情况。

因为视频本质上就是一张张连续播放的图片,所以视频和图片是一个道理。

那么,我们的声音又是如何变成0和1的呢?

比如我用麦克风录制了一段10秒的声音,声音的波形我们都知道它是一个光滑的曲线

真实声音曲线

而我们计算机就是要尽可能把这个光滑的曲线在电脑上给模拟出来。

那么第一步要做的是对这个曲线做采样工作,比如计算机每秒钟对这个声音采样一次,采样完成之后,计算机就把这10秒中的声音在电脑上模拟出来了

采样模拟曲线

那么这个时候我们就会发现,模拟出来的这个波形和我们原始的波形相差非常大,也就是说电脑模拟出来的声音和我们的原始声音会有很大的差别,那要怎么样才能让模拟出来的声音曲线尽可能向原声曲线一样呢?

那么这个时候我们就可以提高计算机采样的频率了,从之前的一秒一次提高到一秒两次,总之就是计算机采样频率越高计算机模拟出来的波形就越逼近声音的真实曲线,也就越能还原出真实的声音。

提高采样频率的模拟曲线

第二步,把刚才模拟出来的曲线进行量化,那量化是什么意思呢?

就像我们的考试成绩一样,有51,60,63,65,80,99这些分数,但是在公布成绩的时候学校发现分数太多,一个一个公布太麻烦,然后学校规定,60分以下的不合格,60-70分为合格,71-100为优秀。把这些不同的分数分成3个不同的等级,之后学校公布成绩的时候就说我校不合格人数为10人,成绩合格人数为60人……,这就是我们说的量化。

量化过程

最后一步,编码。

在完成量化以后,我们假设量化等级一级等于0001,二级等于0011然后以此类推,依次把这些等级记录成对应的0和1就可以了。

编码过程

到此,计算机就完成了把听见的声音转化为数字的过程。

这就是计算机“能看能听“的秘密所在。

标签: #每一秒钟声音60