相关热词搜索:
计算机技术论文:计算机音频处理
计算机技术论文:计算机音频处理 计算机音频处理全文如下:摘要:现代音频技术已经步入数字处理阶段,计算机的多媒体功能为音频 处理提供了很多方便实用的方法,通过这些方法,我们可以让声音听上去更悦耳, 更具有感染力,数字处理的优势被充分体现出来。
关键词:声音三要素;音频属性;音频处理;音频格式 计算机对所有音频资料的处理过程,像录制、编辑、存储、播放,都 是数字化的。我们要了解计算机音频的处理过程,就需要对音频属性和计算机处 理过程进行一些基础性的了解才行。
先来认识下自然界的声音:
声音是一种振动,振动速度有快有慢,幅度有大有小。这是平时容易 混淆的两个属性,振动幅度和音量相关,振动快慢即频率,它与音调相关,振幅 越大音量越高,频率越快音调越高。它们构成声音的要素:响度、音高。声源振 动的各种成分(基音和泛音)决定了它的听觉感受,也就是音色。响度、音高和音 色是声音的三要素。
响度是比较容易理解的一个概念,它和我们常说的音量相关。音调就 是音高,我们常说的高音、中音、低音就是音调的高低。而各种高、中、低音成 分的组成就构成了音色。每一个人对声音的敏感度都不相同,大部分人可以感知 的声音振动频率范围是20Hz~20kHz。世界上没有完全相同的两片树叶,也不存 在相同的耳朵,每一个人对同一音响的感受都是不完全相同的。
计算机软件就是要对上述的声音三要素进行处理,进而改变我们的听 觉感受。
响度处理:录音制品音量各有不同,我们平时剪辑制作通常会考虑到 它的最大值,控制它不要达到数字设备满刻度电平0dBfs。如果超出这个范围, 会使超出部分强制削减到满刻度,就造成削波失真,如果比较严重,录制的声音 就会严重劣化,听起来非常刺耳。我们有时会遇到一些情况,来自网络上的音乐, 声音明明没有达到0 dBfs,却能感受到失真的存在。这是因为音频在剪辑存储时 削波失真了,而再剪辑时调整了音量,这样乍一看音量没有超出范围,而音质依然是受损的。音频在削波失真时,除了感受到声音能量增大外,还存在激发出的 一些附加的频率成分,它们的存在会影响我们的听觉感受,即便音量下调,这些 附加频率成分不会消失。
许多朋友个人录制的音频时会注意音量表,控制音量值不超标,而决 定音量和听觉感受的不只是最大值,还有整段音频音量的最小值,这就可以引入 另一个概念——动态范围。一般情况下,稿件中起伏较大,情感基调有变化,这 样的音频录制出来动态范围会比较大,对这样的音频保证不失真,不做动态处理, 在很多时候听起来音量会偏低。现代音乐创作,基本上都会对动态范围加以控制, 减小动态,来获取相对一致的音量感受。
音调处理:现在有些音频制作可以作变调处理,适当修正音调,或者 模拟童声,模拟汽车由远而近的行驶过程的音调变化——多普勒频移。有了这些 工具,我们就可以适当修正歌唱时的跑调,也可以模拟儿童的声音或者古怪的外 星人、机器人的声音,运动过程中的声音也可以被恰当地模拟出来。
音色处理:这几乎是所有音频工作者必须面对的一个问题——均衡。
每种声源都有自身的频率成分,基音、泛音共同构成一个具有自身特点的声音。
就用声来说,有些人天生具有理想的音色,而有些人先天声音条件不理想,后天 的训练可以适量改善,与生俱来的声音质感是一种恩赐,不可强求。音频处理中 有对音色调整的效果,典型的图示均衡器可以适度改变声音成分,降低缺陷声, 强化质感成分。各种滤波器,可以整段消除不需要的成分,也可以模拟频带很窄 的电话语声。
混响与延时是对声音的另一种修饰,适度使用可以增强空间感,增加 欣赏性,但会相应降低可懂度。主流的音频制作都会考虑适当地使用这些效果, 以增加作品的艺术感染力。
声音像其他的振动波一样,在传播过程中会干涉、衍射、折射,多个 相干声源间存在相互影响。立体声节目的相位是必须考察的问题。引进节目的相 位也要用合适的监听设备认真审听,软件辅助查看。
以上针对于声音的处理都存在相应的设备,比如对音量处理的压限器、 动态处理器、音频处理器,音调处理的有变调器,音色处理的有均衡器、陷波器, 还有延时器、混响器、环绕激励器等。音频录制软件中都有对应的效果或插件, 可以适度调节,用于改善音色、提高音频指标。音频处理最好用频响曲线相对平滑的专业设备,否则会造成音频处理不准确,影响各个环节的音频质量。最坏的 情况是用单声道监听,立体声节目两声道间存在反相,制作剪辑时音频听起来都 正常,而在立体声放音时两声道许多频率成分相互抵消,播放效果非常糟糕。
下面讲讲我们录制中常见的问题。
我们的录制包括话筒、调音台、计算机、声卡、录制软件,是一套完 整的系统。每一种设备都有自己的工作参数,严格按照指标设定才能获得现有条 件下的最优效果。
比如说话筒的典型参数:
指向特征:全向型、心型、超心型 等,这就要求录制时保持话筒的 最佳角度。
收音头:动圈式、电容式 ,话筒的工作方式决定了所采集声音的效 果,一般情况下,电容式话筒的整体表现要好些。
灵敏度:1.5 mV/Pa±3dB ,这个参数是考量录音人的声音响度识别起 点,决定了录音的动态范围。
频率范围及响应曲线:80-15000Hz ,它给出了声音识别的频率范围, 不同频率响应的话筒录制出的声音也是有很大差别的。
产品声道:立体声 ,它决定了声音录制的相位特征。
产品阻抗:350欧姆 ,它影响设备连接的驱动响应特征,不能匹配的 设备连接不能工作或者不能达到理想效果。
此外,话筒有一种邻近效应,是用近传声技术提升低音的效应,即话 筒置于离声源几厘米的位置。在某些场合此效应会产生某些歌手喜欢的强烈丰满 的声音,但有许多场合必须控制或完全避免低音提升,例如,在记录谈话时。邻 近效应可能使谈话不可懂。有些话筒装备了低音滤波器以补偿邻近效应,如 Sennheiser MD 421和MD 441、AKG SolidTube和C 414 B-ULS。
接下来让我们认识一下常见的音频格式,熟悉我们常用的播出格式, 了解这些格式的常见属性,避免不合格的音频在播出中使用。多媒体技术催生了上百种格式、规范、编码方式,现在我们日常能接 触到的格式有WAV、MP3、WMA、MIDI等,还有一些音乐发烧友乐于选择APE、 FLAC等无损压缩格式。音频采集会占用大量的存储空间,且依赖于存储设备的 读写速度,由此引入了音频数据压缩这个概念。我们现在的播出,比较常用的有 MP3压缩格式。MP3属于有损压缩,这种编码方式,压缩比越大,高频损失越明 显,声音听起来发飘,明亮度下降,这是因为频谱中的高频部分(通常16kHz以上) 损失随比特率的下降而损失。MP3格式最高比特率可以达到320 kB/s,互联网上 常见的MP3音乐比特率为128kB/s,这样的音乐音频损失就点大了,还有一些连 这种基本要求都达不到。比特率只反应了互联网音乐的一个层面,还有其他形式 变化带来的影响,一些非专业的转码,简单提升音量,或者通过其他方式多次数 字转换造成音频失真并产生附加的音频衍生物。
录制软件在使用前,应先测试环境音的噪音情况,校正好正常的录音 电平,留有适度的余量,避免大的失真,适度采噪降噪。效果处理不同人有不同 见解,都有自己的欣赏力,根据情况适度应用,要考虑播放时的可懂度。音频响 度处理,最好用动态控制,不要一味地强行提升,避免削波失真。许多不良插件 会造成不好的声音衍生物,非认证的插件谨慎使用。存储时采用合适的格式和参 数,一次不当的存储设置会造成下次使用时保持这种错误状态。
我们日常会用到一些不是我们常用的格式,或者编在影视中的音频, 这时我们需要转换格式。转换前首先要考虑这段音频的品质是否基本合适,非常 低品质的音频不要使用,一定不要把低品质的音频强行调高它的参数,使得到的 成品看上去指标不错,实际上音质依然很差。转换输出参数会影响最终效果,适 量提高转换质量。
对于许多专业人员,听是常用的手段之一,音量旋钮与真实的响度之 间最好形成一种心理刻度。轻微的失真通常不会被大部分人注意,没有经过训练 的耳朵听不出声音的缺陷,我们需要经常留意设备的音量指示,有异常情况学会 辨认。