`

转:各种音频编码方式的比对

阅读更多
各种音频编码方式的比对
参考网址:http://www.cppblog.com/fwxjj/archive/2009/05/27/85918.html

http://jaist.dl.sourceforge.net/project/mpc-hc/MPC%20HomeCinema%20-%20x64/MPC-HC_v1.6.6.6957_x64/MPC-HC.1.6.6.6957.x64.zip

http://universal-downloader-us.softonic.cn/72000/72054/2de50/FFSetup3-0-1.zip?AWSAccessKeyId=AKIAI3PLJSNQNUAKP42Q&Expires=1366665942&Signature=Gz842su9iIDln%2F1IbKCC2dMF5ww%3D&id_file=72054&id_cob=600&browser=Chrome&country=CN&channel=WEB&instance=softonic_zh&pageview_id=bd59ea6ff68ba4b863fffb7f740377d4&SD_used=0&file=%2FFFSetup3-0-1.zip

PCM编码(原始数字音频信号流)
类型:Audio
制定者:ITU-T
所需频宽:1411.2 Kbps
特性:音源信息完整,但冗余度过大
优点:音源信息保存完整,音质好
缺点:信息量大,体积大,冗余度过大
应用领域:voip
版税方式:Free
备注:在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用。因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数bps。一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为 44.1K×16×2 =1411.2Kbps。我们常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。

WMA(Windows Media Audio)
类型:Audio
制定者:微软公司
所需频宽:320~112kbps(压缩10~12倍)
特性:当Bitrate小于128K时,WMA几乎在同级别的所有有损编码格式中表现得最出色,但似乎128k是WMA一个槛,当Bitrate再往上提升时,不会有太多的音质改变。
优点:当Bitrate小于128K时,WMA最为出色且编码后得到的音频文件很小。
缺点:当Bitrate大于128K时,WMA音质损失过大。WMA标准不开放,由微软掌握。
应用领域:voip
版税方式:按个收取
备注:WMA的全称是Windows Media Audio,它是微软公司推出的与MP3格式齐名的一种新的音频格式。由于WMA在压缩比和音质方面都超过了MP3,更是远胜于RA(Real Audio),即使在较低的采样频率下也能产生较好的音质,再加上WMA有微软的Windows Media Player做其强大的后盾,所以一经推出就赢得一片喝彩。

ADPCM( 自适应差分PCM)
类型:Audio
制定者:ITU-T
所需频宽:32Kbps
特性:ADPCM(adaptive difference pulse code modulation)综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。
它的核心想法是:
①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值;
②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。
优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)
缺点:声音质量一般
应用领域:voip
版税方式:Free
备注:ADPCM (ADPCM Adaptive Differential Pulse Code Modulation), 是一种针对16bit (或者更高?) 声音波形数据的一种有损压缩算法, 它将声音流中每次采样的 16bit 数据以 4bit 存储, 所以压缩比 1:4而压缩/解压缩算法非常的简单, 所以是一种低空间消耗,高质量声音获得的好途径。

LPC(Linear Predictive Coding,线性预测编码)
类型:Audio
制定者:
所需频宽:2Kbps-4.8Kbps
特性:压缩比大,计算量大,音质不高,廉价
优点:压缩比大,廉价
缺点:计算量大,语音质量不是很好,自然度较低
应用领域:voip
版税方式:Free
备注:参数编码又称为声源编码,是将信源信号在频率域或其它正交变换域提取特征参数,并将其变换成数字代码进行传输。译码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。具体说,参数编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的准确性,但重建信号的波形同原语音信号的波形可能会有相当大的差别。如:线性预测编码(LPC)及其它各种改进型都属于参数编码。该编码比特率可压缩到2Kbit/s-4.8Kbit/s,甚至更低,但语音质量只能达到中等,特别是自然度较低。

CELP(Code Excited Linear Prediction码激励线性预测编码)
类型:Audio
制定者:欧洲通信标准协会(ETSI)
所需频宽:4~16Kbps的速率
特性:改善语音的质量:
① 对误差信号进行感觉加权,利用人类听觉的掩蔽特性来提高语音的主观质量;
②用分数延迟改进基音预测,使浊音的表达更为准确,尤其改善了女性语音的质量;
③ 使用修正的MSPE准则来寻找 “最佳”的延迟,使得基音周期延迟的外形更为平滑;
④根据长时预测的效率,调整随机激励矢量的大小,提高语音的主观质量;
⑤ 使用基于信道错误率估计的自适应平滑器,在信道误码率较高的情况下也能合成自然度较高的语音。
结论:
① CELP算法在低速率编码环境下可以得到令人满意的压缩效果;
②使用快速算法,可以有效地降低CELP算法的复杂度,使它完全可以实时地实现;
③CELP可以成功地对各种不同类型的语音信号进行编码,这种适应性对于真实环境,尤其是背景噪声存在时更为重要。
优点:用很低的带宽提供了较清晰的语音
缺点:-
应用领域:voip
版税方式:Free
备注:1999年欧洲通信标准协会(ETSI)推出了基于码激励线性预测编码(CELP)的第三代移动通信语音编码标准自适应多速率语音编码器(AMR),其中最低速率为4.75kb/s,达到通信质量。CELP码激励线性预测编码是Code Excited Linear Prediction的缩写。CELP是近10年来最成功的语音编码算法。CELP语音编码算法用线性预测提取声道参数,用一个包含许多典型的激励矢量的码本作为激励参数,每次编码时都在这个码本中搜索一个最佳的激励矢量,这个激励矢量的编码值就是这个序列的码本中的序号。
CELP已经被许多语音编码标准所采用,美国联邦标准FS1016就是采用CELP的编码方法,主要用于高质量的窄带语音保密通信。CELP(Code-Excited Linear Prediction) 这是一个简化的 LPC 算法,以其低比特率著称(4800-9600Kbps),具有很清晰的语音品质和很高的背景噪音免疫性。CELP是一种在中低速率上广泛使用的语音压缩编码方案。

MPEG-1 audio layer 1
类型:Audio
制定者:MPEG
所需频宽:384kbps(压缩4倍)
特性:编码简单,用于数字盒式录音磁带,2声道,VCD中使用的音频压缩方案就是MPEG-1层Ⅰ。
优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。可以达到“完全透明”的声音质量(EBU音质标准)
缺点:频宽要求较高
应用领域:voip
版税方式:Free
备注:MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次:
--层1(Layer 1):编码简单,用于数字盒式录音磁带
--层2(Layer 2):算法复杂度中等,用于数字音频广播(DAB)和VCD等
--层3(Layer 3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍

MUSICAM(MPEG-1 audio layer 2,即MP2)
类型:Audio
制定者:MPEG
所需频宽:256~192kbps(压缩6~8倍)
特性:算法复杂度中等,用于数字音频广播(DAB)和VCD等,2声道,而MUSICAM由于其适当的复杂程度和优秀的声音质量,在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用。
优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。可以达到“完全透明”的声音质量(EBU音质标准)
缺点:
应用领域:voip
版税方式:Free
备注:同MPEG-1 audio layer 1

MP3(MPEG-1 audio layer 3)
类型:Audio
制定者:MPEG
所需频宽:128~112kbps(压缩10~12倍)
特性:编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍,2声道。MP3是在综合MUSICAM和ASPEC的优点的基础上提出的混合压缩技术,在当时的技术条件下,MP3的复杂度显得相对较高,编码不利于实时,但由于MP3在低码率条件下高水准的声音质量,使得它成为软解压及网络广播的宠儿。
优点:压缩比高,适合用于互联网上的传播
缺点:MP3在128KBitrate及以下时,会出现明显的高频丢失
应用领域:voip
版税方式:Free
备注:同MPEG-1 audio layer 1

MPEG-2 audio layer
类型:Audio
制定者:MPEG
所需频宽:与MPEG-1层1,层2,层3相同
特性:MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1、层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。
优点:支持5.1声道和7.1声道的环绕立体声
缺点:-
应用领域:voip
版税方式:按个收取
备注:MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1、层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。

AAC(Advanced Audio Coding ,先进音频编码)
类型:Audio
制定者:MPEG
所需频宽:96-128 kbps
特性:AAC可以支持1到48路之间任意数目的音频声道组合、包括15路低频效果声道、配音/多语音声道,以及15路数据。它可同时传送16套节目,每套节目的音频及数据结构可任意规定。
AAC主要可能的应用范围集中在因特网网络传播、数字音频广播,包括卫星直播和数字AM、以及数字电视及影院系统等方面。AAC使用了一种非常灵活的熵编码核心去传输编码频谱数据。具有48个主要音频通道,16 个低频增强通道,16 个集成数据流, 16 个配音,16 种编排。
优点:支持多种音频声道组合,提供优质的音质
缺点:-
应用领域:voip
版税方式:一次性收费
备注:AAC于1997年形成国际标准ISO 13818-7。先进音频编码(Advanced Audio Coding--AAC)开发成功,成为继MPEG-2音频标准(ISO/IEC13818-3)之后的新一代音频压缩标准。
在MPEG-2制订的早期,本来是想将其音频编码部分保持与MPEG-1兼容的。但后来为了适应演播电视的要求而将其定义成为一个可以获得更高质量的多声道音频标准。理所当然地,这个标准是不兼容MPEG-1的,因此被称为MPEG-2AAC。换句话说,从表面上看,要制作和播放AAC,都需要使用与MP3完全不同的工具。

HR
类型:Audio
制定者: 飞利浦
所需频宽:8Kbps
特性:以增加GSM网络容量为目的,但是会损害语音质量;由于现在网络频率紧缺,一些大的运营商已经在大城市密集地带开通此方式以增加容量。
优点:系统容量大
缺点:语音质量差
应用领域:GSM
版税方式:按个收费
备注:HR半速率,是一种GSM语音编码方式。

FR
类型:Audio
制定者:飞利浦
所需频宽:13Kbps
特性:是一般的GSM手机的通信编码方式,可以获得达到4.1左右Qos的语音通信质量(国际电联规定语音通信质量Qos满分为5)
优点:语音质量得到了提高
缺点:系统容量降低
应用领域:GSM
版税方式:按个收费
备注:FR全速率,是一种GSM语音编码方式

EFR
类型:Audio
制定者:飞利浦
所需频宽:13Kbps
特性:用于GSM手机基于全速率13Kbps的语音编码和发送,可以获得更好更清晰的语音质量(接近Qos4.7)需要网络服务商开通此项网络功能,手机才能配合实现。
优点:音质好
缺点:需要网络服务商开通此项网络功能,且系统容量降低
应用领域:GSM
版税方式:按个收费
备注:EFR增强型全速率,一种GSM网络语音的编码方式。

GSM-AMR(Adaptive Multi-Rate)
类型:Audio
制定者:飞利浦
所需频宽:8Kbps(4.75 Kbps~12.2 Kbps)
特性: 可以对语音进行替换和消音,平滑噪音,支持间断式传输,对语音进行动态侦查。能在各种网络条件下提供优质的语音效果。
优点:音质出色
缺点:-
应用领域:GSM
版税方式:按个收费
备注:GSM-ASM是一种广泛使用在GPRS和W-CDMA网络上的音频标准。在规范ETSI GSM06.90中对GSM-AMR进行了定义。AMR语音编码是GSM2+和WCDMA的默认编码标准,是第三代无线通讯系统的语音编码标准。GSM-AMR标准基于ACELP(代数激励线性预测)编码。它能在广泛的传输条件下提供高品质的语音效果。

EVRC(Enhanced Variable Rate Coder,增强型可变速率编码器)
类型:Audio
制定者:美国Qualcomm通信公司(即高通)
所需频宽:8Kbps或13Kbps
特性:支持三种码率(9.6 Kbps, 4.8 Kbps 和 1.2 Kbps),噪声抑制,邮件过滤。能在各种网络条件下提供优质的语音效果。
优点:音质出色
缺点:-
应用领域:CDMA
版税方式:按个收费
备注:EVRC编码广泛使用于CDMA网络。EVRC标准遵循规范TIA IS-127的内容。EVRC编码基于RCELP(松弛码激励线性预测)标准。该编码可以以Rate 1(171bits/packet),Rate1/2(80bits/packet)或是Rate1/8(16bits/packet)的容量进行操作。在要求下,它也能产生空包(0bits/packet)。

QCELP(QualComm Code Excited Linear Predictive,受激线性预测编码)
类型:Audio
制定者:美国Qualcomm通信公司(即高通)
所需频宽:8k的语音编码算法(可工作于4/4.8/8/9.6Kbps等固定速率上,而且可变速率地工作于800Kbps~9600Kbps之间)
特性:使用适当的门限值来决定所需速率。QCELP是一种8k的语音编码算法(可以在8k的速率下提供接近13k的话音压缩质量)。这是一种可变速率话音编码,根据人的说话特性(大家应该能够体会我们日常的沟通和交流时并不是一直保持某种恒定的方式讲话,有间断、有不同的声音频率等都是人的自然表达)而采取的一种优化技术。
优点:话音清晰、背景噪声小,系统容量大
缺点: 不是Free
应用领域:CDMA
版税方式:每年支付一笔使用权费用
备注:QCELP,即Qualcomm Code Excited Linear Predictive(Qualcomm受激线性预测编码)。美国Qualcomm通信公司的专利语音编码算法,是北美第二代数字移动电话(CDMA)的语音编码标准(IS95)。这种算法不仅可工作于4/4.8/8/9.6kbit/s等固定速率上,而且可变速率地工作于800bit/s~9600bit/s之间。QCELP算法被认为是到目前为止效率最高的一种算法,它的主要特点之一,是使用适当的门限值来决定所需速率。门限值随背景噪声电平变化而变化,这样就抑制了背景噪声,使得即使在喧闹的环境中,也能得到良好的话音质量,CDMA8Kbit/s的话音近似GSM 13Mbit/s的话音。CDMA采用QCELP编码等一系列技术,具有话音清晰、背景噪声小等优势,其性能明显优于其他无线移动通信系统,语音质量可以与有线电话媲美。 无线辐射低。
分享到:
评论

相关推荐

    基于音频比对技术的调频发射台智能监测系统.pdf

    理论上来说,同样的播出音频内容应该是完全相同,或者说是相似度达到100%,但经由不同的编码器或解码器,甚至是同一型号编解码器的不同参数,编码或解码后的内容都会有些微的差别,计算机通过识别这些微小的差别而给...

    一款很实用的,不需要很多程序的比对工具

    - 许多比对工具支持与常见的IDE(如Visual Studio、Eclipse、IntelliJ IDEA)集成,方便开发者在编码过程中进行代码比对。 6. **版本控制系统**: - 与Git、SVN等版本控制系统的良好配合,可以快速查看文件的版本...

    代码比对工具,代码比对工具

    2. **二进制比对**:除了支持文本文件,WinMerge还具备比对二进制文件的能力,这对于处理包含图片、音频或其他非文本内容的文件非常有用。 3. **目录比对**:它可以比较整个目录结构,找出两个目录间的文件和子目录...

    广播电视编码传输平台智能比对切换系统方案初步探讨.pdf

    传统的手动切换方式无法满足3秒内的切换要求,因此引入智能比对切换系统成为必然。 【编码技术】在智能比对切换系统中起着基础作用。编码器负责将原始信号转化为数字编码流,以适应传输和处理。当编码器出现问题...

    BCompare 文件比对工具

    1. **二进制比对**:BCompare可以精确地对比两个文件的每一个字节,无论是图片、音频、视频还是程序文件,都能找出其中的差异。这对于检查文件是否被篡改或恢复损坏文件非常有用。 2. **文本比对**:针对文本文件,...

    文件比对工具

    2. **二进制比对**:适用于非文本文件,如图片、音频或数据库文件,检测内容的细微差别。 3. **文件夹比对**:比较整个目录结构,包括文件名、大小和修改日期的差异,便于同步文件或版本控制。 4. **合并工具**:在...

    代码比对工具

    2. **差异视图**:在比对二进制文件时,工具会以颜色编码的方式显示差异,便于快速定位问题。 3. **部分对比**:如果二进制文件过大,工具允许选择特定区域进行比对,避免不必要的资源消耗。 4. **校验和比较**:...

    音频压缩编码中的参数比特分配技术

    参数比特分配技术是宽带音频编码技术的重要组成部分。通过利用人耳的感知特性,特别是频率掩蔽效应,这种技术能够在保持高质量听觉体验的同时显著降低数据传输需求。随着数字音频技术的不断发展,参数比特分配技术的...

    BeyondCompare工具用于比对两文件/目录内的文件差别

    用户可以根据需求自定义比较规则,比如忽略空格、大小写敏感性等,使得比对结果更符合个人或团队的编码习惯。 6. **其他功能**: 除了主要的文件和目录比对,BeyondCompare还提供了其他实用功能,如文件同步、...

    无损音频鉴定

    3. **元数据分析**:无损音频文件的元数据包含丰富的信息,如采样率、位深度、编码器版本等。通过分析这些信息,可以进一步确认文件的来源和质量。 4. **播放设备反馈**:高端的音乐播放设备和软件往往能识别出有损...

    Muses-master_audiocompare_音频比较_

    "Muses-master_audiocompare_音频比较_"项目专注于音频文件的相似度比较,这是一个技术含量较高的任务,涉及到数字信号处理、音频编码和机器学习等多个领域的知识。 首先,我们要理解音频比较的基本概念。音频文件...

    以二值图像为水印信息,以音频数据为嵌入对象的音频水印系统-源码

    - **核心算法实现**:开发者需要实现水印嵌入和检测的核心算法,这可能涉及信号处理、数字图像处理和音频编码等多个领域的专业知识。 - **文件格式兼容性**:系统应支持常见的音频文件格式,如MP3、WAV、AAC等,以...

    网络摄像机培训IPC基础知识.pptx

    * 网络功能:编码压缩的视音频信号通过网口传输; * 云台、镜头控制功能:通过网络控制云台、镜头的各种动作; * 存储功能:可以把压缩的视音频信号临时存储在本地存储介质(卡等); * 报警输入输出:能接受、处理...

    与音频技术相关信息处理网站地址.docx

    在现代信息技术领域,音频技术是不可或缺的一部分,它涵盖了声音的录制、编辑、处理、编码以及传输等多个环节。本文将深入探讨“与音频技术相关信息处理”的主题,特别关注视频格式转换这一重要知识点,同时也会提及...

    Tau Analyzer无损音频鉴别

    该软件通过对音频文件进行哈希值比对、元数据检查以及音频流分析等多维度检测。哈希值比对是检查文件完整性的常见方法,每个文件都有独一无二的哈希值,如果文件被篡改,其哈希值将发生变化。元数据检查则涉及文件的...

    行业分类-设备装置-基于音频指纹的视频多匹配检测和对媒体频道识别消歧.zip

    2.2 技术实现:这通常涉及对视频进行音频分离,提取音频指纹,然后与数据库中的指纹进行比对。对于多源匹配,需要解决匹配冲突问题,通过权重分配、时间同步或模式匹配等策略来确定最可能的来源。 三、媒体频道识别...

    matlab读取wav音频文件代码-modern-communication-technology-lab:现代通信技术实验:图片&音频

    matlab读取wav音频文件代码 Modern Communication Technology Lab 现代通信技术实验: 图片 音频 1、准备工作 (1)各位同学准备一段语音文件,30S 左右即可,内容任意,歌曲朗诵均可, 保存为单声道,44kbps 采样率的...

    对比工具 Beyond

    1. 文件比对:Beyond Compare能够快速准确地对比两个文件的不同之处,无论是文本文件还是二进制文件,如图片、音频或视频文件。它能突出显示不同行、字节或字符,使用户一目了然。 2. 文件夹比对:对于项目文件夹的...

Global site tag (gtag.js) - Google Analytics