论坛首页 Java企业应用论坛

(十一)用JAVA编写MP3解码器——立体声处理

浏览 5613 次
该帖已经被评为精华帖
作者 正文
   发表时间:2010-08-25   最后修改:2010-08-31

解码一帧Layer3第5步:立体声处理 -- class Layer3的ms_stereo和i_stereo方法

 

      MP3采用的立体声编码方式有中侧立体和强度立体声两种。

      1.中侧立体声(Middle/Side stereo)简称MS_stereo,在这种模式中,用中/侧声道规格化值Mi/Si取代左/右声道的值Li/Ri,重建左/右声道的值Li/Ri用下述公式:

      变换前Mi值在左声道,Si值在右声道。应用上述公式把Mi/Si频谱值变换为Li/Ri并放到左/右声道,就完成了中侧立体声解码。

 

      2.强度立体声(intensity stereo)  在MP3编码一帧结束后,有损压缩把频谱中表现音乐细节的高频成份压缩掉了。为了保留频谱中的高频部分,把这些高频数据编码附加到频带的后面部分。以长块为例,用rzero_bandL保存非零哈夫曼值的频带数,则从rzero_bandL至21的频带为强度立体声的编码数据。

      压制MP3时采用强度立体声编码,能提升音乐的细节,使压缩后的MP3听起来层次上更丰富。但是,很遗憾地告诉你,强度立体声是专利算法,受法律保护滴,很多MP3压缩器都没的这个功能,所以用强度立体声编码的MP3并不多见。

      对采用强度立体声编码的MP3,是否其进行强度声解码,不是训练有素的耳朵,听不出差别,反正我在调试程序时硬就没听出关闭强度立体声解码前后的区别。ISO/IEC 11172-3不对混合块中的长块作强度立体声处理,但很多MP3解码程序都作了处理,源码中把处理混合块中的长块的强度立体声的代码注释掉了,如果你愿意的话,可以取消掉注释把它加进来。是否对混合块中的长块作强度立体声处理,我也听不出什么差别,音乐细胞不发达呀,尽管我很喜欢听。记得去年的某个时候,我把以前买的CD拿出来听,好久没听过了,特亲切。放CD没的MP3方便,于是上网一顿海搜,找到MP3压缩器的No.1--LAME,用VBR模式的128Kpbs--320Kpbs,540M的CD压缩至不到60M,听起来和CD没的什么差别,觉得MP3编码真是个好,于是又上网海搜,想了解下MP3的技术细节,但是很遗憾,其中泛泛而谈的多,深入介绍其细节的少。好奇心的驱使下,想搞明白MP3的那些事,很长一段时间,业余时间就耗这上面了。也是有感于很多涉及MP3解码的关键技术的论文,都不是免费的,我就想把我弄清的部分公开出来,算是一个科谱宣传吧(这话说的:)可能你比我还懂的多)。

 

      联合立体声,请复习《(二)用JAVA编写MP3解码器——帧头信息解码》,对联合立体声(jiont stereo)作了简介。

 

【提示】以下代码是Layer3.java的一部分,应遵守《(一)用JAVA编写MP3解码器——前言》中的许可协议。

 

      今天就说到这,下回再说,上源码。class Layer3内的立体声解码方法的源码如下:

	//5.
	//>>>>STEREO===============================================================
	/*
	 * 在requantizer方法内已经作了除以根2处理, ms_stereo()内不再除以根2.
	 */
	private void ms_stereo() {
		int sb, ss;
		float tmp0, tmp1;
		int rzero_xr = (rzero_index[0] > rzero_index[1]) ? rzero_index[0] : rzero_index[1];
		int rzero_sb = (rzero_xr + 17) / 18;
		for (sb = 0; sb < rzero_sb; sb++)
			for (ss = 0; ss < 18; ss++) {
				tmp0 = xr[0][sb][ss];
				tmp1 = xr[1][sb][ss];
				xr[0][sb][ss] = tmp0 + tmp1;
				xr[1][sb][ss] = tmp0 - tmp1;
			}
		rzero_index[0] = rzero_index[1] = rzero_xr;
	}

	private static float[][] lsf_is_coef;
	private static float[] is_coef;
	/*
	 *  解码一个频带强度立体声,MPEG 1.0
	 */
	private void is_lines_1(int is_pos, int idx0, int max_width,int idx_step) {
		float xr0;
		int sb32 = idx0 / 18;
		int ss18 = idx0 % 18;
		for (int w = max_width; w > 0; w--) {
			xr0 = xr[0][sb32][ss18];
			xr[0][sb32][ss18] = xr0 * is_coef[is_pos];
			xr[1][sb32][ss18] = xr0 * is_coef[6 - is_pos];
			ss18 += idx_step;
			if (ss18 >= 18) {
				ss18 -= 18;
				sb32++;
			}
		}
	}
	/*
	 * 解码一个频带强度立体声,MPEG 2.0/2.5
	 */
	private void is_lines_2(int tab2, int is_pos, int idx0, int max_width,int idx_step) {
		float xr0;
		int sb32 = idx0 / 18;
		int ss18 = idx0 % 18;
		for (int w = max_width; w > 0; w--) {
			xr0 = xr[0][sb32][ss18];
			if (is_pos == 0)
				xr[1][sb32][ss18] = xr0;
			else {
				if ((is_pos & 1) == 0)
					xr[1][sb32][ss18] = xr0 * lsf_is_coef[tab2][(is_pos - 1) >> 1];
				else {
					xr[0][sb32][ss18] = xr0 * lsf_is_coef[tab2][(is_pos - 1) >> 1];
					xr[1][sb32][ss18] = xr0;
				}
			}
			ss18 += idx_step;
			if (ss18 >= 18) {
				ss18 -= 18;
				sb32++;
			}
		}
	}

	/*
	 * 强度立体声(intensity stereo)解码
	 * 公式:
	 * lsf_is_coef -- coefficients for LSF intensity stereo,ISO 13818-3,sesion 2.4.3.2
	 * lsf_is_coef[0][i] = (1 / sqrt(sqrt(2)))^(i + 1)
	 * lsf_is_coef[1][i] = (1 /      sqrt(2)) ^(i + 1)
	 * i=0..14
	 *
	 * is_coef -- coefficients for intensity stereo,iso11172-3,sesion 2.4.3.4.9.3
	 * is_coef[i] = tan(i * (PI / 12))
	 * is_coef[i] = is_coef[i] / (1 + is_coef[i])
	 * i=0..6
	 */
	private void i_stereo(final int gr) {
		if(objSI.ch[0].gr[gr].mixed_block_flag != objSI.ch[1].gr[gr].mixed_block_flag
				|| objSI.ch[0].gr[gr].block_type != objSI.ch[1].gr[gr].block_type)
			return;
		GRInfo gr_info = objSI.ch[1].gr[gr];	//信息保存在右声道.
		int is_p, idx, sfb;

		if(objHeader.getVersion() == Header.MPEG1) {	//MPEG 1.0
			if(gr_info.block_type == 2) {
				//MPEG 1.0, short block/mixed block
				int w3;
				//int do_long = 0;
				//if(gr_info.mixed_block_flag == 1)
				//	do_long = 1;
				for (w3 = 0; w3 < 3; w3++) {
					sfb = rzero_bandS[w3]; //混合块sfb最小为3
					//if (sfb > 3)
					//	do_long = 0;
					for (; sfb < 12; sfb++) {
						idx = 3*intSfbIdxShort[sfb] + w3;
						is_p = scfS[1][w3][sfb];
						if(is_p >= 7)
							continue;
						is_lines_1(is_p,idx,intWidthShort[sfb],3);
					}
				}
				/*if(do_long == 1) {
					for (sfb = rzero_bandL; sfb < 8; sfb++) {
						is_p = scfL[1][sfb];
						if(is_p < 7)
							is_lines_1(is_p,sfbIndexOfEndL[sfb],intWidthLong[sfb],1);
					}
				}*/
			} else {
				//MPEG 1.0, long block
				for (sfb = rzero_bandL; sfb <= 21; sfb++) {
					is_p = scfL[1][sfb];
					if(is_p < 7)
						is_lines_1(is_p,intSfbIdxLong[sfb],intWidthLong[sfb],1);
				}
			}
		} else {	//MPEG 2.0/2.5
			final int tab2 = gr_info.scalefac_compress & 0x1;
			if(gr_info.block_type == 2) {
				//MPEG 2.0/2.5, short block/mixed block
				int w3;
				//int do_long = 0;
				for (w3 = 0; w3 < 3; w3++) {
					sfb = rzero_bandS[w3]; //混合块sfb最小为3
					//if (sfb > 3)
					//	do_long = 0;
					for (; sfb < 12; sfb++) {
						idx = 3*intSfbIdxShort[sfb] + w3;
						is_p = scfS[1][w3][sfb];
						is_lines_2(tab2, scfS[1][w3][sfb], idx, intWidthShort[sfb],3);
					}
				}
				//if(do_long == 1)
				//	for (sfb = rzero_bandL; sfb < 8; sfb++)
				//		is_lines_2(tab2, scfL[1][sfb], sfbIndexOfEndL[sfb], intWidthLong[sfb],1);
			} else {
				//MPEG 2.0/2.5, long block
				for (sfb = rzero_bandL; sfb <= 21; sfb++)
					is_lines_2(tab2, scfL[1][sfb], intSfbIdxLong[sfb], intWidthLong[sfb],1);
			}
		}
	}
	//<<<<STEREO===============================================================

 

上一篇:(十)用JAVA编写MP3解码器——逆量化和重排序

下一篇:(十二)用JAVA编写MP3解码器——消混叠处理

 

【下载地址】http://jmp123.sourceforge.net/

 

  • 大小: 3 KB
   发表时间:2010-08-25  
虽然不怎么懂~但是很佩服lz的精神!
收藏待用。
0 请登录后投票
   发表时间:2010-08-25  
看不大董,冒似比较麻烦
0 请登录后投票
   发表时间:2010-08-26  
大师,能不能把流程串起来,比如


1  读取文件(......代码)
2  对文件的字符进行编码(.....代码)
...........最后就可以播放mp3了。


我能看懂你写的每一步要做的事情,不明白为什么要做
0 请登录后投票
   发表时间:2010-08-26  
是的。
完成解码一帧Layer3十多个步骤就可以解码Layer3了,再加上音频播放模块就可以播放了。
0 请登录后投票
   发表时间:2010-08-27  
一看就知道应该是写c/c++的朋友
0 请登录后投票
   发表时间:2010-08-28  
sunjun 写道
一看就知道应该是写c/c++的朋友

是因为变量命名不合JAVA规范吗?
约定俗成,变量名采用官方文档中的名称描述,这样做是为了想借助相关文档深入了解MP3解码的朋友更方便一点吧。
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics