`
弄月吟风
  • 浏览: 199808 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Android语音采集

阅读更多

Android端的语音采集主要是调用AudioRecord,首先说几个参数

 

private static AudioRecord mRecord;
	// 音频获取源
	private int audioSource = MediaRecorder.AudioSource.MIC;
	// 设置音频采样率,44100是目前的标准,但是某些设备仍然支持22050,16000,11025
	private static int sampleRateInHz = 8000;// 44100;
	// 设置音频的录制的声道CHANNEL_IN_STEREO为双声道,CHANNEL_CONFIGURATION_MONO为单声道
	private static int channelConfig = AudioFormat.CHANNEL_CONFIGURATION_MONO;// AudioFormat.CHANNEL_IN_STEREO;
	// 音频数据格式:PCM 16位每个样本。保证设备支持。PCM 8位每个样本。不一定能得到设备支持。
	private static int audioFormat = AudioFormat.ENCODING_PCM_16BIT;
	// 音频大小
	private int bufSize;

 然后初始化一下AudioRecord,过程如下:

 

 

bufSize = AudioRecord.getMinBufferSize(sampleRateInHz, channelConfig,
				audioFormat);
		mRecord = new AudioRecord(audioSource, sampleRateInHz, channelConfig,
				audioFormat, bufSize);

 初始化完毕以后就需要采集音频数据了:

 

mRecord.startRecording();
		short audiodata[] = new short[bufSize];
		while (isRecord) {
			int readsize = 0;
			while (isRecord == true) {
				readsize = mRecord.read(audiodata, 0, bufSize);
				try {
					for (int i = 0; i < readsize; i++) {
						//dout.writeShort(audiodata[i]);
                                              //数据处理
					}
				} catch (IOException e) {
					// TODO Auto-generated catch block
					e.printStackTrace();
				}
			}
		}
		mRecord.stop();
		audiodata = null;

 接下来是一个语音的播放了,我们这边不放的是采集到的语音流,即PCM无损格式的语音数据,如下:

参数:

 

	private static AudioTrack mTrack;
	// 音频类型
	private int streamType = AudioManager.STREAM_MUSIC;
	// 设置音频采样率,44100是目前的标准,但是某些设备仍然支持22050,16000,11025
	private int sampleRateInHz = 8000;// 44100;
	// 设置音频的录制的声道CHANNEL_IN_STEREO为双声道,CHANNEL_CONFIGURATION_MONO为单声道
	private int channelConfig = AudioFormat.CHANNEL_CONFIGURATION_MONO;// AudioFormat.CHANNEL_IN_STEREO;
	// 音频数据格式:PCM 16位每个样本。保证设备支持。PCM 8位每个样本。不一定能得到设备支持。
	private int audioFormat = AudioFormat.ENCODING_PCM_16BIT;
	// 音频大小
	private int bufSize;
	// 音频模式
	private int mode = AudioTrack.MODE_STREAM;
	protected boolean keepRuning = true;

 然后初始化播放器:

 

bufSize = AudioTrack.getMinBufferSize(sampleRateInHz, channelConfig,
				audioFormat);
		mTrack = new AudioTrack(streamType, sampleRateInHz, channelConfig,
				audioFormat, bufSize, mode);

 然后是播放:

 

DataOutputStream dos = null;
		mTrack.play();
		try {
			revSocket = server.accept();
			dos = new DataOutputStream(new BufferedOutputStream(
					new FileOutputStream(audioFile)));
			din = new DataInputStream(revSocket.getInputStream());
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}

		while (keepRuning) {
			short[] buffer = new short[bufSize / 4];
			try {
				Log.i("状态", "接收数据");
				for (int i = 0; din.available() > 0 && i < buffer.length; i++) {
					buffer[i] = din.readShort();
					dos.writeShort(buffer[i]);
					Log.i("状态", "接收数据," + String.valueOf(i));
				}
				short[] bytes_pkg = buffer.clone();
				mTrack.write(bytes_pkg, 0, bytes_pkg.length);
			} catch (Exception e) {
				e.printStackTrace();
			}
		}
		mTrack.stop();
		try {
			dos.close();
			din.close();
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}

	}
将语音数据保存到文件,并且将裸数据文件保存成可播放的WAV文件
/**
	 * 这里将数据写入文件,但是并不能播放,因为AudioRecord获得的音频是原始的裸音频,
	 * 如果需要播放就必须加入一些格式或者编码的头信息。但是这样的好处就是你可以对音频的 裸数据进行处理,比如你要做一个爱说话的TOM
	 * 猫在这里就进行音频的处理,然后重新封装 所以说这样得到的音频比较容易做一些音频的处理。
	 */
	private void writeDateTOFile() {
		// new一个byte数组用来存一些字节数据,大小为缓冲区大小
		byte[] audiodata = new byte[minBufSize];
		FileOutputStream fos = null;
		int readsize = 0;
		try {
			File file = new File(AudioName);
			if (file.exists()) {
				file.delete();
			}
			fos = new FileOutputStream(file);// 建立一个可存取字节的文件
		} catch (Exception e) {
			e.printStackTrace();
		}
		while (isRecord == true) {
			readsize = mRecord.read(audiodata, 0, minBufSize);
			Log.i("采集大小", String.valueOf(readsize));
			if (AudioRecord.ERROR_INVALID_OPERATION != readsize) {
				try {
					fos.write(audiodata);
				} catch (IOException e) {
					e.printStackTrace();
				}
			}
		}
		try {
			fos.close();// 关闭写入流
		} catch (IOException e) {
			e.printStackTrace();
		}
	}

	// 这里得到可播放的音频文件
	private void copyWaveFile(String inFilename, String outFilename) {
		FileInputStream in = null;
		FileOutputStream out = null;
		long totalAudioLen = 0;
		long totalDataLen = totalAudioLen + 36;
		long longSampleRate = sampleRateInHz;
		int channels = 2;
		long byteRate = 16 * sampleRateInHz * channels / 8;
		byte[] data = new byte[minBufSize];
		try {
			in = new FileInputStream(inFilename);
			out = new FileOutputStream(outFilename);
			totalAudioLen = in.getChannel().size();
			totalDataLen = totalAudioLen + 36;
			WriteWaveFileHeader(out, totalAudioLen, totalDataLen,
					longSampleRate, channels, byteRate);
			while (in.read(data) != -1) {
				out.write(data);
			}
			in.close();
			out.close();
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}

	/**
	 * 这里提供一个头信息。插入这些信息就可以得到可以播放的文件。 为我为啥插入这44个字节,这个还真没深入研究,不过你随便打开一个wav
	 * 音频的文件,可以发现前面的头文件可以说基本一样哦。每种格式的文件都有 自己特有的头文件。
	 */
	private void WriteWaveFileHeader(FileOutputStream out, long totalAudioLen,
			long totalDataLen, long longSampleRate, int channels, long byteRate)
			throws IOException {
		byte[] header = new byte[44];
		header[0] = 'R'; // RIFF/WAVE header
		header[1] = 'I';
		header[2] = 'F';
		header[3] = 'F';
		header[4] = (byte) (totalDataLen & 0xff);
		header[5] = (byte) ((totalDataLen >> 8) & 0xff);
		header[6] = (byte) ((totalDataLen >> 16) & 0xff);
		header[7] = (byte) ((totalDataLen >> 24) & 0xff);
		header[8] = 'W';
		header[9] = 'A';
		header[10] = 'V';
		header[11] = 'E';
		header[12] = 'f'; // 'fmt ' chunk
		header[13] = 'm';
		header[14] = 't';
		header[15] = ' ';
		header[16] = 16; // 4 bytes: size of 'fmt ' chunk
		header[17] = 0;
		header[18] = 0;
		header[19] = 0;
		header[20] = 1; // format = 1
		header[21] = 0;
		header[22] = (byte) channels;
		header[23] = 0;
		header[24] = (byte) (longSampleRate & 0xff);
		header[25] = (byte) ((longSampleRate >> 8) & 0xff);
		header[26] = (byte) ((longSampleRate >> 16) & 0xff);
		header[27] = (byte) ((longSampleRate >> 24) & 0xff);
		header[28] = (byte) (byteRate & 0xff);
		header[29] = (byte) ((byteRate >> 8) & 0xff);
		header[30] = (byte) ((byteRate >> 16) & 0xff);
		header[31] = (byte) ((byteRate >> 24) & 0xff);
		header[32] = (byte) (2 * 16 / 8); // block align
		header[33] = 0;
		header[34] = 16; // bits per sample
		header[35] = 0;
		header[36] = 'd';
		header[37] = 'a';
		header[38] = 't';
		header[39] = 'a';
		header[40] = (byte) (totalAudioLen & 0xff);
		header[41] = (byte) ((totalAudioLen >> 8) & 0xff);
		header[42] = (byte) ((totalAudioLen >> 16) & 0xff);
		header[43] = (byte) ((totalAudioLen >> 24) & 0xff);
		out.write(header, 0, 44);
	}
 播放裸语音数据文件
short[] buffer = new short[bufferSize / 4];
			try {
				// 定义输入流,将音频写入到AudioTrack类中,实现播放
				DataInputStream dis = new DataInputStream(
						new BufferedInputStream(new FileInputStream(audioFile)));
				// 实例AudioTrack
				AudioTrack track = new AudioTrack(AudioManager.STREAM_MUSIC,
						frequence, channelConfig, audioEncoding, bufferSize,
						AudioTrack.MODE_STREAM);
				// 开始播放
				track.play();
				// 由于AudioTrack播放的是流,所以,我们需要一边播放一边读取
				while (isPlaying && dis.available() > 0) {
					int i = 0;
					while (dis.available() > 0 && i < buffer.length) {
						buffer[i] = dis.readShort();
						i++;
					}
					// 然后将数据写入到AudioTrack中
					track.write(buffer, 0, buffer.length);

				}

				// 播放结束
				track.stop();
				dis.close();
			} catch (Exception e) {
				// TODO: handle exception
			}
 
分享到:
评论

相关推荐

    android 语音识别转文字.zip

    总的来说,这个"android 语音识别转文字.zip"压缩包是一个集成了多种语音处理功能的DEMO,包括语音识别、文字转语音、录音、播放和文件管理等,对于学习和开发Android语音应用的开发者来说,是一个非常有价值的参考...

    语音采集,编码,解码,播放

    1. **语音采集**:语音采集是获取声音信号的第一步。在Android中,这通常通过`MediaRecorder`类来实现。我们需要设置录音源(如麦克风)、输出格式(如AMR或AAC)和音频采样率等参数。代码中可能包含设置`...

    Android实现语音数据实时采集、播放

    最近做的项目是和语音实时采集并发送,对方实时接收并播放相关,下面记录下实现的核心代码。 很多Android开发者应该知道android有个MediaRecorder对象和MediaPlayer对象,用于录制和播放音频。这个弊端在于他们不能...

    Android 语音转换成文字

    二、Android语音识别的实现方法 1. 使用系统内置服务:Android提供了SpeechRecognizer类,它是一个接口,用于与系统级的语音识别服务交互。开发者可以通过创建SpeechRecognizer对象,设置识别监听器,然后调用start...

    Android 语音通信

    1. **网络通信**:Android语音通信的基础是建立可靠的网络连接,通常使用TCP或UDP协议。TCP提供可靠的数据传输,适合对稳定性要求高的语音通话;UDP则具有较低的延迟,适用于实时性要求较高的应用场景,如VoIP...

    基于 TensorFlow Lite 开发的 Android 端中文语音识别 Demo.zip

    在这个"基于 TensorFlow Lite 开发的 Android 端中文语音识别 Demo.zip"中,我们将探讨如何利用 TensorFlow Lite 在移动设备上实现本地化的中文语音识别功能。 首先,让我们了解 TensorFlow Lite。它是 TensorFlow ...

    Delphi原生安卓中文语音合成

    这个项目不仅展示了如何在Android平台上进行语音合成,还涵盖了动态申请权限、沉浸模式和Toast消息显示等安卓特定的编程实践。 首先,让我们深入探讨Delphi的安卓语音合成。在Android系统中,语音合成通常依赖于...

    android Speech Recognition_Demo android中文离线语音识别 Android离线语音识别aar反编译源码可编辑版

    1. **语音采集**:首先,应用需要捕获用户的语音输入。这通常通过麦克风实现,Android提供了AudioRecord类用于实时录音。 2. **音频处理**:录制的音频需要经过预处理,如降噪、增益控制等,以便提高识别的准确性。...

    基于Android平台的IP语音通话功能的研究与实现.pdf

    在客户端设计方面,本文采用了Android平台的AudioRecord和AudioTrack类来实现语音采集和播放,并使用了SIP协议来实现语音呼叫控制。同时,本文还对客户端的用户界面进行了设计,实现了用户友好的操作界面。 在...

    android语音识别

    Android语音识别系统的核心是Google的语音服务,它能够将用户的语音指令转化为文字,进而执行相应的操作,如搜索、输入文本、控制应用等。 一、Android语音识别的工作原理 Android语音识别的实现主要依赖于以下...

    谷歌语音识别-百度语音识别-android

    1. **音频采集**:通过Android的AudioRecord类捕获用户的语音输入。 2. **语音编码**:将采集到的原始音频数据进行编码,以便传输到服务器或本地处理。 3. **网络通信**:对于在线识别,需要通过HTTP或HTTPS协议将...

    Android代码-[安卓开源]仿Siri的中文语音助理源码.zip

    《Android开源项目:仿Siri中文语音助理源码解析》 在移动开发领域,Android以其开源性和灵活性吸引了众多开发者。本篇文章将详细探讨一个基于Android平台的开源项目——仿Siri的中文语音助理源码。这个项目旨在...

    Android 轻松实现语音识别 实例.doc

    1. **语音采集**:通过设备内置的麦克风捕捉用户的语音。 2. **语音处理**:对捕获的音频信号进行预处理,如降噪、格式转换等。 3. **特征提取**:从处理后的音频中提取有用的特征,以便于后续的识别。 4. **模式...

    Android-car-eye-device是车辆管理系统的设备端程序负责视频采集gps采集等

    总的来说,"Android-car-eye-device"是现代车辆管理系统的强大工具,通过集成视频采集和GPS定位,实现了对车辆的全方位监控。借助Android平台,它不仅提供了丰富的功能,还有广阔的发展空间,可随着技术的进步不断...

    基于Android手机语音录入软件设计与实现.doc

    - **音频处理技术**:利用Android的MediaRecorder类进行音频采集,调整采样率、位深和声道等参数,以确保高质量的录音效果。 - **文件存储管理**:录制的音频文件需要保存在设备的存储空间中,可以使用SQLite数据库...

    环信视频语音模块

    环信视频语音模块是一款专为Android平台设计的通信组件,主要功能是提供视频聊天和语音通话服务。在项目集成此模块时,开发者可以快速实现视频和音频通讯功能,提升应用的交互体验。以下是对该模块的详细解析: 一...

    Android录音的声波动画

    在Android开发中,创建一个能够显示声波动画的录音应用是一项有趣的挑战,它结合了多媒体处理、用户界面设计以及实时数据可视化。以下是对这个"Android录音的声波动画"项目的关键知识点的详细解释: 1. **Android ...

    Android sipdroid语音及视频通话-IT计算机-毕业设计.zip

    【Android sipdroid语音及视频通话】是一款基于Android平台的开源项目,主要目的是为了实现VoIP(Voice over Internet Protocol)语音通信以及视频通话功能。这个项目对于计算机专业的学生,特别是那些进行毕业设计...

Global site tag (gtag.js) - Google Analytics