- 浏览: 199490 次
- 性别:
- 来自: 杭州
文章分类
最新评论
-
guoshijie1990:
写的不错
Android Https通信 -
xiaochi_84:
你好,我想问一下。为什么我在java工程里测试没有问题。但是到 ...
Android导出xls文件 -
Visual_chenpeng:
Android Https通信 -
jasonpeak:
求jasonpeak 写道我的为什么按返回键还是不关闭呢?求破 ...
Android关于ProgressDialog按返回键关闭 -
jasonpeak:
我的为什么按返回键还是不关闭呢?
Android关于ProgressDialog按返回键关闭
Android端的语音采集主要是调用AudioRecord,首先说几个参数
private static AudioRecord mRecord; // 音频获取源 private int audioSource = MediaRecorder.AudioSource.MIC; // 设置音频采样率,44100是目前的标准,但是某些设备仍然支持22050,16000,11025 private static int sampleRateInHz = 8000;// 44100; // 设置音频的录制的声道CHANNEL_IN_STEREO为双声道,CHANNEL_CONFIGURATION_MONO为单声道 private static int channelConfig = AudioFormat.CHANNEL_CONFIGURATION_MONO;// AudioFormat.CHANNEL_IN_STEREO; // 音频数据格式:PCM 16位每个样本。保证设备支持。PCM 8位每个样本。不一定能得到设备支持。 private static int audioFormat = AudioFormat.ENCODING_PCM_16BIT; // 音频大小 private int bufSize;
然后初始化一下AudioRecord,过程如下:
bufSize = AudioRecord.getMinBufferSize(sampleRateInHz, channelConfig, audioFormat); mRecord = new AudioRecord(audioSource, sampleRateInHz, channelConfig, audioFormat, bufSize);
初始化完毕以后就需要采集音频数据了:
mRecord.startRecording(); short audiodata[] = new short[bufSize]; while (isRecord) { int readsize = 0; while (isRecord == true) { readsize = mRecord.read(audiodata, 0, bufSize); try { for (int i = 0; i < readsize; i++) { //dout.writeShort(audiodata[i]); //数据处理 } } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } } mRecord.stop(); audiodata = null;
接下来是一个语音的播放了,我们这边不放的是采集到的语音流,即PCM无损格式的语音数据,如下:
参数:
private static AudioTrack mTrack; // 音频类型 private int streamType = AudioManager.STREAM_MUSIC; // 设置音频采样率,44100是目前的标准,但是某些设备仍然支持22050,16000,11025 private int sampleRateInHz = 8000;// 44100; // 设置音频的录制的声道CHANNEL_IN_STEREO为双声道,CHANNEL_CONFIGURATION_MONO为单声道 private int channelConfig = AudioFormat.CHANNEL_CONFIGURATION_MONO;// AudioFormat.CHANNEL_IN_STEREO; // 音频数据格式:PCM 16位每个样本。保证设备支持。PCM 8位每个样本。不一定能得到设备支持。 private int audioFormat = AudioFormat.ENCODING_PCM_16BIT; // 音频大小 private int bufSize; // 音频模式 private int mode = AudioTrack.MODE_STREAM; protected boolean keepRuning = true;
然后初始化播放器:
bufSize = AudioTrack.getMinBufferSize(sampleRateInHz, channelConfig, audioFormat); mTrack = new AudioTrack(streamType, sampleRateInHz, channelConfig, audioFormat, bufSize, mode);
然后是播放:
DataOutputStream dos = null; mTrack.play(); try { revSocket = server.accept(); dos = new DataOutputStream(new BufferedOutputStream( new FileOutputStream(audioFile))); din = new DataInputStream(revSocket.getInputStream()); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } while (keepRuning) { short[] buffer = new short[bufSize / 4]; try { Log.i("状态", "接收数据"); for (int i = 0; din.available() > 0 && i < buffer.length; i++) { buffer[i] = din.readShort(); dos.writeShort(buffer[i]); Log.i("状态", "接收数据," + String.valueOf(i)); } short[] bytes_pkg = buffer.clone(); mTrack.write(bytes_pkg, 0, bytes_pkg.length); } catch (Exception e) { e.printStackTrace(); } } mTrack.stop(); try { dos.close(); din.close(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } }
将语音数据保存到文件,并且将裸数据文件保存成可播放的WAV文件
/** * 这里将数据写入文件,但是并不能播放,因为AudioRecord获得的音频是原始的裸音频, * 如果需要播放就必须加入一些格式或者编码的头信息。但是这样的好处就是你可以对音频的 裸数据进行处理,比如你要做一个爱说话的TOM * 猫在这里就进行音频的处理,然后重新封装 所以说这样得到的音频比较容易做一些音频的处理。 */ private void writeDateTOFile() { // new一个byte数组用来存一些字节数据,大小为缓冲区大小 byte[] audiodata = new byte[minBufSize]; FileOutputStream fos = null; int readsize = 0; try { File file = new File(AudioName); if (file.exists()) { file.delete(); } fos = new FileOutputStream(file);// 建立一个可存取字节的文件 } catch (Exception e) { e.printStackTrace(); } while (isRecord == true) { readsize = mRecord.read(audiodata, 0, minBufSize); Log.i("采集大小", String.valueOf(readsize)); if (AudioRecord.ERROR_INVALID_OPERATION != readsize) { try { fos.write(audiodata); } catch (IOException e) { e.printStackTrace(); } } } try { fos.close();// 关闭写入流 } catch (IOException e) { e.printStackTrace(); } } // 这里得到可播放的音频文件 private void copyWaveFile(String inFilename, String outFilename) { FileInputStream in = null; FileOutputStream out = null; long totalAudioLen = 0; long totalDataLen = totalAudioLen + 36; long longSampleRate = sampleRateInHz; int channels = 2; long byteRate = 16 * sampleRateInHz * channels / 8; byte[] data = new byte[minBufSize]; try { in = new FileInputStream(inFilename); out = new FileOutputStream(outFilename); totalAudioLen = in.getChannel().size(); totalDataLen = totalAudioLen + 36; WriteWaveFileHeader(out, totalAudioLen, totalDataLen, longSampleRate, channels, byteRate); while (in.read(data) != -1) { out.write(data); } in.close(); out.close(); } catch (FileNotFoundException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } } /** * 这里提供一个头信息。插入这些信息就可以得到可以播放的文件。 为我为啥插入这44个字节,这个还真没深入研究,不过你随便打开一个wav * 音频的文件,可以发现前面的头文件可以说基本一样哦。每种格式的文件都有 自己特有的头文件。 */ private void WriteWaveFileHeader(FileOutputStream out, long totalAudioLen, long totalDataLen, long longSampleRate, int channels, long byteRate) throws IOException { byte[] header = new byte[44]; header[0] = 'R'; // RIFF/WAVE header header[1] = 'I'; header[2] = 'F'; header[3] = 'F'; header[4] = (byte) (totalDataLen & 0xff); header[5] = (byte) ((totalDataLen >> 8) & 0xff); header[6] = (byte) ((totalDataLen >> 16) & 0xff); header[7] = (byte) ((totalDataLen >> 24) & 0xff); header[8] = 'W'; header[9] = 'A'; header[10] = 'V'; header[11] = 'E'; header[12] = 'f'; // 'fmt ' chunk header[13] = 'm'; header[14] = 't'; header[15] = ' '; header[16] = 16; // 4 bytes: size of 'fmt ' chunk header[17] = 0; header[18] = 0; header[19] = 0; header[20] = 1; // format = 1 header[21] = 0; header[22] = (byte) channels; header[23] = 0; header[24] = (byte) (longSampleRate & 0xff); header[25] = (byte) ((longSampleRate >> 8) & 0xff); header[26] = (byte) ((longSampleRate >> 16) & 0xff); header[27] = (byte) ((longSampleRate >> 24) & 0xff); header[28] = (byte) (byteRate & 0xff); header[29] = (byte) ((byteRate >> 8) & 0xff); header[30] = (byte) ((byteRate >> 16) & 0xff); header[31] = (byte) ((byteRate >> 24) & 0xff); header[32] = (byte) (2 * 16 / 8); // block align header[33] = 0; header[34] = 16; // bits per sample header[35] = 0; header[36] = 'd'; header[37] = 'a'; header[38] = 't'; header[39] = 'a'; header[40] = (byte) (totalAudioLen & 0xff); header[41] = (byte) ((totalAudioLen >> 8) & 0xff); header[42] = (byte) ((totalAudioLen >> 16) & 0xff); header[43] = (byte) ((totalAudioLen >> 24) & 0xff); out.write(header, 0, 44); }播放裸语音数据文件
short[] buffer = new short[bufferSize / 4]; try { // 定义输入流,将音频写入到AudioTrack类中,实现播放 DataInputStream dis = new DataInputStream( new BufferedInputStream(new FileInputStream(audioFile))); // 实例AudioTrack AudioTrack track = new AudioTrack(AudioManager.STREAM_MUSIC, frequence, channelConfig, audioEncoding, bufferSize, AudioTrack.MODE_STREAM); // 开始播放 track.play(); // 由于AudioTrack播放的是流,所以,我们需要一边播放一边读取 while (isPlaying && dis.available() > 0) { int i = 0; while (dis.available() > 0 && i < buffer.length) { buffer[i] = dis.readShort(); i++; } // 然后将数据写入到AudioTrack中 track.write(buffer, 0, buffer.length); } // 播放结束 track.stop(); dis.close(); } catch (Exception e) { // TODO: handle exception }
发表评论
-
Android获取设备信息
2012-11-22 00:10 1391转http://blog.csdn.net/gumanr ... -
Android列表索引实现
2012-07-15 10:47 6688最近做一个项目用到了列表索引,所以在网上找了一下,发现一个博客 ... -
Android开发环境搭建(Windows)
2012-07-03 13:37 792什么都不说来,直接下载附件好了,这个图文的不好发布 -
Linux下Android环境搭建
2012-07-03 13:34 1232--以Ubuntu为例 Linux下Android环境 ... -
Android ListView 滑动背景为黑色的解决办法
2012-06-28 22:08 1070转至:http://blog.163.com/zh ... -
Android蓝牙开发
2012-06-26 15:38 1527今天查了一些资料,然后发现一篇文章挺好,关于蓝牙的,原文网址: ... -
Android自定义对话框
2012-06-22 11:36 2503这时我封装的一个对话框工具类 package com. ... -
Android语音识别
2012-06-18 09:28 2272Android由于有了Google的支持,那么他的语音识别做起 ... -
Android监控
2012-06-08 20:04 1508Android的监控一般都是需要用到Jni的,然后进行NDK编 ... -
Android视频播放
2012-05-24 19:55 1901视频播放优好多种,一种是播放系统可以播放的视频文件,一种是播放 ... -
重写android返回键
2012-05-24 19:23 21911在Activity里面加入下面代码: @Overrid ... -
Android图像处理工具类
2012-04-09 09:37 2519还是最近整理代码、、发现了一个师兄写的图片工具类,感觉还是蛮有 ... -
Android导出xls文件
2012-04-08 15:45 6609整理硬盘的时候找到了这些代码,看了一下,发现还有点用处,所以就 ... -
android的文字跑马灯效果
2012-04-03 21:04 7306今天问了解决文本内容过长的显示问题,而用了一个android自 ... -
Android超级简单的TabView实现
2012-04-03 20:56 7178可能很多人都有想要实现一个导航栏,但是不知道改怎么弄,因为an ... -
ImageView的属性android:scaleType
2012-04-03 20:04 2053ImageView的属性android:scaleType ... -
关于Android程序的全屏显示
2012-04-03 19:53 1011对于Android开发来说,全屏和无标题是我们常用的几行代码, ... -
Android文件下载
2012-03-19 16:45 1367嘿嘿,也不知道什么时候写的代码,清理硬盘的时候发现了,而且还能 ... -
Android视图的截图
2012-03-19 16:38 6897在pc上的截图软件很多,但是android上的比较少,所以就自 ... -
Android短信批量删除效果
2012-03-19 16:38 3609前段时间在做一个项目的后期维护时,对方提出了把短信做成可以批量 ...
相关推荐
总的来说,这个"android 语音识别转文字.zip"压缩包是一个集成了多种语音处理功能的DEMO,包括语音识别、文字转语音、录音、播放和文件管理等,对于学习和开发Android语音应用的开发者来说,是一个非常有价值的参考...
1. **语音采集**:语音采集是获取声音信号的第一步。在Android中,这通常通过`MediaRecorder`类来实现。我们需要设置录音源(如麦克风)、输出格式(如AMR或AAC)和音频采样率等参数。代码中可能包含设置`...
最近做的项目是和语音实时采集并发送,对方实时接收并播放相关,下面记录下实现的核心代码。 很多Android开发者应该知道android有个MediaRecorder对象和MediaPlayer对象,用于录制和播放音频。这个弊端在于他们不能...
二、Android语音识别的实现方法 1. 使用系统内置服务:Android提供了SpeechRecognizer类,它是一个接口,用于与系统级的语音识别服务交互。开发者可以通过创建SpeechRecognizer对象,设置识别监听器,然后调用start...
1. **网络通信**:Android语音通信的基础是建立可靠的网络连接,通常使用TCP或UDP协议。TCP提供可靠的数据传输,适合对稳定性要求高的语音通话;UDP则具有较低的延迟,适用于实时性要求较高的应用场景,如VoIP...
在这个"基于 TensorFlow Lite 开发的 Android 端中文语音识别 Demo.zip"中,我们将探讨如何利用 TensorFlow Lite 在移动设备上实现本地化的中文语音识别功能。 首先,让我们了解 TensorFlow Lite。它是 TensorFlow ...
这个项目不仅展示了如何在Android平台上进行语音合成,还涵盖了动态申请权限、沉浸模式和Toast消息显示等安卓特定的编程实践。 首先,让我们深入探讨Delphi的安卓语音合成。在Android系统中,语音合成通常依赖于...
1. **语音采集**:首先,应用需要捕获用户的语音输入。这通常通过麦克风实现,Android提供了AudioRecord类用于实时录音。 2. **音频处理**:录制的音频需要经过预处理,如降噪、增益控制等,以便提高识别的准确性。...
在客户端设计方面,本文采用了Android平台的AudioRecord和AudioTrack类来实现语音采集和播放,并使用了SIP协议来实现语音呼叫控制。同时,本文还对客户端的用户界面进行了设计,实现了用户友好的操作界面。 在...
Android语音识别系统的核心是Google的语音服务,它能够将用户的语音指令转化为文字,进而执行相应的操作,如搜索、输入文本、控制应用等。 一、Android语音识别的工作原理 Android语音识别的实现主要依赖于以下...
1. **音频采集**:通过Android的AudioRecord类捕获用户的语音输入。 2. **语音编码**:将采集到的原始音频数据进行编码,以便传输到服务器或本地处理。 3. **网络通信**:对于在线识别,需要通过HTTP或HTTPS协议将...
《Android开源项目:仿Siri中文语音助理源码解析》 在移动开发领域,Android以其开源性和灵活性吸引了众多开发者。本篇文章将详细探讨一个基于Android平台的开源项目——仿Siri的中文语音助理源码。这个项目旨在...
1. **语音采集**:通过设备内置的麦克风捕捉用户的语音。 2. **语音处理**:对捕获的音频信号进行预处理,如降噪、格式转换等。 3. **特征提取**:从处理后的音频中提取有用的特征,以便于后续的识别。 4. **模式...
总的来说,"Android-car-eye-device"是现代车辆管理系统的强大工具,通过集成视频采集和GPS定位,实现了对车辆的全方位监控。借助Android平台,它不仅提供了丰富的功能,还有广阔的发展空间,可随着技术的进步不断...
- **音频处理技术**:利用Android的MediaRecorder类进行音频采集,调整采样率、位深和声道等参数,以确保高质量的录音效果。 - **文件存储管理**:录制的音频文件需要保存在设备的存储空间中,可以使用SQLite数据库...
环信视频语音模块是一款专为Android平台设计的通信组件,主要功能是提供视频聊天和语音通话服务。在项目集成此模块时,开发者可以快速实现视频和音频通讯功能,提升应用的交互体验。以下是对该模块的详细解析: 一...
【Android sipdroid语音及视频通话】是一款基于Android平台的开源项目,主要目的是为了实现VoIP(Voice over Internet Protocol)语音通信以及视频通话功能。这个项目对于计算机专业的学生,特别是那些进行毕业设计...
在Android开发中,创建一个能够显示声波动画的录音应用是一项有趣的挑战,它结合了多媒体处理、用户界面设计以及实时数据可视化。以下是对这个"Android录音的声波动画"项目的关键知识点的详细解释: 1. **Android ...