`

Google的语音识别API,支持各种语言

 
阅读更多

要使用这个API,你得先有一些心理素质:面对倒霉的FLAC格式,因为这个API只支持FLAC格式的数据,杯具啊。

不过你找到了我的博客,那么你是幸福的,因为我已经为你准备了不少好东西了。(顺便说一句,如果要转载记得清楚地标注“来自http://blog.laobubu.net”,我信任你。)

现在看看如何请求数据:

  • 【URL】http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN
  • 【方式】POST
  • 【请求头】Content-Type:audio/x-flac; rate=16000
  • 【POST】flac文件的数据
  • 【URL里可选参数】&maxresults=返回结果数

如果你人品大爆发,你成功了,可以得到类似这个的结果

{"status":0,"id":"54e1babccaa58682ffbb02ceb42aa47c-1",
"hypotheses":[{"utterance":"测试程序","confidence":0.8556527}]}

或者你的请求URL里设置了maxresults(比如 http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN&maxresults=10 )你就会得到:

{"status":0,"id":"fbf23a887b9ac2bfb630aa40dd1a776c-1","hypotheses":
[
{"utterance":"欢迎访问过的网址","confidence":0.7275984},
{"utterance":"欢迎访问我的网站"},
{"utterance":"欢迎访问我的网址"},
{"utterance":"欢迎访问过的网站"},
{"utterance":"白云访问过的网址"},
{"utterance":"怀孕访问过的网址"},
{"utterance":"欢迎访问有的网址"},
{"utterance":"欢迎访问过的网址哦"},
{"utterance":"白云访问我的网站"},
{"utterance":"怀孕访问我的网站"}
]
}

不过不简单哦

实例

Python代码

  1. #By laobubu.net
  2. import urllib2
  3. FILE='1.flac' #这里假设在当前文件夹下有一个叫1.flac的文件被识别
  4. url = 'http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN'
  5. audio=open(FILE,'rb').read()
  6. headers = {'Content-Type' : 'audio/x-flac; rate=16000'}
  7. req = urllib2.Request(url, audio, headers)
  8. response = urllib2.urlopen(req)
  9. print response.read().decode('UTF-8')

PHP代码

  1.  
  2. <?php
  3. $ch = curl_init();
  4. curl_setopt($ch, CURLOPT_URL, "http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN&maxresults=10");
  5. curl_setopt($ch, CURLOPT_VERBOSE, 0);
  6. curl_setopt($ch, CURLOPT_HEADER, 0);
  7. curl_setopt($ch, CURLOPT_POST, 1);
  8. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
  9. curl_setopt($ch, CURLOPT_POSTFIELDS, file_get_contents('1.flac'));
  10. curl_setopt($ch, CURLOPT_HTTPHEADER, array("Content-Type: audio/x-flac; rate=16000"));
  11. $data = curl_exec($ch);
  12. curl_close($ch);
  13. if ($data=json_decode($data,true)) {
  14.  echo "<ul>";
  15.  foreach($data['hypotheses'] as $i) echo "<li>".$i['utterance']."</li>";
  16.  echo "</ul>";
  17. } else {
  18.  echo "<i>识别出错</i>";
  19. }
  20. ?>

头疼:FLAC文件格式

这里我长话短说,google的flac也有限制,22050 Hz+201kbps还正常,如果比这个大多了就不对了。

不过还有最要命的问题,怎么生成FLAC文件?

没关系,这里有救星:flac.exe包下载

http://datastorage.laobubu.net/FLAC.zip 

具体使用方法是【flac.exe 文件.wav】这样在命令行调用即可,测试得知:不支持MP3等格式,但是支持基本的wav格式。

至于其他环境下(如linux里)也有对应的flac下载。我没有怎么用过linux就不说啥了。

好了,你可以去制造你的app了,哈哈。

来自laobubu实验室自动转换API

为了方便,我写了一个python程序,放在Google App Engine上面,只要提交一个音频文件的URL(支持MP3、wav等常见格式),且文件不大,就可以得到结果了哦。

API入口:http://laobubumf.appspot.com/stt/
备用入口:http://glab.laobubu.net/stt/

 

分享到:
评论

相关推荐

    谷歌语音识别-百度语音识别-android

    本文将详细探讨标题“谷歌语音识别-百度语音识别-android”所涵盖的知识点,包括谷歌和百度的语音识别服务以及它们在Android平台上的应用。 首先,我们来了解**谷歌语音识别**(Google Speech Recognition)。谷歌...

    谷歌和科大讯飞语音识别

    压缩包文件名为“Vivibot”可能是指一个示例项目或库,它可能包含了实现科大讯飞和谷歌语音识别接口的代码示例。开发者可以通过研究这个项目,快速理解和学习如何在Android应用中集成这两种语音识别技术。 总结,...

    android上实现语音识别,基于google的语音识别

    语音识别技术是在Android SDK1.5中才加入的(RecognizerIntent),这里我们简单的分析一下自带的api例子,其实它就是通过一个Intent的Action动作来完成的。主要有以下两种模式: ACTION_RECOGNIZE_SPEECH:一般语音...

    freeswitch对接google的语音识别和语音合成例子

    1. **配置认证**:为了使用Google的API,首先需要在Google Cloud Console中创建项目并启用相关的语音识别和语音合成API。然后,生成API密钥或设置服务账户,确保Freeswitch可以安全地访问这些服务。 2. **安装和...

    VoiceRecongnition(google语音识别输入文字,带下载google语音安装包)

    在实际应用中,Google语音识别不仅限于英文,它支持多种语言,包括但不限于中文。用户可以在设置中选择合适的语言,以便更准确地识别语音。 总的来说,Google语音识别技术为Android用户带来了更直观、快捷的输入...

    Android语音识别+google语言包.rar

    本压缩包中的“google+语音+apk安装包.rar”很可能就是Google语音服务的更新或附加语言包,安装后能增强系统的语音识别能力,尤其对于那些非英语的用户来说,这是一个非常实用的功能。 然而,值得注意的是,描述中...

    语音识别php文件

    总的来说,"语音识别php文件"的主题涵盖了PHP编程语言和谷歌语音识别API的结合使用,涉及了API调用、数据处理和错误管理等多个方面。通过对"GoogleVoiceApi"文件的深入研究和实践,开发者可以掌握如何在PHP环境中...

    基于Flask Web的中文自动语音识别演示系统,包含语音识别语音合成声纹识别之说话人识别源码+运行说明.zip

    5. **API接口集成**:为了实现以上功能,项目可能集成了各种语音服务的API,如阿里云的ASR(Automatic Speech Recognition)、TTS和声纹识别API。开发者需要理解如何正确地调用这些API,处理返回的数据,并将其整合...

    gspeech-rec, 在一个 shell script 中使用Google语音识别 API v2,一个.zip

    gspeech-rec, 在一个 shell script 中使用Google语音识别 API v2,一个 gspeech-rec从中识别谷歌语音speech-rec.sh 是一个bash脚本,它将一个flac音频文件发送到Google进行语音识别,并打印出最佳返回的假设。...

    UE4/UE5 GooGleTTS文本转语音插件

    这是谷歌云文本到语音和同步云语音到文本语音识别API的虚幻引擎包装。 有了这个插件,你将能够合成31种语言的自然男性和女性语音,并识别119种语言和方言的语音。 无缝TTS缓存将保护您的钱包!如果tts节点满足已经...

    测试可用的android远程语音识别实例

    谷歌语音识别API支持多种语言,能处理更复杂的指令,并返回识别文本。 4. **权限管理**:使用谷歌语音识别需要在AndroidManifest.xml中添加相应的权限,如`INTERNET`权限,以允许应用连接到互联网进行语音识别请求...

    Unity3D教程:调用Android语音识别1

    在本篇Unity3D教程中,我们将探讨如何在Unity3D项目中调用Android设备的内置语音识别功能。首先,我们需要了解的是,Android...虽然教程中遇到讯飞SDK的问题,但通过Google的API,我们仍然能够实现基本的语音识别功能。

    LabView图形化编程语言之语音识别、密码锁、语音设备串口通信、识别系统.zip

    1. **语音识别**:LabView可以与各种语音识别库或API集成,如Microsoft的Speech Recognition API或Google的语音识别服务,实现对语音输入的处理和解析。用户可以通过编程来实现特定的命令识别或语音控制功能。例如,...

    Android 轻松实现语音识别

    Android 轻松实现语音识别是基于 Google 的语音识别技术实现的,利用 Android SDK 中提供的 API 实现语音识别功能。该功能可以将用户的语音输入识别出来,并将其打印在列表上。 知识点: 1. Android 语音识别技术...

    SpeechRecognition:使用Google Speech Recognition API将您的语音转换为文本

    使用Google语音识别API将您的语音转换为文本Google语音识别会自动识别您说出的单词,并以文本形式显示。 先决条件: 安装了Python; 已安装Google语音识别API; 主动的Internet连接(越快越好)Beautiful Soup...

    STM32语音识别资料

    开发者可以通过阅读和分析这些代码来学习如何处理音频数据,进行特征提取,以及如何与外部的语音识别服务进行交互,如Google语音API或阿里云语音识别服务。 此外,这份资料还作为学习参考资料,适合对STM32和其他...

    Android语音识别源码

    2. **本地识别**:Google语音识别服务依赖网络,如果网络不稳定,可以考虑使用本地语音识别库,如Pocketsphinx。 3. **多语言支持**:根据需要,可以通过Intent设置识别的语言,实现多语言识别。 4. **离线模式**...

    语音识别ios

    现在,我们转向谷歌的语音识别API。谷歌的语音识别服务以其准确性和多语言支持而知名。要集成这个服务,你需要在Google Cloud Console创建一个项目,启用语音识别API,并获取API密钥。然后,在iOS应用中,你可以使用...

    安卓语音识别

    6. **多语言支持**: Android的语音识别API支持多种语言,开发者可以根据用户的需求或应用的定位选择合适的语言模型。 7. **性能优化**: 对于需要频繁进行语音识别的场景,考虑优化识别速度和功耗是非常必要的。例如...

    Springboot实现语音识别听写

    // 这里处理音频文件并调用语音识别API } ``` 处理音频文件前,需要将其转换为适合科大讯飞API的格式。科大讯飞的Msc.jar库提供了一系列API用于语音识别,比如`Recognizer`类,它支持实时音频流处理。创建一个`...

Global site tag (gtag.js) - Google Analytics