`
passionke
  • 浏览: 21517 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

利用h5做语音识别

 
阅读更多
 
 
把zip包解压到某一个路径。 比如我这边是 /Users/passionke/study/SpeechRecognition
 
然后 在命令行下切换到这个路径
 
cd /Users/passionke/study/SpeechRecognition
 
在这个路径下执行
 
python -m SimpleHTTPServer 8090
 
这样就可以在网页上打开
 
 


 
在网页上最好使用F12 打开console面板,
  • 大小: 262.2 KB
分享到:
评论
4 楼 passionke 2015-10-21  
客户端(web端)语言javascript, 功能: 启动识别, 获取识别结果,将识别结果发回给服务器端

chrome浏览器的语音识别功能,通过js控制浏览器开启语音识别的声音监听,当语音识别有结果的时候,将声音文件名以及结果发送回服务器。

当网页被打开时,获取网页中带的文件名参数并立即开始声音识别监听

服务器端(server端) 语言 nodejs, 功能: 提供https的服务,接受前端发回的文件名与识别结果,并记录在文件中

server端使用nodejs + express 搭建起https服务

使用https服务是为了避免浏览器弹出窗口受援语音权限给浏览器

控制端 语言 python, 功能。 列出当前文件夹下wma文件列表,打开本地连接,链接上带上文件名, 声音播放, 延迟30s并执行上一步过程

打开本地链接使用python自带的webbrowser模块,

声音播放使用mp3play 的模块

本地电脑

开启立体混音模式,将电脑播放的声音混音到立体混音通道。 禁用立体混音的输出。(避免出现无限回声) 浏览器识别的时候,需要首先设置音频输入为 立体混音。
3 楼 amy265 2015-10-12  
https://www.google.com.hk/#safe=strict&q=%E4%B8%80%E5%B9%B4%E8%87%B32015%E5%B9%B410%E6%9C%8810%E5%8F%B7%E4%B8%8B%E5%8D%88%E4%B8%A4%E7%82%B9
2 楼 amy265 2015-10-12  
https://localhost/sppech/index.html?filename=D:\chenlin\python\1012\SpeechRecognition\SpeechRecognition\wma\data.wma
1 楼 passionke 2015-10-12  
https://localhost/sppech/index.html?filename=D:\chenlin\python\1012\SpeechRecognition\SpeechRecognition\wma\data.wma

相关推荐

    H5语音录入+百度语音识别完整版

    【标题】"H5语音录入+百度语音识别完整版"所涵盖的知识点主要涉及现代Web应用中的音频处理和人工智能技术的结合。这是一个基于HTML5的前端语音录入功能,结合了后端Java语言的处理和百度的语音识别服务,构建了一个...

    基于springboot+h5+websocket的即时通讯客服系统和百度实时语音转译(语音在线识别)

    这个系统利用现代Web技术构建了一个实时通信平台,通过集成百度的语音识别服务,实现了语音到文本的转化,为用户提供了一种方便快捷的在线客服交流方式。 首先,SpringBoot是Java开发中的一个轻量级框架,它简化了...

    H5讯飞语音听写js

    【标签】:“H5语音”标签表明这个项目专注于HTML5环境下的语音处理技术,包括但不限于语音识别和合成。 【文件名称列表】:“web-speech-master”可能是一个包含该项目源代码的压缩包,其中可能有以下内容: 1. `...

    html5录音+百度语音实现语音识别

    本教程将深入探讨如何利用HTML5的录音功能与百度语音识别技术实现语音输入功能。 一、HTML5录音 API HTML5的`<audio>`标签提供了音频播放和控制的基本功能,而`MediaDevices.getUserMedia()`接口则允许我们访问...

    科大讯飞语音识别(离线+在线)完整工程源代码可运行

    本文将详细讲解基于科大讯飞的语音识别技术,包括离线和在线两种模式,并结合提供的源代码工程,深入解析其工作原理和实现步骤。在Android平台上,利用Java语言进行开发,开发者可以有效地将语音转化为文字,提升...

    h5网站录音 语音识别 Excel文件上传

    综上所述,H5网站录音利用Web Audio API实现音频录制,语音识别借助Google Speech-to-Text API进行文本转化。Excel文件的上传通过前端组件完成,后端使用ASP.NET MVC处理并导入到数据库。在实际开发中,我们需要关注...

    语音识别 科大讯飞,人脸

    在项目"qhinsProject"中,可能包含了利用科大讯飞的语音识别和人脸识别技术开发的Android应用源代码,包括相关的SDK集成、接口调用、数据处理和用户界面设计。通过对这个项目的深入学习和分析,开发者可以了解到如何...

    Python-使用tensorflow深度学习框架实现sequencetosequence神经网络进行语音识别

    在本文中,我们将深入探讨如何使用TensorFlow深度学习框架实现Sequence-to-Sequence(Seq2Seq)神经网络模型,专门用于语音识别任务。Seq2Seq模型在自然语言处理领域有着广泛的应用,尤其在机器翻译和语音识别中表现...

    H5混合开发语音APP1

    通过这些接口,开发者可以构建出更加智能化、用户友好的应用程序,充分利用语音识别和合成技术提高应用的易用性和交互性。在实际项目中,还需要考虑到性能优化、错误处理和兼容性问题,以确保在各种Android设备上都...

    语音转文字.rar

    这个压缩包提供了两个系统必备的安装包,这可能包括了语音合成引擎和其他支持语音识别的库或软件,确保用户能够在不同操作系统上实现文本到语音的转换。此外,它还包含了一个英文语音播报的示例,用于演示如何使用...

    在uniapp中使用百度语音识别技术创建简易录音器源码

    在uniapp中集成百度语音识别技术,可以...通过这样的方式,你就可以在uniapp中利用百度语音识别技术创建一个简易的录音器应用。这个应用不仅可以录制用户的语音,还能实时转换成文本,为用户提供便捷的语音输入体验。

    讯飞语音转文字demo

    【讯飞语音转文字demo】是一款基于科大讯飞核心技术的智能语音识别系统演示程序,其主要功能是将录制的语音转换成文字,为用户提供高效、准确的文字录入解决方案。这款应用广泛应用于会议记录、访谈整理、在线教育等...

    垃圾分类小程序端使用SpringBoot+uniapp技术,包含文字识别、语音识别

    总结来说,这个项目提供了一个实际的案例,展示了如何利用现代开发技术(SpringBoot、uniapp)和分布式服务(Dubbo)构建一个具有AI识别功能(如文字识别、语音识别)的移动应用,并通过MySQL进行数据持久化。...

    h5 web录音并上传后端

    这个“H5 Web录音并上传后端”的示例着重展示了如何利用H5的新特性在浏览器内实现录音功能,并将录制的音频文件发送到服务器端。这一技术在在线教育、聊天应用、语音识别等多种场景中有着广泛的应用。 【描述】:...

    HTML5为输入框添加语音输入功能的实现方法

    早在十年前,语音识别技术还非常有限,网页上的实现也相对复杂,很多网页需要借助Flash等插件来实现语音识别功能。而随着HTML5标准的出现,网页可以通过简单地添加属性标签即可实现语音输入,大大简化了开发流程。 ...

    绘本跟读_微信小程序模板js代码前台前端H5页面源码.rar

    用户可以播放绘本中的音频,然后跟随朗读,程序会利用微信小程序的语音识别API,分析用户的发音并给出反馈,帮助用户提升语言能力。 总结,"绘本跟读_微信小程序模板js代码前台前端H5页面源码.rar"是一个关于微信小...

Global site tag (gtag.js) - Google Analytics