`
wx1569618008
  • 浏览: 75320 次
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

语音识别机器人毕业设计第三天

 
阅读更多

1.安装python下的库之PyAudio

  • 首先卸载掉以前我们用的库,安装新的库。原因是以前的库有BUG,在python里带的pyaudio库各种报错,最后查看了“stackoverflow”上的一些解决方案,定位错误的源头,发现我的库里read函数不能屏蔽IOerror。所以一定是版本问题。 所以要解决的第一步就是卸载老的库,安装新的库。下图是我在【http://people.csail.mit.edu/hubert/pyaudio/docs/】官方文档里找到的相关介绍

上面谈到的报错我们列出如下:

当然还有诸多:我以文档的形式列出,方便后期搜索引擎爬到。让更多的人解决这些问题(我准备参加完毕业,全部开源)

[IOError: [Errno Input overflowed] -9981]
IOError: [Errno Invalid input device (no default output device)] -9996
ALSA lib confmisc.c:768:(parse_card) cannot find card '0'
ALSA lib conf.c:4292:(_snd_config_evaluate) function snd_func_card_driver returned error: No such file or directory
ALSA lib confmisc.c:392:(snd_func_concat) error evaluating strings
ALSA lib conf.c:4292:(_snd_config_evaluate) function snd_func_concat returned error: No such file or directory
ALSA lib confmisc.c:1251:(snd_func_refer) error evaluating name
ALSA lib conf.c:4292:(_snd_config_evaluate) function snd_func_refer returned error: No such file or directory
ALSA lib conf.c:4771:(snd_config_expand) Evaluate error: No such file or directory
ALSA lib pcm.c:2266:(snd_pcm_open_noupdate) Unknown PCM sysdefault
ALSA lib confmisc.c:768:(parse_card) cannot find card '0'
ALSA lib conf.c:4292:(_snd_config_evaluate) function snd_func_card_driver returned error: No such file or directory
ALSA lib confmisc.c:392:(snd_func_concat) error evaluating strings
ALSA lib conf.c:4292:(_snd_config_evaluate) function snd_func_concat returned error: No such file or directory
ALSA lib confmisc.c:1251:(snd_func_refer) error evaluating name
ALSA lib conf.c:4292:(_snd_config_evaluate) function snd_func_refer returned error: No such file or directory




好了:我们开始解决它...............

sudo apt-get remove python-pyaudio

  • 然后我们来安装我们需要的最新模块
sudo apt-get install python-pyaudio

sudo apt-get install git

git clone http://people.csail.mit.edu/hubert/git/pyaudio.git

sudo apt-get install libportaudio0 libportaudio2 libportaudiocpp0 portaudio19-dev

sudo apt-get python-dev

sudo python pyaudio/setup.py install

  • 安装完就解决了我们一开始谈到的问题 io报错 9981。当然还要在源代码里做修改,把read函数里面的参数修改为false,安装上面官方文档的截图进行传参。后面我会在代码里标注。

2.解决声卡的各种问题

在这个上面我研究了很长时间,看了许多代码,我们在毕业设计第一天就谈到了声卡的驱动安装,这里再次谈起是因为我们要用python里的pyaudio解决声音的vad功能:

话音激活检测(VAD)算法能够区分传输语音信号中的语音信号和背景噪音,避免无用信号的传输,从而节省有限网络资源,因此对VAD算法的研究有重要的意义。由于一般静默压缩方法仅考虑高信噪比和平稳背景噪声这种理想通信条件,为了在复杂的背景噪声下进行VAD检测。简单来说就是我们不可能一直让录音和存储,比如现在家里没有人,也没人说话,我们完全就没必要录音上传检测语音识别。而vad就是解决这个的,当有较大的振幅时,我们开始存储语音,然后上传识别。 我们在python中写了一部分代码用来解决环境静音:后面我们会拿出这部分代码来详细说明。但是问题又来了:这个pyaudio底层都用的是linux的声音接口,当我们运行程序的时候就出现警告而且是上百行:就像上面图片,但是仔细看:错误原因是找不到:那好解决了,错误的引起是我们本来就没有这些设备。我们把这些东西删除。具体操作如下:

  • 删除这些报错的设备:什么错误,删除什么
sudo vim /usr/share/alsa/alsa.conf
$ ALSA lib pcm.c:2239:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.rear
ALSA lib pcm.c:2239:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.center_lfe
ALSA lib pcm.c:2239:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.side
ALSA lib pcm.c:2239:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.hdmi
ALSA lib pcm.c:2239:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.hdmi
ALSA lib pcm.c:2239:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.modem
ALSA lib pcm.c:2239:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.modem
ALSA lib pcm.c:2239:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.phoneline
ALSA lib pcm.c:2239:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.phoneline

例如:上面报错是,那么删除下面的:

pcm.rear cards.pcm.rear
pcm.center_lfe cards.pcm.center_lfe
pcm.side cards.pcm.side
pcm.hdmi cards.pcm.hdmi
pcm.modem cards.pcm.modem
pcm.phoneline cards.pcm.phoneline
X11 proxy: Unsupported authorisation protocol
xcb_connection_has_error() returned true
  • 添加一些东西,解决con错误
sudo copy ~ .Xauthority /root
ALSA lib pulse.c:243:(pulse_connect) PulseAudio: Unable to connect: Connection refused

报错如上:解决方法:

 在路径 /usr/share/alsa/alsa.conf.d/  下删除pulseaudio files. 

Cannot connect to server socket err = No such file or directory
Cannot connect to server request channel
jack server is not running or cannot be started
jack_control start
After making those changes, I no longer get the errors, just:
然后运行基本不报错了:
Listening... Press Ctrl+C to exit

转载于:https://my.oschina.net/u/3506656/blog/910718

分享到:
评论

相关推荐

    语音信号数字处理

    4. **基于单片机的语音识别机器人的设计.pdf**:此文档可能讲解了如何利用单片机设计一个能够理解和执行语音命令的机器人,涵盖了硬件选择、软件开发和实时处理等方面。 5. **听觉特性与鲁棒语音识别算法研究.kdh**...

    毕业设计 Python源代码+开发文档说明 微信机器人程序

    在Python微信机器人的实现中,开发者可能会使用到如`itchat`、`wxpy`等第三方库,这些库提供了与微信API交互的接口,使得程序能够接收和发送微信消息。项目可能包括以下几个关键部分: 1. **微信API接口**:通过...

    赋予树莓派3B机器人车语音识别控制和对象检测的控制程序。(毕设/课设/竞赛/实训/项目开发)

    相关项目设计中,皆可应用在项目开发、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面中 可借鉴此优质项目实现复刻,也可以基于此项目进行扩展来开发出更多...

    基于python开发的桌面级婴儿智力机器人,可以让宝宝提升智力,开心快乐+源码+开发文档+项目代码解析(高分优秀项目)

    加上现在人工智能-语音识别(包括唤醒)/合成技术逐渐成熟, 相关的平台服务相继开放给第三方开发者使用,对应电台的智能设备也越来越多; 加上树莓派刚出3的时候买了一个,当时只是把系统装了,了解下新功能;在网上找了...

    基于树莓派的智能语音交互系统设计-卢嫚.pdf

    设计过程中采用了Python编程语言,并利用了支持中文语音交互的“wukong-robot”开源项目,还整合了第三方插件,以便增加更多可扩展的应用技能,设计出一个具有聊天功能的陪伴型机器人。 智能语音交互已成为最广泛...

    毕设&课设&项目&实训-基于AI、区块链加密技术,去中文化的私有聊天机器人.zip

    【标题】中的“毕设&课设&项目&实训-基于AI、区块链加密技术,去中文化的私有聊天机器人”揭示了这是一个针对学生设计的项目,涵盖了毕业设计、课程设计、实践项目和训练任务,目的是开发一个具备AI智能和区块链加密...

    毕业设计(论文)-基于at89s52单片机的消防智能电动车的设计.doc

    - **语音识别电路**:实现语音播报功能。 - **无线收发模块**:实现数据的无线传输。 - **软件设计**: - **主程序流程**:定义主程序的执行逻辑。 - **灭火子程序**:编写灭火操作的具体步骤。 - **传感器...

    毕设&课程作业_银行智能排队系统.zip

    - **人工智能模块**:可能采用机器学习算法(如决策树、神经网络)预测等待时间,或者通过自然语言处理技术(如NLP库如NLTK或Spacy)进行语音识别或聊天机器人交互。 - **消息队列**:如RabbitMQ或Kafka,用于处理...

    人工智能是什么?.pdf

    第三阶段是瓶颈阶段,上世纪70年代经过科学家深入的研究,发现机器模仿人类思维是一个十分庞大的系统工程,难以用现有的理论成果构建模型。第四阶段是第二发展期,已有人工智能研究成果逐步应用于各个领域,人工智能...

    三分钟看懂ChatGPT

    ChatGPT的推出不仅展示了人工智能在自然语言处理领域的最新成就,也为教育、科研、商业甚至日常生活提供了新的交互工具,对于毕业设计、微信小程序等应用领域都有潜在的影响。随着技术的不断进步,ChatGPT和类似的AI...

    大班毕业诗《师生情》.docx

    “三年前我第一次来到这里,玩具扔满地,还要发脾气;今天站在这里的还是我自己,脸上再也没有泥,手帕、袜子自己洗,还会唱歌跳舞画画做游戏,懂得了很多道理。”这部分展示了孩子自我管理能力的提升,这与教育科技...

    基于matlab的毕业论文题目参考.pdf

    第二部分的论文题目继续拓展了MATLAB的应用范围,包括建筑沉降监测、轴承动态特性、虚拟控制系统设计、钢桁梁施工控制、永磁同步电机控制、色域平台开发、语音信号去噪、二极管双T电桥仿真、推土机动力系统匹配、二...

    第19章 神经网络模型.pdf

    - **模式识别**:如图像识别、语音识别。 - **预测分析**:金融市场的趋势预测。 - **智能控制**:机器人控制、自动驾驶汽车。 - **组合优化**:物流路径规划、任务调度。 - **图像处理**:图像分类、目标检测。 - *...

    JAVA上百实例源码以及开源项目源代码

    多人聊天室 3个目标文件 第一步:运行ServerData.java 启动服务器,然后服务器处于等待状态 第二步:运行LoginData.java 启动(客户端)登陆界面 输入用户名 ip为本机localhost 第三步:在登陆后的界面文本框输入文本...

Global site tag (gtag.js) - Google Analytics