在.net中,对英文语音有较好的支持,但是对中文语音的支持还没有加入进来,我们要想实现中文发音或中文语音识别,必需先安装微软的Speech Application SDK(SASDK),它的最新版本是 SAPI 5.1 他能够识别中、日、英三种语言,你可以在这里下载:http://www.microsoft.com/speech/download/sdk51/,需要安装这两个文件Speech SDK 5.1和5.1 Language Pack,其中5.1 Language Pack可以选择安装支持的语言。
安装好以后,我们就可以开始进行语音程序的开发了,当然,在这之前我们需要把SAPI.dll通过如下图所示添加到引用中
下面我们设计一个能够朗读中英文混合语言的类:
我们将用单例模式实现该类,类的代码如下,我们将详细解释:
public class Speach
{
private static Speach _Instance = null ;
private SpeechLib.SpVoiceClass voice =null;
private Speach()
{
BuildSpeach() ;
}
public static Speach instance()
{
if (_Instance == null)
_Instance = new Speach() ;
return _Instance ;
}
private void SetChinaVoice()
{
voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(0) ;
}
private void SetEnglishVoice()
{
voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(1) ;
}
private void SpeakChina(string strSpeak)
{
SetChinaVoice() ;
Speak(strSpeak) ;
}
private void SpeakEnglishi(string strSpeak)
{
SetEnglishVoice() ;
Speak(strSpeak) ;
}
public void AnalyseSpeak(string strSpeak)
{
int iCbeg = 0 ;
int iEbeg = 0 ;
bool IsChina = true ;
for(int i=0;i<strSpeak.Length;i++)
{
char chr = strSpeak[i] ;
if (IsChina)
{
if (chr<=122&&chr>=65)
{
int iLen = i - iCbeg ;
string strValue = strSpeak.Substring(iCbeg,iLen) ;
SpeakChina(strValue) ;
iEbeg = i ;
IsChina = false ;
}
}
else
{
if (chr>122||chr<65)
{
int iLen = i - iEbeg ;
string strValue = strSpeak.Substring(iEbeg,iLen) ;
this.SpeakEnglishi(strValue) ;
iCbeg = i ;
IsChina = true ;
}
}
}//end for
if (IsChina)
{
int iLen = strSpeak.Length - iCbeg ;
string strValue = strSpeak.Substring(iCbeg,iLen) ;
SpeakChina(strValue) ;
}
else
{
int iLen = strSpeak.Length - iEbeg ;
string strValue = strSpeak.Substring(iEbeg,iLen) ;
SpeakEnglishi(strValue) ;
}
}
private void BuildSpeach()
{
if (voice == null)
voice = new SpVoiceClass() ;
}
public int Volume
{
get
{
return voice.Volume ;
}
set
{
voice.SetVolume((ushort)(value)) ;
}
}
public int Rate
{
get
{
return voice.Rate ;
}
set
{
voice.SetRate(value) ;
}
}
private void Speak(string strSpeack)
{
try
{
voice.Speak(strSpeack,SpeechVoiceSpeakFlags.SVSFlagsAsync) ;
}
catch(Exception err)
{
throw(new Exception("发生一个错误:"+err.Message)) ;
}
}
public void Stop()
{
voice.Speak(string.Empty,SpeechLib.SpeechVoiceSpeakFlags.SVSFPurgeBeforeSpeak) ;
}
public void Pause()
{
voice.Pause() ;
}
public void Continue()
{
voice.Resume() ;
}
}//end class
在 private SpeechLib.SpVoiceClass voice =null;这里,我们定义个一个用来发音的类,并且在第一次调用该类时,对它用BuildSpeach方法进行了初始化。
我们还定义了两个属性Volume和Rate,能够设置音量和语速。
我们知道,SpVoiceClass 有一个Speak方法,我们发音主要就是给他传递一个字符串,它负责读出该字符串,如下所示。
private void Speak(string strSpeack)
{
try
{
voice.Speak(strSpeack,SpeechVoiceSpeakFlags.SVSFlagsAsync) ;
}
catch(Exception err)
{
throw(new Exception("发生一个错误:"+err.Message)) ;
}
}
其中SpeechVoiceSpeakFlags.SVSFlagsAsync表示异步发音。
但是,这个方法本身并不知道你给的字符串是什么语言,所以需要我们它这个字符串用什么语言读出。SpVoiceClass 类的Voice 属性就是用来设置语种的,我们可以通过SpVoiceClass 的GetVoices方法得到所有的语种列表,然后在根据参数选择相应的语种,比如设置语种为汉语如下所示:
private void SetChinaVoice()
{
voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(0) ;
}
0表示是汉用,1234都表示英语,就是口音不同。
这样,我们就设置了语种,如果结合发音方法,我们就可以设计出一个只发汉语语音的方法
private void SpeakChina(string strSpeak)
{
SetChinaVoice() ;
Speak(strSpeak) ;
}
只发英语语音的方法也是类似的,上面程序里有。
对于一段中英文混合的语言,我们让程序读出混合语音的方法就是:编程把这段语言的中英文分开,对于中文调用SpeakChina方法,英文调用SpeakEnglishi方法;至于怎样判断一个字符是英文还是中文,我采用的是判断asc码的方法,具体的类方法是通过AnalyseSpeak实现的。
这样,对于一段中英文混合文字,我们只需把它作为参数传递给AnalyseSpeak就可以了,他能够完成中英文的混合发音。
当然,对于发音的暂定、继续、停止等操作,上面也给出了简单的方法调用,很容易明白。
下面简单介绍一下中文语音识别的方法:
先把该语音识别的类源代码贴在下面,然后再做说明:
public class SpRecognition
{
private static SpRecognition _Instance = null ;
private SpeechLib.ISpeechRecoGrammar isrg ;
private SpeechLib.SpSharedRecoContextClass ssrContex =null;
private System.Windows.Forms.Control cDisplay ;
private SpRecognition()
{
ssrContex = new SpSharedRecoContextClass() ;
isrg = ssrContex.CreateGrammar(1) ;
SpeechLib._ISpeechRecoContextEvents_RecognitionEventHandler recHandle =
new _ISpeechRecoContextEvents_RecognitionEventHandler(ContexRecognition) ;
ssrContex.Recognition += recHandle ;
}
public void BeginRec(Control tbResult)
{
isrg.DictationSetState(SpeechRuleState.SGDSActive) ;
cDisplay = tbResult ;
}
public static SpRecognition instance()
{
if (_Instance == null)
_Instance = new SpRecognition() ;
return _Instance ;
}
public void CloseRec()
{
isrg.DictationSetState(SpeechRuleState.SGDSInactive) ;
}
private void ContexRecognition(int iIndex,object obj,SpeechLib.SpeechRecognitionType type,SpeechLib.ISpeechRecoResult result)
{
cDisplay.Text += result.PhraseInfo.GetText(0,-1,true) ;
}
}
我们定义了ssrContex 和isrg为语音识别的上下文和语法,通过设置isrg的DictationSetState方法,我们可以开始或结束识别,在上面的程序中是BeginRec和CloseRec方法。cDisplay 是我们用来输出识别结果的地方,为了能够在大部分控件上都可以显示结果,我用了一个Control 类来定义它。当然,每次语音识别后都会触发ISpeechRecoContextEvents_RecognitionEventHandler 事件,我们定义了一个这样的方法ContexRecognition来响应事件,并且在这个方法里输出识别结果。
这样,中文语音处理的一些最基本的问题就有了一个简单的解决方法,当然,这种方法还有很多不完善的地方,希望大家多提出批评意见,共同提高。
分享到:
相关推荐
### 中英文语音合成与中文语音识别技术在C#中的应用 #### 1. 引言 随着人工智能技术的发展,语音合成(Text-to-Speech,TTS)与语音识别(Speech Recognition)技术在日常生活中得到了广泛应用,如智能助手、自动...
在.NET框架中,虽然内置了对英文语音合成和识别的支持,但默认情况下并不包含中文语音的支持。为了在C#环境中实现中文语音的功能,我们需要引入微软的Speech Application SDK(SASDK),具体版本为SAPI 5.1。这个SDK...
### 语音合成与识别技术在C#中的应用 在当今高度数字化的世界中,语音合成(Text-to-Speech,TTS)与语音识别(Speech Recognition)技术已成为人机交互的重要组成部分,尤其是在智能家居、智能助手、教育软件及无...
在C#编程环境中,开发中英文语音程序是一项实用的技术,尤其在人机交互、智能助手或者无障碍应用中。本案例提供了实现这一功能的源代码,名为"NetSpeech",这表明它可能是一个基于.NET框架的语音合成库或者API的使用...
总之,C#.NET中的中英文语音朗读源码提供了一个实用的工具,帮助开发者利用.NET Framework内置的语音合成能力,创建具有语音交互功能的应用程序。通过深入研究和实践,我们可以进一步提升用户体验,使应用更具人性化...
在C#中,Microsoft提供了名为Microsoft Speech Platform的SDK,它包含了一系列的API,可以用于语音识别、语音合成(TTS)等多种功能。这个程序很可能就是基于这个SDK构建的。 首先,程序的核心部分是语音识别引擎。...
使用语音识别和语音合成技术,只需要输入文字就可以读出文字内容。同时可以对中英文混合阅读。并可设置音量大小和语速。 三、源码评价 该源码功能,代码都比较简单,但是功能还是比较使用的,比较适合初学者学习...
总结来说,C#中的中英文朗读器开发涉及到TTS技术的应用、语音合成类的使用以及用户交互设计等多个方面。通过熟悉System.Speech库,你不仅可以构建这样的应用,还能进一步扩展到更复杂的语音处理任务,比如语音识别和...
在C#中,我们可以创建一个类来封装语音合成的功能。在这个例子中,使用了单例模式来确保类的唯一实例。单例模式可以避免在程序运行期间多次实例化同一对象,节省资源。下面是对这个类的详细解释: ```csharp public...
C#是一种广泛用于开发Windows应用程序的强大编程语言,而微软的Speech SDK则提供了丰富的语音处理功能,包括语音合成(TTS)和语音识别。 首先,我们要了解什么是语音合成(Text-to-Speech, TTS)。TTS技术允许程序...
对于开发人员而言,掌握如何在C#中实现语音识别是一项非常实用的技能。 #### 二、C#语音识别实现方案 在C#中实现语音识别主要依赖于Microsoft提供的Speech SDK(Software Development Kit)。根据描述中的信息,...
【中科大讯飞Interphonic.5.0语音合成系统】是科大讯飞公司推出的一款先进的语音合成技术产品,其主要目标是为用户提供高质量、自然流畅的语音合成体验。这款系统尤其值得一提的是它内置了小美(女声粤语)这一特色...
总结起来,创建一个C#中英文语音阅读软件涉及的关键知识点包括:C#编程基础、语音合成API的使用(如SAPI和Azure Text-to-Speech)、处理混合语言文本的策略以及如何根据文本内容调整语音引擎的设置。通过实践这些...
根据给定的信息,本文将详细解析C#中的英文语音合成及中文语音识别技术...通过以上步骤,我们可以实现C#中英文语音合成与中文语音识别的基本功能。这种方法不仅适用于简单的应用程序,还可以作为更复杂系统的组成部分。
这个系统将利用特定的DLL文件和.NET Framework的语音合成技术,也称为TTS(Text-to-Speech)。 首先,我们要了解.NET Framework中的语音合成引擎。在.NET中,我们可以使用System.Speech.Synthesis命名空间提供的类...
语音识别技术的应用包括语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。语音识别技术所涉及的领域包括信号处理、模式识别、概率论和信息论、...
4. **语音合成(TTS)**:是将文本数据转化为可听见的语音的过程,这个demo就是利用了TTS技术,支持中英文。 5. **ASP.NET Web应用开发**:如果"WebApplication2"是一个Web应用,那么开发者可能使用ASP.NET创建了一...
SAPI是微软提供的一种接口,用于开发语音识别和合成应用。这个“WindowsFormsApplication2”压缩包文件很可能包含了实现这一功能的源代码示例。 首先,我们要了解C#语音识别的基础。在C#中,我们可以通过引用`...
综上所述,这个C#屏幕读屏软件项目结合了图像抓取、OCR识别、语音合成等多个领域的技术,为用户提供了一种无障碍的屏幕内容访问方式。开发者通过深入理解这些技术,可以进一步优化软件性能,提升用户体验。