`
weihe6666
  • 浏览: 436210 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

HTK-HVite

阅读更多
HTK-HVite


This operation is similar to the HLEd word-to-phone mapping operation , however in this case the HVite command can consider all pronunciations for each word (in the case where a word has more than one pronunciations), and then output the pronunciation that best matches the acoustic data.

HVite的目的在于为每一个word后加一个sp
比如:
"*/sample1.lab"
DIAL
ONE
TWO
THREE
FOUR
FIVE
SIX
SEVEN
EIGHT
NINE
OH
ZERO
.
经过word-to-phone转换后:
"*/sample1.lab"
sil
d
ay
l
w
ah
n
t
uw
th
r
iy
f
ow
r
f
ay
v
s
ih
k
s
s
eh
v
ih
n
ey
t
n
ay
n
ow
z
iy
r
ow
sil
.
每个词之间有一个小的sp,处理后的结果为:
"*/sample1.lab"
sil
d
ay
l
sp
w
ah
n
sp
t
uw
sp
th
r
iy
sp
f
ow
r
sp
f
ay
v
sp
s
ih
k
s
sp
s
eh
v
ih
n
sp
ey
t
sp
n
ay
n
sp
ow
sp
z
iy
r
ow
sp
sil
.

指令:
$ HVite -A -D -T 1 -l '*' -o SWT -b SENT-END -C config -H hmm7/macros -H hmm7/h
mmdefs -i aligned.mlf -m -t 250.0 150.0 1000.0 -y lab -a -I words.mlf -S train.
scp dict monophones1>HVite_log

-l dir :
   This specifies the directory to store the output label files.If this option is not used then HVite will store the label files in the same directory as the data.In particular,setting the option -l ’*’ will cause a label file named xxx to be prefixed by the patternn "*/xxx" in the output MLF file. This is useful for generating MLFs which are independent of the location of the corresponding data files.

-o s :
     -o s    output label formating NCSTWMX
Choose how the output labels should be formatted. s is a string with certain letters (from NSCTWM) indicating binary flags that control formatting options.
  N normalise acoustic scores by dividing by the duration (in frames) of the segment.
  S remove scores from output label. By default scores will be set to the total likelihood of the segment.
  C Set the transcription labels to start and end on frame centres. By default start times are set to the start time of the frame and end times are set to the end time of the frame.
  T Do not include times in output label files. W Do not include words in output label files when performing state or model alignment.  
  M Do not include model names in output label files when performing state
and model alignment.

   -b s    def s as utterance boundary word 

   -H mmf  Load HMM macro file mmf

   -i s    Output transcriptions to MLF s 

   -y s    output label file extension

   -a      align from label files               off


-b s    def s as utterance boundary word     none
-c f    tied mixture pruning threshold       10.0
-d s    dir to find hmm definitions          current
-e      save direct audio rec output         off
-f      output full state alignment          off
-g      enable audio replay                  off
-h s    set speaker name pattern             *.mfc
-i s    Output transcriptions to MLF s       off
-j i    Online MLLR adaptation               off
         Perform update every i utterances
-k      use an input transform               off
-l s    dir to store label/lattice files     current
-m      output model alignment               off
-n i [N] N-best recognition (using i tokens) off
-o s    output label formating NCSTWMX       none
-p f    inter model trans penalty (log)      0.0
-q s    output lattice formating ABtvaldmn   tvaldmn
-r f    pronunciation prob scale factor      1.0
-s f    grammar scale factor                 1.0
-t f [f f] set pruning threshold             0.0
-u i    set pruning max active               0
-v f    set word end pruning threshold       0.0
-w [s]  recognise from network               off
-x s    extension for hmm files              none
-y s    output label file extension          rec
-z s    generate lattices with extension s   off
-A      Print command line arguments         off
-B      Save HMMs/transforms as binary       off
-C cf   Set config file to cf                default
-D      Display configuration variables      off
-E s [s] set dir for parent xform to s       off
         and optional extension
-F fmt  Set source data format to fmt        as config
-G fmt  Set source label format to fmt       as config
-H mmf  Load HMM macro file mmf
-I mlf  Load master label file mlf
-J s [s] set dir for input xform to s        none
         and optional extension
-K s [s] set dir for output xform to s       none
         and optional extension
-L dir  Set input label (or net) dir         current
-P      Set target label format to fmt       as config
-S f    Set script file to f                 none
-T N    Set trace flags to N                 0
-V      Print version information            off
-X ext  Set input label (or net) file ext    lab

分享到:
评论

相关推荐

    HTK-3.4.tar.gz

    《深入解析HTK-3.4:语音技术的基石》 HTK(Hidden Markov Model Toolkit)是一款广泛应用的开源工具包,主要用于语音信号处理、语音合成以及语音识别领域。其最新版本HTK-3.4,是研究者和开发者的重要资源,提供了...

    HTK-3.3-alpha1.tar.gz_HTK_HTK工具箱_htk-3.3_隐马尔科夫模型_马尔科夫

    HTK工具箱由一系列的命令行工具组成,例如HHEd用于编辑HMM定义,HVite用于进行解码,HCompV用于模型压缩,以及HList用于显示模型信息。这些工具共同构成了一个完整的HMM开发流程,使得研究人员和工程师能够高效地...

    HTK-3.4.1.zip_HTK_HTK source 3.4.1_HTK-samples-3.4.1_htk source_

    HTK的组件包括一系列的工具,如HSLAB(用于创建和编辑HMM状态图)、HHEdit(用于编辑HMM定义)、HVite(用于训练和解码HMMs)等。这些工具共同构成了一个强大的语音识别工作流程。在64位Windows上编译的可执行文件,...

    HTK-3.5.beta-2.tar.gz

    HTK的核心组件包括HSLAB(用于实验设计)、HLABEL(用于标注数据)、HHEd(用于编辑HMM模型)、HCompV(用于训练HMM)、HVite(用于在线解码)等。这些工具共同构成了一个强大的框架,用于训练和应用隐马尔可夫模型...

    HTK-samples-3.4.zip_HTK_htk-3.4.1

    - **HTK架构**:HTK由一系列工具组成,包括模型定义工具(HED)、训练工具(HHEd、HVite等)和解码工具(HDecode)等,提供了一个完整的语音识别流程。 2. **HTK的工作流程**: - **模型定义**:使用HED工具定义...

    htk-3.3.rar_HTK_HTK3_htk 3.3 linux source_htk-3.3_语音

    2. **工具(Tools)**:包括训练和应用HMM的程序,如HCompV用于模型编译,HDecode用于解码,HVite用于在线训练等。 3. **示例(Examples)**:提供简单的示例项目,帮助初学者快速上手。 4. **文档(Docs)**:包含...

    HTK-samples-3.4.zip_HMM_HTK_HTK 3.4_HTK samples_HTK-in-VC

    同时,HTK的命令行工具,如HHEd(模型编辑)、HVite(解码)、HCopy(特征提取和模型参数化)等,也需要熟悉其用法和参数设置。 在实际应用中,HTK常常与VC(Visual C++)或其他编程环境结合,开发出定制化的语音...

    htk.rar_HTK_HTK-in-VC

    HTK的主要组件包括特征提取器(HSLAB)、模型定义工具(HHEd)、训练工具(HTrain)和解码工具(HVite)等。 2. **文档**:压缩包中的文档可能详述了HTK的安装步骤、配置环境、基本概念、模型训练过程以及如何使用...

    HTK-speechRecognition

    **HTK语音识别系统概述** HTK(HMM Toolkit)是一种广泛应用的开源工具包,用于构建隐马尔可夫模型(HMM)为基础的语音识别系统。它由剑桥大学工程系开发,为语音处理研究者和工程师提供了一个强大且灵活的平台。...

    有关HTK的资料(htk-3.3 VoiceDialSystem)

    - HVite:在线识别工具,用于实时的语音识别。 二、VoiceDialSystem简介 VoiceDialSystem是基于HTK的一个语音拨号系统,其目标是实现通过语音命令来拨打电话号码。该系统通常包括语音识别、语音合成以及数据库...

    HTK.rar_HTK_HTK工具包_htk-3.3_htk.e

    4. **HVite**: HMM在线训练和解码工具,能够对新数据进行模型适应和解码。 5. **HCompV**: 用于将HMM模型转换为Viterbi网络,这在解码过程中非常有用,可以加速模型的搜索过程。 6. **HList**: 用于列出模型文件中...

    HTK-samples-3.4.tar.gz_HTK_HTK samples_I Want! I Want_htk sample

    安装完成后,我们可以利用HTK提供的工具,如HCompV用于模型参数化,HVite用于解码,HHEd用于模型编辑等,对样本数据进行处理。 首先,我们需要使用HCompV对音频文件进行特征提取,生成HTK所需的参数文件。然后,...

    HTK-3.4.1 剑桥大学语音处理工具库 源代码

    《HTK-3.4.1:剑桥大学的语音处理工具库详解》 HTK(Hidden Markov Model Toolkit)是剑桥大学开发的一个开源工具包,主要用于语音识别和处理。HTK-3.4.1是其一个重要的版本,为研究者和开发者提供了丰富的功能和...

    htk-3.2.1-windows-binary.zip_HMM_HTK Windows exe_htk binary_隐马尔可

    4. HVite:HMM Viterbi Training/Decoding,用于训练HMM和进行解码。 5. HCompV:HMM参数压缩工具,用于降低模型的存储需求。 6. HERest:HMM Estimation,用于从观测数据估计HMM参数。 在Windows环境下,这些工具...

    HTK-samples-3.3.tar.gz_HTK

    4. **模型训练**:HTK使用EM(期望最大化)算法来训练HMMs,用户将学习如何使用HVite进行此过程,并调整参数以优化模型性能。 5. **特征提取**:HTK支持多种特征提取方法,如MFCC(梅尔频率倒谱系数)、PLP(感知...

    HTKbook--chinese.zip_HTK 语音处理_HTK 中文_HTKbook--chinese_HTKbook中文

    《HTKbook--chinese.zip》是一个包含HTK(Hidden Markov Model Toolkit)语音处理工具中文版的相关资料,主要目标是帮助用户更轻松地理解和掌握HTK技术。HTK是语音识别领域广泛应用的一个开源工具包,它提供了一整套...

    HTK-3.2.tar.gz_HTK_HTK3.2_隐马尔科夫模型_马尔科夫

    2. 数据预处理工具:如HVite,用于将原始音频数据转换为特征向量,如MFCC(梅尔频率倒谱系数)。 3. 模型训练工具:如HHEd,用于根据观测数据估计模型参数,采用Baum-Welch算法进行最大似然估计或EM算法。 4. 模型...

    HTK-samples-3.2.tar.gz_HTK_HTK工具箱_htk sample_隐马尔科夫模型_马尔科夫

    **HTK工具箱详解与应用** HTK(Hidden Markov Model Toolkit)是一个广泛使用的开源工具包,主要用于构建和分析隐马尔科夫模型(HMMs)。标题中的"HTK-samples-3.2.tar.gz"是这个工具包的一个特定版本,其中包含了...

    隐马尔可夫工具箱HTK-3.4.1

    2. **HTK架构**:HTK的核心组件包括HHEd(模型编辑器)、HCompV(模型编译器)、HVite(解码器)、HNetTrain(神经网络训练工具)等。这些工具分别负责HMM模型的创建、参数估计、解码以及新型模型的学习。 3. **...

    htk-3.3-windows-binary.zip_HMM_HTK_HTK toolkit_HTK windows_windo

    压缩包内的文件“htk”可能是一个目录或者文件,这通常包含了HTK工具包的所有组件,如HHEd(模型编辑器)、HCompV(模型编译器)、HVite(解码器)、HLabel(标注工具)等。这些工具使得用户能够创建、训练、优化和...

Global site tag (gtag.js) - Google Analytics