`
JerryWang_SAP
  • 浏览: 1033040 次
  • 性别: Icon_minigender_1
  • 来自: 成都
文章分类
社区版块
存档分类
最新评论

科大讯飞语音转文字以及中文分词的Java测试代码

阅读更多

我录了一段音存储在这个test.m4a文件里,语音内容为"测试一下Netweaver对于并发请求的响应性能"。

使用如下Java代码进行测试:


package com.iflytek.msp.lfasr;

import java.util.HashMap;
import org.apache.log4j.Logger;
import com.alibaba.fastjson.JSON;
import com.iflytek.msp.cpdb.lfasr.client.LfasrClientImp;
import com.iflytek.msp.cpdb.lfasr.exception.LfasrException;
import com.iflytek.msp.cpdb.lfasr.model.LfasrType;
import com.iflytek.msp.cpdb.lfasr.model.Message;
import com.iflytek.msp.cpdb.lfasr.model.ProgressStatus;

// SDK document: http://www.xfyun.cn/doccenter/lfasr#go_sdk_doc_v2
public class TestLfasr 
{
    // original media path
    private static final String local_file = "c:\\temp\\test.m4a";

    private static final LfasrType type = LfasrType.LFASR_STANDARD_RECORDED_AUDIO;
    
    private static int sleepSecond = 20;
    
    public static void main(String[] args) {
        LfasrClientImp lc = null;
        try {
            lc = LfasrClientImp.initLfasrClient();
        } catch (LfasrException e) {
            Message initMsg = JSON.parseObject(e.getMessage(), Message.class);
            System.out.println("ecode=" + initMsg.getErr_no());
            System.out.println("failed=" + initMsg.getFailed());
        }
                
        // get upload task id
        String task_id = "";
        HashMap<String, String> params = new HashMap<>();
        params.put("has_participle", "true");
        try {
            Message uploadMsg = lc.lfasrUpload(local_file, type, params);
            int ok = uploadMsg.getOk();
            if (ok == 0) {
                task_id = uploadMsg.getData();
                System.out.println("task_id=" + task_id);
            } else {
                System.out.println("ecode=" + uploadMsg.getErr_no());
                System.out.println("failed=" + uploadMsg.getFailed());
            }
        } catch (LfasrException e) {
            Message uploadMsg = JSON.parseObject(e.getMessage(), Message.class);
            System.out.println("ecode=" + uploadMsg.getErr_no());
            System.out.println("failed=" + uploadMsg.getFailed());                  
        }
        while (true) {
            try {
                Thread.sleep(sleepSecond * 1000);
                System.out.println("waiting ...");
            } catch (InterruptedException e) {
            }
            try {
                Message progressMsg = lc.lfasrGetProgress(task_id);
                if (progressMsg.getOk() != 0) {
                    System.out.println("task was fail. task_id:" + task_id);
                    System.out.println("ecode=" + progressMsg.getErr_no());
                    System.out.println("failed=" + progressMsg.getFailed());
                    continue;
                } else {
                    ProgressStatus progressStatus = JSON.parseObject(progressMsg.getData(), ProgressStatus.class);
                    if (progressStatus.getStatus() == 9) {
                        System.out.println("task was completed. task_id:" + task_id);
                        break;  
                    } else {
                        System.out.println("task was incomplete. task_id:" + task_id + ", status:" + progressStatus.getDesc());
                        continue;
                    }
                }
            } catch (LfasrException e) {
                Message progressMsg = JSON.parseObject(e.getMessage(), Message.class);
                System.out.println("ecode=" + progressMsg.getErr_no());
                System.out.println("failed=" + progressMsg.getFailed());
            }
        }
        try {
            Message resultMsg = lc.lfasrGetResult(task_id);
            System.out.println(resultMsg.getData());
            if (resultMsg.getOk() == 0) {
                System.out.println(resultMsg.getData());
            } else {
                System.out.println("ecode=" + resultMsg.getErr_no());
                System.out.println("failed=" + resultMsg.getFailed());
            }
        } catch (LfasrException e) {
            Message resultMsg = JSON.parseObject(e.getMessage(), Message.class);
            System.out.println("ecode=" + resultMsg.getErr_no());
            System.out.println("failed=" + resultMsg.getFailed());
        }
    }
}

测试结果

(1) 所有中文均能成功转成文字; 但英文Netweaver的语音转换成了Net ball

(2) 智能分词也能按照期望工作,比如“测试一下”成功地分词成了“测试”和“一下”。

 

完整的Java项目在我的github上:https://github.com/i042416/voice2text
要获取更多Jerry的原创技术文章,请关注公众号"汪子熙"或者扫描下面二维码:

 
 
0
0
分享到:
评论

相关推荐

    科大讯飞语音识别官网接口文档

    科大讯飞语音识别官网接口文档, 语音识别api ,

    科大讯飞语音引擎3.0+TTS使用.zip

    本文将深入探讨科大讯飞语音引擎3.0及其TTS(Text To Speech,文本转语音)技术的应用与实现,帮助读者理解这一先进科技的内在机制。 一、科大讯飞语音引擎3.0概述 科大讯飞语音引擎3.0是科大讯飞公司推出的新一代...

    科大讯飞语音合成V2.36 绿色特别版

    本次我们关注的是科大讯飞的语音合成V2.36绿色特别版,这是一款将任意文字转化为语音的高效工具,为用户提供了一种全新的文字处理方式。 语音合成,顾名思义,是将文本数据转化为可听的语音输出,这项技术基于深度...

    科大讯飞TTS

    **科大讯飞TTS**,全称是科大讯飞Text To Speech,是由中国领先的语音技术提供商科大讯飞开发的一种文本转语音(TTS)系统。它将输入的文字信息转化为可听的语音输出,广泛应用在智能语音助手、语音导航、有声读物、...

    中文分词java源代码

    《中文分词Java源代码深度解析》 在信息爆炸的时代,自然语言处理(NLP)技术扮演着至关重要的角色,而中文分词是NLP中的基础环节。本篇将深入探讨一个以Java编写的中文分词系统,通过对提供的源代码进行分析,揭示...

    中文分词 java 代码

    中文分词 java 代码

    科大讯飞开发资料

    TTS SDK是科大讯飞开发包中的关键部分,全称为“文本转语音”服务。它能够将输入的文本转换为自然流畅的语音输出,广泛应用于智能助手、导航系统、有声读物等领域。TTS技术主要包含以下几个核心模块: 1. 文本分析...

    科大讯飞语音合成需要的文件iFlyTTS.rar

    科大讯飞作为中国领先的AI企业,其在语音技术领域有着深厚的积累,特别是语音合成技术。"科大讯飞语音合成需要的文件iFlyTTS.rar"是一个与科大讯飞的iFlyTTS(文语通)系统相关的压缩包,它包含了用于实现语音合成...

    jieba分词java版项目

    这通常是通过JNI(Java Native Interface)或者Java的JNIWrapper库来实现的,使得Java代码可以直接调用C/C++编写的底层分词库。 3. **项目结构**: 在项目中,`run`包下的`test`程序应该是项目的入口点,通常包含...

    中文分词java实现

    例如,使用jieba分词进行分词和词性标注的Java代码示例: ```java import com.huaban.analysis.jieba.JiebaSegmenter; import com.huaban.analysis.jieba.Posseg; public class ChineseWordSeg { public static ...

    lucene分词测试代码

    用java写的图形分词测试的小东西,用的分词器是: 来自“猎图网 www.richmap.cn”基于IKAnalyzer分词算法的准商业化Lucene中文分词器,其使用“正向全切分算法”,42万汉字字符/每秒的处理能力(IBM ThinkPad 酷睿I...

    JAVA实现的中文分词程序

    Java实现的中文分词程序是一种基于Java编程语言的文本处理工具,主要应用于处理中文文本,将其拆分成有意义的词汇单元,这一过程被称为分词。在自然语言处理(NLP)领域,分词是预处理阶段的关键步骤,为后续的文本...

    java 实现的中文分词算法(代码)

    在Java代码实现中,常用的数据结构有`HashMap`用于存储词典,`StringBuilder`用于拼接候选词语,`ArrayList`或`LinkedList`用于存储分词结果。同时,Java的字符串操作函数,如`substring()`和`indexOf()`,会在分词...

    离线语音合成 TTS_Test(语音) C Sharp c# 例程

    7. **示例代码**: `TTS_Test(语音)`很可能是包含C#代码示例的文件,它演示了如何使用科大讯飞的SDK进行离线语音合成。通过分析和运行这个示例,开发者可以快速理解和实现自己的TTS功能。 总之,离线语音合成技术在...

    FMM最大正向匹配分词java源代码

    ### FMM最大正向匹配分词Java源代码分析 #### 一、概述 本文将对提供的"FMM最大正向匹配分词Java源代码"进行详细解析。该代码实现了基于最大正向匹配(Forward Maximum Matching,简称FMM)算法的中文分词功能。...

    使用IK Analyzer实现中文分词之Java实现

    IK Analyzer 是一个开源的,基于 java 语言开发的轻量级的中文分词工具包。从 2006年 12 月推出 1.0 版开始, IKAnalyzer 已经推出了 4 个大版本。最初,它是以开源项目Luence 为应用主体的,结合词典分词和文法分析...

    java版本结巴分词

    Java版本的结巴分词是基于Java实现的中文分词工具,它在处理中文文本时具有高效、灵活和易用的特点。结巴分词(Jieba)最初是由Python开发的,但为了满足Java开发者的需求,也有了Java版本。本文将深入探讨Java版...

    java实现中文分词simhash算法

    中文不同于英文,单词之间没有明显的分隔符,因此在处理中文文本时,我们需要先进行分词,即将连续的汉字序列切分成有意义的词汇单元。Sanford中文分词库是一种常用的分词工具,它基于统计模型,能够根据语料库学习...

    python实现语音识别前期准备(调用科大讯飞平台)

    在这个过程中,我们需要准备一些必要的环境和第三方库,以及了解科大讯飞的语音听写流式WebAPI接口。 首先,确保你的开发环境是Windows操作系统,并且已经安装了Python 3.7。为了成功运行语音识别的Demo,你需要...

    基于java的中文分词系统

    【标题】:“基于Java的中文分词系统”指的是一个利用Java编程语言开发的软件工具,其主要功能是对中文文本进行分词处理。在自然语言处理(NLP)领域,中文分词是预处理的关键步骤,因为中文没有明显的空格来区分...

Global site tag (gtag.js) - Google Analytics