`
izuoyan
  • 浏览: 9318074 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

获取汉语字串的拼音

阅读更多

代码请到这里下载: http://www.hellocpp.net/Articles/Article/731.aspx

网上有很多获取给定汉语字符的拼音的方法。但是个人感觉都不是很全。绝大部分只能获取声母,而且只限于GB2312的编码。

本文提供一个简单的方法。能获取unicode字的拼音。包括韵母。其实这个方法非常非常的简单。可能大家都想到过。只是觉得太简单了。不屑于去用。

方法就是:找个输入法的字符拼音对照表。把这个表逆转过来就可以了。至于内存么。我测试过了。顶多2M的内存。查找速度慢?字符都是有序的,排序后用折半查找。通常情况14次左右的对比就搞定了。绝对不会有问题的。

另外,多音字的确是个问题。最好辅助的找个汉语分词的库,把句子分成词,然后查找词的拼音。这个比较靠谱一些。本文的代码没有处理多音字。但是支持常用词语的查询。大于27000个汉字。
本文的代码直接编译肯定不行的,自己下载了小改一下。包里已经带了我转好的有序表。如果要自己生成有序表(输入表的词汇可以变化的)输入的汉字表如下:


馤ai
騃ai
鯦ai
鱫ai
鴱ai
呆板aiban
爱不释手aibushishou
爱厂如家aichangrujia
挨打aida
爱戴aidai
哀悼aidao
挨饿aie
爱抚aifu
挨个aige
爱国aiguo
爱国侨胞aiguoqiaobao

分享到:
评论

相关推荐

    sqlServer 获取汉字字串的拼音声母

    这个标题提到的问题是“sqlServer 获取汉字字串的拼音声母”,即如何从一个包含汉字的字符串中提取出每个汉字的声母部分。下面我们将详细探讨这个问题以及提供的代码实现。 首先,我们要理解汉字的拼音声母。汉语...

    汉字字符串拼音排序-QT、C++

    例如,汉字"你好"会转换为"nǐ hǎo",然后我们可以获取首字母"N"和"H"。 对于字符串排序,C++标准库提供了`std::sort`函数,可以对任何可比较的元素进行排序,包括`QString`对象。如果我们已经有了每个字符串的...

    获取光标前字串的源代码

    在编程领域,获取光标前的字符串是一项常见的需求,特别是在文本编辑器或者命令行界面的开发中。这个任务可以通过各种编程语言来实现,比如Visual Basic (VB)。在这个场景下,我们将探讨如何利用API(应用程序接口)...

    android字串导出工具

    导出android代码内的字串到excel,便于翻译。 导出后的格式是: key 英文 待翻译的语言 导出时,会自动忽略不必要的字串。比如注释里带not translate,或者属性里有translate="false"的字串。 ------------ ./string...

    在浏览器中获取文件或字串的md5的js源代码

    标题中的“在浏览器中获取文件或字串的md5的js源代码”指的是利用JavaScript实现MD5哈希算法,以处理浏览器环境中的文件或字符串。MD5(Message-Digest Algorithm 5)是一种广泛使用的加密散列函数,产生一个128位...

    字串替换器 1.05 版

    "字串替换器 1.05 版"是一款实用工具,主要用于文本处理中的字符串查找与替换操作。在日常的编程、文档编辑或数据分析中,我们经常需要批量修改大量文本中的特定字符或短语,这款软件就是为了满足这种需求而设计的。...

    php获取中文拼音首字母类和函数分享

    `_getInitials`方法是类中的一个私有方法,它用于获取中文字串的拼音首字符。如果输入字符串是英文的,它会直接返回原字符串。如果输入字符串是中文的,它会遍历字符串中的每一个汉字,并返回其拼音首字母。如果输入...

    Autohotkey之热字串和自动扩展

    Autohotkey 之热字串和自动扩展 Autohotkey 的热字串和自动扩展功能是其中非常重要的两个概念。热字串是指在 Autohotkey 中定义的一种特殊的热键,它可以实现自动扩展的功能。例如,当用户键入一些单词的缩写时,热...

    2050:例5.20字串包含.cpp

    2050:【例5.20】字串包含 时间限制: 1000 ms 内存限制: 65536 KB 提交数: 19468 通过数: 8142 【题目描述】 字符串移位包含问题。 对于一个字符串来说,定义一次循环移位操作为:将字符串的第一个字符移动到末尾...

    js获取url中”?”后面的字串方法

    //获取url中”?”符后的字串 var theRequest = new Object(); if (url.indexOf(“?”) != -1) { var str = url.substr(1); strs = str.split(“&”); for ( var i = 0; i < strs.length; i++) { theRequest[strs...

    js获取url中"?"后面的字串方法

    "符后的字串 var theRequest = new Object(); // 创建一个空对象用来存储参数 if (url.indexOf("?") != -1) { // 如果URL中确实包含了"?",则执行后续代码 var str = url.substr(1); // 去掉"?"符号,获取实际的...

    论文研究-基于外部排序的字串左右熵快速计算方法.pdf

    提出了一种计算方法,对于某长度字串计算熵,首先按长度提取语料中的全部字串,使用外部排序和归并获取字串的出现频率,然后分别剔除首尾字符构造待计算字串的频率提供文件,最后使用文件记录频率对比来计算右熵和左...

    遍历电脑,找出含有相关字串的所有文件

    在IT领域,尤其是在软件开发和数据管理中,有时我们需要快速定位到包含特定字串的文件。这个任务可以通过编写脚本或者使用专门的搜索工具来实现。以下是一些关于如何遍历电脑并找出含有相关字串的所有文件的知识点:...

    Java 基本语法(四)——字串和数组

    ### Java基本语法(四)—— 字串和数组 #### 字串(String) 在Java中,`String` 是一种非常重要的数据类型,它代表一系列字符。Java中的字符串是不可变的,这意味着一旦创建了一个字符串对象,其内容就不能更改。...

    android字串的拆分问题

    本文将深入探讨“android字串的拆分问题”,并提供相关的解决方案。 字符串拆分是处理文本数据时的一项基本操作。在Java和Android中,我们可以使用多种方法来拆分字符串。主要的方法有两种:`split()` 和 `Pattern....

    TextCrypt字串加解密工具

    撰写应用程式时,常会将程式设定值储存成文字档(*.ini, *.config, *.xml),一般比较资安敏感的字串(如资料库连线字串)写在这些没有加密的文字档里,容易被人窥看。兼顾简易及可逆的解密需求,我们会在文档中替代成已...

    Android应用获取设备序列号的方法

    一般情况下,序列号都是厂商自己定义的一串字串,字串中的某几位会有不同含义,比如厂商的ID、出厂时间、机器类型等,另外,运营商定义的序列号几乎也是遵循这样的规律。 出厂时序列号的烧录 这个是烧录程序做的事情。...

    Delphi字串函数

    常用的字串函数,比Delphi自带的速度快很多! StrPos,StrRplc,及其它常用,易用性函数。

    html转C语言字串或数组工具

    "html转C语言字串或数组工具"就是这样的一个实用程序,它能够帮助C语言开发者有效地处理HTML内容,将其转化为C语言可读的字符串或数组形式。这对于在C语言环境下构建网页爬虫、解析HTML文档或者进行数据提取等任务...

Global site tag (gtag.js) - Google Analytics