`
iomo
  • 浏览: 39757 次
  • 性别: Icon_minigender_1
  • 来自: 上海
最近访客 更多访客>>
社区版块
存档分类
最新评论

汉字转拼音

    博客分类:
  • .net
阅读更多

 

StrToPinyin.cs

 

using System;
using System.Data;
using System.Configuration;
using System.Web;
using System.Web.Security;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Web.UI.WebControls.WebParts;
using System.Web.UI.HtmlControls;
namespace JM.Dreamzx.Bll
{
    public   class StrToPinyin
    {
        public StrToPinyin()
        { }

        private static string[] strChineseCharList = 
            { 
#region

                "A阿啊锕嗄厑哎哀唉埃挨溾锿鎄啀捱皑凒溰嘊敳皚癌毐昹嗳矮蔼躷噯藹譪霭靄艾伌爱砹硋隘嗌塧嫒愛碍暧瑷僾壒嬡懓薆曖璦鴱皧瞹馤鑀鱫安侒峖桉氨庵谙萻腤鹌蓭誝鞌鞍盦馣鮟盫韽啽雸垵"   , 
                "A俺唵埯铵隌揞罯銨犴岸按荌案胺豻堓婩暗貋儑錌黯肮岇昂昻枊盎醠凹坳垇柪軪爊敖厫隞嗷嗸嶅廒滶獒獓遨熬璈蔜翱聱螯翶謷翺鳌鏖鰲鷔鼇芺袄媪镺襖岙扷岰傲奡奥嫯慠骜奧嶴澳懊擙謸鏊"   , 
                #endregion
            };
        /// <summary> 
        /// 获得一个字符串的汉语拼音码 
        /// </summary> 
        /// <param name="strText">字符串</param> 
        /// <returns>汉语拼音码,该字符串只包含大写的英文字母</returns> 
        public static string GetChineseSpell(string strText)
        {
            if (strText == null || strText.Length == 0)
                return strText;
            System.Text.StringBuilder myStr = new System.Text.StringBuilder();
            foreach (char vChar in strText)
            {
                // 若是字母则直接输出 
                if ((vChar >= 'a' && vChar <= 'z') || (vChar >= 'A' && vChar <= 'Z'))
                    myStr.Append(char.ToUpper(vChar));
                else if ((int)vChar >= 19968 && (int)vChar <= 40869)
                {
                    // 若字符Unicode编码在编码范围则 查汉字列表进行转换输出 
                    foreach (string strList in strChineseCharList)
                    {
                        if (strList.IndexOf(vChar) > 0)
                        {
                            myStr.Append(strList[0]);
                            break;
                        }
                    }
                }
            }
            return myStr.ToString();
        }// GetChineseSpell  
    }
}

 

 

   ConvertHzToPz_Gb2312.cs

 

 

using System;
using System.Data;
using System.Configuration;
using System.Web;
using System.Web.Security;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Web.UI.WebControls.WebParts;
using System.Web.UI.HtmlControls;
using System.Text;

namespace JM.Dreamzx.Bll
{
  public   class ConvertHzToPz_Gb2312
    {
        public ConvertHzToPz_Gb2312()
        {
            //
            // TODO: Add constructor logic here
            //
        }


        //01-09区为特殊符号。 
        //16-55区为一级汉字,按拼音排序。 
        //56-87区为二级汉字,按部首/笔画排序。
        // 每个汉字及符号以两个字节来表示。第一个字节称为“高位字节”,第二个字节称为“低位字节”。
        //“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。
        //例如“啊”字在大多数程序中,会以0xB0A1储存。(与区位码对比:0xB0=0xA0+16,0xA1=0xA0+1)。
        //源码下载:http://www.51aspx.com/CV/HanZiZhuanPinYin
        #region //gb2312中的汉字编码
        private static readonly string[][] _Allhz =
         new string[][]
   {
    new string[]{"A","啊阿呵吖嗄腌锕錒"},
    new string[]{"Ai","爱矮挨哎碍癌艾唉哀蔼隘埃皑呆嗌嫒瑷暧捱砹嗳锿霭乂乃伌僾儗凒剀剴叆呃呝啀嘊噫噯堨塧壒奇娭娾嬡嵦愛懓懝敱敳昹曖欬欸毐溰溾濭烠焥璦皚皧瞹硋磑礙絠薆藹諰譪譺賹躷醷鎄鑀閡阂阨阸隑靄靉餲馤騃鯦鱫鴱崖"},
          #endregion


        public static string Convert(string str)
        {
            if (str == null)
                return null;
            Encoding ed = Encoding.GetEncoding("GB2312");
            if (ed == null)
                throw (new ArgumentException("没有找到编码集GB2312"));
            int bh = 0;
            char[] charary = str.ToCharArray();
            byte[] bAry = new byte[2];
            StringBuilder rtnSb = new StringBuilder();
            for (int i = 0; i < charary.Length; i++)
            {

                bAry = ed.GetBytes(charary[i].ToString());
                if (bAry.Length == 1)
                {
                    rtnSb.Append(charary[i]);
                    continue;
                }
                bh = bAry[0] - 0xA0;
                if (0x10 <= bh && bh <= 0x57)//是gb2312汉字
                {
                    bool isFind = false;
                    for (int j = 0; j < _Allhz.Length; j++)
                    {
                        if (_Allhz[j][1].IndexOf(charary[i]) != -1)
                        {
                            rtnSb.Append(_Allhz[j][0]);
                            isFind = true;
                            break;
                        }
                    }
                    if (!isFind)
                        rtnSb.Append(charary[i]);

                }
                else
                    rtnSb.Append(charary[i]);

            }
            return rtnSb.ToString();
        }



    }
}

 

 

            //lbPinyin.Text = "首字母是:" + StrToPinyin.GetChineseSpell(txtChn.Text) + "<br>拼音是:" + ConvertHzToPz_Gb2312.Convert(txtChn.Text);
            string user_simple = StrToPinyin.GetChineseSpell(uname).ToLower();
            string user_full   = ConvertHzToPz_Gb2312.Convert(uname).ToLower();

 (来源:http://www.iomo.cn)

分享到:
评论

相关推荐

    C++中文汉字转拼音

    本项目名为"C++中文汉字转拼音",旨在利用C++编程实现一个高效、灵活的汉字转拼音功能。 项目的核心在于使用"拼音-中文"的数据字典。这种设计思路是预先建立一个包含所有汉字及其对应拼音的映射关系,通常以文本...

    汉字转拼音_汉字转拼音Excel_

    标题“汉字转拼音_汉字转拼音Excel_”暗示我们将讨论如何使用Excel中的VBA宏来实现这个功能。VBA是一种内置于Microsoft Office套件中的编程语言,允许用户自定义工作簿的行为,包括自动化任务、创建复杂的公式以及...

    中文汉字转拼音 大写(默认) 小写 首字母大写

    在IT领域,中文汉字转拼音是一项常见的处理任务,特别是在自然语言处理、文本分析以及编程中。这个任务的主要目的是将汉字转换成对应的汉语拼音,以便计算机能够更好地理解和处理中文信息。以下将详细介绍汉字转拼音...

    postgreSQL 拼音字库 汉字转拼音 8.4

    网上传的postgreSQL汉字转拼音的方法,是针对9.3的版本(相信你要是8.4的也搜到了但不能直接用,才来看我的),尝试了8.4的版本来做拼音处理。发现网上的《postgreSQL汉字转拼音》里面坑比较多,尝试纠正了一下,发...

    Mysql中文汉字转拼音的实现(每个汉字转换全拼)

    在MySQL中实现中文汉字转拼音的功能,主要是为了方便在数据库查询和数据分析时处理中文文本,尤其是在没有全文索引或者需要进行复杂模糊匹配时。以下是一个简单的实现方法,它利用自定义函数来完成这一任务。 首先...

    C#汉字转拼音(npinyin)将中文转换成拼音全文或首字母

    例如,如果一个程序需要对中文字符进行排序,或者在没有输入法的情况下通过英文键盘输入中文,汉字转拼音就显得尤为重要。 "C#汉字转拼音(npinyin)"是一个C#库,它提供了一个方便的方式来将汉字转换为对应的汉语...

    JavaScript中文转拼音,JS中文转拼音插件,中文转拼音(JavaScript)

    标签中的"URL拼音化"强调了这个插件在生成拼音URL上的应用场景,而"JS中文转拼音插件"和"中文转拼音"则表明该插件专注于这个功能,并且是用JavaScript编写的。 总之,这个压缩包提供的JavaScript插件是一个实用的...

    delphi 汉字转拼音组件

    在处理中文字符时,尤其是在需要进行汉字与拼音转换的场景下,Delphi 汉字转拼音组件显得尤为重要。本文将深入探讨这款组件的功能、应用及其在Delphi7环境下的使用方法。 首先,我们要明确这款组件的核心功能——将...

    表格汉字转拼音_汉字转拼音_

    汉字转拼音是将中文字符转化为其对应的普通话读音的过程。在计算机系统中,汉字通常以Unicode编码存储,而拼音则是一种基于拉丁字母的表示方式,便于计算机处理和搜索。这项技术主要依赖于汉字拼音库,这些库包含了...

    delphi12 汉字转拼音全拼及简拼 XE

    汉字转拼音是计算机处理中文文本的重要一环。全拼是指将汉字转换为完整的汉语拼音,而简拼则是用简化的形式表示汉字,通常只包含声母和韵母,不包括声调。在Delphi 12 XE中,我们可以利用内置的TCharServices组件...

    汉字转拼音Delphi代码, 在Delphi2010下也可以实现

    本主题聚焦于在Delphi环境下实现汉字转拼音的功能,这是一个常见的需求,尤其是在处理中文字符、语音合成或者搜索引擎优化时。对于Delphi 7 和 Delphi 2010 这两个不同版本,由于它们之间的编码差异,代码可能需要...

    DelPhi中文转拼音,全拼和首字母

    标题中的"Delphi中文转拼音,全拼和首字母"是指使用Delphi编程语言开发的一个功能,该功能能够将输入的中文文本转化为对应的拼音表示,包括全拼(每个汉字转化为完整的拼音)和首字母(每个汉字转化为声母,即汉语...

    汉字转拼音C++源代码

    汉字转拼音是将中文汉字转化为对应的汉语拼音的过程。在计算机处理中文时,由于计算机内部主要处理ASCII编码,而汉字属于Unicode或GBK等多字节编码,因此需要将汉字转换为拼音以便进行进一步的处理。这个转换过程...

    oracle汉字转拼音package包-支持UTF8

    总的来说,这个"oracle汉字转拼音package包-支持UTF8"是一个非常实用的工具,可以帮助我们在Oracle数据库环境中有效地处理汉字到拼音的转换问题,尤其适用于处理UTF8编码的多语言数据。正确理解和使用这个Package,...

    Java汉字转拼音(支持多音字)

    这个"Java汉字转拼音(支持多音字)"的主题涉及了如何在Java环境中实现这一功能,特别是考虑到中文的多音字特性。 多音字是指一个汉字有多个读音,其读音取决于它在特定语境中的含义。例如,“打”字可以读作“dǎ...

    SQL 汉字转拼音首字母

    ### SQL汉字转拼音首字母知识点解析 #### 一、背景介绍 在数据库处理过程中,有时候我们需要将汉字转换为对应的拼音,特别是在中文环境下的数据检索、排序等操作中,这种需求尤为常见。本篇文章将深入探讨如何利用...

    Qt 汉字转拼音与首字母

    当我们处理中文字符时,有时需要将汉字转换为拼音或提取其首字母,这在比如搜索、排序或生成缩略词时非常有用。本教程将深入讲解如何在Qt环境中利用C++实现汉字到拼音和首字母的转换。 首先,要进行汉字转拼音,...

    oracle汉字转拼音函数整理大全

    ### Oracle汉字转拼音函数知识点详解 #### 一、概述 在Oracle数据库中,有时需要将汉字转换成拼音,尤其是在处理中文数据时。本篇文档详细介绍了两种用于转换汉字到拼音的自定义函数:`fn_getpyKGJG` 和 `fn_...

    关于汉字转拼音的实现方法.rar(简单方便实用)

    汉字转拼音是计算机处理中文文本时常见的需求,尤其在语音合成、搜索引擎索引、自动文本标注等领域有着广泛应用。本资源提供了实现这一功能的必要组件和详细步骤,旨在帮助开发者快速理解并实施汉字转拼音功能。 ...

    java汉字转拼音,android汉字转拼音,汉字转拼音首字母,汉字转ASCII

    以上就是关于“java汉字转拼音,android汉字转拼音,汉字转拼音首字母,汉字转ASCII”的技术要点。在实际应用中,根据需求选择合适的转换方式,并注意处理可能出现的异常情况,如多音字、非ASCII字符等。在处理大量...

Global site tag (gtag.js) - Google Analytics