`

Python实现返回汉字首字母

阅读更多

Python实现返回汉字首字母,该程序只能识别常规拼音,不能识别多音字。

  • #coding=gbk   
  • def multi_get_letter(str_input):     
  •     if isinstance(str_input, unicode):     
  •         unicode_str = str_input     
  •     else:     
  •         try:     
  •             unicode_str = str_input.decode('utf8')     
  •         except:     
  •             try:     
  •                 unicode_str = str_input.decode('gbk')     
  •             except:     
  •                 print 'unknown coding'    
  •                 return    
  •          
  •     return_list = []     
  •     for one_unicode in unicode_str:     
  • #        print single_get_first(one_unicode)      
  •         return_list.append(single_get_first(one_unicode))     
  •     return "".join(return_list)         
  •          
  • def single_get_first(unicode1):     
  •     str1 = unicode1.encode('gbk')     
  •     try:             
  •         ord(str1)     
  •         return str1     
  •     except:     
  •         asc = ord(str1[0]) * 256 + ord(str1[1]) - 65536    
  •         if asc >= -20319 and asc <= -20284:     
  •             return 'a'    
  •         if asc >= -20283 and asc <= -19776:     
  •             return 'b'    
  •         if asc >= -19775 and asc <= -19219:     
  •             return 'c'    
  •         if asc >= -19218 and asc <= -18711:     
  •             return 'd'    
  •         if asc >= -18710 and asc <= -18527:     
  •             return 'e'    
  •         if asc >= -18526 and asc <= -18240:     
  •             return 'f'    
  •         if asc >= -18239 and asc <= -17923:     
  •             return 'g'    
  •         if asc >= -17922 and asc <= -17418:     
  •             return 'h'    
  •         if asc >= -17417 and asc <= -16475:     
  •             return 'j'    
  •         if asc >= -16474 and asc <= -16213:     
  •             return 'k'    
  •         if asc >= -16212 and asc <= -15641:     
  •             return 'l'    
  •         if asc >= -15640 and asc <= -15166:     
  •             return 'm'    
  •         if asc >= -15165 and asc <= -14923:     
  •             return 'n'    
  •         if asc >= -14922 and asc <= -14915:     
  •             return 'o'    
  •         if asc >= -14914 and asc <= -14631:     
  •             return 'p'    
  •         if asc >= -14630 and asc <= -14150:     
  •             return 'q'    
  •         if asc >= -14149 and asc <= -14091:     
  •             return 'r'    
  •         if asc >= -14090 and asc <= -13119:     
  •             return 's'    
  •         if asc >= -13118 and asc <= -12839:     
  •             return 't'    
  •         if asc >= -12838 and asc <= -12557:     
  •             return 'w'    
  •         if asc >= -12556 and asc <= -11848:     
  •             return 'x'    
  •         if asc >= -11847 and asc <= -11056:     
  •             return 'y'    
  •         if asc >= -11055 and asc <= -10247:     
  •             return 'z'    
  •         return ''    
  • f=multi_get_letter("啊")  
  • print f  
分享到:
评论

相关推荐

    python获取一组汉字拼音首字母的方法

    在进行中文文本处理时,经常需要将汉字转换为拼音或拼音的首字母,特别是在姓名识别、排序或者搜索功能的实现上。本篇文章将详细介绍如何利用Python来获取一组汉字的拼音首字母,并提供一个实际的代码示例。 #### 1...

    获取汉字首字母

    1. **汉字取首字母**:这涉及到汉语拼音转换,通常需要借助拼音库如`pinyin`(JavaScript)或者Python的`pypinyin`等。这些库提供了将汉字转化为拼音的功能,然后我们从中提取首字母。 2. **首字母大写**:在某些...

    数据库获取中文首字母自定义函数(字母查汉字模糊查询)

    标题“数据库获取中文首字母自定义函数(字母查汉字模糊查询)”指的是在数据库系统中定义一个函数,该函数能接受用户输入的英文首字母,然后返回所有以该首字母为拼音首字母的中文字段。这种功能对于具有大量中文...

    最完善的汉字转拼音首字母

    汉字转拼音首字母是计算机处理汉字时的一种常见技术,尤其在中文信息检索、文本分析、自动文本摘要等领域有着广泛的应用。这项技术的核心是将汉字转化为其对应的拼音,并提取出每个汉字拼音的首字母,以便于快速查找...

    查询中文拼音首字母

    5. **结果处理**:将所有汉字的首字母连接成字符串,作为最终结果返回。 在`Program.cs`文件中,很可能包含了实现这个功能的C#代码。代码可能包括定义方法、导入库、处理字符串、调用拼音转换函数等操作。由于具体...

    取汉字拼音首字母的函数

    例如,Python有一个名为`pypinyin`的库,它可以方便地将汉字转换为拼音,包括首字母和全拼。 在实际的编程实践中,我们可以编写一个函数,接受一个包含汉字的字符串作为参数,然后遍历字符串中的每一个字符,对每个...

    取汉字首字母_取汉字首字母_

    这个函数接受一个汉字作为输入,返回其拼音的首字母,并将其转化为大写。如果需要获取全部拼音,可以去掉`.upper()`。 描述中提到的“无需数据库”,意味着这个方法不需要依赖外部存储系统,可以在本地直接完成,这...

    提取汉字拼音首字母最佳方案VB/VBA源码

    2. **汉字转拼音**:核心转换函数,接受单个汉字或字符串作为输入,返回对应的拼音首字母。 3. **处理特殊情况**:考虑到多音字、隔音符号等情况,需要有专门的逻辑处理。 4. **性能优化**:为了处理大量汉字,可能...

    汉字字符串输出首字母源代码

    在中文环境下,由于汉字的多样性,直接获取首字母并不像英文那样简单,需要对汉字编码有一定的理解。 汉字的编码主要有GB2312、GBK、Big5和Unicode(UTF-8)等几种常见格式。在现代编程中,UTF-8编码是最常用的一种...

    Unicode汉字拼音首字母查询

    `pinyin(char, style=Style.INITIALS)`将返回汉字的拼音首字母形式,然后通过列表推导式将每个音节的首字母提取出来,并连接成字符串。 在实际应用中,可能需要处理大量汉字,这就需要批量查询和存储汉字的拼音首...

    功能较全的汉字转首字母和拼音

    在这个"功能较全的汉字转首字母和拼音"的VB源代码中,我们可以学习到如何实现这一功能。 首先,我们要理解汉字转拼音的基本原理。在中国,每个汉字都有对应的汉语拼音,这是基于普通话的标准发音。在编程中,我们...

    获取汉字拼音首字母

    总之,获取汉字拼音首字母是中文信息处理中的一个重要环节,它在搜索引擎优化、数据分析、自然语言处理等多个场景中都有广泛的应用。熟练掌握这一技术,能够帮助我们在处理中文数据时更加得心应手。

    超级列表框排序(汉字首字母,字母,数字)

    在处理中文字符串时,我们通常需要将汉字转换为其拼音首字母以便排序。这需要使用到汉字转拼音库,如pypinyin。首先,导入pypinyin库,并为每个列表项的文本获取首字母。然后,可以使用这些首字母来执行排序操作。...

    python-pinyin, 汉字拼音转换工具 Python 版(pypinyin)。.zip

    例如,它可以处理繁体字,支持多音字的模糊匹配,以及获取特定字的首字母缩写。对于教学、语言学习或者数据分析等场景,这些功能都是非常实用的。 在实际应用中,pypinyin库经常被用来解决以下问题: 1. **搜索引擎...

    Python 获取中文字拼音首个字母的方法

    在Python编程语言中,处理中文字符并获取其拼音首字母是一项常见的需求,特别是在文本处理、数据分析或搜索引擎优化等场景。本文将详细介绍一种方法,通过编码转换和特定的ASCII码范围映射来实现这一功能。 首先,...

    城市按拼音首字母排列列表Demo

    比如,`sorted(city_list, key=lambda x: pinyin(x)[0])`,其中`pinyin(x)`是一个函数,返回给定汉字`x`的拼音首字母。 3. **汉字转拼音**:在Python中,可以使用第三方库如`pypinyin`来实现汉字到拼音的转换。这个...

    postgresql中文首字母查找

    在PostgreSQL数据库中,中文首字母查找是一种常见的需求,特别是在构建搜索索引或者进行模糊匹配时。本主题将深入探讨两种不同的实现方案,并分析它们的效率和准确度。 方案一通常涉及对中文字符串进行预处理,提取...

    f_getpy.rar_F首字母汉字_f_getpy_getpy函数_getpy函数 txt

    `getpy`函数的主要目标是处理中文字符并返回其对应的拼音首字母。在汉语中,每个汉字都有一个或多个对应的拼音,这些拼音通常由声母和韵母组成。例如,汉字“我”对应的拼音是“wǒ”,首字母是“w”。在编程中,这...

    取所有首拼音字母.rar

    在IT领域,尤其是在编程和数据处理中,"取所有首拼音字母"通常指的是从中文文本中提取每个汉字的首字母,形成一个拼音缩写。这个过程对于构建关键词索引、生成简短标识符或者实现中文搜索优化等应用场景非常有用。在...

    Python-xpinyin一个用于把汉字转换为拼音的库

    Python的xpinyin库是一个强大的工具,它允许开发者将汉字转换为拼音,这在处理中文文本时非常有用。这个库的设计简单易用,可以方便地集成到各种Python项目中,尤其适用于那些需要对汉字进行拼音处理的场景,比如...

Global site tag (gtag.js) - Google Analytics