`
elite20130514
  • 浏览: 48259 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

常用汉字排序

阅读更多
public static void main(String[] args) {
		String[] strs = {"张三","李四","王五"};
		Comparator c = Collator.getInstance(Locale.CHINA);
		Arrays.sort(strs,c);
		int i = 0;
		for(String str : strs) {
			System.out.println((++i)+"、"+ str);
		}
		
	}

 

1、李四
2、王五
3、张三

 对于某些生僻字,无法java无法做出正确的排序,因为java使用的是UNICODE编码,而中文UNICODE字符集是源于GB18030,GB18030又是GB2312发展起来,GB2312是一个包含7000多个字符的字符集,它是按拼音排序,并且是连续的,之后的GBK、GB18030都是在其基础上扩充出来的,所以要让它们完整排序也就难上加难

分享到:
评论

相关推荐

    3000个常用汉字按使用频率排序.rar

    标题 "3000个常用汉字按使用频率排序.rar" 提供的信息主要涉及汉字的常见使用情况和排序规则。在中文语言中,汉字是基本的书写单元,它们的使用频率可以反映出不同汉字在日常生活和书面表达中的重要性。通常,高频率...

    EasyUI Datagrid 中文排序的问题

    这里使用了 `gbk` 字符集,它是中文的一种常用编码格式,通常用于实现中文排序。 3. **其他数据库**: 对于 PostgreSQL 或 SQL Server 等其他数据库系统,也有类似的函数或方法来实现中文排序。具体实现方式需...

    5000个常用的汉字列表.txt

    收集了5000个常用的汉字列表 ,每行一个 用\n 隔开方便使用,

    GB2312常用汉字词频排序

    这是我收录的GB2312中的全部的汉字,并按照每个汉字的使用频率进行排序。 挺适合做自然语言处理了。

    汉字排序 拼音 笔画 所有汉字 常用和非常用 精确

    通过里面的工具类,可以方便的进行拼音,笔画排序,并且对java的排序类进行了修复,可以精确的对UTF-8所支持的所有汉字排序。

    5000个常用的汉字列表收集

    在IT领域,尤其是在文本处理、自然语言处理(NLP)以及中文信息检索方面,了解和掌握常用汉字至关重要。"5000个常用的汉字列表收集"这个资源是为这些应用场景提供基础数据的重要工具。这份资源可能包含了一份按照...

    常用汉字拼音排序码表

    ### 常用汉字拼音排序码表解析 #### 概述 本文档提供了一份经过精心排序的汉字拼音码表,相较于传统的按照内码顺序排列的方式,这份码表更便于理解和应用,尤其对于输入法设计者而言更为友好。下面将详细介绍这份...

    常用汉字7000(带拼音_字帖版).pdf

    常用汉字7000(带拼音_字帖版).pdf

    解决Ext Grid中文排序问题

    为了解决这个问题,我们可以重写Ext.data.Store的`applySort`函数,以便在进行本地排序时应用中文排序规则。上述代码正是这样一个解决方案。它将原生的`applySort`函数替换为一个新的版本,其中包含了对中文字符串...

    常用汉字及拼音首字母对照表(5000多文字)

    本资源收集了5000以上的汉字及拼音和首字母 https://mp.csdn.net/postedit/81201171(在这里作者提供了收集方法)

    汉字Unicode根据拼音排序表

    汉字 unicode , 这种格式的,汉字表是在http://xh.5156edu.com/conversion.html这个页面里面找的zmj.php.js这个文件获取的。

    ios 中文 排序

    标签"中文 排序 拼音 pinyin"提示我们需要关注的是汉字转拼音和基于拼音的排序技术。 首先,我们需要一个库或者方法来获取汉字的拼音。iOS中可以使用开源库如`GDataXMLNode`或者`CFStringTransform`函数,但更常用...

    中文的常用字7000,无需积分

    《中文的常用字7000》资源是一个涵盖了汉语中最为常见的7000个汉字的集合,这对于学习、教学或是研究汉语的人都是一项极其宝贵的工具。这个压缩包包含两个文件,分别是“7000常用字.txt”和“7000常用字优化版.txt”...

    ★【C#常用排序算法大全】★.

    【C#常用排序算法大全】包括了四种基本的排序算法:冒泡排序、选择排序、插入排序和希尔排序。这些算法都是在计算机科学中广泛使用的,对于理解和优化数据处理至关重要。 1. **冒泡排序**: 冒泡排序是一种简单的...

    一二级汉字拼音输入法码表(按常用字排序)

    GB2312拼音输入法码表,包括一级和二级汉字,已按拼音定义格式。并按默认的微软拼音输入法的常用字顺序排列,最常用的字排在前面。

    VBA中几种常用的排序方法

    VBA各种常规使用的排序方法详细,原代码

    2500个常用字音频文件

    例如,文件名可能是“一.mp3”、“二.mp3”这样的模式,按汉字笔画或常用程度排序。 其次,汉字作为中文的核心元素,其数量庞大,常用的约有2500个。这些字覆盖了日常交流的大部分需求,学习并掌握它们对于非母语者...

    对Oracle 排序中的几种常用排序的介绍

    1. **按拼音排序**:Oracle支持按照汉字的拼音进行排序,这在处理中文数据时非常有用。可以使用`NLSSORT`函数配合`NLS_SORT`参数来实现。例如,以下语句会按照汉语拼音对`danwei`字段进行升序排序: ```sql select...

    3500现代汉语常用字表+7000现代汉语通用字表

    这个字表同样按照使用频率排序,让学习者逐步提升汉字认知水平。 此外,字表中还包含了2984个繁体字。繁体字是中国传统文化的重要载体,尽管在大陆地区简体字已成为主流,但在台湾、香港、澳门以及海外华人社区,...

    2021年最新常用汉字合集及释义数据源.zip

    《2021年最新常用汉字合集及释义数据源》是一个综合性的汉字学习与研究资源,包含了大量的汉字信息,旨在为汉字的学习者、教师、开发者以及对汉字有兴趣的人群提供便利。这个压缩包中包含了四个主要的数据文件,分别...

Global site tag (gtag.js) - Google Analytics