`
啸笑天
  • 浏览: 3462475 次
  • 性别: Icon_minigender_1
  • 来自: China
社区版块
存档分类
最新评论

随机汉字

    博客分类:
  • java
 
阅读更多

public static String getChineseCharacter(long seed) throws Exception { 
String str = null; 
int highPos, lowPos; 
Random random = new Random(seed); 
highPos  =  176 + random.nextInt(39); 
lowPos = 161 + random.nextInt(93); 
byte[] b = new byte[2]; 
b[0] = (new Integer(highPos)).byteValue(); 
b[1] = (new Integer(lowPos)).byteValue(); 
str = new String(b, "GBK"); 
return str; 
} 

 

 原理是根据汉字的区位码,其中本例高位从176位置取,低位从161位置开始取

 

所谓汉字编码,就是采用一种科学可行的办法,为每个汉字编一个唯一的代码,以便计算机辨认、接收和处理。在此介绍的是《国家标准信息交换汉字编码》。这种编码经过加工整理一律以汉语拼音的字母为序,音节相同的字以使用频率为序,其查找方法与一般汉语字典的汉字拼音音节索引查找法相同。
  为了使每一个汉字有一个全国统一的代码,1980年,我国颁布了第一个汉字编码的国家标准: GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。由于国标码是四位十六进制,为了便于交流,大家常用的是四位十进制的区位码。所有的国标汉字与符号组成一个94×94的矩阵。在此方阵中,每一行称为一个"区",每一列称为一个"位",因此,这个方阵实际上组成了一个有94个区(区号分别为0 1到94)、每个区内有94个位(位号分别为01到94)的汉字字符集。一个汉字所在的区号和位号简单地组合在一起就构成了该汉字的"区位码"。在汉字的区位码中,高两位为区号,低两位为位号。 在区位码中,01-09区为682个特殊字符,16~87区为汉字区,包含6763个汉字 。其中16-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列)。 
  所以,当我们需要n个任意汉字时,我们不必建一个全部汉字表,而是利用区位码实现常用汉字的提取。

分享到:
评论

相关推荐

    易语言 取随机汉字 易语言 取随机汉字

    易语言 取随机汉字 易语言 取随机汉字

    C# 随机生成汉字 随机生成汉字

    本篇文章详细介绍了如何使用C#语言实现随机生成汉字的功能,重点解析了GB2312编码的使用以及生成随机汉字的具体算法实现。这种技术在多种应用场景下都有广泛用途,例如数据测试、字符识别训练等。通过深入理解GB2312...

    随机生成汉字(控制台下)

    在IT领域,编程时常需要处理各种数据生成任务,其中之一就是生成随机汉字。本文将深入探讨如何在控制台环境下实现这一功能,以及背后的汉字编码原理。 首先,我们要了解汉字的编码方式。汉字在计算机中通常使用...

    易语言-取文本随机汉字

    "取文本随机汉字"是易语言中一个实用的功能,它主要用于生成包含随机汉字的文本字符串。这个功能在许多场景下都非常有用,比如测试、数据填充、密码生成等。 首先,我们要理解"取文本随机汉字"这个操作的核心概念。...

    生成随机中文姓名(C++)

    在这个项目中,我们可能看到的是通过GBK编码来存储和处理中文字符,因为GBK是中文Windows系统中常用的一种编码方式,它包含了大部分常用汉字。 `Name.cpp`和`Name.h`两个文件分别代表了类的实现和接口定义。在`Name...

    aotu.js 字符串指定字符 随机生成出汉字

    // 输出类似 "你好啊" 这样的随机汉字字符串 ``` 这个功能对于生成引流脚本中的随机内容特别有效,因为它能确保每次运行生成的内容都是不同的,从而增加吸引力。此外,`aotu.js`可能还提供了其他高级选项,比如...

    用C#生成随机中文汉字验证码的基本原理.txt

    最后,通过调用以上方法生成随机汉字并组合成验证码。 ```csharp // 生成包含4个汉字的验证码 string GenerateVerificationCode() { StringBuilder sb = new StringBuilder(); for (int i = 0; i ; i++) { byte...

    易语言 取随机汉字源码

    在易语言中,“取随机汉字”是一个常见的功能,用于生成随机的汉字字符,常用于各种需要随机数据的场景,如测试、模拟用户输入等。 “取随机汉字源码”指的是实现这一功能的易语言程序代码。编写这样的源码,你需要...

    取随机汉字的模块,取随机字

    取随机汉字的模块。 一切都打包。 不解释 占汉字 太烦了! 我郁闷 倒了。。

    php用字库显示随机汉字

    在这种情况下,使用字库文件来显示随机汉字就成为了一个有效且实用的解决方案。 首先,我们来理解“字库文件”。字库文件,通常指的是包含各种汉字的编码文件,比如GB2312、GBK、UTF-8等编码格式的文本文件。这些...

    asp.net 生成随机汉字验证码以及验证

    在ASP.NET开发中,生成随机汉字验证码是一种常见的安全措施,用于防止自动化的恶意攻击,比如机器人注册、垃圾信息提交等。这种验证码通过显示一组难以由机器识别的随机汉字,要求用户输入以完成验证,增加了非人类...

    C#生成随机中文汉字验证码的基本原理

    用C#生成随机中文汉字验证码的基本原理 (转载)

    游戏随机中文名JSON 格式.txt

    根据提供的文件信息,我们可以了解到这是一份包含了大量随机生成的中文名称的数据集,采用JSON格式存储。这份数据集主要用于游戏中的随机命名,可以为游戏角色、物品等提供独特的名称。接下来,我们将从几个方面来...

    Java代码实现随机生成汉字的方法

    Java代码实现随机生成汉字的方法 Java代码实现随机生成汉字的方法是指利用Java语言编写的程序来随机生成汉字。该方法可以生成随机的汉字,满足特定的需求。 背景知识 -------- GB 2312-80 是中国国家标准简体中文...

    易语言取随机汉字.7z

    易语言作为一款中国本土的、以中文编程为特色的编程语言,其丰富的库函数和简单直观的语法使得生成随机汉字变得轻而易举。 易语言的“取随机汉字”功能主要涉及到以下几个方面的知识点: 1. **易语言基础**:...

    随机生成姓名----- 中文+英文+数字

    随机生成姓名----- 中文+英文+数字

    易语言字节集文本生成器源码,易语言随机文本自动生成

    3. **取随机汉字**:在中文环境中,生成随机文本特别要考虑汉字的选取。易语言提供了生成随机汉字的方法,这通常涉及到汉字编码的处理。例如,通过生成一个在常用汉字编码范围内的随机数,然后转换为汉字。 4. **取...

    随机生成简体中文

    从文件名“hanzi”来看,这可能是一个包含生成的随机汉字的文件,可能以文本或二进制格式存储。分析这个文件可以进一步了解生成的汉字数量、频率分布,甚至可能的模式或规律。 总之,随机生成简体中文是一个涉及...

    VB 生成随机中文验证码源码

    在VB(Visual Basic)编程环境中,生成随机中文验证码是一项常见的需求,主要应用于网站安全验证,防止机器人自动操作。中文验证码的生成涉及到字符集选择、随机数生成、图像处理等多个技术环节。下面将详细讲解如何...

    生成随机的汉字 字母 数字 特殊字符

    生成随机的汉字 字母 数字 特殊字符,可以定制产生的数量。

Global site tag (gtag.js) - Google Analytics