- 浏览: 150074 次
- 性别:
- 来自: 武汉
文章分类
最新评论
-
mathlpz:
JSP_Struts标签 html:select option基本用法 -
phil09s:
还有一篇相当不错的教程:http://lavasoft.blo ...
commons-logging log4j的联系区别 -
phil09s:
灰常不错的教程,配合http://sammor.iteye.c ...
commons-logging log4j的联系区别
public byte[] getBytes()
使用平台默认的字符集将此 String 解码为字节序列,并将结果存储到一个新的字节数组中。
当此字符串不能在默认的字符集中解码时,该方法无指定的行为。当需要进一步控制解码过程时,应使用 CharsetEncoder 类。
返回:
结果字节数组
String的getBytes()方法是得到一个字串的字节数组,这是众所周知的。但特别要注意的是,本方法将返回该操作系统默认的编码格式的字节数组。如果你在使用这个方法时不考虑到这一点,你会发目前一个平台上运行良好的系统,放到另外一台机器后会产生意想不到的问题。比如下面的程式,
- class TestCharset
- {
- public static void main(String[] args)
- {
- new TestCharset().execute();
- }
- private void execute() {
- String s = "Hello!你好!";
- byte[] bytes = s.getBytes();
- System.out.println("bytes lenght is:" + bytes.length);
- }
- }
在一个中文视窗系统XP系统下,运行时,结果为:
bytes lenght is:12
不过如果放到了一个英文的UNIX环境下运行:
$ java TestCharset
bytes lenght is:9
如果你的程式依赖于该结果,将在后续操作中引起问题。为什么在一个系统中结果为12,而在另外一个却变成了9了呢?上面已提到了,该方法是和平台(编码)相关的。在中文操作系统中,getBytes方法返回的是个GBK或GB2312的中文编码的字节数组,其中中文字符,各占两个字节。而在英文平台中,一般的默认编码是“ISO-8859-1”,每个字符都只取一个字节(而不管是否非拉丁字符)。
Java中的编码支持
Java是支持多国编码的,在Java中,字符都是以Unicode进行存储的,比如,“你”字的Unicode编码是“4f60”,我们能通过下面的实验代码来验证:
- class TestCharset
- {
- public static void main(String[] args)
- {
- char c = ’你’;
- int i = c;
- System.out.println(c);
- System.out.println(i);
- }
- }
不管你在所有平台上执行,都会有相同的输出:
----------------- output ------------------
你
20320
20320就是Unicode “4f60”的整数值。其实,你能反编译上面的类,能发目前生成的.class文件中字符“你”(或其他所有中文字串)本身就是以Unicode编码进行存储的:
- char c = ’u4F60’;
- ... ...
即使你知道了编码的编码格式,比如:
javac -encoding GBK TestCharset.java
编译后生成的.class文件中仍然是以Unicode格式存储中文字符或字符串的。
使用String.getBytes(String charset)方法
所以,为了避免这种问题,我建议大家都在编码中使用String.getBytes(String charset)方法。下面我们将从字串分别提取ISO-8859-1和GBK两种编码格式的字节数组,看看会有什么结果:
- class TestCharset
- {
- public static void main(String[] args)
- {
- new TestCharset().execute();
- }
- private void execute() {
- String s = "Hello!你好!";
- byte[] bytesISO8859 =null;
- byte[] bytesGBK = null;
- try
- {
- bytesISO8859 = s.getBytes("iso-8859-1");
- bytesGBK = s.getBytes("GBK");
- }
- catch (java.io.UnsupportedEncodingException e)
- {
- e.printStackTrace();
- }
- System.out.println("-------------- 8859 bytes:");
- System.out.println("bytes is: " + arrayToString(bytesISO8859));
- System.out.println("hex format is:" + encodeHex(bytesISO8859));
- System.out.println();
- System.out.println("-------------- GBK bytes:");
- System.out.println("bytes is: " + arrayToString(bytesGBK));
- System.out.println("hex format is:" + encodeHex(bytesGBK));
- }
- public static final String encodeHex (byte[] bytes) {
- StringBuffer buff = new StringBuffer(bytes.length * 2);
- String b;
- for (int i=0; i<bytes.length ; i++)
- {
- b = Integer.toHexString(bytes[i]);
- // byte是两个字节的,而上面的Integer.toHexString会把字节扩展为4个字节
- buff.append(b.length() > 2 ? b.substring(6,8) : b);
- buff.append(" ");
- }
- return buff.toString();
- }
- public static final String arrayToString (byte[] bytes) {
- StringBuffer buff = new StringBuffer();
- for (int i=0; i<bytes.length ; i++)
- {
- buff.append(bytes[i] + " ");
- }
- return buff.toString();
- }
- }
- --------------
- 8859 bytes:
- bytes is: 72 101 108 108 111 33 63 63 63
- hex format is:48 65 6c 6c 6f 21 3f 3f 3f
- --------------
- GBK bytes:
- bytes is: 72 101 108 108 111 33 -60 -29 -70 -61 -93 -95
- hex format is:48 65 6c 6c 6f 21 c4 e3 ba c3 a3 a1
可见,在s中提取的8859-1格式的字节数组长度为9,中文字符都变成了“63”,ASCII码为63的是“?”,一些国外的程式在国内中文环境下运行时, 经常出现乱码,上面布满了“?”,就是因为编码没有进行正确处理的结果。而提取的GBK编码的字节数组中正确得到了中文字符的GBK编码。字符“你”“好”“!”的GBK编码分别是:“c4e3”“bac3”“a3a1”。得到了正确的以GBK编码的字节数组,以后需要还原为中文字串时,能使用下面方法:
new String(byte[] bytes, String charset)
发表评论
-
读取配置文件
2014-05-16 13:41 0package com.hundsun.hsacct.act ... -
Linux环境搭建系统
2013-05-20 10:09 01. VMware workstation ... -
Java 繁体化
2013-05-10 13:59 1369package com.xxyy.common; i ... -
Error : \Java\jdk1.6.0_17\lib\tools.jar was unexpected at this time
2012-02-14 21:26 1858when our application server fai ... -
findbugs ant 代码审核工具
2012-01-11 15:38 2997Findbugs 是一个静态分析工具,它检查类或者 JA ... -
commons-logging log4j的联系区别
2011-12-19 14:54 66101、Apache通用日志接口(commons-loggi ... -
Solaris 10 上网
2011-10-17 13:12 1181昨天在虚拟机里面装好了solaris操作系统,却上不了网,按照 ... -
Solaris 10 的安装【转载】
2011-10-17 10:22 2902Solaris 10 的安装------------- ... -
eclipse 提示 快捷键
2011-10-08 16:53 899eclipse3.3中把内容助手(content assist ... -
windows环境下SVN服务器环境的搭建
2011-07-04 22:42 1787一 环境 操作系统:windows2003 serve ... -
MongoDB的初次接触学习体验
2011-06-16 17:52 0待续。。。 -
win7免安装mysql配置使用
2011-06-12 11:29 3025win7 64位机 下载地址:http://www.mys ... -
如何让电脑发音帮你读英文
2010-08-28 18:22 3585[1]首先,在桌面单击右键,在旁拉菜单中选择“文本文档”,就会 ... -
正则表达式 java
2010-01-19 11:11 1081目前,正则表达式已经在很多软件中得到广泛的应用,包括*nix ... -
zk webapps下 文件 乱码
2010-01-06 10:30 182518328 [main] INFO lucene.Lucene ... -
SPRING 定时任务设置详解
2010-01-04 15:15 1179org.springframework.schedulin ... -
C3P0 连接池详细配置
2009-12-06 15:27 919<c3p0-config> <default ... -
WebApplicationContext : org.springframework.web.context.ContextLoaderListener作用
2009-12-05 15:59 1447如果您想要在自己所定义的Servlet类别中使用Spring的 ... -
一个web项目web.xml的配置中<context-param>配置是起什么作用的
2009-12-05 15:44 12311.启动一个WEB项目的时候,容器(如:Tomcat)会去读它 ... -
寻找项目的配置文件
2009-10-21 11:40 993try { String ur ...
相关推荐
原生js图片圆形排列按钮控制3D旋转切换插件.zip
内含二维数组与三维数组,分别为list2nd,list3rd
原生js颜色随机生成9x9乘法表代码.zip
原生js实现图片叠加滚动切换代码.zip
【Academic tailor】学术小裁缝必备知识点:全局注意力机制(GAM) 注意力机制是深度学习中的重要技术,尤其在序列到序列(sequence-to-sequence)任务中广泛应用,例如机器翻译、文本摘要和问答系统等。这一机制由 Bahdanau 等人在其论文《Neural Machine Translation by Jointly Learning to Align and Translate》中首次提出。以下将详细介绍这一机制的背景、核心原理及相关公式。 全局注意力机制(Global Attention Mechanism, GAM)由 《Global Attention Mechanism: Retain Information to Enhance Channel-Spatial Interactions》提出,是一篇针对计算机视觉任务提出的方法。这篇文章聚焦于增强深度神经网络中通道和空间维度之间的交互,以提高分类任务的性能。与最早由 Bahdanau 等人提出的用于序列到序列任务的注意力机制 不同,这篇文章的重点是针对图像分类任务,并未专注于序
本项目在开发和设计过程中涉及到原理和技术有: B/S、java技术和MySQL数据库等;此文将按以下章节进行开发设计; 第一章绪论;剖析项目背景,说明研究的内容。 第二章开发技术;系统主要使用了java技术, b/s模式和myspl数据库,并对此做了介绍。 第三章系统分析;包罗了系统总体结构、对系统的性能、功能、流程图进行了分析。 第四章系统设计;对软件功能模块和数据库进行详细设计。 第五章系统总体设计;对系统管理员和用户的功能进行描述, 第六章对系统进行测试, 第七章总结心得;在论文最后结束章节总结了开发这个系统和撰写论文时候自己的总结、感想,包括致谢。
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。
镗夹具总工艺图
原生js树叶数字时钟代码.rar
近代非线性回归分析-韦博成1989
内容概要:本文详细介绍了用 Rust 语言实现冒泡排序算法的具体步骤,以及通过设置标志位来优化算法性能的方法。示例代码包括了函数定义、内外层循环逻辑、标志位的应用,并在主函数中展示了如何调用 bubble_sort 函数并显示排序前后的数组。 适合人群:具有基本 Rust 编程基础的学习者和开发者。 使用场景及目标:适用于想要深入了解 Rust 中冒泡排序实现方式及其优化技巧的技术人员。通过本篇文章,能够掌握 Rust 基本语法以及算法优化的基本思想。 阅读建议:除了仔细阅读和理解每一部分的内容外,还可以尝试修改代码,改变数据集大小,进一步探索冒泡排序的时间复杂度和优化效果。此外,在实际应用时也可以考虑引入并发或其他高级特性以提升性能。
培训课件 -安全隐患分类与排查治理.pptx
中国各地级市的海拔标准差数据集提供了298个地级市的海拔变异性信息。海拔标准差是衡量某地区海拔高度分布离散程度的统计指标,它通过计算各测量点海拔与平均海拔之间的差异来得出。这一数据对于评估地形起伏对网络基础设施建设的影响尤为重要,因为地形的起伏度不仅会增加建设成本,还会影响信号质量。此外,由于地形起伏度是自然地理变量,它与经济社会因素关联性较小,因此被用作“宽带中国”试点政策的工具变量,以研究网络基础设施建设对经济的影响。数据集中包含了行政区划代码、地区、所属省份、所属地域、长江经济带、经度、纬度以及海拔标准差等关键指标。这些数据来源于地理空间数据云,并以Excel和dta格式提供,方便研究者进行进一步的分析和研究。
YOLO算法的原理与实现
视网膜病变是糖尿病和高血压的主要微血管并发症。如果不及时治疗,可能会导致失明。据估计,印度三分之一的成年人患有糖尿病或高血压,他们未来患视网膜病变的风险很高。我们研究的目的是检查糖化血红蛋白 (HbA1c)、血压 (BP) 读数和脂质水平与视网膜病变的相关性。我们的主要假设是,血糖控制不佳(表现为高 HbA1c 水平、高血压和异常脂质水平)会导致视网膜病变风险增加。我们使用眼底照相机筛查了 119 名印度患者的视网膜病变,并获取了他们最近的血压、HbA1c 和血脂谱值。然后,我们应用 XGBoost 机器学习算法根据他们的实验室值预测是否存在视网膜病变。我们能够根据这些关键生物标志物高精度地预测视网膜病变。此外,使用 Shapely Additive Explanations (SHAP),我们确定了对模型最重要的两个特征,即年龄和 HbA1c。这表明血糖控制不佳的老年患者更有可能出现视网膜病变。因此,这些高风险人群可以成为早期筛查和干预计划的目标,以防止视网膜病变发展为失明。
在强化学习(RL)领域,如何稳定地优化策略是一个核心挑战。2015 年,由 John Schulman 等人提出的信赖域策略优化(Trust Region Policy Optimization, TRPO)算法为这一问题提供了优雅的解决方案。TRPO 通过限制策略更新的幅度,避免了策略更新过大导致的不稳定问题,是强化学习中经典的策略优化方法之一。
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。
这组数据涵盖了1999至2020年间中国各地区普通小学毕业生的数量。它为我们提供了一个深入了解中国教育领域中普通小学阶段教育水平和教育资源分配情况的窗口。通过分析这些数据,可以为制定科学合理的教育政策提供依据,同时,通过比较不同城市的普通小学毕业生数,也能为城市规划和劳动力市场调查提供参考。数据来源于中国区域统计年鉴和中国各省市统计年鉴,包含了8472个样本,以面板数据的形式呈现。这些数据对于掌握中国教育态势具有重要的参考价值。
原生js制作拖拽排列排序代码.zip
PixPin截图工具,非常好用的一款截图工具