最新文章列表

文本文件和二进制文件区别及java中字节流和字符流归纳

首先在物理上文本文件和二进制文件并没有区别,都是以二进制01的形式存放于存储介质中,他们的区别只是逻辑上的区别,这两种方式只是在编码层次上有差别。文本文件是基于字符编码的文件,常见的编码有ASCII编码,UNICODE编码等等。二进制文件是基于值编码的文件,你可以根据具体应用,指定某个值是什么意思(这样一个过程,可以看作是自定义编码)。 对于读到的二进制流的解释方式可以分为按文本方式和按二进制方式 ...
stevenjohn 评论(0) 有2990人浏览 2012-02-17 15:48

字符编码笔记:ASCII,Unicode和UTF-8【转载】

字符编码笔记:ASCII,Unicode和UTF-8 阮一峰 发表于 2007年10月28日 | 分类:首页 -> 档案 -> IT技术 今天中午,我突然想搞清楚Unicode和UTF-8之间的关系 ...
slendersEye 评论(0) 有870人浏览 2012-02-16 21:35

字符编码详解及由来(UNICODE,UTF-8,GBK)[转帖]

字符编码详解及由来(UNICODE,UTF-8,GBK)[转帖] 各种字符编码方式详解及由来(ANSI,UNICODE,UTF-8,GB2312,GBK) - 日志 - yunlingzhi 2009-01-29 09:53     一直对字符的各种 ...
slendersEye 评论(0) 有829人浏览 2012-02-16 20:34

含Unicode字符XML文件解决

解析XML出现如下异常: An invalid XML character (Unicode: 0x2) was found in the element content of the document. Nested exception: An invalid XML character (Unicode: 0x2) was found in the element content of the ...
ainidehsj 评论(0) 有3591人浏览 2012-02-15 16:49

字符(串)与unicode转换

昨天在公司听见同事在询问中文与asicii码如何转换?我当时就很差异,asicii码怎么可能表示中文啊?!原来是要将形如\uXXXX(X表示一16进制数,非X)的码与中文转换。好吧,我刚知道“这竟然被叫成asicii码”! 于是现在网上找了一下资料,对参考的代码进行了一些优化,如StringBuffer的使用和正则表达式验证合法性。 通过思考,已经能理解Unicode向字符的转换,对相反的转换的原理 ...
直线曲线 评论(0) 有5564人浏览 2012-02-09 21:44

java字符编码相关

JAVA中转义字符: 1.八进制转义序列:\ + 1到3位5数字;范围'\000'~'\377'       \0:空字符 2.Unicode转义字符:\u + 四个十六进制数字;0~65535      \u0000:空字符 3.特殊字符:就3个       \":双引号 
printfabcd 评论(1) 有2795人浏览 2012-02-05 15:21

【消除盲点系列】(二)JavaWeb开发之编码问题

声明:【消除盲点系列】文章内容全部整理自网络,出处众多,无法一一罗列 ,敬请谅解!欢迎讨论、指正,欢迎转载! //补充资料@2012/02/15 http://unicode.org/faq/utf_bom.html 涉及到编码的位置 (1)html页面、浏览器 (2)应用服务器 (3)JSP、Servlet (4)文件系统 (5)数据库驱动 (6)数据库管理系统 --------------- ...
slendersEye 评论(0) 有617人浏览 2012-01-31 10:56

对Java字符类型的深入了解

Java 的1.1 版 本 引 入了 许 多 处 理 字 符(char 型 数 据) 的 类。 这些 新 的 类 能 够 使 得 某 些 具 体 平 台 上 的字 符 转 换 成 为 符 合Unicode 标 准 ...
skywen 评论(0) 有2295人浏览 2012-01-09 11:23

Java的简单数据类型

Java的简单数据类型 Java提供了几类简单数据类型表示数字和字符,本文对其进行了分析讲解 数据类型 数据类型就是对内存位置的抽象表达。程序员可以利用多种数据类型:某些由编程语言定义,某些由外部库定义,还有些则由程序员来定义。很多编程语言都 依赖于特定的计算机类型和对数据类型属性的具体编译实现,比如word和integer数据类型的大小等。另一方面,Java的虚拟机负责定义其内置数据 类型的各方面 ...
fuaotech 评论(0) 有986人浏览 2011-12-19 14:06

HtmlPaser与StringEscapeUtils共舞抓取网页

用正则来匹配的确很强大,但如果是网页的话HtmlPaser更方便,由于抓下来的信息中文是unicode的,所以要用到apache的一个包,以下是代码: import java.net.URL; import org.apache.commons.lang3.StringEscapeUtils; import org.htmlparser.NodeFilter; import org.h ...
chenpenghui 评论(0) 有1516人浏览 2011-12-13 14:48

字符编码和字符集的区别(utf-8 utf-16,ascII,gb2312,gbk)

今天学习IO流,对几个编码不了解,上网查到了,奉献给大家! 1.ASCII(American Standard Code for Information Interchange)码,是一种字符集。美国标准信息交换 ...
yjf997234900. 评论(0) 有1454人浏览 2011-12-12 21:40

unicode编码

终于把unicode编码做了一个大致的了解了。   在学习的过程中知道了很多概念和相关的发展历史,对以前比较模糊的概念也有了比较深入的了解。   一些概念: bom(byte order mark)用来区别是big endian(BE)还是little endian(LE)。区别的方法: 在UTF-16文件的头2个字节里做个标记: LE [0xFF, 0xFE], BE [0xFE, ...
hongjn 评论(0) 有1017人浏览 2011-12-11 16:46

java unicode to utf-8

package test.wingware; public class UnicodeToUTF8 { private static final int MASKBITS = 0x3F; private static final int MASKBYTE = 0x80; private static final int MASK2BYTES = 0xC0; private ...
wingware 评论(2) 有2979人浏览 2011-12-08 16:19

什么是unicode

        unicode是字符的统一标识符,又叫万国码。每个国家的字符都被规范在一定的数字范围内。unicode是分面的,一共分了17个面,现在只使用了少数的几个面。         unicode编码可以转化为utf-8和gbk2132等各种具体的编码模式。
wensuper 评论(0) 有914人浏览 2011-12-03 08:17

拆分String和得到Unicode

拆分String和得到Unicode   拆分String有两种方法(本人现在所知): 一: String s = “abdABC”; Char[] ch = s.toCharArray();//把String中得每个字符转换成Char,放在Char[] 里(放在字符型数组里)。   二:
w4p 评论(0) 有1644人浏览 2011-10-24 11:19

Java用native2ascii命令做unicode编码转换

  背景:在做Java开发的时候,常常会出现一些乱码,或者无法正确识别或读取的文件,比如常见的validator验证用的消息资源(properties)文件就需要进行Unicode重新编码。原因是java默认的编码方式为Unicode,而我们的计算机系统编码常常是GBK等编码。需要将系统的编码转换为java正确识别的编码问题就解决了。   1、native2ascii简介:native2asci ...
feng_an_qi 评论(0) 有735人浏览 2011-10-17 21:36

汉字姓名生成unicode码的简单算法

public class UnicodeConverter { public static void main(String[] args) { String name="黄云增"; String unicodeName=""; for(int i=0;i<name.length();i++){ if((int)name.c ...
huangyunzeng 评论(0) 有1348人浏览 2011-10-11 11:59

BOM

BOM - Byte Order Mark。对于Unicode编码的文件,BOM可以出现在文件最开始,用来指示一个文本所使用的编码。 Unicode有好几种编码,UTF-8,UTF-16BE/LE等。如果不知道文件编码,将无法正确解析文件。BOM则解决了这种问题。 但是对于使用其它方式指定编码的文件,则BOM可能会引发问题。比如对于特定的系统,如果需要手动指定文件编码,则BOM和指定的编码就 ...
deepnighttwo 评论(0) 有770人浏览 2011-10-10 15:46

PropEdit插件

编写properties文件的Eclipse插件(plugin),有了它我们在编辑一些简体中文、繁体中文等Unicode文本时,就不必再使用native2ascii编码了。您可以通过Eclipse中的软件升级(Software Update)安装此插件,步骤如下: 1、展开Eclipse的Help菜单,将鼠标移到Software Update子项,在出现的子菜单中点击Find and Instal ...
Yinny 评论(0) 有2741人浏览 2011-10-09 11:38

java unicode转换代码

static Pattern p = Pattern.compile("////u([0123456789abcdef]{4})"); public static String stringToUnicode(String s) { Matcher matcher = p.matcher(s); StringBuffer buffer ...
floydd 评论(0) 有750人浏览 2010-11-08 15:48

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics