0 0

有点糊涂了10

用notepad打开一个文本文件,可以看到编码有ANSI,UTF-8,Unicode和unicode big endia四种格式, 一直认为unicode应该有utf-7,utf-8,utf-16等等不同的格式。 我用perl试图处理unicode格式的文本文件,但是读出来每个字符前都有一个小框框....可见perl无法处理这种unicode字符(Perl似乎只能搞搞utf-8).

我猜想这里所谓的unicode 应该对应VC里的multibytetowildchar后生成的LPTWSTR字符。。。。


问题是这里的unicode是哪一种utf格式?难道是utf-16?



问题补充:
今天下午总算把问题弄得更清楚

ASCII  ASNI UTF-8 unicode,unicode big endia几种编码

如达人说的
unicode 指的确实是utf-16le

unicode big endia是utf-16be,这是苹果搞出来的乱七八糟的倒装格式。

基本上windows api处理就是以ANSI和unicode-16le为主,(C#里使用utf8)


我用perl的File::Bom确实解析出encoding ,更具体的说,可以分辨出有FileBOM的unicode等,无法识别ASCII和ASNI,但是通过perlio读utf-16格式的时候

open(handle,"<:via(File::BOM)",$file); 这样也不行:

open(handle,"<:encoding($enc)",$file);。。

都是乱码。。。
杩欐槸utf16le(我打的是这是utf16le)...

2009年3月05日 13:24

2个答案 按时间排序 按投票排序

0 0

notepad上指的Unicode是UCS-2的UTF-16LE,Unicode Big Endian指的是UTF-16BE,UTF-8就是UTF-8。
MultiByteToWideChar转换出来的是wchar_t为字符单位的字符串,是UTF-16LE的。

Perl有内建的Unicode支持……嗯,读读http://ahinea.com/en/tech/perl-unicode-struggle.html或者http://perl.active-venture.com/pod/perlguts-unicode.html或者别的文档吧……

2009年3月05日 13:40
0 0

不一样的,unicode都是2个字节的,utf8是变长的,有1-3个字节不等

2009年3月05日 13:24

相关推荐

    Project2.zip

    这种的变量定义,对于p1很清楚是*p1类型,但是对于p2基础不扎实的同学可能有点糊涂,怎么办呢,C++中提供了一个函数typeid(变量名).name(),可以直接使用cout输出类型名,该资源是通过测试的源代码,下载下来双击...

    ZendAPI:深入PHP内核PDF格式

    这听起来有点糊涂,但其实并不复杂(见图 3-1 PHP 内部结构图)。为了实现一个 WEB 脚本的解释器,你需要完成以下三个部分的工作:1、 解释器部分,负责对输入代码的分析、翻译和执行;2、 功能性部分,负责具体实现...

    动态.NET代码生成器

    当你想用CodeDom生成一个类时,必须先生成类中的要素,如属性、方法,委托、事件等等,生成属性时,也必须先生成属性里的要素,这样一来,每生成一个要素,只要找到CodeDom里对应的类就行了,呵,是不是有点糊涂了。

    c++17的部分知识点相关文章,上一篇还有些

    感觉有点糊涂 常式 串视 即指针+长度 字节 先放这,慢慢看 c++访问 有与d的比较 变量 任何 可选 聚合类扩展 数组引用 结构化绑定 动[u,v]或动&[u,v],非常方便 外部模板,看一看 c++标准库时间 c++20 作者:fqbqrr

    ajax提交数据到后台php接收(实现方法)

    在网上看了很久,发现数据的利用ajax提交数据到后台其实很简单,但是很多讲解的并不清楚,对于初学者来说,很多真的是看着有点糊涂,拿来直接用,又想去了解怎么回事,其实利用ajax提交数据到后台是非常的简单的。...

    js的回调函数详解

    至于怎么用,还是有点糊涂。网上的一些相关的也没有详细的说一下是怎么回事,说的比较片面。下面我只是说说个人的一点理解,大牛勿喷。我们来看一下一个粗略的一个定义“函数a有一个参数,这个参数是个函数b,当函数...

    待测试多播组通讯程序,有点小问题,大家帮忙看看

    现在遇到问题如下: 1.服务器发送数据出去,要想自己也接收数据要loopback,可是在建立多播组的时候没勾选loopback也自动接收...自己也高糊涂了,求各位给个修改方法。 找不到上传附件的地方,给个连接大家下载源码。

    C语言课件:第十章 指针(Pointers).ppt

    指针对于初学者来说可能显得有点令人糊涂和不易理解,但一旦被掌握,它们将成为强有力的工具并变得易于使用。 概念 * 指针(Pointers):一个变量的地址称为该变量的指针。 * 指针变量(Pointer Variables):若一...

    des加密解密源码 C# key值问题分析

    因为是新人、刚交给我这个任务的时候有点眩晕。就开始在网上找各种des加密的内容。因为不懂以为需要把原理也搞明白,最后误了时间、把自己也搞糊涂了。当然,逻辑能力强、有兴趣的朋友可以试着去搞搞。先贴加密、...

    电脑显示屏幕的分辨率与大小详解.docx

    显示屏幕的分辨率与大小是我们常常接触到的概念,但是在实际操作中,却常常被各种名称和比例搞糊涂。下面,我们将对常见的屏幕比例和分辨率进行详细的解释。 第一类:4:3 家族 4:3 是最常见的屏幕比例,从电视时代...

    DesignPattern:用于学习GoF设计模式的测试项目

    I我得到了什么当我分别组织我的个人博客时,这个概念已被很好地理解,并且UML图被坦白地弄糊涂了,但是通过查看该图,我在某种程度上能够理解。 我能够拓宽我的知识,以了解如何从抽象到实现,从接口和abstrace类,...

    笨蛋的英文怎么写.docx

    - silly:口语中常用,语气较重,指极度愚蠢,有时带有一些“糊涂”的意味,也可以指行为、言语无聊或无意义。 - fatuous:形容人盲目愚蠢,自以为是到无法看清自己的地步。 6. 其他俚语和表达: - Stupid ...

    电纸书、电子阅读器和电子书阅读器三者的区别.pdf

    有人在前面加上手持二字,成了手持电子书阅读器,不过这名字实在是有点长,不便于记忆,于是去掉书字,将之称为“电子阅读器”则比较有电子产品的味道。实际上,所有用来看电子图书的这类硬件设备,都可以叫“电子...

    leetcode不会-zombie-bloodbath:僵尸血洗

    无论如何,我认为我在接近正确的事情上糊涂了我的方式,但我知道对整数列表进行排序可能是科技行业中最常见的 DS&A 问题。 我有点尴尬,因为我没有准备好一个巧妙的答案。 当我试图解决问题时,那种尴尬对我没有任何...

    牛津高中英语M3U1复习.doc

    3. 混淆(confuse)动词,意为使糊涂或混乱;将…混淆,混淆分别是动词短语confuse sth. with sth. 和名词confusion。从他困惑(confused)的表情判断,我知道他对这个问题真的很困惑。为了避免混淆(confusion),...

    2019人教必修一Unit1Teenagelife课本基础知识测试(含答案).pdf

    8. **使糊涂;使迷糊**:这个词指的是让人感到困惑或不明白的状态。英语中对应的词是“confuse”。 9. **建议;推荐**:指的是向他人提供自己的看法或建议。英语中可以使用“recommend”来表示这一含义。 10. **高级...

    电子商务网站的总体设计与策划.docx

    一个较大的电子商务网站内容繁多,如果网站结构不清晰,内容杂乱,浏览者会看得糊里糊涂,而且网站的扩充和维护也会相当困难。 网站是由一个个网页组成的,因此网页组织非常关键,网页组织的好坏直接关系到网站的...

    正则表达式30分钟入门教程

    元字符^(和数字6在同一个键位上的符号)和$都匹配一个位置,这和\b有点类似。^匹配你要用来查找的字符串的开头,$匹配结尾。这两个代码在验证输入的内容时非常有用,比如一个网站如果要求你填写的QQ号必须为5位到12...

Global site tag (gtag.js) - Google Analytics