`
gelongmei
  • 浏览: 209465 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
文章分类
社区版块
存档分类
最新评论

查看文件编码

 
阅读更多
查看文件编码
在Linux中查看文件编码可以通过以下几种方式:
1.在Vim中可以直接查看文件编码
:set fileencoding
即可显示文件编码格式。
如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在
~/.vimrc 文件中添加以下内容:

set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936

这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照 fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。
2. enca (如果你的系统中没有安装这个命令,可以用sudo yum install -y enca 安装 )查看文件编码
$ enca filename
filename: Universal transformation format 8 bits; UTF-8
CRLF line terminators
需要说明一点的是,enca对某些GBK编码的文件识别的不是很好,识别时会出现:
Unrecognized encoding

文件编码转换
1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
:set fileencoding=utf-8

2. enconv 转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码,操作如下
enconv -L zh_CN -x UTF-8 filename

3. iconv 转换,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如将一个UTF-8 编码的文件转换成GBK编码
iconv -f GBK -t UTF-8 file1 -o file2
查看文件编码file命令
file ip.txt  ip.txt: UTF-8 Unicode text, with escape sequences
一、利用iconv命令进行编码转换文件内容编码转换  iconv命令用于转换指定文件的编码,默认输出到标准输出设备,亦可指定输出文件。  用法: iconv [选项...] [文件...]  有如下选项可用:  输入/输出格式规范:  -f, --from-code=名称 原始文本编码  -t, --to-code=名称 输出编码  信息:  -l, --list 列举所有已知的字符集    输出控制:  -c 从输出中忽略无效的字符  -o, --output=FILE 输出文件  -s, --silent 关闭警告  --verbose 打印进度信息  -?, --help 给出该系统求助列表  --usage 给出简要的用法信息  -V, --version 打印程序版本号    例子:  iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt  这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件。
二、文件名编码转换
因为现在用linux,原来在windows里的文件都是用GBK编码的。所以copy到linux下是乱码,文件内容可以用iconv来转换可是好多中文的文件名还是乱码,找到个可以转换文件名编码的命令,就是convmv。
convmv命令详细参数  例如
convmv -f GBK -t UTF-8 *.mp3
不过这个命令不会直正的转换,你可以看到转换前后的对比。如果要直正的转换要加上参数 --notest
convmv -f GBK -t UTF-8 --notest *.mp3
-f 参数是指出转换前的编码,-t 是转换后的编码。这个千万不要弄错了。不然可能还是乱码哦。还有一个参数很有用。就是 -r 这个表示递归转换当前目录下的所有子目录。
* 需要安装 convmv-1.10-1.el5.noarch.rpm 
三、  更好的傻瓜型命令行工具enca,它不但能智能的识别文件的编码,而且还支持成批转换。    1.安装    
$sudo apt-get install enca    
2.查看当前文件编码    
enca -L zh_CN ip.txt     Simplified Chinese National Standard; GB2312     Surrounded by/intermixed with non-text data    
3.转换    命令格式如下    
$enca -L 当前语言 -x 目标编码 文件名    
例如要把当前目录下的所有文件都转成utf-8    
enca -L zh_CN -x utf-8 *    
检查文件的编码 enca -L zh_CN file     
将文件编码转换为"UTF-8"编码  enca -L zh_CN -x UTF-8 file
如果不想覆盖原文件可以这样         enca -L zh_CN -x UTF-8 < file1 > file2

http://blog.csdn.net/jnbbwyth/article/details/6991425
分享到:
评论

相关推荐

    查看文件编码格式Demo

    本文将深入探讨“查看文件编码格式”的重要性、方法以及相关的技术细节。 首先,我们要明白什么是文件编码格式。文件编码格式,如ASCII、UTF-8、GBK等,是用来规定字符集和它们在二进制数据流中表示方式的一种标准...

    linux 查看文件编码

    在Linux系统中,查看文件编码是一项非常基础但重要的任务,特别是在处理文本文件、脚本或者进行跨平台数据传输时。本文将深入探讨如何在Linux环境下识别和检查文件的字符编码,以便正确理解和处理这些文件。 首先,...

    Linux下查看文件编码,文件编码格式转换和文件名编码.doc

    Linux 文件编码查看、转换和文件名编码转换 在 Linux 中查看文件编码可以通过多种方式实现,例如,在 Vim 中可以使用 `set fileencoding` 命令来查看当前文件的编码格式。如果需要自动识别文件编码,可以在 `~/....

    解压密码123,可以查看文件编码

    下面是如何使用010 Editor来查看文件编码的步骤: 1. **打开010 Editor**:启动010 Editor程序,点击菜单栏上的“文件”&gt;“打开”,找到你刚刚解压出来的文件。 2. **分析文件编码**:在文件打开后,010 Editor会...

    Python 查看文件的编码格式方法

    #### 一、为什么需要查看文件编码格式? 在处理包含非英文字符(如中文、日文等)的文件时,如果不了解文件的编码格式,直接使用默认编码进行读取可能会导致错误的结果。例如,如果一个文件使用的是`GB2312`编码,...

    获取文件编码格式(纯JAVA代码,绝对对你有用)

    java 识别文件的编码格式 读取文件的编码 utf-8 gbk gb2312 java 编码 java 获取文件编码格式 java 乱码查找

    Java 获得文件编码格式

    在Java编程语言中,获取文件编码格式是一项重要的任务,特别是在处理不同来源的文本文件时。文件的编码格式决定了字符如何在计算机中存储和显示,不同的编码如ASCII、GBK、UTF-8等支持的字符集范围不同。这篇博客...

    获取zip文件编码格式 cpdetector.zip

    "获取zip文件编码格式 cpdetector.zip" 是一个工具,它能够帮助我们识别ZIP文件内文本文件的编码格式。 这个工具的关键依赖于三个JAR文件:antlr-1.0.jar、cpdetector-1.08.jar和jchardet-1.0.jar。这些库提供了...

    读取创建CSV文件并自动解析文件编码方式

    本文将深入探讨如何读取和创建CSV文件,并特别关注自动解析文件编码方式这一关键环节。我们将使用Java语言进行示例,同时引入第三方库来辅助处理编码问题。 首先,创建CSV文件的基本过程涉及将数据写入具有特定分隔...

    查看文本文件的编码格式

    在日常工作中,无论是编程、编辑文档还是网页开发,了解并正确处理文件编码至关重要。 标题“查看文本文件的编码格式”所指的是一个工具或程序,它的功能是帮助用户检测和识别文本文件(如.txt和.html文件)的编码...

    Linux查看文件编码格式及文件编码转换

    ### Linux查看文件编码格式 在Linux环境中,了解文件的编码格式是非常重要的,因为这直接影响到文件的正确读取和处理。下面将详细介绍如何在Linux环境下查看文件编码格式的方法。 #### 使用Vim查看文件编码 Vim是...

    JAVA获取文件编码格式

    标题提到的“JAVA获取文件编码格式”是一项常见的任务,特别是在处理来自不同来源的文本文件时。在这种情况下,我们可以利用第三方开源库来帮助我们完成这项工作。描述中提到了一个叫做"cpdetector"的工具,这是一个...

    Qt文件编码批量转换

    Qt5.9开发的文件编码转换。该工具我用来在Windows7下面VS2015编译器与MinGW编译器编码转换。MinGW编译器使用UTF-8编码,VS2015使用GB2312编码。 预编译头文件缺失,将头文件替换为 #include #include #include #...

    批量编码转化工具(实现文件编码的自动检测)

    文件编码是用来表示文本字符的规则,常见的有ASCII、GB2312、GBK、UTF-8等。不同的编码方式决定了字符集的大小和覆盖的字符范围。例如,ASCII只包含英文字符,而GBK则包含了更多的中文字符。UTF-8是一种多字节编码...

    java 文件编码转换

    在IT行业中,文件编码转换是一项基础且重要的任务,尤其是在处理多语言或多系统交互时。Java作为一种广泛使用的编程语言,提供了丰富的API来支持文件编码的识别和转换。标题"java 文件编码转换"指的是使用Java来解决...

    C#获取文件编码(可以获取子目录下的文件)

    在IT行业中,尤其是在软件开发领域,文件编码是一个至关重要的概念,尤其当涉及到多语言支持、数据交换或跨平台开发时。C#作为一种强大的编程语言,提供了丰富的API来处理文件编码问题。本文将深入探讨如何使用C#来...

    文件编码转换工具

    文件编码是计算机处理文本的一种方式,它决定了字符与二进制数据之间的映射关系。不同的编码格式有不同的字符集和编码规则,例如GBK、UTF-8等。在处理跨平台或跨语言的文件时,文件编码的不一致可能导致乱码问题,...

    批量修改文件编码软件

    在IT领域,文件编码是一个非常重要的概念,尤其是在处理文本文件时。不同的编码方式决定了文本文件中字符的存储和显示方式。常见的编码格式有ASCII、ISO-8859-1、GB2312、GBK、UTF-8等。本文将深入探讨批量修改文件...

    各种类型文件头标准编码.docx

    文件头标准编码详解 在计算机领域中,文件头标准编码是指文件的开头部分包含的一些特殊标识符,用于标识文件的类型和格式。这些标识符通常是固定的,用于告诉计算机这是什么类型的文件,以便正确地打开和处理该文件...

    mac文件编码转换

    在Mac操作系统中,文件编码转换是一项重要的任务,尤其对于处理包含不同字符集的文本文件时。常见的文件类型如txt、xml、css、htm、html、php、jsp等,它们可能因开发环境或语言设定的不同而采用不同的编码方式,如...

Global site tag (gtag.js) - Google Analytics