`

【翻译】把以EUC-JP编码的文件批量变换为UTF-8编码的脚本

    博客分类:
  • Bash
阅读更多
最近想把过去用EUC-JP编码的PHP文件,全部变换为UTF-8编码,
于是写了简单的脚本。虽然简单,如果不做笔记,估计很快就会忘记。
#!/bin/sh

for i in "$@"
do
  echo $i
  iconv -f EUCJP -t UTF-8 $i ${i}.utf8
  rm $i
  mv ${i}.utf8 $i
done


From: http://www.cyber.t.u-tokyo.ac.jp/~jnakano/blog/2008/08/eucno.html
0
0
分享到:
评论

相关推荐

    文件代码类型的相互转换,Shift_JIS、EUC-JP、ISO-2022-JP、 Unicode、UTF-8

    实现不同文件代码类型,诸如 Shift_JIS、EUC-JP、ISO-2022-JP、 Unicode、UTF-8 的相互変換,FREE软件

    EUC-JP, JIS, Shift-JIS转码

    "EUC-JP, JIS, Shift-JIS 编码转换详解" EUC-JP 是一种用来表示日语汉字的编码方法,主要用在 Unix 系统上。EUC 的全称为 Extended Unix Code,是一种用8位bit来表示字符的方法。EUC-JP 简称 EUC。 JIS 是一种用7...

    nls_euc-jp.rar_conversion

    1. 如何将EUC-JP编码的数据转换为其他编码格式,如ISO-2022-JP、Shift_JIS或Unicode(UTF-8)。 2. 在不同操作系统或应用之间的数据交换标准,确保兼容性和一致性。 3. 错误处理策略,比如遇到未知或无效的编码组合...

    文字变换工具(EUC->SJIS)

    本文将深入探讨“文字变换工具(EUC->SJIS)”这一实用工具,它专门用于转换日文文本文件的编码格式,帮助用户在不同编码之间进行无缝切换。 EUC(Extended Unix Code)是一种广泛用于东亚地区的多字节字符编码,特别...

    EUC_KR转GB18030表

    例如,在处理东亚语言(如韩语)时,可能会遇到需要将EUC-KR编码的数据转换为GB18030编码的需求。本文将详细介绍如何实现这一转换,并基于一个具体的EUC-KR到GB18030的转码表进行深入解析。 #### 二、EUC-KR与GB...

    SAS EG导入UTF-8编码的文本数据文件时的乱码问题解决方法

    在使用SAS EG(Enterprise Guide)导入编码为UTF-8的文本数据文件时,用户可能会遇到中文乱码问题。UTF-8编码的文本文件在处理中文字符时,如果没有正确设置编码,可能会导致中文字符显示不正确,即出现乱码现象。...

    fix_id3_kr_encoding:将包含 EUC-KR 或 CP949 编码的 ID3 标签更新为 UTF-8 编码

    将包含 EUC-KR 或 CP949 编码标签的 ID3 标签更新为 UTF-8 编码。 需要诱变剂库。 $ sudo easy_install mutagen $ cd directory_with_mp3_files $ python fix_kr_id3.py 将 EUC-KR / CP949 编码的 ID3 标签更新为...

    node-unzip-mbcs:解压缩非UTF8编码,例如cp949,sjis,gbk,euc-kr,euc-jp和gb2312

    按语言划分的主要非UTF8编码: 朝鲜语:cp949,euc-kr 日语:sjis(shift_jis),cp932,euc-jp 中文:gbk,gb18030,gb2312,cp936,hkscs,big5,cp950安装npm install -g unzip-mbcs命令行界面Usage: unzip-mbcs...

    有关pdfbox-1.3.1中Identity-H编码为乱码的解决方法

    在使用PDFBox 1.3.1版本时,可能会遇到一个常见的问题,即当处理包含非ASCII字符(如中文、日文或韩文等)的PDF文件时,可能会出现“Identity-H”编码导致的乱码现象。这是因为PDFBox在解析含有Unicode编码的PDF文档...

    编码模拟器v1.0绿色版支持ANSI编码

    功能介绍 在文本字元编码之间进行转换(包括UTF-8,没有bom标记的UTF-8,UTF-16le,UTF-16be,UTF-32le,UTF-32be,中文简体GBK,中文繁体BIG5,日文 shift-JIS, 日文 euc-jp, 韩文 euc-kr等, 请参照支援的

    gvim解决utf-8文件中文乱码

    这段设置意味着gvim会按照顺序尝试用UCS-BOM(Unicode字符集带BOM标记)、UTF-8、CP936(简体中文Windows编码)、GB18030(简体中文国标编码)、BIG5(繁体中文编码)、EUC-JP(日文编码)、EUC-KR(韩文编码)和...

    EUC_JP也可能显示的多国语putty

    EUC_JP也可能显示的多国语putty,可以选择的文字编码很多

    Cvt2Utf8,将日文内码的文本文件批量转码为UTF-8格式的工具

    本文将深入探讨一个名为"Cvt2Utf8"的工具,它专门用于将日文内码的文本文件批量转换为更通用的UTF-8编码格式。 首先,我们来理解一下标题中的关键术语。"Cvt2Utf8"是这个工具的名称,暗示了它的功能——转换...

    易语言编码转换 各种编码

    编码转换可转utf-8等..............

    易语言-易语言实现文件编码检测

    uchardet是一个广泛使用的C++库,能够自动识别多种文本编码,包括但不限于ASCII、ISO-8859-x、Windows-125x、UTF-8、UTF-16、EUC-JP等。易语言模块源码可能就是将uchardet库进行了封装,以便于在易语言环境中使用。 ...

    C文件euc格式

    对于这类非标准编码的源代码,建议在转换为标准编码如UTF-8后进行编辑和编译,以确保兼容性和可维护性。 总之,理解和处理"C文件euc格式"需要对编码理论、C/C++的I/O操作以及特定编码的解析有深入的理解。在实际...

    编码转换工具.exe

    "EUC-JP" "EUC-KR" "GB18030" "GB2312" "HP-ROMAN8" "IBM 850" "IBM 866" "IBM 874" "ISO 2022-JP" "ISO 8859-1" "ISO 8859-2" "ISO 8859-3" "ISO 8859-4" "ISO 8859-5" "ISO 8859-6" "ISO 8859-7" ...

    各国文字Unicode编码范围

    在HTML和RTF文档中,这些字符通常通过指定相应的charset属性来表示,例如`charset="utf-8"`表示使用UTF-8编码,这允许包含Unicode范围内的所有字符。 了解不同语言的Unicode编码范围对于开发跨平台和跨语言的应用...

    谷歌浏览器-字符编码插件

    用户可以通过插件的菜单选择合适的编码,比如GBK、BIG5或EUC-JP等,以确保网页内容正确显示。 谷歌浏览器的字符编码插件通常有以下特点: 1. 易用性:用户界面直观,操作简单,只需点击几下即可更改编码。 2. 兼容...

Global site tag (gtag.js) - Google Analytics