【翻译】把以EUC-JP编码的文件批量变换为UTF-8编码的脚本 - 技术与人际，两手都要硬 - ITeye博客

`

kanglecjr

浏览: 522267 次
性别:
来自: 北京

最近访客更多访客>>

briefyf

-tl-

malinhuan123

mygod_cx

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

DawnBells： ...
java.util.concurrent 之六：使用Future类和Callable类
kanglecjr： http://tieba.baidu.com/f?kz=101 ...
泰语字母好看的手写体
zxjlwt：学习了。http://surenpi.com
java.util.concurrent 之六：使用Future类和Callable类
spring_springdata： java jsoup开源框架demo使用实例教程源代码下载:h ...
JSOUP获取网页数据返回403错误（403 error loading URL,connection类）
narochids： MARK!
JavaScript+Ajax实例大全（1521例以上），可以随编辑随执行

【翻译】把以EUC-JP编码的文件批量变换为UTF-8编码的脚本

博客分类：

Bash

脚本 PHP C C++C#

阅读更多

最近想把过去用EUC-JP编码的PHP文件，全部变换为UTF-8编码，
于是写了简单的脚本。虽然简单，如果不做笔记，估计很快就会忘记。

#!/bin/sh

for i in "$@"
do
  echo $i
  iconv -f EUCJP -t UTF-8 $i ${i}.utf8
  rm $i
  mv ${i}.utf8 $i
done

From: http://www.cyber.t.u-tokyo.ac.jp/~jnakano/blog/2008/08/eucno.html

0
顶

0
踩

分享到：

【翻译】PHP中文字编码变换时使用SJIS ... | 【翻译】用PHP取得字符串的长度（strlen,m ...

2011-02-02 07:43
浏览 1581
评论(0)
分类:操作系统
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

文件代码类型的相互转换，Shift_JIS、EUC-JP、ISO-2022-JP、 Unicode、UTF-8: 实现不同文件代码类型，诸如 Shift_JIS、EUC-JP、ISO-2022-JP、 Unicode、UTF-8 的相互変換，FREE软件

EUC-JP, JIS, Shift-JIS转码: "EUC-JP, JIS, Shift-JIS 编码转换详解" EUC-JP 是一种用来表示日语汉字的编码方法，主要用在 Unix 系统上。EUC 的全称为 Extended Unix Code，是一种用8位bit来表示字符的方法。EUC-JP 简称 EUC。 JIS 是一种用7...

nls_euc-jp.rar_conversion: 1. 如何将EUC-JP编码的数据转换为其他编码格式，如ISO-2022-JP、Shift_JIS或Unicode（UTF-8）。 2. 在不同操作系统或应用之间的数据交换标准，确保兼容性和一致性。 3. 错误处理策略，比如遇到未知或无效的编码组合...

文字变换工具(EUC->SJIS): 本文将深入探讨“文字变换工具(EUC->SJIS)”这一实用工具，它专门用于转换日文文本文件的编码格式，帮助用户在不同编码之间进行无缝切换。 EUC（Extended Unix Code）是一种广泛用于东亚地区的多字节字符编码，特别...

EUC_KR转GB18030表: 例如，在处理东亚语言（如韩语）时，可能会遇到需要将EUC-KR编码的数据转换为GB18030编码的需求。本文将详细介绍如何实现这一转换，并基于一个具体的EUC-KR到GB18030的转码表进行深入解析。 #### 二、EUC-KR与GB...

标准编码的码表,UTF8,unicode等等: EUC（Extended Unix Code）是一组用于东亚语言的多字节编码，包括EUC-CN（GB2312）、EUC-TW（Big5）和EUC-JP（Shift-JIS）。EUC编码允许在单一的字节流中表示多种语言，但不具有互换性，即不同EUC变种之间无法直接...

C文件euc格式: 对于这类非标准编码的源代码，建议在转换为标准编码如UTF-8后进行编辑和编译，以确保兼容性和可维护性。总之，理解和处理"C文件euc格式"需要对编码理论、C/C++的I/O操作以及特定编码的解析有深入的理解。在实际...

fix_id3_kr_encoding:将包含 EUC-KR 或 CP949 编码的 ID3 标签更新为 UTF-8 编码: 将包含 EUC-KR 或 CP949 编码标签的 ID3 标签更新为 UTF-8 编码。需要诱变剂库。 $ sudo easy_install mutagen $ cd directory_with_mp3_files $ python fix_kr_id3.py 将 EUC-KR / CP949 编码的 ID3 标签更新为...

有关pdfbox-1.3.1中Identity-H编码为乱码的解决方法: 在使用PDFBox 1.3.1版本时，可能会遇到一个常见的问题，即当处理包含非ASCII字符（如中文、日文或韩文等）的PDF文件时，可能会出现“Identity-H”编码导致的乱码现象。这是因为PDFBox在解析含有Unicode编码的PDF文档...

node-unzip-mbcs:解压缩非UTF8编码，例如cp949，sjis，gbk，euc-kr，euc-jp和gb2312: 按语言划分的主要非UTF8编码：朝鲜语：cp949，euc-kr 日语：sjis（shift_jis），cp932，euc-jp 中文：gbk，gb18030，gb2312，cp936，hkscs，big5，cp950安装npm install -g unzip-mbcs命令行界面Usage: unzip-mbcs...

编码模拟器v1.0绿色版支持ANSI编码: 功能介绍在文本字元编码之间进行转换(包括UTF-8,没有bom标记的UTF-8,UTF-16le,UTF-16be,UTF-32le,UTF-32be,中文简体GBK,中文繁体BIG5,日文 shift-JIS, 日文 euc-jp, 韩文 euc-kr等, 请参照支援的

gvim解决utf-8文件中文乱码: 这段设置意味着gvim会按照顺序尝试用UCS-BOM（Unicode字符集带BOM标记）、UTF-8、CP936（简体中文Windows编码）、GB18030（简体中文国标编码）、BIG5（繁体中文编码）、EUC-JP（日文编码）、EUC-KR（韩文编码）和...

EUC_JP也可能显示的多国语putty: EUC_JP也可能显示的多国语putty,可以选择的文字编码很多

Cvt2Utf8，将日文内码的文本文件批量转码为UTF-8格式的工具: 本文将深入探讨一个名为"Cvt2Utf8"的工具，它专门用于将日文内码的文本文件批量转换为更通用的UTF-8编码格式。首先，我们来理解一下标题中的关键术语。"Cvt2Utf8"是这个工具的名称，暗示了它的功能——转换...

易语言编码转换各种编码: 编码转换可转utf-8等..............

易语言-易语言实现文件编码检测: uchardet是一个广泛使用的C++库，能够自动识别多种文本编码，包括但不限于ASCII、ISO-8859-x、Windows-125x、UTF-8、UTF-16、EUC-JP等。易语言模块源码可能就是将uchardet库进行了封装，以便于在易语言环境中使用。 ...

编码转换工具.exe: "EUC-JP" "EUC-KR" "GB18030" "GB2312" "HP-ROMAN8" "IBM 850" "IBM 866" "IBM 874" "ISO 2022-JP" "ISO 8859-1" "ISO 8859-2" "ISO 8859-3" "ISO 8859-4" "ISO 8859-5" "ISO 8859-6" "ISO 8859-7" ...

各国文字Unicode编码范围: 在HTML和RTF文档中，这些字符通常通过指定相应的charset属性来表示，例如`charset="utf-8"`表示使用UTF-8编码，这允许包含Unicode范围内的所有字符。了解不同语言的Unicode编码范围对于开发跨平台和跨语言的应用...

TSPLIB数据集文件+194城市+EUC-2D: TSPLIB数据集文件+194城市+EUC-2D

Global site tag (gtag.js) - Google Analytics