- 浏览: 482417 次
- 性别:
- 来自: 湖南
文章分类
- 全部博客 (201)
- j2ee (43)
- oracle (9)
- mysql (7)
- db2 (1)
- j2se (3)
- spring (1)
- hibernate (3)
- struts (0)
- Berkeley DB (0)
- linux (60)
- Apache2+PHP+MYSQL (2)
- solr (15)
- svn (1)
- IntelliJ Idea (1)
- eclipse,myeclipse (4)
- ant (2)
- vim (8)
- IT生活 (4)
- 测试 (6)
- lucene (4)
- shell (1)
- nutch (18)
- thread (1)
- hadoop (5)
- mapreduce (0)
- Python (4)
- 硬件 (1)
- database (1)
- maven (1)
- 正则表达 (0)
- 互联网 (1)
最新评论
-
youngcoder:
good job
HTTP协议头部与Keep-Alive模式详解 -
javazdq:
受教了 解释的不错。
lucene创建索引高级特性和索引创建参数优化 -
josico:
有几个问题想问下楼主1. LinkedBlockingQueu ...
生产者-消费者-BlockingQueue -
annybz:
有没有关于 BlockingQueue和ConcurrentL ...
生产者-消费者-BlockingQueue -
uniquejava:
多谢,记录的很真实。
DB2 学习记录
nux命令行下查看看文件的编码
enca 文件名
linux文件名编码批量转换
convmv -f 源编码 -t 新编码 [选项] 文件名
常用参数:
-r 递归处理子文件夹
–notest 真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。
–list 显示所有支持的编码
–unescap 可以做一下转义,比如把%20变成空格
比如我们有一个utf8编码的文件名,转换成GBK编码,命令如下:
convmv -f UTF-8 -t GBK --notest utf8编码的文件名
Linux下批量转换文件内容编码
1.使用enca,例如要把当前目录下的所有文件都转成utf-8
$enca -x utf-8 *
2,使用iconv 转换
iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如将一个UTF-8 编码的文件转换成GBK编码
iconv -f GBK -t UTF-8 file1 -o file2
mysql gbk转utf8
linux下GBK->UTF-8文件编码批量转换脚本
-
find default -type d -exec mkdir -p utf/{} ;
find default -type f -exec iconv -f GBK -t UTF-8 {} -o utf/{} ;
这两行命令将default目录下的文件由GBK编码转换为UTF-8编码,目录结构不变,转码后的文件保存在utf/default目录下。
mysql gbk转utf8
经过两天的尝试,mysq数据转码终于告一段落
起因:gbk编码,用脚本python处理导入数据的时候,某些汉字乱码,为了根治,决定把数据库转码
环境linux,secretcrt,mysql 5.1.14-beta
1.数据库按gbk导出(mysqldump -uroot db_rdm --default-character-set gbk -p db_rdm.sql)
2.创建为utf8库,如(create database db_rdm_test DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci; )
3.把一下shell保存执行
DB='db_rdm_test'
sed 's/gbk/utf8/g' db_rdm_gbk.sql_bak | iconv -f gb18030 -t utf-8 > $DB.sql
mysql -uroot --default-character-set=utf8 $DB < $DB.sql
说明:find命令,配合-exec参数,可以对查询的文件进行进一步的操作,可以得到很多有用的功能,比如说文件包含特定字符串的查询等,要了解这个功能,最简单直接的就是看find命令帮助,列出
-exec command ;
Execute command; true if 0 status is returned. All following arguments to find are taken to be arguments to the command until an argument consisting of #;' is encountered. The string {}' is replaced by the current file name being processed everywhere it occurs in the arguments to the command, not just in arguments where it is alone, as in some versions of find. Both of these constructions might need to be escaped (with a \') or quoted to protect them from expansion by the shell. The command is executed in the starting directory.
其实只要读懂这段话就理解了
废话少说,这里简单说明一下
-exec 参数后面跟的是 command命令,注意点如下:
command命令的终止,使用 ';' (分号)来判定,在后面必须有一个 ';'
'{}',使用{}来表示文件名,也就是find前面处理过程中过滤出来的文件,用于command命令进行处理
特别强调,对于不同的系统,直接使用分号可能会有不同的意义, 使用转义符 '\'在分号前明确说明,对于前面我们遇到的问题,主要就是这个原因引起的!
举例:
1.查询所有保护字符串“Hello”的文件
find / -exec grep "Hello" {} \;
2.删除所有临时文件
find / -name "*.tmp" -exec rm -f {} \;
发表评论
-
ifstat命令行统计网络流量
2012-06-05 15:31 5511关于统计网络流量的问题,我喜欢用命令行方式查看: ... -
CentOS 5: Make Command not Found
2012-05-22 17:50 1395个人博客:http://demi-panda.com ... -
Linux Deepin 安装永中 Office2012 个人版(更新)
2012-05-18 19:41 1522下面讲解如何在 Linux Deepin 上安装并使用永中 O ... -
Piwik 网站分析系统
2012-04-25 15:38 2954个人博客:http://demi-panda.com ... -
C3P0使用出错!
2012-04-18 21:43 2063个人博客:http://demi-panda.com/ ... -
win7、ubuntu11.10双系统,win7重装后,如何找回linux
2012-03-25 18:40 1380个人博客:http://demi-panda.com ... -
stardict 词库安装
2012-03-22 11:32 1484下载词库文件以后直接在目录下执行 tar -xjvf ... -
ubuntu 64位 安装 永中Office
2012-03-21 11:07 0Ubuntu 64位默认是不能安装永中Office的,因为它不 ... -
is not in the sudoers file
2012-02-15 17:23 1083解决方案: 首需要切换到root身份 $su - (注意 ... -
is not in the sudoers file
2011-12-22 14:00 992解决方案: 首需要切换到root身份 $su - (注意 ... -
进程间通信IPC、LPC、RPC
2011-05-25 15:12 2061进程间通 ... -
ubuntu下virtualbox虚拟机XP里使用USB
2011-05-19 09:25 2494环境:ubuntu10.04下安装virualbox,虚拟 ... -
Shell 判断文件类型
2011-05-11 15:45 3699#!/bin/sh ... -
Linux wget 详解
2011-05-07 16:05 4675个人技术博客:http://dem ... -
linux curl命令详解
2011-04-30 15:36 6000个人技术博客:http://demi-panda.com ... -
解决Socket TIME_WAIT造成的服务器无法访问,Apache的KeepAlive和TCP/IP的TIME
2011-04-20 11:19 4569个人技术博客:http://demi-panda.com ... -
Ffmpeg快速命令使用
2011-03-24 15:52 1828Ffmpeg使用语法 ffmpeg [[opt ... -
Linux远程备份工具Rsync使用案例
2011-02-24 10:31 3522个人技术博客:http://dem ... -
linux下的命令行下转换媒体格式工具FFMPEG详解
2011-02-15 17:25 6662在windows下有格式工厂之 ... -
Linux下tar bz gz等压缩包的压缩和解压
2011-02-12 12:58 1422解压 就用得挺熟 ...
相关推荐
批量转换通常涉及到大量的文本文件或代码文件,例如在软件本地化、网站迁移或跨平台开发中,可能需要将GBK编码的文件转换为UTF-8编码,以便在支持UTF-8的环境中正确显示和处理中文字符。这个过程可以通过编写脚本或...
在某些情况下,我们可能需要将GBK编码的文件转换为UTF-8编码,以便更好地兼容国际化的软件环境或者满足网络传输的要求。Shell脚本提供了一种高效且灵活的方式来批量处理这种转换任务。下面我们将详细讲解如何使用...
例如,一个使用GBK编码的网页在UTF-8环境下打开可能会出现乱码,反之亦然。这类软件通常提供便捷的转换功能,可以对整个网页或者文件进行编码格式的转换。 EditPlus是一款功能强大的文本编辑器,它具有批量转换文件...
- 理解字符编码如ASCII、UTF-8、GBK等的基本概念,以及它们在不同语言和系统中的应用,是进行有效转换的前提。 7. **编码检测** - 在转换之前,确定文件的当前编码是很重要的。可以使用`file`命令或者专门的检测...
这通常涉及读取GBK编码的源文件,解析其内容,然后将每个字符转换为对应的UTF-8编码,最后将转换后的数据写入新的文件中。这个过程需要正确处理多字节字符,以确保转换后的文本保持原意不变。 压缩包子文件的文件...
标题 "将Txt批量转UTF-8格式工具" 暗示了这个软件或脚本的主要功能,即批量转换...了解这些知识点后,你可以根据提供的工具或自己编写脚本来批量转换TXT文件到UTF-8编码,从而确保文件在各种环境下的正确显示和处理。
具体来说,我们需要编写一个Python脚本来遍历指定目录下的所有文件,并将GBK编码的文件转换为UTF-8编码。为了使脚本更具通用性,我们还考虑到了不同Python版本(如Python 2.x和Python 3.x)之间的差异。 #### 实现...
例如,从Windows系统迁移到Linux系统时,原先使用GBK编码的文件可能需要转换为UTF-8编码,以便更好地适应新环境的需求。此时,一个能够批量处理文件编码转换的脚本就显得尤为重要。 #### 核心知识点解析 ##### 1. ...
总结来说,本文档介绍了一个使用VBS编写的脚本,该脚本利用`AdoDb.Stream`对象实现了在GBK和UTF-8编码间的批量转换,解决了在不同编码系统之间阅读和编辑文件的问题,特别是在面对不支持特定编码的软件时。...
例如,从Windows环境移植到Linux环境时,文件编码可能需要从GBK转换为UTF-8。通过编写Shell脚本实现自动化文件编码转换能够大大提高工作效率。 #### 一、背景介绍 当我们将Windows系统上的JSP网页移植到Linux环境中...
- **转换文件编码**:`iconv -f gbk -t utf8 原.txt > 新.txt`,这将文件从GBK编码转换为UTF-8编码。 - **计算文件的MD5校验值**:`md5sum` 命令可以用来验证文件的一致性。 - **创建硬链接**:`ln` 命令用于创建...
确定了原始编码后,你可以使用工具将模板文件转换为你需要的编码格式,例如转换为UTF-8无BOM格式,以便在各种环境下都能正常运行。 文件"51ECSHOP模板转码专用工具1.0"很可能是这个工具的安装包或可执行文件。在...
例如,如果一个从互联网上下载的中文文档是以GBK编码的,而在Mac或Linux系统中默认使用的是UTF-8编码,TextExchange可以帮助完成转换。 3. **批量转换**:在处理大量文件时,TextExchange可能提供了批量转换功能,...
反之,如果要将UTF-8编码文件转换为GBK,命令行则应输入`./conv -g /path/to/my/files`。 总的来说,这个shell脚本提供了一种简单且实用的方法来批量处理文件的字符编码转换问题,尤其适用于需要在GBK和UTF-8之间...
iconv是一个广泛使用的函数库,用于在不同的字符编码之间进行转换,例如从UTF-8转换到GBK。apr-iconv的设计目标是确保在不同操作系统上的行为一致,同时避免对特定系统实现的依赖,增强了代码的可移植性。 在apr-...
# 将utf-8编码的文件test.txt转换为gbk编码的gbk.txt pen.py file test.txt@utf8 -c gbk.txt@gbk # 文件转换,转换为utf-16-bom类型文件(jsp/aspx的utf-16-bom类型文件可绕过一些安全软件) pen.py file cmd.jsp -c ...
- 在创建ZIP文件时,尽量使用标准的UTF-8编码,确保文件名的通用性。 - 尽量避免在文件名中使用非ASCII字符,以减少跨平台或跨工具时可能出现的乱码问题。 7. **了解操作系统差异** - 不同操作系统对编码的支持...
- **命令解释**:此命令用于批量转换文件或目录的名称编码,从GBK编码转换为UTF-8编码。 - **应用场景**:在处理包含非英文字符的文件名时,可能会遇到编码问题,此时使用此命令可以帮助解决此类问题。 - **关键参数...
1. **编码系统**:汉字的编码方式有很多种,常见的有GB2312(国标简体中文)、GBK(扩展国标)、Big5(繁体中文)、Unicode(万国码)和UTF-8等。这些编码系统各有其适用范围和特点,例如,GB2312主要适用于简体中文...