- 浏览: 763741 次
- 性别:
- 来自: 南京
文章分类
- 全部博客 (663)
- Eclipse&MyEclipse (40)
- PHP (3)
- Java (72)
- CSS (3)
- MySQL (35)
- Oracle (68)
- Red Hat Linux (23)
- Tomcat (26)
- Oracle10gAS (1)
- Spring (28)
- MyBatis&iBatis (13)
- JS (47)
- JQuery (23)
- Editplus (2)
- 其他 (4)
- Html (15)
- SQL (5)
- Ant (2)
- Hadoop (2)
- Servlet (9)
- Windows (11)
- Flex (1)
- CentOS Linux (7)
- Microsoft SQL Server (2)
- DB2 (3)
- Mysql char 与 varchar 区别 (0)
- excel (5)
- jsp (8)
- FreeMarker (1)
- EasyUI (5)
- WebShpere MQ (1)
- Maven2 (6)
- 浏览器缓存 (2)
- visio (1)
- XML (2)
- 物联网 (1)
- Maven (3)
- JSTL (2)
- HTTP (1)
- Fourinone (1)
- IP知识 (1)
- MyBatis (1)
- 项目管理 (2)
- office2003+2007 (1)
- DOS (1)
- JProfiler (1)
- Thinpad T440p (1)
- ActiveMQ (10)
- MongoDB (5)
- Vert.x3 (1)
- Ngnix (3)
- Spark (2)
- BigData (1)
- 性能概念公式 (1)
- RocketMQ (3)
- IT名词术语 (1)
- Java编程工具 (1)
- RabbitMQ (2)
- MetaMQ (1)
- 架构 (6)
- KafkaMQ (7)
- Redis (4)
- OAuth (1)
- Gradle (1)
- CentOS (5)
- Microsoft_Toolkit (1)
- git (5)
- IntelliJ Idea (4)
- Nginx (3)
- docker (12)
- VMware (2)
- 算法 (1)
- JDBCPool (1)
- spring-cloud (7)
- netbean (1)
- 微信小程序 (2)
- CURL (2)
- Java生成二维码 (1)
- 区块链 (2)
- 机器学习 (1)
- SpringBoot (3)
- Android (9)
- 微服务架构 (1)
- Kubernetes (2)
- OpenProject (0)
- 测试 (1)
- https (1)
- 开源许可证 (1)
- ServiceMesh (2)
- NET (0)
- .NET (1)
- TEST (1)
- iOS (2)
- thymeleaf (4)
- lombok (1)
- 浏览器设置 (1)
- 富文本编辑器 (1)
- 搜索引擎 (1)
- IT常识 (1)
- UML (0)
- Axure (1)
- appstore无法联网 (0)
- apk无法安装 (1)
- SQLServer (2)
- 卸载弹窗软件 (1)
- jenkins (1)
- TortoiseGit (1)
- eureka (1)
- ajax (1)
- spyder (0)
最新评论
(原作者地址)http://hi.baidu.com/893625/blog/item/c5dbf9d158080c359b502715.html
import java.io.BufferedReader;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.FileReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.PushbackInputStream;
import java.util.ArrayList;
import java.util.HashSet;
import java.util.List;
import java.util.Set;
public class BOMRemover {
/**
* ant 编译之后的result文件,注意要编译提示错误的文件名要在同一行 可以设置命令提示窗口的缓冲区大小实现
*
* @param resultFileName
*/
public static Set getFileNamesFromCompileResult(String resultFileName)
throws java.io.IOException {
Set<String> set = new HashSet();
BufferedReader reader = new BufferedReader(new FileReader(
resultFileName));
String start = "[javac] ";
int startLen = start.length();
String end = ".java:";
int endLen = end.length();
String errMsg = "\\65279";
while (reader.ready()) {
String line = reader.readLine();
int indexStart = line.indexOf(start);
if (line.indexOf(errMsg) == -1) {
continue;
}
if (indexStart != -1) {
int indexEnd = line.indexOf(end);
if (indexEnd != -1) {
String name = line.substring(indexStart + startLen,
indexEnd + endLen - 1);
set.add(name.trim());
}
}
}
return set;
}
public static void DealSrcFiles(String path) {
if (path.charAt(path.length() - 1) != '\\') {
path += '\\';
}
File file = new File(path);
if (!file.exists()) {
System.out.println("Error: Path not Existed! Please Check it out!");
return;
}
String[] filelist = file.list();
for (int i = 0; i < filelist.length; i++) {
File temp = new File(path + filelist[i]);
if ((temp.isDirectory() && !temp.isHidden() && temp.exists())) {
DealSrcFiles(path + filelist[i]);
} else {
if (filelist[i].endsWith(".java")) {
try {
trimBom(path + filelist[i]);
} catch (Exception eee) {
}
}
}
}
}
/**
* 读取流中前面的字符,看是否有bom,如果有bom,将bom头先读掉丢弃
*
* @param in
* @return
* @throws IOException
*/
public static InputStream getInputStream(InputStream in) throws IOException {
PushbackInputStream testin = new PushbackInputStream(in);
int ch = testin.read();
if (ch != 0xEF) {
testin.unread(ch);
} else if ((ch = testin.read()) != 0xBB) {
testin.unread(ch);
testin.unread(0xef);
} else if ((ch = testin.read()) != 0xBF) {
throw new IOException("错误的UTF-8格式文件");
} else {
// 不需要做,这里是bom头被读完了
// // System.out.println("still exist bom");
}
return testin;
}
/**
* 根据一个文件名,读取完文件,干掉bom头。
*
* @param fileName
* @throws IOException
*/
public static void trimBom(String fileName) throws IOException {
FileInputStream fin = new FileInputStream(fileName);
// 开始写临时文件
InputStream in = getInputStream(fin);
ByteArrayOutputStream bos = new ByteArrayOutputStream();
byte b[] = new byte[4096];
int len = 0;
while (in.available() > 0) {
len = in.read(b, 0, 4096);
// out.write(b, 0, len);
bos.write(b, 0, len);
}
in.close();
fin.close();
bos.close();
// 临时文件写完,开始将临时文件写回本文件。
System.out.println("[" + fileName + "]");
FileOutputStream out = new FileOutputStream(fileName);
out.write(bos.toByteArray());
out.close();
System.out.println("处理文件"+fileName);
}
/**
* 根据ant编译错误来去除bom
*
* @param resultFile
* @throws IOException
*/
static void trimBomByCompileResult(String resultFile) throws IOException {
Set<String> set = getFileNamesFromCompileResult(resultFile);
for (String fName : set) {
trimBom(fName);
}
}
public static void main(String[] args) throws IOException {
// if(args.length==0){
// DealSrcFiles(System.getProperty("user.dir"));
// }
// else{
// DealSrcFiles(args[0]);
// }
//直接扫描所有的java文件
DealSrcFiles("F:/workspace/proj/src");
//另一种调用方式,只扫描ant报错的文件,只需把报错文件另存为即可
//trimBomByCompileResult("d:/bom.txt");
}
}
发表评论
-
文本域显示行数算法
2021-03-10 22:46 283每行显示字符数: showCount 总共字符数:tot ... -
[初级容易犯错的地方]JAVA方法中的参数用final来修饰的效果(转)
2020-11-23 16:52 237今天顺便看到这个文章,转发一下,因是很多初级者容易犯错的地 ... -
Java批量解析微信dat文件,微信图片破解
2020-02-17 20:33 2091package com.chinada.dms.test.y ... -
Spring Framework 5.0 入门篇(转)
2019-04-25 10:00 01.为什么学习Spring? 随着对Java EE ... -
类中内部类中的方法访问外部类中变量的示例(转)
2018-10-06 21:23 458lass Day10_11 { public static ... -
java连接ssh到服务器执行命令(免密码)
2018-07-10 09:00 0今天在做不同服务器间,免密码执行curl 命令 Java ... -
于Aviator的规则引擎Demo(转)
2018-05-03 09:26 1834编写不易,转载请注明(http://shihlei.itey ... -
va网络爬虫经验分享(转)
2018-04-20 10:33 573最近三年很少写博客,虽然一直从事IT行业,但更多的是管理工作 ... -
高级Java开发人员最常访问的几个网站(转)
2018-04-19 14:30 308这是高级Java开发人员最常访问的几个网站。 这些网 ... -
趣味算法图解,文科生都看懂了(转)
2018-04-17 17:22 881编者按 IDEA 是由 Sándor ... -
Java Security:公钥私钥、数字签名、消息摘要是什么 (转)
2018-04-13 10:10 420https://www.cnblogs.com/f119436 ... -
一文了解十大 Java 开发者必备测试框架!(转)
2018-04-10 13:55 366想要提升自己的自动化测试技能吗?本文将介绍10个优秀的 Ja ... -
深入理解 Java 多线程核心知识:跳槽面试必备(转)
2018-04-02 13:43 329多线程相对于其他 Java 知识点来讲,有一定的学习门槛,并 ... -
11大Java开源中文分词器的使用方法和分词效果对比(转)
2018-03-19 15:37 557原文出处: 杨尚川 本文的目标有两个: 1、学会使用1 ... -
远程debug代码(转)
2018-03-16 16:45 1016参考:http://blog.csdn.net/su ... -
微服务架构初探(转)
2018-03-16 16:39 645什么是微服务 ... -
你真的理解了MVC, MVP, MVVM吗?(转)
2018-03-15 15:26 543前言: 准备写这篇文章的时候 , 我自认为对MVC已经有深刻 ... -
JAR(Spring Boot)应用的后台运行配置(转)
2018-03-09 07:04 1116酱油一篇,整理一下关于Spring Boot后台运行的一些配 ... -
一位阿里架构师在2018年给每个程序员的小建议(转)
2018-03-01 15:54 571一位阿里架构师在2018年给每个程序员的小建议 1 ... -
Java 9 新特性,看这里就明白了(转)
2018-02-28 14:54 5671、Java9 新特性之---目 ...
相关推荐
在Java编程中,UTF-8编码是一个非常常见且广泛使用的字符编码格式,它能支持全球大部分语言的字符表示。然而,UTF-8有一个特殊特性,那就是它可以带有Byte Order Mark(BOM),这是一个特殊的字节序列,用于标识数据...
BOM,即字节顺序标记,是UTF-8编码中可选的一部分,用于标识数据流的字节顺序。在大多数情况下,BOM在UTF-8编码中并不必要,因为它默认是小端序,但对于某些程序或系统,BOM可能有助于识别文件的编码方式。 在处理...
标题中的"Android-清除utf8bom的IntellijIDEA插件"指的是一款针对IntelliJ IDEA开发的插件,其主要功能是帮助开发者快速、方便地从项目中删除不必要的UTF-8 BOM头。在Android Studio,即基于IntelliJ IDEA的Android...
对于使用UTF-8编码的文本文件,特别是编程源代码,通常推荐使用无BOM版本,以防止可能出现的解析问题。而这个批量去除BOM工具无疑是一个实用的辅助工具,可以帮助开发者轻松解决由BOM引发的困扰。
本文将详细讨论Python中如何将目录下的所有源文件转换为UTF-8编码,并去除Byte Order Mark (BOM)。首先,我们要理解的是,UTF-8是一种广泛使用的Unicode字符编码方案,它能够兼容ASCII编码并支持全球多种语言。而BOM...
在UTF-8编码中,BOM是可选的,但某些编辑器如记事本默认会添加。 当XML文件以UTF-16编码并包含BOM头时,DOM4J在解析过程中可能会遇到问题,因为DOM4J默认并不期望XML文档以这种方式开始。这可能导致解析异常,例如`...
BOM是Unicode编码格式中的一个特殊字符,用于标识文件的编码类型,常见于UTF-8、UTF-16和UTF-32等格式。在某些情况下,如读取或合并多个文本文件时,BOM头可能会导致不必要的困扰,例如乱码或解析错误。本文将详细...
描述中提到的"批量转换utf-8"意味着这个工具不仅能够去除BOM,还能进行批量的文件编码转换操作,将非UTF-8格式的文件转换为无BOM的UTF-8格式。这对于管理大量的源代码文件尤其有用,特别是在跨平台或多开发环境的...
在UTF-8编码中,BOM是一个可选的字节序列,通常出现在文件的开头,用来告诉软件该文件是用UTF-8编码的。然而,有些程序,特别是像IntelliJ IDEA这样的集成开发环境(IDE),可能对含有BOM的UTF-8文件处理不理想,...
"去BOM头工具"就是针对这种情况设计的,它的主要功能是去除Eclipse中使用UTF-8带BOM编码格式的文件开头的BOM头。Eclipse是一个广泛使用的Java集成开发环境(IDE),它允许开发者配置项目的编码格式。在默认情况下,...
UTF-8 BOM去除工具用于删除文件中的BOM标志,以防止这些潜在问题,确保文件正确显示和处理。 综上所述,这个压缩包文件集合涵盖了软件开发流程中的关键组件:持续集成服务器、版本控制、构建工具以及部署和字符编码...
在UTF-8编码中,BOM头由三个字节组成(0xEF, 0xBB, 0xBF),它并不是必须的,但有时候会被添加到文件的开头来表明该文件是采用UTF-8编码。尽管BOM头对于某些程序来说是有用的,但它可能会引起一些问题,尤其是在处理...
Python的`codecs`库提供了处理BOM的功能,如`utf_8_sig`解码器可以自动去除UTF-8的BOM。 2. **在Java中处理BOM** Java的`InputStreamReader`类允许指定是否忽略BOM,通过设置`CharsetDecoder`的`onMalformedInput...
标题中的“BOM结构的更改标记不显示问题”是指在处理文本文件时,尤其是在编码格式为UTF-8的情况下,出现的Byte Order Mark (BOM) 不被正确显示或识别的问题。BOM是一个特殊的字符序列,用于标识文件是以UTF-8编码的...
如果你的Excel文件以UTF-8 BOM格式保存,那么在读取时可能需要进行额外处理,去除BOM标志。 此外,如果你需要在导入Excel数据后进行处理,例如数据库操作,你可能需要对数据进行转换和验证。Apache POI允许你访问...
这种源码可能对理解和处理Unicode编码的文本文件,特别是UTF-8格式的文件时,有着重要作用。 【描述】中提到的内容包括源码、JDK安装和使用说明,这意味着这个压缩包不仅提供了实际的编程代码,还有一份关于Java ...
例如,UTF-8的BOM(字节顺序标记)是`FF FE`或`FE FF`,可以通过查找这些模式来初步判断。 3. **尝试解码**:使用各种编码尝试解码字节数组,并检查解码结果是否合理。这可能包括检查解码后的字符串是否包含非法...
【18】支持带UTF-8标记/不带UTF-8标记的文件 每个步骤都说得很详细了,就没有必要贴图了,体积不要太大才好。 【1】正则表达式应用——替换指定内容到行尾 原始文本如下面两行 abc aaaaa 123 abc 444 希望每次...
【18】支持带UTF-8标记/不带UTF-8标记的文件 每个步骤都说得很详细了,就没有必要贴图了,体积不要太大才好。 【1】正则表达式应用——替换指定内容到行尾 原始文本如下面两行 abc aaaaa 123 abc 444 希望每次...