今天女友让我统计一份数据,数据是一个txt的文件,里面每一行格式为“733026057 辽宁鞍山,上海上海,上海上海,”。需要的结果为“733026057;2; 上海上海[2];辽宁鞍山[1]"
以为自己能很快搞定,却半个小时才把代码搞定,那个⊙﹏⊙b汗呀!现在想想遇到的主要问题为:
(1)Java.io.*下的文件读写操作N久没写过了,上手慢了(原始文本编码方式为GB2312,必须处理编码)
(2)字符串处理有点耗时了,比如提取数字”733026057“,这个数字后面跟的不是空格,是使用”Tab“健生成的。最后使用模式匹配搞定。(这一块一种没仔细看,一定要抽空好好好学习一下
)
(3)Map做统计较好,但是按统计频率排序就不方便了,临时创建了一个MapSort,使用Collections.sort()完成排序。
特别说明:由于女友催的急,代码写的仓促,贴出来主要是提醒自己该提高了!java大侠们就忽略该文吧~
Pattern工具类:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class PatternUtils {
// 截取数字
public static String getNumbers(String content) {
Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher(content);
while (matcher.find()) {
return matcher.group(0).trim();
}
return "";
}
// 截取非数字
public static String splitNotNumber(String content) {
Pattern pattern = Pattern.compile("\\D+");
Matcher matcher = pattern.matcher(content);
while (matcher.find()) {
return matcher.group(0).trim();
}
return "";
}
}
FileUtils:
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.io.Writer;
public class FileUtils {
public static BufferedReader getBufferedReader(String filePath, String charset) throws Exception {
// 文件字节流
FileInputStream fis = new FileInputStream(filePath);
// 字节流和字符流的桥梁,可以指定指定字符格式
InputStreamReader isr = new InputStreamReader(fis, charset);
// 将InputStreamReader 封装到缓冲流中,需要字符编码正确
BufferedReader br = new BufferedReader(isr);
return br;
}
public static BufferedWriter getBufferedWirtie(String filePath, String charset) throws Exception {
File file = new File(filePath);
if (!file.exists()) {
file.createNewFile();
}
Writer ops = new OutputStreamWriter(new FileOutputStream(file), charset);
BufferedWriter bw = new BufferedWriter(ops);
return bw;
}
}
MapSort:
public class MapSort implements Comparable<MapSort>{
private String key;
private Integer num;
public MapSort(String key, Integer num) {
this.key = key;
this.num = num == null ? 0 : num;
}
@Override
public int compareTo(MapSort o) {
return o.getNum()-this.num;
}
public String getKey() {
return key;
}
public void setKey(String key) {
this.key = key;
}
public Integer getNum() {
return num;
}
public void setNum(Integer num) {
this.num = num;
}
}
Main:
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.util.ArrayList;
import java.util.Collections;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Set;
public class StaticMain {
public static void main(String[] args) throws Exception {
//Reads text from a character-input stream
BufferedReader br = FileUtils.getBufferedReader("E:\\juan.txt", "GB2312");
BufferedWriter bw = FileUtils.getBufferedWirtie("E:\\result.txt", "UTF-8");
String str = br.readLine();
while (str != null) {
// 读取ID及Address
str = str.trim();
String id = PatternUtils.getNumbers(str);
String addrStr = PatternUtils.splitNotNumber(str);
//統計地址
Map<String, Integer> addrMap = new HashMap<String, Integer>();
String[] addrArray = addrStr.split(",");
for (String addr : addrArray) {
addr = addr.trim();
if (addrStr.equals("")) {
continue;
}
Integer num = addrMap.get(addr);
if (num == null) {
addrMap.put(addr, 1);
} else {
addrMap.put(addr, num + 1);
}
}
//Map排序
List<MapSort> list = new ArrayList<MapSort>();
Set<String> keySet = addrMap.keySet();
for(String key:keySet) {
list.add(new MapSort(key, addrMap.get(key)));
}
Collections.sort(list);
//获取处理结果
String result = id + ";" + addrMap.size() + ";";
for (MapSort ad : list) {
result = result + ad.getKey() + "[" + ad.getNum() + "];";
}
System.out.println(result);
//写文件
bw.write(result);
bw.newLine();
str = br.readLine();
}
//应该使用在finally里
br.close();
bw.flush();
bw.close();
}
}
分享到:
相关推荐
java读取操作xml及对应jar包; apache-log4j-1.2.16; commons-codec-1.3; commons-httpclient-3.1; commons-logging-1.1; HTMLParser-2.0-SNAPSHOT-bin; xercesImpl,代码是我自己写的、质量有保证。
本教程将聚焦于如何使用原生Java 8来实现对西门子S7系列PLC的读写操作,而无需依赖任何DLL(动态链接库)文件,确保了程序的平台独立性和纯粹性。 首先,我们要理解S7协议。西门子的S7协议是用于其PLC产品通信的一...
本主题将深入探讨如何在Java中进行二叉树、树和森林的读写操作。 首先,二叉树是一种特殊的树,其中每个节点最多有两个子节点,通常分为左子节点和右子节点。在Java中,我们可以使用类来表示节点,并通过实例化这些...
它可以让你自由地定位到文件的任意位置进行读写操作: ```java RandomAccessFile randomFile = new RandomAccessFile(fileName, "r"); long position = 500; // 跳转到文件的第500个字节 randomFile.seek...
在这个过程中,你可以根据需要执行INSERT、UPDATE、DELETE等SQL语句,实现对SQLite数据库的读写操作。 在测试过程中,可以创建一个名为`Test.java`的类,模拟上述步骤来读取数据库中的数据。例如: ```java import...
标题提及的“java读写hdf5格式文件需要使用的库”主要包括两个部分:Java接口库和操作系统特定的动态链接库。这里提供的jar文件`hdf5-3.3.2.jar`是Java接口库,它封装了对HDF5文件的操作,使得Java程序员可以通过...
4. **使用jcifs库**:jcifs库是Java的一个第三方库,它实现了CIFS(Common Internet File System)协议,使得Java可以方便地操作Windows网络共享。安装jcifs后,你可以像这样创建SmbFile对象并读取文件: ```java ...
Java提供了一些库来实现这一功能,其中之一就是jcifs库,它是一个开源的Java SMB(Server Message Block)客户端,使得Java程序能够方便地操作Windows网络共享文件。在本文中,我们将深入探讨如何使用jcifs库中的...
在Java编程语言中,文件的读写操作是日常开发中不可或缺的部分。无论是处理用户数据、配置文件,还是进行数据持久化,都需要用到文件的读写功能。本篇将详细介绍如何在Java中实现文件的读写操作,并通过一个小例子...
在实际应用中,Apache POI 的功能不仅限于简单的读写操作,还支持复杂的格式转换、样式调整和模板填充等功能,是 Java 开发者处理 Word 文件的强大工具。然而,需要注意的是,由于 `.doc` 文件格式的复杂性,处理...
在Java中读取Access数据库的数据通常涉及使用Java Database Connectivity (JDBC) API。本文将详细介绍如何使用JDBC连接到Access数据库并进行分页读取数据,同时也会提及相关的库和示例代码。 首先,我们需要一个能...
### Java读写XML、Word与TXT文件:去除乱码问题详解 #### 一、引言 在实际开发过程中,我们经常需要处理各种类型的文件,包括XML、Word文档以及普通的文本文件(如TXT)。这些文件在读写过程中经常会遇到乱码问题,...
### Java 二进制文件的读写操作 在Java中,进行二进制文件的读写操作是非常常见的需求,尤其是在处理非文本类型的文件(如图片、音频或视频等)时。本文将详细介绍如何使用`FileInputStream`和`FileOutputStream`类...
在Java编程语言中,文件读写操作是程序与外部数据交互的基本能力。这篇学习笔记将带你初探这个领域,适合新手入门。我们将讨论如何使用Java进行文件的读取、写入以及一些常见的应用场景。 首先,Java提供了java.io...
- `public IniReader(String filePath)`: 构造函数,接收文件路径,初始化文件读取操作。 - `public Map, Map, String>> parse()`: 主解析方法,返回一个表示INI文件内容的Map对象。 - `private boolean ...
在Java中直接读取DWG文件并非内置功能,通常需要借助第三方库来实现。 本文将深入探讨如何使用Java读取DWG文件,并提供一个简单的代码示例。首先,我们需要了解可用的库,例如`Teigha File Format API`(前身为Open...
可以通过读取和处理Excel文件的特定部分(如按行或按列)来分块操作,而不是一次性读取所有内容。 3. **设置合适的内存参数**:在JVM启动时,可以增加堆内存大小,例如使用`-Xms`和`-Xmx`选项。然而,这并不是...
本文将详细介绍如何使用Java来读取和修改XML文件,主要涉及以下几个核心知识点: 1. **DOM解析器**: Document Object Model(DOM)是一种将XML文档转换为内存中的树形结构的方法,使得可以遍历和修改XML文件。...