package com.txt;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.HashSet;
import java.util.Set;
/**
* 读取多个txt文件,去掉重复元素,再写入一个新的txt文件。
*
* @author Administrator
*
*/
public class Raw {
/**
* 读取指定目录下的txt文件,并添加到set里面(即去掉重复元素)
*
* @param path
* @return setStr
*/
public static Set<String> reader(String path) {
Set<String> setStr = new HashSet<String>();
try {
String encoding = "GBK";
File file = new File(path);
String[] fileList = file.list();
for (String fl : fileList) {
String newPath = path + "\\" + fl;
InputStreamReader read = new InputStreamReader(
new FileInputStream(newPath), encoding);// 考虑到编码格式
BufferedReader bufferedReader = new BufferedReader(read);
String lineTxt = null;
while ((lineTxt = bufferedReader.readLine()) != null) {
if (!lineTxt.trim().equals("")) {
setStr.add(lineTxt);
}
}
read.close();
}
} catch (Exception e) {
System.out.println("读取文件内容出错");
e.printStackTrace();
}
return setStr;
}
/**
* 将set里面的数据写入到一个新的txt文件里面
*
* @param str
* @throws IOException
*/
public static void writer(Set<String> str) throws IOException {
FileWriter fileWriter = new FileWriter("D:\\Result.txt");
int count = 0;
for (String string : str) {
if (!string.trim().equals("")) {
count++;
fileWriter.write(string.trim() + "\r\n");
}
}
System.out.println(count);
fileWriter.flush();
fileWriter.close();
}
public static void main(String[] args) throws IOException {
System.out.println("set>>" + reader("D:\\Stop words"));
writer(reader("D:\\Stop words"));
}
}
分享到:
相关推荐
定义了一个 Job(读取和写入数据的作业)和一个 Step(读取、处理和写入数据的过程)。在这里,我们设置了批处理的大小为 100,这意味着每次处理 100 条记录。 现在,当你运行这个 Spring Boot 应用时,Spring ...
以上就是关于“C#源代码读取多个txt,写入excel”这个主题的主要知识点,涵盖了文件操作、Excel交互、性能优化等多个方面。在实际应用中,这些技术可以帮助开发者高效地处理大量数据,提高工作效率。
在Java编程中,将数据从TXT文件读取并导入MySQL数据库是一项常见的任务,涉及到文件操作、字符串处理以及数据库交互等多个知识点。以下是对这些关键概念的详细解释: 1. **文件操作**:`FileOper.java`可能包含了对...
3. **写入新文件**:创建一个新的TXT文件,使用`StreamWriter`将去重后的数据写入。遍历HashSet,将每个唯一的行写入新文件。 ```csharp using (StreamWriter writer = new StreamWriter("output.txt")) { foreach...
这个压缩包"Python实现批量读取txt文件并转换为excel的方法示例.zip"提供了一个实用的脚本,可以帮助我们自动化地将多个TXT文本文件转换成Excel工作簿。下面我们将深入探讨这个过程涉及的关键知识点。 首先,Python...
这个“批量读取txt文件导入数据库Demo实例”可能是一个示例程序,展示了如何高效地完成这项工作。下面,我们将详细讨论这个过程涉及的关键知识点。 1. 文件读取: - **Python的内置函数**:Python是进行此类操作的...
反之,如果找到重复行,则将该行写入另一个结果文件,并增加重复计数。 这个脚本中的关键函数是`binarySearch()`,它实现了二分查找算法。二分查找是一种高效的搜索方法,适用于已排序的数据。在每次迭代中,它将...
在本例中,使用`ReadToEnd()`方法读取整个文件内容为一个字符串,再使用`Split()`方法按照换行符`vbCrLf`进行分割,得到每一行的内容。 ```vbnet arrContent = sr.ReadToEnd().Split(vbCrLf) ``` 此外,在比较两行...
以下是一个简单的示例,展示了如何读取带有BOM头的UTF-8文件,并将其写入一个新的不带BOM头的文件: ```java import java.io.*; import java.nio.charset.Charset; import java.nio.charset.StandardCharsets; ...
首先,`FileStream`是.NET Framework中的一个类,它允许我们以流的形式读取和写入文件。创建`FileStream`对象时,通常需要提供文件的路径和访问模式(如只读或写入)。下面是一个基本的示例: ```csharp using ...
这个项目的目标是读取一个包含英语文章的文件,计算其中每个单词出现的次数,然后利用堆排序算法将单词按照出现频率从大到小进行排列,并将结果输出到新的文件中。下面我们将详细探讨这个过程涉及的知识点。 首先,...
- **FreeFile** 函数:返回一个可用于打开新文件的文件号。 - **Open** 语句: - **For Append As #FileNum**:以追加模式打开文件。 - **For Input Access Read As #FileNum**:以只读模式打开文件。 - **Print #...
4. 遍历阅读器对象的每一行,每一行都是一个列表,列表中的每个元素对应CSV文件中的一列数据。 在代码示例中,使用了`with`语句来打开文件。这是推荐的做法,因为`with`语句可以确保文件最终会被正确关闭,即使在...
在编程领域,尤其是在处理大量文本数据时,去除重复文本是一个常见的需求。易语言,作为一款中国本土化的编程语言,提供了一系列的内置函数和方法来帮助开发者解决这个问题。本篇文章将详细探讨“易语言去除重复文本...
然后,它创建两个路径:一个是原始的TXT文件(`pdb_file`),另一个是存储合并后结果的文件(`save_path`)。 接着,使用`open()`函数以读模式打开原始TXT文件(`pdb_file`)和另一个文件(`topo_file`),同时以写...
4. **文件写入**:将文件头和编码后的数据写入新的EDF文件,保持文件格式的正确性。 `license.txt`文件可能是`ReadEDF.m`和`SaveEDF.m`脚本的许可协议,规定了这些代码的使用和分发条件。在使用这些函数时,应遵循...
2. `fwrite()`: 将数据写入文件,接受一个指针、要写入的元素个数、元素大小和文件指针作为参数。 3. `fread()`: 从文件中读取数据,与`fwrite()`类似,但用于读取。 4. `fclose()`: 关闭文件,释放系统资源。 三、...
本教程将详细讲解如何使用Python3来合并多个CSV文件,并在过程中去除表头。以下是你需要了解的关键知识点: 1. **Python CSV 模块**: Python内置的`csv`模块用于读写CSV文件。它提供了方便的API来读取和写入CSV...
总结来说,Java语音文件合成涉及音频文件的读取、格式转换、数据合并和写入等多个步骤。开发者需要对Java Sound API有深入理解,并可能需要借助第三方库处理特定的音频格式。通过编写和测试Util类,可以方便地将多个...
此过程涉及两个主要步骤:首先读取Excel文件并将其内容写入一个临时TXT文件;然后对这个临时文件进行处理,移除每行开头的数字和空白字符,并去除重复的记录,最终生成一个干净的TXT文件。 #### 二、程序结构与实现...