package com.purang.pdf;
import java.io.BufferedOutputStream;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import org.textmining.text.extraction.WordExtractor;
public class Word {
public static void main(String args[]){
try{
//读取 用 DataInputStream
// DataInputStream fin=new DataInputStream(new FileInputStream( "D:/word/JAVA读取word文件.doc "));
//写入用 DataOutputStream
//读取
final int BUFFER_SIZE = 16 * 1024 ;
FileInputStream in = new FileInputStream("D:/word/JAVA读取word文件.doc");
WordExtractor extractor = new WordExtractor();
String str = extractor.extractText(in);
//写入
BufferedOutputStream out = new BufferedOutputStream(new FileOutputStream("D:/word/d.txt "), BUFFER_SIZE);
out.write(str.getBytes("utf-8"));
out.close();
System.out.println("读写完成");
}
catch(Exception e){
}
}
}
分享到:
相关推荐
在.NET框架中,读取和...以上就是使用.NET读取和写入Word文档的基本方法,根据实际需求,你还可以实现更复杂的操作,如格式化文本、插入图片、处理表格等。在实践中,确保对异常进行适当的处理,以保证代码的健壮性。
在Java编程语言中,读取文件是常见的任务之一,尤其对于处理文本文件,如TXT文件,以行为单位读取文件内容是一种效率较高且易于管理数据的方式。本篇将深入探讨如何使用Java进行逐行读取TXT文件,并提供相关示例代码...
2. **从试题表读出试题信息**: - 读取试题表中“题目”字段的内容,通过OLE Automation重新加载Word文档以获取试题信息。 3. **同步显示和更新试题记录中的信息**: - 在试题库维护或联机考试等应用中,利用...
在IT行业中,Word文档是日常工作中非常常见的文件格式,用于编写报告、合同、论文等各种文本内容。使用编程语言如C#进行Word文档的读写操作,可以极大地提高工作效率,实现自动化处理和批量编辑。本篇将详细介绍C#...
实例224 文本文件的操作 313 实例225 使用ROT13加密解密文件 314 6.7 其他 315 实例226 获取窗口文本 315 实例227 判断文件是否正在被使用 316 实例228 在程序中调用.HLP文件 317 实例229 C#中实现文件拖放 ...
实例224 文本文件的操作 313 实例225 使用ROT13加密解密文件 314 6.7 其他 315 实例226 获取窗口文本 315 实例227 判断文件是否正在被使用 316 实例228 在程序中调用.HLP文件 317 实例229 C#中实现文件拖放 ...
实例224 文本文件的操作 313 实例225 使用ROT13加密解密文件 314 6.7 其他 315 实例226 获取窗口文本 315 实例227 判断文件是否正在被使用 316 实例228 在程序中调用.HLP文件 317 实例229 C#中实现文件拖放 ...
实例224 文本文件的操作 313 实例225 使用ROT13加密解密文件 314 6.7 其他 315 实例226 获取窗口文本 315 实例227 判断文件是否正在被使用 316 实例228 在程序中调用.HLP文件 317 实例229 C#中实现文件拖放 ...
字符流一般用于处理纯文本类型的文件,如TXT文件等,但不能处理图像视频等非文本文件。 2. 字节流本身没有缓冲区,缓冲字节流相对于字节流,效率提升非常高。而字符流本身就带有缓冲区,缓冲字符流相对于字符流效率...
6. **软盘写保护**:软盘不能写入只能读出是因为设置了写保护。 7. **字节定义**:在计算机中,一个字节由8个二进制位组成。 8. **点阵字库**:16×16点阵字库中,存储一个汉字的字模信息需32字节。 9. **计算机...
只读出不可写入 2. D. 计算机硬件系统和软件系统 3. D. 随机存储器 4. B. 系统软件 5. B. 字根 6. B. 页面 7. D. 嵌入型 8. B. 被转入后台执行 9. A. 选择、剪切和粘贴 10. C. 选中 判断题答案: 1. × 第一代...