这几天想用Java读富文档。用javax.swing.text和javax.swing.text.rtf包中的类读RTF文档时出现中文乱码问题(出现?号)。
幸好找到
ANGEL SKY 的博客。用ISO8859_1编码转换。
代码片断:
String bodyText = null;
DefaultStyledDocument styledDoc = new DefaultStyledDocument(); //javax.swing.text.Document的一个实例
try {
InputStream is = new FileInputStream(new File("data/java.swing.text读RTF文档测试.rtf"));
new RTFEditorKit().read(is, styledDoc, 0);
bodyText = new String(styledDoc.getText(0, styledDoc.getLength()).getBytes("ISO8859_1")); //提取文本
} catch (IOException e) {
throw new DocumentHandlerException("不能从RTF中摘录文本!", e);
} catch (BadLocationException e) {
throw new DocumentHandlerException("不能从RTF中摘录文本!", e);
}
System.out.println(bodyText);
分享到:
相关推荐
让我们详细探讨这两个过程以及解决乱码和转换失败的问题。 **RTF模板生成Word文档** RTF是一种通用的文本格式,它可以包含丰富的文本样式、图像和表格等元素。使用RTF模板生成Word文档通常涉及到编程或自动化脚本...
本篇文章将深入探讨如何在Java中读取doc和rtf文档内容,并解决中文乱码问题,同时还会涉及到log4j日志记录以及使用Swing展示rtf内容。 首先,读取.doc文件通常涉及到使用Apache POI库。Apache POI是一个开源项目,...
由于给定的文件信息中存在大量的乱码和重复字符,导致实际可读取的内容有限。基于现有的信息,我将尽力提炼相关的知识点。首先,标题“java读取word文档.pdf”和描述“java读取word文档.pdf”暗示了文章内容可能涉及...
"docConvertDocx.zip"这个压缩包文件提供了一个解决方案,利用com.aspose.words Java库将旧版的DOC格式文件转换为较新的DOCX格式,同时保证转换过程中不出现乱码问题。下面我们将深入探讨这个过程涉及的知识点。 ...
`java+mysql乱码问题.docx` 解决的是字符编码问题,特别是当 Java 应用程序与 MySQL 通信时可能出现的乱码。解决方案通常涉及设置数据库和连接的字符集为 UTF-8,以及在 Java 程序中指定正确的字符集。 `mysql时间...
在IText 5.x版本中,对亚洲字符集的支持得到了显著提升,这个扩展包包含必要的字体和编码,确保在处理亚洲文字时能正确显示和排版,解决了早期版本中可能存在的乱码问题。 `itext-rtf-2.1.7.jar`则专注于RTF(Rich ...
4. **字符集与编码**:使用`iTextAsian.jar`时,确保正确处理字符编码,特别是对于非ASCII字符,如中文、日文等,以避免乱码问题。 5. **错误处理**:在实际开发中,你可能遇到各种异常,如文件找不到、内存不足等...
在处理包含这些语言的DOC文件时,这个扩展是必不可少的,它可以确保文本的正确显示和排版,避免乱码问题。 最后,`iText-rtf-2.1.3.jar`则是处理RTF(Rich Text Format)文件的扩展,RTF是一种跨平台的文本格式,...
本书是第II卷,以开发人员在项目开发中经常遇到的问题和必须掌握的技术为中心,介绍了应用Java进行桌面程序开发各个方面的知识和技巧,主要包括Java语法与面向对象技术、Java高级应用、窗体与控件应用、文件操作...
这对于在中文环境下开发的项目尤其重要,确保PDF文档中的文本不会出现乱码或者无法正确显示的问题。 总的来说,这个压缩包包含的三个JAR文件合在一起,提供了创建、编辑PDF文档以及将内容导出为RTF格式的能力,并且...
在处理文件上传时,尤其是在用户输入可能包含多国语言字符的情况下,设置合适的字符编码至关重要,防止乱码问题的发生。 接下来,`速动画教程第二十二集.rtf`很可能是一个配套的教程文本,以Rich Text Format (RTF)...
- **字体与乱码**:解决报表中出现的字体显示和乱码问题。 - **OutputPostProcessor**:自定义报表输出后处理流程。 - **字符集与乱码**:深入探讨字符集问题及其解决方案。 - **国际化支持**:实现报表的多语言支持...
XMLP与Java技术紧密结合,可以轻松地将报表发布到Web端,支持多种输出格式,包括但不限于PDF、HTML和RTF等,适用于各种企业级应用场合。 #### 1.4 必要配置 在使用Oracle XML Publisher前,需要确保环境已经正确...
Doxygen是一种开源跨平台的,以类似JavaDoc风格描述的文档系统,完全支持C、C++、Java、Objective-C和IDL语言,部分支持PHP、C#。Doxygen可以从一套归档源文件开始,生成HTML格式的在线类浏览器,或离线的LATEX、RTF...
- **字体与乱码**:解决由于字符集不匹配导致的显示问题。 - **Output Post Processor**:对输出进行后处理,如签名、加密等。 - **字符集与乱码**:深入探讨字符编码问题及其解决方案。 - **国际化支持**:支持...