`
chenlb
  • 浏览: 693418 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Java读RTF乱码问题

阅读更多
    这几天想用Java读富文档。用javax.swing.text和javax.swing.text.rtf包中的类读RTF文档时出现中文乱码问题(出现?号)。
    幸好找到 ANGEL SKY 的博客。用ISO8859_1编码转换。

代码片断:
String bodyText = null;
        DefaultStyledDocument styledDoc 
= new DefaultStyledDocument();    //javax.swing.text.Document的一个实例
        try {
            InputStream is 
= new FileInputStream(new File("data/java.swing.text读RTF文档测试.rtf"));
            
new RTFEditorKit().read(is, styledDoc, 0);
            bodyText 
= new String(styledDoc.getText(0, styledDoc.getLength()).getBytes("ISO8859_1"));    //提取文本
        } catch (IOException e) {
            
throw new DocumentHandlerException("不能从RTF中摘录文本!", e);
        } 
catch (BadLocationException e) {
            
throw new DocumentHandlerException("不能从RTF中摘录文本!", e);
        }
        System.out.println(bodyText);
分享到:
评论
1 楼 南星_JAVA 2010-04-16  
bodyText = new String(styledDoc.getText(0, styledDoc.getLength()).getBytes("ISO8859_1"));
改成
bodyText = new String(styledDoc.getText(0, styledDoc.getLength()).getBytes("ISO8859_1","gbl"));
就好用了

相关推荐

    根据RTF模板生成WORD,WORD转PDF

    让我们详细探讨这两个过程以及解决乱码和转换失败的问题。 **RTF模板生成Word文档** RTF是一种通用的文本格式,它可以包含丰富的文本样式、图像和表格等元素。使用RTF模板生成Word文档通常涉及到编程或自动化脚本...

    读取doc rtf文档内容

    本篇文章将深入探讨如何在Java中读取doc和rtf文档内容,并解决中文乱码问题,同时还会涉及到log4j日志记录以及使用Swing展示rtf内容。 首先,读取.doc文件通常涉及到使用Apache POI库。Apache POI是一个开源项目,...

    java读取word文档.pdf

    由于给定的文件信息中存在大量的乱码和重复字符,导致实际可读取的内容有限。基于现有的信息,我将尽力提炼相关的知识点。首先,标题“java读取word文档.pdf”和描述“java读取word文档.pdf”暗示了文章内容可能涉及...

    docConvertDocx.zip

    "docConvertDocx.zip"这个压缩包文件提供了一个解决方案,利用com.aspose.words Java库将旧版的DOC格式文件转换为较新的DOCX格式,同时保证转换过程中不出现乱码问题。下面我们将深入探讨这个过程涉及的知识点。 ...

    mysql5.7.23 for mac os x10.13+ & navicat.zi及密码修改、设置、启动及常见问题整理

    `java+mysql乱码问题.docx` 解决的是字符编码问题,特别是当 Java 应用程序与 MySQL 通信时可能出现的乱码。解决方案通常涉及设置数据库和连接的字符集为 UTF-8,以及在 Java 程序中指定正确的字符集。 `mysql时间...

    itext相关jar包

    在IText 5.x版本中,对亚洲字符集的支持得到了显著提升,这个扩展包包含必要的字体和编码,确保在处理亚洲文字时能正确显示和排版,解决了早期版本中可能存在的乱码问题。 `itext-rtf-2.1.7.jar`则专注于RTF(Rich ...

    itext生成word需要的jar包

    4. **字符集与编码**:使用`iTextAsian.jar`时,确保正确处理字符编码,特别是对于非ASCII字符,如中文、日文等,以避免乱码问题。 5. **错误处理**:在实际开发中,你可能遇到各种异常,如文件找不到、内存不足等...

    itext 对word的操作

    在处理包含这些语言的DOC文件时,这个扩展是必不可少的,它可以确保文本的正确显示和排版,避免乱码问题。 最后,`iText-rtf-2.1.3.jar`则是处理RTF(Rich Text Format)文件的扩展,RTF是一种跨平台的文本格式,...

    Java开发实战1200例(第1卷).(清华出版.李钟尉.陈丹丹).part3

    本书是第II卷,以开发人员在项目开发中经常遇到的问题和必须掌握的技术为中心,介绍了应用Java进行桌面程序开发各个方面的知识和技巧,主要包括Java语法与面向对象技术、Java高级应用、窗体与控件应用、文件操作...

    itext需要的jar包

    这对于在中文环境下开发的项目尤其重要,确保PDF文档中的文本不会出现乱码或者无法正确显示的问题。 总的来说,这个压缩包包含的三个JAR文件合在一起,提供了创建、编辑PDF文档以及将内容导出为RTF格式的能力,并且...

    速动画教程系列第22集

    在处理文件上传时,尤其是在用户输入可能包含多国语言字符的情况下,设置合适的字符编码至关重要,防止乱码问题的发生。 接下来,`速动画教程第二十二集.rtf`很可能是一个配套的教程文本,以Rich Text Format (RTF)...

    Oracle XML Publisher技巧集锦.docx

    - **字体与乱码**:解决报表中出现的字体显示和乱码问题。 - **OutputPostProcessor**:自定义报表输出后处理流程。 - **字符集与乱码**:深入探讨字符集问题及其解决方案。 - **国际化支持**:实现报表的多语言支持...

    Oracle XML Publisher技巧集锦.doc

    XMLP与Java技术紧密结合,可以轻松地将报表发布到Web端,支持多种输出格式,包括但不限于PDF、HTML和RTF等,适用于各种企业级应用场合。 #### 1.4 必要配置 在使用Oracle XML Publisher前,需要确保环境已经正确...

    Doxygen代码注释规范

    Doxygen是一种开源跨平台的,以类似JavaDoc风格描述的文档系统,完全支持C、C++、Java、Objective-C和IDL语言,部分支持PHP、C#。Doxygen可以从一套归档源文件开始,生成HTML格式的在线类浏览器,或离线的LATEX、RTF...

    Oracle-XML-Publisher技巧集锦.doc

    - **字体与乱码**:解决由于字符集不匹配导致的显示问题。 - **Output Post Processor**:对输出进行后处理,如签名、加密等。 - **字符集与乱码**:深入探讨字符编码问题及其解决方案。 - **国际化支持**:支持...

Global site tag (gtag.js) - Google Analytics