`

java通过url在线预览Word、excel、ppt、pdf、txt文档中的内容

    博客分类:
  • java
阅读更多
在页面上显示各种文档中的内容。在servlet中的逻辑

word:

BufferedInputStream bis = null;
  URL url = null;
  HttpURLConnection httpUrl = null; // 建立链接
  url = new URL(urlReal);
  httpUrl = (HttpURLConnection) url.openConnection();// 连接指定的资源
  httpUrl.connect();// 获取网络输入流
  bis = new BufferedInputStream(httpUrl.getInputStream());

  String bodyText = null;
  WordExtractor ex = new WordExtractor(bis);
  bodyText = ex.getText();
  response.getWriter().write(bodyText);

excel:

BufferedInputStream bis = null;
  URL url = null;
  HttpURLConnection httpUrl = null; // 建立链接
  url = new URL(urlReal);
  httpUrl = (HttpURLConnection) url.openConnection();// 连接指定的资源
  httpUrl.connect();// 获取网络输入流
  bis = new BufferedInputStream(httpUrl.getInputStream()); 

content = new StringBuffer();
  HSSFWorkbook workbook = new HSSFWorkbook(bis);
  for (int numSheets = 0; numSheets < workbook.getNumberOfSheets(); numSheets++) {
   HSSFSheet aSheet = workbook.getSheetAt(numSheets);// 获得一个sheet
   content.append("\n");
   if (null == aSheet) {
    continue;
   }
   for (int rowNum = 0; rowNum <= aSheet.getLastRowNum(); rowNum++) {
    content.append("\n");
    HSSFRow aRow = aSheet.getRow(rowNum);
    if (null == aRow) {
     continue;
    }
    for (short cellNum = 0; cellNum <= aRow.getLastCellNum(); cellNum++) {
     HSSFCell aCell = aRow.getCell(cellNum);
     if (null == aCell) {
      continue;
     }
     if (aCell.getCellType() == HSSFCell.CELL_TYPE_STRING) {
      content.append(aCell.getRichStringCellValue()
        .getString());
     } else if (aCell.getCellType() == HSSFCell.CELL_TYPE_NUMERIC) {
      boolean b = HSSFDateUtil.isCellDateFormatted(aCell);
      if (b) {
       Date date = aCell.getDateCellValue();
       SimpleDateFormat df = new SimpleDateFormat(
         "yyyy-MM-dd");
       content.append(df.format(date));
      }
     }
    }
   }
  }
  response.getWriter().write(content.toString());

ppt:

BufferedInputStream bis = null;
  URL url = null;
  HttpURLConnection httpUrl = null; // 建立链接
  url = new URL(urlReal);
  httpUrl = (HttpURLConnection) url.openConnection();// 连接指定的资源
  httpUrl.connect();// 获取网络输入流
  bis = new BufferedInputStream(httpUrl.getInputStream());

StringBuffer content = new StringBuffer("");
  SlideShow ss = new SlideShow(new HSLFSlideShow(bis));
  Slide[] slides = ss.getSlides();
  for (int i = 0; i < slides.length; i++) {
   TextRun[] t = slides[i].getTextRuns();
   for (int j = 0; j < t.length; j++) {
    content.append(t[j].getText());
   }
   content.append(slides[i].getTitle());
  }
  response.getWriter().write(content.toString());

pdf:

BufferedInputStream bis = null;
  URL url = null;
  HttpURLConnection httpUrl = null; // 建立链接
  url = new URL(urlReal);
  httpUrl = (HttpURLConnection) url.openConnection();// 连接指定的资源
  httpUrl.connect();// 获取网络输入流
  bis = new BufferedInputStream(httpUrl.getInputStream());

PDDocument pdfdocument = null;
  PDFParser parser = new PDFParser(bis);
  parser.parse();
  pdfdocument = parser.getPDDocument();
  ByteArrayOutputStream out = new ByteArrayOutputStream();
  OutputStreamWriter writer = new OutputStreamWriter(out);
  PDFTextStripper stripper = new PDFTextStripper();
  stripper.writeText(pdfdocument.getDocument(), writer);
  writer.close();
  byte[] contents = out.toByteArray();

  String ts = new String(contents);
  response.getWriter().write(ts);

txt:

BufferedReader bis = null;
  URL url = null;
  HttpURLConnection httpUrl = null; // 建立链接
  url = new URL(urlReal);
  httpUrl = (HttpURLConnection) url.openConnection();// 连接指定的资源
  httpUrl.connect();// 获取网络输入流
  bis = new BufferedReader( new InputStreamReader(httpUrl.getInputStream()));

StringBuffer buf=new StringBuffer();
  String temp;
  while ((temp = bis.readLine()) != null) {
   buf.append(temp);
   response.getWriter().write(temp);
   if(buf.length()>=1000){
    break;
   }
  }
  bis.close();


http://blog.csdn.net/wanglj7525/archive/2011/04/01/6295231.aspx
分享到:
评论

相关推荐

    \java通过url在线预览Word、excel、ppt、pdf、txt文档中的内容

    "Java 通过 URL 在线预览 Word、Excel、PPT、PDF、TXT 文档中的内容" Java 语言可以通过 URL 在线预览 Word、Excel、PPT、PDF、TXT 文档中的内容。下面将详细介绍如何实现这一功能。 Word 文档预览 在 servlet ...

    java通过url在线预览Word、excel、ppt、pdf、txt文档

    ### Java通过URL在线预览Word、Excel、PPT、PDF、TXT文档的关键技术与实现 #### 一、概述 在互联网应用中,实现对不同格式文档(如Word、Excel、PPT、PDF、TXT等)的在线预览功能是一项常见但重要的需求。这不仅...

    java实现在线文档预览(项目+相关软件)

    在IT领域,尤其是在Web开发中,提供在线文档预览功能是一项常见的需求,它允许用户无需下载文件即可查看文档内容。本项目"java实现在线文档预览(项目+相关软件)"正是针对这一需求的解决方案,它结合了Java后端技术...

    SpringBoot实现的在线实时编辑文档SpringBoot(30) 整合PageOffice实现在线编辑Word和Excel

    在本项目中,我们将探讨如何使用SpringBoot框架与PageOffice集成,实现在线实时编辑Word和Excel的功能。SpringBoot以其简洁的配置和快速的开发能力,成为Java领域中备受青睐的微服务框架。而PageOffice则是一款强大...

    帆软报表导出各种格式(excel/word/pdf等)

    在本主题中,我们将探讨如何使用帆软报表导出各种格式,包括Excel、Word和PDF等,以便满足不同场景下的需求。 首先,我们要知道帆软报表的导出功能依赖于两个核心的Java类库:fr-server-6.5.jar和fr-third-6.5.jar...

    Office文档转换预览解决方案(JAVA)

    在项目代码中,`java将office文档pdf文档转换成swf文件在线预览.docx`可能是一个示例文档,它展示了如何使用Java处理Office文档并进行转换。而`docview`可能是一个包含视图逻辑或预览界面的类或模块,负责在前端展示...

    java实现文件预览工具包

    在Java中,我们通常使用OpenOffice的API来处理Office文档,如Word(.doc, .docx)、Excel(.xls, .xlsx)和PowerPoint(.ppt, .pptx)等格式的文件。这个工具包包含的OpenOffice安装包可能包括了相关的JAR文件和其他...

    Android 基于x5Webview 浏览文件 office文档

    在Android开发中,为了提供用户友好的体验,有时我们需要在应用程序内部查看和处理Office文档,如Word、Excel或PowerPoint。X5WebView是腾讯QQ浏览器团队开源的一个高性能、跨平台的WebView组件,它基于Chromium内核...

    基于springboot的文件在线预览.rar

    SpringBoot作为一个轻量级的框架,简化了Java Web应用的开发流程,而文件在线预览功能则可以让用户无需下载即可查看各种类型的文件,包括文本、图片、Word文档、PPT、PDF、Excel、压缩文件、多媒体文件以及CAD文档等...

    java实现在线预览仿百度文库

    1. **文档转换**:Java中有多个库可以用于文档转换,例如Apache POI用于处理Microsoft Office格式(如Word、Excel、PowerPoint),PDFBox用于处理PDF文件。这些库允许我们将文档内容读取并转化为HTML或其他可渲染的...

    ASP.NET 仿百度文库文档在线预览

    在本文中,我们将深入探讨如何使用ASP.NET实现一个仿百度文库的文档在线预览功能,支持多种常见文件格式,如PDF、DOC、DOCX、XLS、XLSX、PPT和PPTX。 首先,我们需要了解在线预览的基本原理。在线预览的核心是将...

    FlexPaper java实现仿百度文库、豆丁在线阅读

    FlexPaper 是一款强大的在线文档查看和转换工具,它支持多种文件格式,如PDF、Word、Excel和PPT等。在Java环境下,通过FlexPaper可以实现类似百度文库和豆丁网的在线阅读功能,为用户提供无缝的文档预览体验。在Java...

    file-online-preview-master.zipspringboot实现文件预览包含在线预览的

    常见的文件类型有文本、图片、PDF、Office文档(Word、Excel、PPT)、音视频等。每种类型可能需要不同的处理方式。例如,图片和PDF可以直接通过浏览器的内置支持来预览,而Office文档则可能需要借助第三方库(如...

    fileView-4.3.0.zip

    支持word excel ppt,pdf等办公文档 支持txt,java,php,py,md,js,css等所有纯文本 支持zip,rar,jar,tar,gzip等压缩包 支持jpg,jpeg,png,gif等图片预览(翻转,缩放,镜像) 支持mp3,mp4,flv等多媒体文件预览 ...

    wenjian.zip.zip_Unity打开word等_zip

    Unity可以通过WebView插件来集成一个Web视图,用户可以在其中预览HTML内容,包括嵌入的PDF或在线版本的Word、Excel和PPT文档。这需要在项目中引入WebView插件,并配置好相应的URL以打开所需内容。 2. **利用系统...

    pageOfficeDemo

    PageOffice是一款强大的在线文档编辑组件,它能够无缝集成到各种Web应用程序中,提供对Word、Excel、PPT、PDF等常用文档类型的在线创建、编辑和保存功能。本示例"pageOfficeDemo"将详细介绍如何将PageOffice与Struts...

    Office Web Apps系统调研

    Office Web Apps (OWA) 是一套基于Web的应用程序,能够使用户在Web浏览器中查看、编辑Microsoft Office文档(包括Word、Excel、PowerPoint)。这套系统提供了强大的兼容性和跨平台能力,用户无需安装完整的Office...

    网管教程 从入门到精通软件篇.txt

    Perfect文档、Microsoft:Word文档;DisplayWrite文档 DOT:Microsoft Word文档模板 DPL:Borland Delph 3压缩库 DRV:驱动程序 DRW:Micrografx Designer/Draw;Pro/E绘画文件 DSF:Micrografx Designer VFX...

Global site tag (gtag.js) - Google Analytics