`
luckyjaky
  • 浏览: 114435 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

c# 读取word文件文本内容

阅读更多

添加morcosoft word 12.0 object Library引用(低版本的com也可以) 
       

写道
//获得word文件的文本内容
public string Doc2Text(string docFileName)
{
//实例化COM
Microsoft.Office.Interop.Word.ApplicationClass wordApp = new Microsoft.Office.Interop.Word.ApplicationClass();
object fileobj = docFileName;
object nullobj = System.Reflection.Missing.Value;
//打开指定文件(不同版本的COM参数个数有差异,一般而言除第一个外都用nullobj就行了)
Microsoft.Office.Interop.Word.Document doc = wordApp.Documents.Open(ref fileobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj
);
//取得doc文件中的文本
string outText = doc.Content.Text;
//关闭文件
doc.Close(ref nullobj, ref nullobj, ref nullobj);
//关闭COM
wordApp.Quit(ref nullobj, ref nullobj, ref nullobj);
//返回
return outText;
}


 

分享到:
评论
1 楼 miss4813 2009-09-16  
能获得 word 文档的样式 吗?

相关推荐

    C#读取Word内容

    总结来说,C#读取Word内容主要通过两种方式:一是使用Microsoft.Office.Interop.Word库,二是利用OpenXML SDK。两者各有优缺点,开发者应根据实际需求选择合适的方法。在项目开发过程中,确保正确处理异常,避免资源...

    C#操作word文档 C#实现Word中表格信息读取

    根据提供的文件信息,我们可以归纳出两个主要的知识点:一是如何使用C#操作Word文档并插入图片;二是如何利用C#批量替换Word文档中的书签文本。下面将对这两个知识点进行详细解析。 ### 一、使用C#操作Word文档并...

    C#读取Word文档的技巧

    在实现C#读取Word文档时,需要使用FileStream对象来读取文本文件里的信息,但是对于Word文档来说就不能使用这样的方法了。因为Word文档是一个二进制文件,包含了许多格式和样式信息,无法使用FileStream对象来读取。...

    c# 读取WORD的内容并显示在页面上

    根据给定的文件信息,以下是对“C#读取Word的内容并显示在页面上”的相关知识点的详细解析。 ### 一、概述 本程序的主要功能是利用C#语言读取一个Word文档的内容,并将这些内容展示在一个网页上。实现这一功能的...

    c#用aspose.word读取word文件内容,并显示图片

    在探讨如何利用C#结合Aspose.Word库读取Word文档内容并显示其中的图片之前,我们首先需要了解几个关键的概念和技术点。 ### Aspose.Word 库简介 Aspose.Words 是一个强大的.NET类库,用于在服务器端处理Microsoft ...

    C#读写word文件

    首先,要实现C#读取Word文件,我们可以利用Microsoft Office Interop库,这是一个允许C#与Office应用程序进行交互的COM接口。在VS2008中,你需要确保已安装了Microsoft Office,并且在项目中添加对Microsoft.Office....

    C#读取word文件中的文本实现对单词的索引显示

    本主题聚焦于如何使用C#来读取Word文件并实现文本内容的检索,结合自然语言处理(NLP)技术,使得用户可以对文档中的单词进行索引和显示。以下是对这个知识点的详细讲解: 首先,为了读取Word文件,我们需要利用...

    C#读取word文件Excel文件PDF文件Txt文件

    在IT行业中,编程语言C#提供了丰富的库和方法来处理各种类型的文件,包括Word文档、Excel电子表格、PDF文档和纯文本文件。本教程将详细阐述如何使用C#有效地读取这些不同格式的文件。 首先,让我们从读取Word文件...

    C# 读取word文档和图片

    一、C#读取Word文档 1. **使用Microsoft.Office.Interop.Word** 微软提供的COM互操作库允许C#代码与Office应用程序进行交互。首先,你需要在项目中引用`Microsoft.Office.Interop.Word`库。然后,你可以创建一个...

    C# 读取word源码

    总的来说,C#读取Word文档的全文内容是一项基础但实用的技能,它在数据分析、文档处理、自动化办公等多个领域都有广泛的应用。通过熟练掌握这一技术,开发者可以更高效地处理与Word文档相关的任务。

    c# word、txt文档文件对比(查重)

    1. **读取文件内容**:使用C#的`System.IO.File`类的`ReadAllText`方法读取Word文档和txt文件的文本内容。由于Word文档不是纯文本格式,我们需要先将其转换。可以使用`Microsoft.Office.Interop.Word`命名空间,但这...

    C#读取word内容

    以下是如何使用C#读取Word文档内容的详细步骤和相关知识点: 首先,你需要在你的项目中添加对Microsoft Word 11.0 Object Library的引用。这是Office Interop库的一部分,它提供了对Word对象模型的访问。你可以通过...

    C#word文件文本提取

    使用Interop,你可以创建一个Word应用程序实例,打开文档,然后读取其内容。以下是一个基本示例: ```csharp using Microsoft.Office.Interop.Word; // 创建Word应用程序实例 Application wordApp = new ...

    c#打开word文档及读取word文档

    在C#编程环境中,操作Microsoft Word文档是一项常见的任务,包括打开Word文档以及读取文档内容。这涉及到.NET Framework中的Microsoft.Office.Interop.Word库,它允许C#应用程序与Word进行交互。以下是一些关于如何...

    C#读写Excel和Word文件

    C#读写Word文件 读写Word文件通常使用Microsoft.Office.Interop.Word或者第三方库如DocX、Open XML SDK。Interop库操作Word文档简单直接,但有性能和兼容性问题。其他库如DocX和Open XML SDK提供了解决方案。 - *...

    C#处理word文件汇总

    以上内容详尽介绍了C#处理Word文件的基本知识点,包括读取、解析文本、处理图片以及对文档进行各种操作的方法。通过理解并运用这些技术,开发者能够高效地在C#程序中实现对Word文档的自动化处理。

    C#操作word文档(多种方法)

    创建新的Word文档并写入内容涉及`Document`对象的`Content`属性和`Range`对象的方法,如`Range.Text = "新文本"`。可以构建复杂的文档结构,包括段落、样式、表格等。 以上就是C#操作Word文档的一些核心知识点和...

    C# 不依赖Office读取Word、PPT

    例如,对于.docx文件,我们可以找到名为`word/document.xml`的文件,其中包含了大部分文本内容。 为了实现这一功能,C#提供了System.IO.Compression命名空间,其中的ZipFile类可以方便地对ZIP文件进行操作。下面是...

    C#将word文件存入数据库与读取(Web版).zip

    总结起来,C#在Web环境下处理Word文件的关键在于将文件转换为适合数据库存储的格式,以及正确地进行数据库操作和文件读写。通过选择合适的工具和策略,可以有效地管理这些文件,并为用户提供流畅的体验。

    批量替换word/excel文件的内容(c#)

    实现批量替换word/excel文件的内容。 ·可以对多个词条进行一次性替换。 ·对加密、已打开的、只读文档跳过处理。 ·替换后黄底红字显示。 ·支持大小写匹配。 ·导入/导出替换配置文件。 ·日志记录替换情况,多看...

Global site tag (gtag.js) - Google Analytics