`
tedeyang
  • 浏览: 323184 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

简单分析Word2007的docx文件

阅读更多
同事说office2007,“还可以用用的”,
我狠狠心用了1G多硬盘空间,安装了一个Office 2007 xxx版,试用一下。
  • GUI界面确实有很大的改观,分布更加合理;
  • 发现word可以直接保存为PDF了.
  • 发现word文件名后缀改为了docx。

有意思的是docx的文件格式,用文本编辑器打开查看,发现其中含有目录结构。
我猜测这应该是一个打包文件,尝试着把后缀名docx改成zip,居然真的用压缩软件打开了。
docx的内部目录结构:
a.docx
|-[Content_Types].xml
|-_rels
    |-.rels
|-docProps
    |-app.xml
    |-core.xml
|-word
    |-_rels
         |-...
    |-theme
    |-... 

不过把这个目录解压缩后再打包成zip文件,word是不能识别的。

word变得如此开放,不知道是喜是忧。
2
1
分享到:
评论

相关推荐

    python实现生成Word、docx文件的方法分析

    在Python编程中,生成Word和docx文件是一个常见的需求,特别是在数据报告、自动化文档生成等领域。Python有一个名为`python-docx`的库,它提供了一种简单易用的方式来创建、修改Word文档。以下是对`python-docx`库的...

    解析word文件的简单实现-附件:test.docx

    总的来说,解析Word文件涉及理解.docx文件的结构,并使用适当的库来处理这些结构。`python-docx`提供了一个高层次的接口,使得在Python中处理Word文档变得相对简单。通过结合段落、表格和其它元素,我们可以有效地...

    Word(docx/doc)批量转txt工具

    docx是Microsoft Word 2007及以后版本的默认文件格式,它基于XML,具有更好的结构化和压缩特性,使得文件更小但包含的信息更多。而doc格式是早期Word版本的文件格式,基于二进制,虽然广泛支持,但在处理复杂文档时...

    py源码实例Word-docx-读取word

    `python-docx`是一个强大的第三方Python库,专门用于处理.docx文件。通过它,用户可以轻松地读取、修改或创建Word文档。安装这个库非常简单,可以通过pip命令来完成: ```bash pip install python-docx ``` #### 2....

    LR手动关联Microsoft Office Word 文档.docx

    根据给定文件的信息,本文将深入探讨LR(LoadRunner)中的手动关联技术及其在Microsoft Office Word文档中的应用。本文旨在帮助读者理解关联的基本概念、重要性以及如何在LoadRunner环境中手动执行关联操作。 ### ...

    python自动办公-54 Word-docx-批量把图片和表格写入Word

    本教程将聚焦于如何使用Python的`docx`库来批量地将图片和表格插入到Word文档中,这对于报告生成、数据分析报告或者任何形式的文本处理工作都是极其有用的。 首先,`docx`是Python的一个库,用于创建、读取和修改...

    Python项目-自动办公-54 Word-docx-批量把图片和表格写入Word.zip

    docx库允许开发者以编程方式创建、修改和操作Word文件。首先,我们来看“img_table.py”这个Python脚本,它很可能是实现图片和表格批量插入功能的主要代码。 在Python中,`python-docx`库提供了对Word文档的API接口...

    使用Python创建和修改Word文档

    8. **保存和读取文档**:完成文档编辑后,使用`document.save()`方法保存为.docx文件,如果要打开一个已存在的文件进行修改,可以使用`docx.Document('existing_file.docx')`。 9. **段落和列表**:Python-DocX支持...

    poi解析导入word (简单Demo使用)

    Apache POI提供了HWPF(Horrible Word Processor Format)和XWPF(XML Word Processor Format)两个API,分别用于处理旧版的DOC文件和较新的DOCX文件。在这个例子中,我们主要关注XWPF,因为它适用于现代的Word文档...

    易语言操作word文档案例

    这需要设置文件路径和文件名,以及选择合适的文件格式,如`.doc`或`.docx`。 6. **示例代码分析**: `Word2000Example.e`可能是包含操作Word文档的易语言源代码文件。我们可以从中学习如何使用易语言的API调用来...

    新建 Microsoft Word 文档.docx.zip

    标题 "新建 Microsoft Word 文档.docx.zip" 暗示我们正在处理一个压缩文件,其中包含一个名为 "新建 Microsoft Word 文档.docx" 的文档。这个文档很可能是使用Microsoft Word创建的,Word是Microsoft Office套件的一...

    word或csv文件转换成excel的方法.docx

    将 Word 或 CSV 文件转换成 Excel 文件,可以使得数据更加易于处理和分析。 现在,让我们具体看一下如何将 Word 或 CSV 文件转换成 Excel 文件。 步骤 1:打开 Word 文档 首先,打开 Word 应用程序,并创建一个新...

    docx4j及其依赖包

    3. **读取文档**: `docx4j`可以读取`.docx`文件,提取其中的文本、图片、表格等信息,这对于数据分析或文档预览场景很有帮助。 4. **文档转换**: 支持将`.docx`文档转换成其他格式,如PDF、HTML、纯文本等,也可以...

    最新简单运输合同零件运输合同样本热门模板word.docx

    在这个案例中,标题为"最新简单运输合同零件运输合同样本热门模板word.docx"的文件,描述中并未提供额外信息,但我们可以根据标签"最新合同"以及部分内容,分析这份合同的主要内容。 【合同主要内容】 1. **运输...

    python生成docx文档从模板

    `python-docx`是一个用于读写Microsoft Word .docx文件的Python库,它提供了丰富的API来创建、修改和操作Word文档。 首先,我们需要安装`python-docx`库。在命令行或终端中输入以下命令: ```shell pip install ...

    在matlab中操作excel word.docx

    Matlab 是一款强大的数据分析和处理工具,而 Excel 和 Word 是常用的办公软件。通过 Matlab,我们可以轻松地操作 Excel 和 Word 文档,实现自动化办公的功能。本文将介绍如何使用 Matlab 操作 Excel 和 Word 文档,...

    怎么把扫描件pdf转换成word.docx

    - **保存为Word**:在确认内容无误后,选择“文件”菜单中的“另存为”,然后在弹出的对话框中选择Word文档格式,如`.docx`,并指定保存位置。 5. **优化转换效果** - **提高扫描质量**:扫描时应确保文档清晰,...

    word 转文本文件源码

    - Word文档主要有两种格式:.doc(用于Word 2003及更早版本)和.docx(用于Word 2007及更高版本)。两者存储方式不同,转换时需分别处理。 2. **文本提取**: - 对于.doc文件,可以使用Apache POI库,这是一个...

    初中信息技术第一课用python编程word.docx

    【标题与描述解析】 ...通过这些知识点的学习,学生将能掌握Python编程基础,理解基本的数据类型和操作,学会编写简单的控制结构,并能够使用Python处理文本文件,如Word文档,同时了解编程在实际问题解决中的应用。

    POI读取 word 2003 和 word 2007 的例子

    它们是HWPF(Horrible Word Processor Format)用于处理Word 97-2003格式(.doc)的文件,以及XWPF(XML Word Processing Format)用于处理Word 2007及以上版本(.docx)的文件。 1. **读取Word 2003 (.doc)文件**...

Global site tag (gtag.js) - Google Analytics