最近,因公司项目的需要,学习了下万小军老师的文档摘要平台-PKUSUMSUM。
具体参考:https://blog.csdn.net/m0_37306360/article/details/78655956
文本摘要有支持单文档、多文档、基于主题的文档,针对不同的文档类型,总的有9种算法策略提供对应的选择。
其中算法ILP比较特殊需要引入动态链接库,才能正常运行。
附件里面已经整合可以使用的源码,对应目录这边简单介绍下
code:算法策略源码
dll:window ilp 需要的动态链接库文件
lib:依赖的第三方jar包
maven-lib: maven构建依赖的jar包
so:linux ilp 需要的动态链接库文件
注意:如果采用ILP算法在window下需要将dll目录2个文件放到C:\Windows\System32目录下方便可以正常使用;如果采用ILP算法在liunx下需要将so目录下2个文件放到lib64目录下方便生效及正常使用。
这边针对的window和linux都是64位的。
lib的文件可以从https://github.com/PKULCWM/PKUSUMSUM下载
maven-lib文件来源参考如下图:
相关推荐
nlp学习笔记-基于论文摘要的文本分类(topline) 本文旨在介绍大模型在自然语言处理领域中的应用,特别是基于论文摘要的文本分类任务。我们将深入探讨大模型的概念、原理、训练方法和微调技术,并讨论如何将大模型...
基于Pytorch的中文文本摘要生成开这个仓库的主要目的是记录一下自己实验过程和数据。参考文本摘要领域大佬写的两篇论文: and ,然后参考另一位大佬修改的代码.另外,在这里还是要感谢一下。这里的所有内容基本上没...
笔记本把多篇文字、网页、图像、文档保存在一个笔记库中,便于集中管理资料。 2. 笔记本具有丰富的目录管理功能,可以创建多层目录,可以恢复被删除的数据。 3. 笔记本内嵌RTF2.0文字编辑器,可以编辑图文并茂...
康奈尔笔记的显著特点是其结构化的设计,将页面分为三个主要部分:关键词/主题区域、笔记区和摘要区。这种布局有助于使用者在记录的同时进行思考,并方便将来的复习。 康奈尔笔记法主要包括以下几个步骤: 1. 页面...
- **alt**:提供替代文本,当图片无法显示时显示此文本。 - **title**:鼠标悬停时显示的提示信息。 - **width**和**height**:设置图像的尺寸。 - **border**:设置图像边框的宽度。 5. **链接标签**:<a></a>...
《ChatGPT 4.0 笔记》是一本...通过阅读《ChatGPT 4.0 笔记》,用户可以更加深入地了解 ChatGPT 4.0 的功能和性能,并掌握如何充分利用这一强大的自然语言处理工具进行各种应用,如对话生成、文本摘要、情感分析等。
它与文本摘要程序所做的恰好相反。 给定一些文本作为输入,文本摘要生成器会生成缩短的文本。 逆汇总器采用缩短的输入(相似或相同的文本)并以相反的方式进行处理。 这将导致文本展开。 它可以与任何具有知识差距...
- 文字笔记功能:不仅支持文字录入,还具备复制粘贴、摘要显示、分类管理、保存时间显示等功能,满足多样化需求。 - 图片笔记功能:允许用户获取相机或相册权限,进行图片编辑和导入,提供快捷的图片记录方式。 - ...
根据提供的文件信息,可以提炼出以下web安全相关的知识点: 1. 同源策略:是一种安全机制,用于限制网页上的脚本如何与...通过这份复习笔记,可以了解到web安全中的各种概念和机制,对于理解和防范Web攻击至关重要。
文字笔记支持复制粘贴、摘要显示、分类管理等,以满足用户的多样化需求;图片笔记则允许用户通过获取设备权限进行快速图片编辑和导入,提升了图片记录的效率;笔记分享功能则能将内容分享至微信、QQ等社交平台,支持...
在这个HTML笔记中,主要涵盖了关于HTML和CSS的一些关键知识点,包括元信息设定、文本格式化、列表创建、表格构建、样式定义以及表单元素等。 首先,`<meta charset="UTF-8">`是一个非常重要的元标签,它定义了文档...
摘要式读书笔记是最基础也是最直接的记录方式,适用于快速提取文本中的关键信息。 - **索引读书笔记**:记录文章标题、作者、出版信息等基本资料,便于日后查阅。这种类型的笔记适合用于大量文献管理,帮助快速定位...
以下是笔记的知识点摘要: Lotus 介绍 Lotus是一种群件产品,具有文档数据库、工作流体系、标准Web服务器和电子邮件体系四种特征。 Lotus产品最初是CS结构,分为服务器端和客户端两个部分。服务器端包括Domino邮件...
复习笔记主要涵盖了以下几个关键知识点: 1. **语言模型**:语言模型是NLP的基础,它用来评估一个句子出现的概率。常见的有n-gram模型、基于神经网络的词向量模型(如Word2Vec、GloVe)以及后来的Transformer模型,...
2. **学习笔记**:对于学生或研究者,mybase可用于整理学习资料,整理文献摘要,构建个人学习知识库。 3. **个人日记**:mybase也能作为日记本,记录生活点滴,同时支持多媒体内容,让日记更加生动。 4. **信息...
10. **文本生成**:包括文章摘要、诗歌创作、故事生成等,深度学习模型可以学习语言模式并自动生成连贯的文本。 通过阅读《斯坦福CS224n_自然语言处理与深度学习_笔记_hankcs.pdf》,你可以深入理解这些主题,掌握...
1. **Cornell笔记法**:这种方法通过划分笔记页面,将笔记分为问题、笔记和摘要三个区域,便于整理和回顾。 2. **思维导图**:通过图形化的方式展现信息结构,帮助理解和记忆复杂的概念,同时促进创新思维。 3. **...