`
melec
  • 浏览: 28512 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

PHP提取摘要

PHP 
阅读更多
function getSummary($content,$words,$max_desc_len=200){

if(is_array($words)){
$arrwords = $words;
}else{
$arrwords = explode(',',$words);
}
//$arrwords = array('挖掘'=>30,'频繁'=>20);

//如果没有关键词,直接输出前几段
if(count($arrwords)==0){
$output = $content;

//有关键词,输出带关键词的段落
}else{
//将内容拆分成数组
$content = str_replace('\n','[]',$content);
$content = str_replace('.','.[]',$content);
$content = str_replace('。','。[]',$content);
$docs = explode('[]',$content);
$docs = array_filter($docs,'strlen');
//记录每个关键词的在每段出现的次数和每段的权重,按权重排序
$poss = 0;
$pos = true;
foreach($docs as $key=>$content){
foreach ( $arrwords as $word) {
while ($pos) {
$pos = mb_strpos ( $content, $word, $poss , 'utf8' );
if($pos===false){
break;
}else{
$pos_words['pos'] = $pos; //记录所有的关键词出现的位置
$pos_words['word'] = $word; //记录每个位置的关键词
$allpos[$key]['words'][] = $pos_words; //记录段落关键词位置
$allpos[$key]['weight'] += 20;

$poss = $pos+1;
$pos = true;
}
}
$poss = 0;
$pos = true;
}
$weight[$key] = intval($allpos[$key]['weight']);
}
$weight = array_flip($weight);
krsort($weight);
$weight = array_flip($weight);
foreach($weight as $k=>$v){
$summary[] = $docs[$k];
}

$output = array_slice($summary,0,2);
}
$output = getShort(implode('..',$output),$max_desc_len);
//$output = implode('..',$output);
return $output;
}
分享到:
评论

相关推荐

    php 关键词提取+关键词库

    此外,在文本分类、情感分析和新闻摘要等场景下,关键词提取也有着广泛的应用。 总之,"php 关键词提取+关键词库"是一个实用的工具,结合了PHP编程语言的灵活性和关键词提取的智能算法,为处理文本数据提供了强大的...

    PHP截取字符串,生成文章摘要

    - 结合`strpos()`或`strstr()`找到特定标记(如首段、小标题等)来提取摘要。 为了实现一个更智能的摘要生成器,还可以考虑引入开源的PHP库,如`PHP-Text-Summarization`,它利用了TF-IDF算法来自动找出文章的...

    基于PHP的WP最新文章提取器php版源码.zip

    【标题】"基于PHP的WP最新文章提取器php版源码.zip" 提供的是一个用于WordPress(WP)的PHP程序,其主要功能是提取WordPress博客的最新文章信息。这个源码可能是一个独立的脚本或者类库,允许开发者或者网站管理员...

    php提取网页正文内容的例子__2.docx

    本文将探讨如何使用PHP提取网页正文内容,特别是基于提供的代码示例进行讨论。 首先,提取网页正文的关键在于识别并保留与文章相关的内容,同时去除广告、导航、脚注等无关信息。郑晓提出的思路是: 1. 从HTML文档...

    PHP版自动生成文章摘要

    标题中的“PHP版自动生成文章摘要”指的是使用PHP编程语言实现的一种功能,它能够自动从文章内容中提取出摘要,特别是在处理包含HTML代码的文章时,能够确保摘要的生成不会导致HTML标签的不完整或破坏文档结构。...

    PHP教程之怎样在php中使用PDF文档功能

    PHP捆绑PDFLIB库也许是最好的web出版平台了。一对典型的用法: ...内容摘要 安装PDFLib 3.0.1 和有PDF支持的PHP4.01pl2(译注:你可以安装最新的php4.03pl1) 提取PDF文档 (我假设你有一点配置php的经验)

    自动生成文章摘要的代码[PHP 版本]

    标题中的“自动生成文章摘要的代码[PHP 版本]”指的是使用PHP编程语言实现的一种自动提取文章摘要的算法或函数。这种功能通常用于博客、新闻网站等,以展示文章的概要,而不必完整显示全文,从而提高用户体验并保持...

    phpanalysis中文分词以及提取关键字

    2. **新闻摘要**:快速提取文章关键信息,生成新闻摘要。 3. **情感分析**:对用户评论、社交媒体内容进行分词,挖掘用户情感倾向。 4. **信息检索**:在大量文档中快速定位相关资料。 综上所述,PHPAnalysis在中文...

    WordPress获取文章内容摘要的方法

    本文实例讲述了WordPress获取文章内容...php global $more; $more = 1; //1=全文 0=摘要 $my_content = strip_tags(get_the_excerpt(), $post->post_content); //获得文章 $my_content = str_replace(array(“rn”, “r

    miner:Miner是一个PHP库,用于从HTML页面提取元数据和有趣的文本内容(例如作者,摘要等)。 它的作用类似于Apache Tika中的简化HTML元数据解析器

    Miner是一个PHP库,可从HTML页面提取元数据和有趣的文本内容(例如作者,摘要等)。 它的作用就像的简化。 WTF是矿工吗? - 考虑下面来自LinkedIn的屏幕截图: 当您在LinkedIn上发布指向您的联系的链接时,它将...

    PHP实例开发源码—google搜索爬虫php版.zip

    2. **HTML解析**:使用PHP的DOMDocument或SimpleXMLElement库解析返回的HTML内容,查找和提取搜索结果的相关元素,如链接、标题、摘要等。 3. **数据提取**:使用XPath或CSS选择器定位目标元素,并从中提取所需信息...

    TextRank算法:提取关键词+摘要

    句子:摘要 关系矩阵以N个句子构建一个N*N的关系矩阵,这样句子之间的关系如何计算? 简单一点就PageRank的出链计算,但是这里出链都是一样的,无差异,每个句子的出链都是(N-1),所以矩阵里的元素都是一

    精通正则表达式基于.NET ASP PHP JSP JavaScript

    ASPNETValidator/SummaryDialog.aspx 对话框式验证摘要 ASPNETValidator/SummaryPage.aspx 网页式验证摘要 第11章(/11/) 判断是否为对象.asp 判断是否为对象 判断是否为数值.asp ...

    自己做的PHP站内搜索引擎

    一般会创建一个包含URL、页面标题、内容摘要、关键词等字段的表,以便于搜索时进行匹配。 【全文检索】 对于搜索引擎而言,全文检索至关重要。PHP可以借助如MySQL的FULLTEXT索引来实现这一功能。当用户输入关键词,...

    PHP 结巴分词,DEMO测试文档,下载可直接使用

    - **关键词提取**:找出文本中的核心词汇,用于摘要生成或推荐系统。 - **聊天机器人**:理解用户的输入,进行自然语言理解和回复生成。 总的来说,PHP 结巴分词库提供了高效且易用的中文分词功能,是PHP开发者处理...

    基于PHP的google搜索爬虫php版.zip

    3. **正则表达式**:对于某些特定格式的数据,可以使用正则表达式进行匹配和提取,例如搜索结果的标题、URL、摘要等。 4. **数据存储**:爬取的信息通常需要保存以便后续分析,PHP可以连接各种数据库(如MySQL、...

    PHP实例开发源码-Google php网页搜索.zip

    5. 遍历结果数组,提取每个搜索结果的关键信息(如标题、URL、摘要等)。 6. 将这些信息格式化为HTML,展示在网页上。 在学习这个实例时,除了掌握PHP基础和HTTP请求,还需要了解JSON格式和如何在PHP中解析JSON。...

    baidu搜索小偷程序PHP版本

    这个PHP程序的任务就是解析这个返回的HTML页面,从中提取出诸如网页标题、链接、摘要等关键信息。解析HTML通常会用到PHP的DOM解析库或者正则表达式。提取出的信息可以存储在数据库中,以便进一步分析或展示。值得...

    php录入页面中动态从数据库中提取数据的实现

    摘要:用php制作动态web页面时,在提交服务器之前,让php根据用户在当前页面上录入的某字段的值立即从数据库中取出相关的其它字段的值并显示到当前页面上,是php程序开发中的难点。本文以一个具体实例详细介绍了怎样...

    PHP实例开发源码——谷鸽新闻搜索Googie php sp1.zip

    2. **DOM解析**:使用PHP的DOMDocument或DOMXPath库来解析抓取的HTML,提取出新闻标题、摘要、链接等关键信息。 3. **数据存储**:可能将抓取的数据存储在MySQL或其他数据库中,方便快速查询。 4. **搜索算法**:...

Global site tag (gtag.js) - Google Analytics