代码如下 复制代码
<?
/*
抓取百度收录代码
*/
function baidu($s){
$baidu="http://www.baidu.com/s?wd=site%3A".$s;
$site=file_get_contents($baidu);
//$site=iconv("gb2312", "UTF-8", $site);
ereg("找到相关网页(.*)篇,", $site,$count);
$count=str_replace("找到相关网页","",$count);
$count=str_replace("篇,","",$count);
$count=str_replace("约","",$count);
$count=str_replace(",","",$count);
return $count[0];
}
echo baidu(www.hzhuti.com); //获取好主题在百度中的收录数量
?>
获取百度的热词
代码如下 复制代码
<?php
/**
* * @user 小杰
* @return array 返回百度的热词数据(数组返回)
*/
function getBaiduHotKeyWord()
{
$templateRss = file_get_contents('http://top.baidu.com/rss_xml.php?p=top10');
If (preg_match('/<table>(.*)</table>/is', $templateRss, $_description)) {
$templateRss = $_description [0];
$templateRss = str_replace("&", "&", $templateRss);
}
$templateRss = "<?xml version="1.0" encoding="GBK"?>" . $templateRss;
$xml = simplexml_load_String($templateRss);
foreach ($xml->tbody->tr as $temp) {
if (!empty ($temp->td->a)) {
$keyArray [] = trim(($temp->td->a));
}
}
return $keyArray;
}
print_r(getBaiduHotKeyWord());
这是在网上找的 稍微修改了下 将下面代码写入php文件
百度收录和百度快照时间
代码如下 复制代码
<?php
$domain = “http://www.hzhuti.com/nokia/5230/ *欲查询的域名*/
$site_url = ‘http://www.baidu.com/s?wd=site%3A’;
$all = $site_url.$domain; /*域名所有收录的网址*/
$today = $all.’&lm=1′; /*域名今日收录的网址*/
$utf_pattern = “/找到相关结果数(.*)个/”;
$kz_pattern = “/<span class=”g”>(.*)</span>/”; /*用以匹配快照日期的字符串*/
$times = “/d{4}-d{1,2}-d{1,2}/”; /*匹配快照日期的正则表达式,如:2011-8-4*/
$s0 = @file_get_contents($all); /*将site:www.ninthday.net的网页置入$s0字符串中*/
$s1 = @file_get_contents($today);
preg_match($utf_pattern,$s0,$all_num); /*匹配”找到相关结果数*个”*/
preg_match($utf_pattern,$s1,$today_num);
preg_match($kz_pattern,$s0,$temp);
preg_match($times,$temp[0],$screenshot);
if($all_num[1] == “”)
$all_num[1] = 0;
if($today_num[1] == “”)
$today_num[1] = 0;
if($screenshot[0] == “”)
$screenshot[0] = “暂无快照”;
?>
<html>
<head>
<title>Test</title>
</head>
<body>
<table>
<tr>
<td>日期</td><td>百度收录</td><td>百度今日收录</td><td>百度快照日期</td>
</tr>
<tr>
<td><?php echo date(‘m月d日G时’);?> </td><td><?php echo $all_num[1]; ?></td><td><?php echo $today_num[1]; ?></td><td><?php echo $screenshot[0]; ?></td>
</tr>
</table>
<p>百度收录:<a href=”<?php echo $all; ?>” target=”_blank”><?php echo $all_num[1]; ?></a></p>
<p>百度今日收录:<a href=”<?php echo $today; ?>” target=”_blank”><?php echo $today_num[1]; ?></a></p>
<p>百度快照日期:<a href=”<?php echo $all; ?>”><?php echo $screenshot[0]; ?></a></p>
</body>
</html>
上面的方法未经过严格考虑,如果服务器不支持file_get_contents函数我们就无法操作了,所以还可以利用curl操作,这个更方便可以模仿用户哦。
分享到:
相关推荐
PHP代码使用file_get_contents()函数来获取指定URL的页面内容,然后通过ereg()函数(这是一个已被弃用的函数,建议使用preg_match()替代)来提取页面中特定的文本内容,这部分文本内容是关于某个域名下被百度收录的...
php 抓取百度搜索结果脚本,php命令行下运行
《批量百度收录、快照查询程序详解》 在互联网领域,搜索引擎优化(SEO)是提升网站可见性的重要手段,其中,百度收录与快照更新情况是衡量网站SEO效果的关键指标。本文将详细介绍一款名为"批量百度收录、快照查询...
第二,网站在使用过程中整站被注入色情等信息,且被百度收录,而且收录页面特别多,SEO人员在后期没法全部获取到快照链接或link链接用于快照投诉,用此工具可批量获取 此程序为简易程序,做的比较简单,运行速度可能...
"百度全自动推送文章收录PHP代码附带教程"是一个帮助网站管理员实现快速文章收录的解决方案,通过编写PHP代码实现与百度搜索引擎的自动交互。 首先,我们要理解什么是“百度自动推送”。这是一种技术手段,允许网站...
百度快照是指百度搜索引擎在抓取并存储网页时,所保留的一个页面静态版本。当用户在搜索结果中点击“快照”链接时,可以看到这个页面在某一个时间点的状态,即使原始网页已经更改或无法访问。快照是搜索引擎对网页...
百度快照是百度搜索引擎抓取并存储网页内容的一个副本,当用户搜索时,它会显示一个时间戳,表示该快照的抓取日期。如果你发现自己的网页快照过旧,可能会影响用户体验,因为用户看到的信息可能不是最新的。本文将...
通过阅读和理解这个项目的代码,你可以学习到更多关于如何抓取百度云分享链接的具体实现细节。 总的来说,抓取百度云分享数据涉及到了Python网络请求、数据解析、可能的验证码处理以及应对反爬策略等技术。在实践中...
百度快照是指百度搜索引擎在抓取网页时保存的一个静态版本,当原网站无法访问时,用户可以通过快照浏览网页内容。本文将深入探讨“百度快照更新软件”的概念、功能及使用方法。 【描述】:“百度快照当天更新,3...
在这个压缩包中,提供的源代码主要用于查询网站的关键性能指标,包括百度权重、Alexa排名、Google PageRank、Google收录量、百度收录量以及百度快照更新情况。这些数据对于网站优化和搜索引擎营销(SEO)至关重要。 ...
【百度快照】是搜索引擎(以百度为例)在抓取并存储网页时,为了提高网页检索效率而创建的一种缓存版本。它记录了网页在某个时间点的状态,当原网页因服务器问题、网站改版或其他原因无法访问时,用户可以通过点击...
1. **百度快照**:百度快照是搜索引擎在抓取网页时保存的一个静态版本,它记录了网页在某个时间点的状态,用户可以通过快照查看网页的早期内容,尤其是在原网页无法访问时。 2. **快照时间升级**:百度在升级后,将...
"百度关键词排名抓取程序"是一个专门针对百度搜索引擎的工具,它的主要功能是自动收集和分析特定关键词在百度搜索结果中的排名情况。这类程序通常用于SEO(搜索引擎优化)工作,帮助网站管理员了解他们的网站在百度...
本软件实现了单个网页快照抓取、批量网页快照抓取等功能。实现了网址的基本操作,如添加网址、删除网址、修改网址等。本软件的知识产权属天使知识授理厂 www.a3gs.com 你可以到此网站下载本软件源码进行学习、修改等...
百度快照是搜索引擎在抓取并存储网页时制作的一个静态版本,当用户无法访问原网页时,可以通过查看快照来获取部分信息。以下将详细探讨这个工具及其相关的知识点。 首先,理解“百度快照”的概念至关重要。百度快照...
百度快照是搜索引擎抓取网站页面后存储的副本,反映了网站的最新状态。当快照不更新时,可能意味着网站内容更新不够频繁,或者搜索引擎对网站的信任度下降。下面,我们将根据提供的内容,分享五个有效解决百度快照不...
1. **快照更新触发**:软件可能具有自动或手动触发百度蜘蛛抓取的功能,以尝试加速快照更新,这通常需要对百度的爬虫行为有深入理解。 2. **内容优化建议**:提供网站内容优化的建议,比如关键词密度调整、元标签...
过去,快照显示的抓取时间帮助用户判断该网页内容的更新频率和时效性。但是,百度最近的更新中将快照时间的显示替换为内容的发布时间。其原因主要可以归结为以下几点: 1. 用户需求:用户通常希望搜索到最新且与...
机械臂抓取程序