<?php
header('Content-Type:text/html;charset=utf-8');
//$file=_FILE_('e:\URLRepeat.txt');
require 'includes/mysql.func.php';
//echo $DOCUMENT_ROOT;
//
//$path="e:/URLRepeat.txt";
//$path1="e:/alias.sorted.short";
$fp =fopen($path1,'r');
if($action == 'addDB'){
echo 'addDB done';
}
if($action == 'addURLRepeat'){
echo 'addURLRepeat done';
//addURLRepeat();
// show();
}
if($action == 'count'){
countTotal();
}
function countTotal(){
// 建立对数据库的连接
$db=new mysqli('localhost','root','ustc','url');
if(mysqli_connect_errno()){
echo 'Mysql Connect Error';
exit(0);
}
$db->query('SET NAMES UTF8');
/*
* 计算case的总数量
*/
// $_sql_count='select count(*) from urlcase';
// $result_count=$db->query($_sql_count);
// $count_num=$result_count->fetch_array();
// echo 'case数量为:'.$count_num[0].'个'.'<br>';
/*
* 遍历urlcase总数据 然后到url_db 表中查询
*/
$num=0;
set_time_limit(0);
$_sql_all='select * from urlcase';
$result_all = $db->query($_sql_all);
for( $i =0;$i<296;$i++){
$count_all=$result_all->fetch_array();
//echo $count_all[2].'<br>';
//一个case中多个url
$result_split=split('\|',$count_all[2]);
//计算有多少个url
$result_count=count($result_split);
$result_split_1=$result_split[0];
$result_split_1=split('//',$result_split[0]);
//echo '查询'.$result_split_1[1].'是否在苦中'.'<br>';
$result_test='www.zahrainfotech.com';
$_sql_search='select id from url_db where url = '.'"'.trim($result_split_1[1]).'"' ;
// echo '<br>'.'sql'.$_sql_search.'<br>';
// $_sql_search='select id from url_db where url = '.'\''.trim($result_split_1).'\'' ;
//echo $_sql_search.'<br>';
$db1=new mysqli('localhost','root','ustc','url');
if(mysqli_connect_errno()){
echo 'Mysql Connect Error';
exit(0);
}
$db1->query('SET NAMES UTF8');
$result=$db1->query($_sql_search);
$result_1=$result->fetch_array;
//得到 查詢url的結果
$result_first=$result_1[0];
$no=0;
$yes=0;
if(empty($result_first)){
//echo '无结果!';
$no++;
echo $result_split_1[1].'<br>';
}else{
// $yes++;
$flag=0;
for($i=1;$i<$result_count;$i++){
$_sql_search_1='select id from url_db where url = '.'"'.trim($result_split[$i]).'"' ;
// $_sql_search='select id from url_db where url = '.'\''.trim($result_split_1).'\'' ;
//echo $_sql_search.'<br>';
$result_1=$db1->query($_sql_search_1);
$result_1_1=$result_1->fetch_array();
//得到 查詢url的結果
$result_first_1=$result_1_1[0];
if ($result_firest_1 == $result_first){
}else {
$flag=1;
// echo '查询'.$result_split_1[1].'是否在库中'.'<br>';
// echo '查询出的相关id为:'.$result_first.'<br>';
echo $count_all[0];
}
// echo $result_count.'<br>';
}
if (flag == 0){
$yes++;
}
// //echo $result_split[0].'<br>';
//
// if($num==100){
// break;
// }
// $num++;
}
}
echo '解决'.$yes.'个';
$db->close();
$db1->close();
}
function show(){
$path="e:/URLRepeat_2.txt";
$fp=fopen($path,'r');
while(!feof($fp))
{
$filetxt = fgets($fp);
echo $filetxt.'<br>';
$result=split(' ',$filetxt);
// echo $result[0].$result[2].'<br>';
//case_id
$url_id=$result[0];
$anchor=$result[2];
$url=$result[1];
$case_id=$result[0].$result[2];
}
}
function addURLRepeat(){
$path="e:/URLRepeat_2.txt";
$fp=fopen($path,'r');
// 建立对数据库的连接
$db=new mysqli('localhost','root','ustc','url');
if(mysqli_connect_errno()){
echo 'Mysql Connect Error';
exit(0);
}
$db->query('SET NAMES UTF8');
while(!feof($fp))
{
$filetxt = fgets($fp);
// echo $filetxt.'<br>';
$result=split(' ',$filetxt);
// echo $result[0].$result[2].'<br>';
//case_id
$url_id=$result[0];
$anchor=$result[2];
$url=$result[1];
$case_id=$result[0].$result[2];
//1、检查case_id 在数据库中是否存在
//2、存在 则更
//3、不存在则插入
// echo $case_id;
// $_sql='select * from '.'\''.'urlcase'.'\''.' where '.'\''.'case_id'.'\''.' = '.'\''.$case_id.'\'';
$_sql= ' select * from urlcase where case_id = '.'\''.trim($case_id).'\'' ;
// echo $_sql.'<br>';
// echo $_sql.'<br>';
$result = $db->query($_sql);
$rows=$result->num_rows;
// echo 'rows'.$rows.'<br>';
if($rows == 0 ){
echo '0000000'.'<br>';
$_sql_insert='insert into urlcase (case_id,url,url_id,anchor) values('.'\''.trim($case_id).'\''.','.'\''.trim($url).'\''.','.trim($url_id).','.'\''.trim($anchor).'\''.')';
// echo $_sql_insert.'<br>';
$db->query($_sql_insert);
}else{
$_sql_select_url='select url from urlcase where case_id = '.'\''.trim($case_id).'\'' ;
$result_url = $db->query($_sql_select_url);
$rows=$result_url->fetch_array();
$prex_url=$rows[0];
$url_all = $prex_url.'|'.$url;
echo $url_all.'<br>';
$_sql_update='update urlcase set url = '.'\''.trim($url_all).'\''.' where case_id='.'\''.trim($case_id).'\'' ;
$db->query($_sql_update);
}
}
$db->close();
}
function addDB(){
//echo $fp;
//echo filesize($path);
//_connect();
//echo '<br>';
//$i = 0;
//set_time_limit(0);
//while(!feof($fp))
//{
// $filetxt = fgets($fp);
// echo $filetxt.'<br>';
// $result=split(' ',$filetxt);
// echo count($result);
// echo $result[0];
// echo strcmp ($result[1],trim($result[1]));
// echo '<br>';
// echo count($result);
//echo $result[3];
//echo $result[0].$result[1];
//*****插入400m文件******
//$_sql = 'insert into url values('.trim($result[0]).','.'\''.trim($result[1]).'\''.')';
//_insert($_sql);
//***********************
//
//$_sql='select * from url where url=\'www.baidu.com\'';
// $result= mysql_fetch_array(_query($_sql),MYSQL_ASSOC);
//
// echo empty($result);
// foreach($result as $n=>$m)
// {
// echo $n.' ';
// }
// if($result[4] == 1 )
// {
// echo 'ssss';
// }
// foreach($result as $r){
// echo '%%%%%'.$r;
////
//// }
// echo '<br>';
// echo '&&&&&&&&'.split($filetxt,' ').'&&&&&&&&&&&&&&&&';
//}
//fclose($fp);
}
?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<body>
<form action="deal.php?action=addDB" method="post" name="addDB"><input
type="submit" id="addDB" value='将url归一化库插入到数据库'></input></form>
<form action="deal.php?action=addURLRepeat" method="post"
name="addURLRepeat"><input type="submit" id="addURLRepeat"
value="将需要处理的URL 插入数据库"></input></form>
</body>
<form action="deal.php?action=count" method="post" name="count"><input
type="submit" id="count" value="开始统计"></input></form>
</body>
</html>
分享到:
相关推荐
PHP php_igbinary.dll PHP5.4以上所有版本扩展分别包括 php_igbinary-2.0.1-5.5-nts-vc11-x86 php_igbinary-2.0.1-5.5-ts-vc11-x64 php_igbinary-2.0.1-5.5-ts-vc11-x86 php_igbinary-2.0.1-5.6-nts-vc11-x64 ...
phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站phpphp网站...
阿里云笔试题介绍,不过不是最近的了,好像
标题“php7.2.4 64 位下载”涉及的是PHP编程语言的一个特定版本——PHP 7.2.4,专为64位操作系统设计。PHP是一种广泛使用的开源服务器端脚本语言,尤其适合网页开发。64位版本的PHP在处理大数据量和内存需求较高的...
支持 PHP 版本 (Thread Safe): 5.5.* x86 5.5.* x64 5.6.* x86 5.6.* x64 测试环境 Windows7 64bit PHP 5.5.35 TS x86 PHP 5.5.35 TS x64 PHP 5.6.21 TS x86 PHP 5.6.21 TS x64 将对应的版本 ...
wnmp环境下,引用COM组件,使用print2flash时必须要引入COM类,将对应的.dll文件放在php目录下的ext文件夹下,在php.ini中添加extension=php_com_dotnet.dll,开启com.allow_dcom = true 即可使用COM类,注意:如果...
php_igbinary-1.2.1-5.5-nts-vc11-x64 php_igbinary-1.2.1-5.5-nts-vc11-x86 php_igbinary-1.2.1-5.5-ts-vc11-x64 php_igbinary-1.2.1-5.5-ts-vc11-x86 php_redis-2.2.7-5.6-nts-vc11-x64 ...
【标题】:“php一个简单的在线编辑器” 在线编辑器是一种网页应用,允许用户在浏览器上直接编辑文本,常用于博客、论坛或者内容管理系统等。PHP是服务器端的一种脚本语言,用于处理用户提交的数据和生成动态网页。...
《PHP 5.2.10在Windows环境下的配置与应用》 PHP(Hypertext Preprocessor)是一种广泛使用的开源脚本语言,尤其在Web开发领域有着重要地位。标题中的"php-5.2.10-Win32.zip"指的是PHP的5.2.10版本的Windows 32位非...
php_com_dotnet.dll,用于在php环境里调用windows api的神器
【标题】:“提供一套完整的php源码给大家参考,杭州家教网源码” 【描述】:“提供一套完整的php源码给大家参考,杭州家教网源码”这套资源包含了一个用于构建杭州家教网的全套PHP源代码,是学习和研究PHP web开发...
PHP支持MSSQL的驱动下载(最新) 教程文档:https://blog.csdn.net/lccee/article/details/54289076 严重注意:不要因为自己的愚蠢乱骂人,自己版本对不上,连不上就在评论区骂人的人,请自重,实在笨到不会用,你...
PHP的文档的扩展必备神器,主要用于在php环境里调用windows api以及处理word文档,先在php.ini文件中开启配置(即设置com.allow_dcom = true),然后下载php_com_dotnet.dll到php的ext扩展目录下,重启Apache后即可...
PHP5 完整官方 中文教程 版权信息 前言 入门指引 简介 简明教程 安装与配置 安装前需要考虑的事项 Unix 系统下的安装 Mac OS X 系统下的安装 Windows 系统下的安装 PECL 扩展库安装 还有问题? 运行时配置 语言参考 ...
php5.0以上的用这个吧
《PHP、MySQL和Apache编程导学(原书第4版)》是一本专注于教授如何使用PHP、MySQL和Apache进行Web开发的书籍。这些技术是构建动态网站和服务器端应用程序的核心组件,通常被称为“AMP”——Apache服务器、MySQL数据库...
完整的 集成了apache+mysql+zend+php php订餐系统 兼容firefox, ie, opera 一键点击就可以运行 演示地址: http://at91.cn/snack.encode.v0.2/ 完整版下载地址: http://at91.cn/uploads/php_mysql_snack.zip ...
php5apache2_4.dll 包内有不同版本。包括最新了phpPHP 5.4.9