`
liuyunlu
  • 浏览: 24808 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

过滤网页信息

阅读更多

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<!-- saved from url=(0025)http://www.thisky.com/tt/ -->
<HTML><HEAD><TITLE>批量贴图工具power by 最冷的夏天</TITLE>
<SCRIPT language=JavaScript>
<!--

function SymError()
{
  return true;
}

window.onerror = SymError;

//-->
</SCRIPT>

<SCRIPT language=JavaScript1.2>
function delnull()
{
 var str=document.getElementById('text').value;
 str=str.replace(/([\s]*\r\n[\s]*){2,}/gm,"\r\n");
 document.getElementById('text').value=str;
}
function refix()
{
 var str=document.getElementById('text').value;
 str=str.replace(/([\s]*\r\n[\s]*){2,}/gm,"\r\n\r\n");
 document.getElementById('text').value=str;
}
function url()
{
 var str=document.getElementById('text').value;
 str=str.replace(/^[ ]*(http:\/\/|^mms:\/\/|^rtsp:\/\/|^pnm:\/\/|^ftp:\/\/|^mmst:\/\/|^mmsu:\/\/)([^\r\n]*)$/igm,"[url]$1$2[/url]");
 document.getElementById('text').value=str;
}

function addbr()
{
 var str=document.getElementById('text').value;
 str=str.replace(/\r\n/gm,"\r\n\r\n");
 document.getElementById('text').value=str;
}

function html_trans(str) {
 str = str.replace(/\r/g,"");
 str = str.replace(/on(load|click|dbclick|mouseover|mousedown|mouseup)="[^"]+"/ig,"");
 str = str.replace(/<script[^>]*?>([\w\W]*?)<\/script>/ig,"");

if(set.filtrate.checked)
{
 str = str.replace(/[^<]*<([^>]*?)>[^<]*/ig,"<$1>");
 tm=window.textfield.value;
 if(tm.length<1){
  var arr;
  arr=str.match(/<img[^>]+src=[" ]?([^"]+)[" ]?[^>]*>/ig);
  tm=arr[0].replace(/<img[^>]+src=[" ]?([^"]+)[" ]?[^>]*>/ig,"$1")+"\"";
  i=tm.search(/\/[^\/]+"/ig);
  tm=tm.substr(0,i);
  window.textfield.value=tm+"/";
 }
 if(tm.substr(tm.length-1,1)!="/") tm+="/";
 var strtm="<img[^>]+src=[\"]?("+tm+"[^\"]+)[\"]?[^>]*>";
 var re = new RegExp(strtm,"ig");
 str = str.replace(re,"\n[img]$1[/img]\n");
}
else
{
 if(set.stext.checked) str = str.replace(/[^<]*<([^>]*?)>[^<]*/ig,"<$1>");

 if(!set.linka.checked) str = str.replace(/<a[^>]+href=[" ]?([^"]+)[" ]?[^>]*>(.*?)<\/a>/ig,"\n[url=$1]$2[/url]\n");
 if(!set.font_color.checked&&!set.stext.checked)
  str = str.replace(/<font([^>]+)color=([^ >]+)([^>]*)>(.*?)<\/font>/ig,"\n[color=$2]<font$1$3>$4</font>[/color]\n");
 if(!set.font_size.checked&&!set.stext.checked)
  str = str.replace(/<font([^>]+)size=([^ >]+)([^>]*)>(.*?)<\/font>/ig,"\n[size=$2]<font$1$3>$4</font>[/size]\n");
 if(!set.font_face.checked&&!set.stext.checked)
  str = str.replace(/<font[^>]+face=([^ >]+)[^>]*>(.*?)<\/font>/ig,"\n[font=$1]$2[/font]\n");
 if(!set.img.checked) str = str.replace(/<img[^>]+src=[" ]?([^"]+)[" ]?[^>]*>/ig,"\n[img]$1[/img]\n");

 if(!set.odj.checked){
  //return str;
  str = str.replace(/<object[^>]+classid=[" ]?clsid:D27CDB6E-AE6D-11cf-96B8-444553540000[" ]?[^>]*>(.*?)<param[^>]+name=[" ]?movie[" ]?[^>]+value=[" ]?([^"]+)[" ]?[^>]*>/ig,"\n[swf]$2[/swf]\n");
  str = str.replace(/<object[^>]+classid=[" ]?clsid:CFCDAA03-8BE4-11cf-B84B-0020AFBBCCFA[" ]?[^>]*>.*<param[^>]+name="src"[^>]+value="([^"]+)">/ig,"\n[rm]$1[/rm]\n");
 }
 if(!set.font_b.checked&&!set.stext.checked){
  str = str.replace(/<([\/]?)b>/ig,"[$1b]");
  str = str.replace(/<([\/]?)strong>/ig,"[$1b]");}
 if(!set.font_u.checked&&!set.stext.checked)
  str = str.replace(/<([\/]?)u>/ig,"[$1u]");
 if(!set.font_i.checked&&!set.stext.checked)
  str = str.replace(/<([\/]?)i>/ig,"[$1i]");

 str = str.replace(/&nbsp;/g," ");
 str = str.replace(/&amp;/g,"&");
 str = str.replace(/&quot;/g,"\"");
 str = str.replace(/&lt;/g,"<");
 str = str.replace(/&gt;/g,">");
}
 str = str.replace(/<br>/ig,"\n");
 str = str.replace(/<p[^>]*?>/ig,"\n\n");
 str = str.replace(/<[^>]*?>/g,"");
 str = str.replace(/\[url=([^\]]+)\]\n(\[img\]\1\[\/img\])\n\[\/url\]/g,"$2");
 str = str.replace(/\n+/g,"\n");
 
 return str;
}
function copycode(obj){
obj.select();
objcopy=obj.createTextRange();
objcopy.execCommand("Copy");
}
function trans(){
 var str = "";
 rtf.focus();
 rtf.document.body.innerHTML = "";
 rtf.document.execCommand("paste");
 str = rtf.document.body.innerHTML;
 if(str.length == 0) {
  alert("剪切版不存在超文本数据!");
  return "";
 }
 return html_trans(str);
}
function zhen(str)
{
 strfound=str.replace(/\\/ig,"\\\\");
 strfound=strfound.replace(/\[/ig,"\\[");
 strfound=strfound.replace(/\]/ig,"\\]");
 strfound=strfound.replace(/\{/ig,"\\{");
 strfound=strfound.replace(/\}/ig,"\\}");
 strfound=strfound.replace(/\|/ig,"\\|");
 strfound=strfound.replace(/\//ig,"\\/");
 strfound=strfound.replace(/\^/ig,"\\^");
 strfound=strfound.replace(/\./ig,"\\.");
 strfound=strfound.replace(/\*/ig,"\\*");
 strfound=strfound.replace(/\?/ig,"\\?");
 strfound=strfound.replace(/\+/ig,"\\+");
 return strfound;
}
function replace_star()
{
 var str=document.getElementById('text').value;
 if(!reg.checked)
  strfound=zhen(find_text.value);
 else
  strfound=find_text.value;
 var re = new RegExp(strfound,"ig");
 str=str.replace(re,replace_text.value);
 document.getElementById('text').value=str;
}
</SCRIPT>

<META http-equiv=Content-Type content="text/html; charset=gb2312">
<STYLE type=text/css>
BODY {
 FONT-SIZE: 12px
}
TD {
 FONT-SIZE: 12px
}
TH {
 FONT-SIZE: 12px
}
.style1 {color: #000000}
</STYLE>

<META content="MSHTML 6.00.2900.2180" name=GENERATOR></HEAD>
<BODY>
<TABLE style="BORDER-COLLAPSE: collapse" cellSpacing=0 cellPadding=0
align=center border=0>
  <TBODY>
  <TR>
    <TD align=center width=10 bgColor=#19223f>&nbsp;</TD>
    <TD width=740 bgColor=#cccccc>
      <TABLE cellSpacing=0 cellPadding=0 width=713 border=0>
        <TBODY>
        <TR>
          <TD align=center width=713 bgColor=#cccccc><TEXTAREA onbeforepaste="if(document.getElementById('x_paste').checked){window.clipboardData.setData('text',trans());this.focus();}" id=text style="WIDTH: 98%; HEIGHT: 300px" name=textarea cols=100></TEXTAREA>
            <IFRAME id=rtf style="WIDTH: 0px; HEIGHT: 0px" marginWidth=0
            marginHeight=0 src="images/cnsminex_empty.htm"
            scrolling=no></IFRAME><LABEL for=x_paste></LABEL>
            <TABLE width=713 align=center border=0>
              <TBODY>
              <TR align=center>
                <TD width="25%"><INPUT style="WIDTH: 150px; HEIGHT: 50px" onclick="document.getElementById('text').value += trans();" type=button value=追加转换剪切板数据 name=button></TD>
                <TD width="25%">
                  <P align=center><INPUT style="WIDTH: 150px; HEIGHT: 50px" onclick=copycode(window.text) type=button value=将代码复制到剪切板 name=button>
                  </P></TD>
                <TD width="25%"><INPUT style="WIDTH: 150px; HEIGHT: 50px" onclick="document.getElementById('text').value=''" type=button value="清 空 内 容" name=button></TD>
                <TD width="25%">
                  <TABLE cellSpacing=0 cellPadding=0 width="100%" border=0>
                    <TBODY>
                    <TR align=center>
                      <TD><INPU  

分享到:
评论

相关推荐

    网页信息采集过滤.zip

    用vs2010,基于WinInet的一个用来抓取网页信息(保存为THML文件)的mfc小程序,可以自己输URL,可以自己输关键词进行过滤显示,预设了抓取页面内URL,邮箱等功能,由于对c++ regex 正则表达式不是太懂,筛选信息可能...

    页面内容的选择过滤方法

    在IT行业中,页面内容的选择过滤方法是Web开发中的一个重要概念,尤其在大数据量展示和用户交互性提升方面。本主题主要关注如何通过JavaScript技术来实现这一功能,这可以从提供的两个文件——`testTable1.html`和`...

    网络信息过滤

    《网络信息过滤技术在DELPHI环境下的实现》 网络信息过滤是网络安全领域的重要组成部分,其目的是保护用户免受有害、不适当或无用信息的影响。DELPHI是一种流行的面向对象的编程语言,以其强大的Windows应用程序...

    网络信息过滤系统论文

    1. **基于内容的过滤系统**:这类系统主要依赖于对网页内容的分析来判断信息的相关性和价值,如通过关键词匹配、语义分析等技术实现。 2. **协同过滤系统**:通过分析用户的行为模式和偏好,利用用户间的相似性来...

    护卫神非法信息过滤系统 v2.0

    护卫神非法信息过滤系统,是一款专业且完全免费的服务器非法信息过滤软件,实时拦截、替换服务器上各个网站的非法信息,并记录详细日志,是您管理服务器必备的软件! 护卫神非法信息过滤系统概况: 1、自定义监控...

    护卫神(非法信息过滤系统)

    ☆ 开启【Gzip过滤】后,将可以过滤经过Gzip压缩的网页。 9、日志分析 ☆ 每天一个日志文件,详细的日志分析,让您能准确掌握非法信息情况! ☆ 记录非法信息被过滤的时间、客户端IP、完整的URL路径、周边关联词...

    等价标记的网页信息隐藏

    传统的网页信息隐藏技术在隐蔽性和抗机器过滤能力上存在不足。为了解决这些问题,一种新的方法——【基于等价标记的网页信息隐藏算法】被提出。这种方法改进了基于属性对顺序的隐藏技术,提高了隐藏信息的容量,并...

    家庭网页管理系统(网址等过滤)

    《家庭网页管理系统——掌握网页过滤技术与应用》 在当今互联网时代,网络信息纷繁复杂,尤其是对于家庭环境,为了保障孩子的网络安全,防止接触不良信息,一个高效的家庭网页管理系统显得尤为重要。本文将深入探讨...

    网监王WJW110 专业级网站不良信息过滤系统

    新一代智能双向高速过滤系统,网监王WJW110运行在IIS高效的内核层,采用独有的高速过滤算法,可保证在不影响网站运行效率的前提下实现不良... 支持对ASCII、GBK和UTF8等网页编码的过滤。 6. 详尽的日志功能让你清楚了

    VB 网页标签提取与过滤

    在VB(Visual Basic)编程环境中,网页标签的提取与过滤是一项常见的任务,特别是在网页抓取或数据挖掘项目中。这个主题涉及到如何从HTML文档中获取特定的信息,如文本内容、图片链接、音频文件(如mp3)以及网页...

    baidu-web-filter.rar_网页 过滤

    标签“网页_过滤”再次强调了这个项目的核心功能,即对网页内容进行筛选和控制,可能包括关键字过滤、URL黑名单、内容检测等技术,以达到过滤掉特定信息的目的。 【压缩包子文件的文件名称列表】:小胖的百度网页...

    TreeCtrl1206.rar_TreeCtrl_TreeCtrl1206.rar_网页代码_网页内容_网页过滤

    2. **网页内容解析**:解析HTML文档,可能使用正则表达式或DOM解析器来提取和处理网页信息。 3. **过滤机制**:设计和实现过滤算法,包括关键词匹配、内容筛选等,确保过滤规则的灵活性和效率。 4. **版本控制**:...

    基于协同过滤算法的电影推荐系统

    协同过滤是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的...

    基于文件过滤驱动和事件触发的网页防篡改机制

    总之,基于文件过滤驱动和事件触发的网页防篡改机制是一种集监测、响应和管理于一体的综合安全解决方案,它利用先进的技术和算法,有效保障了网页内容的安全,为政府、企事业单位提供了可靠的信息安全保障。

    htmlparser进行网页信息的抽取

    总结来说,HTMLParser是一个强大且易用的HTML解析工具,它允许开发者通过定义过滤器策略来高效地抽取网页信息。在给定的示例中,`WrapperComment` 类展示了如何结合多种过滤器从HTML文档中提取特定表格内容,这种...

    论文研究-基于移动Agent的Web信息智能过滤算法及其实现.pdf

    讨论了Web信息过滤的现状,提出了Web信息过滤应用中移动Agent的结构并设计了基于移动Agent的信息过滤工作模型。...实际应用表明,该Web信息过滤模型能够有效地完成对网页信息的过滤和保证内部人员合法地使用网络。

    IDC网站天使(防盗链,防木马上传,信息过滤等)

    它的作用就是过滤网页中被非法插入的恶意代码,而且过滤后不会影响网页的正常浏览,同时可以设置允许嵌入代码有域名,以保证广告联盟代码,统计代码等可以正常使用 功能七、信息过滤 非法信息过滤是很多人需要的 ...

Global site tag (gtag.js) - Google Analytics