`
wangheid
  • 浏览: 37063 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Java 过滤 html、script、style 代码得到纯字符串 方法

    博客分类:
  • java
 
阅读更多

  1. /*** 
  2.  
  3. * @param content 内容String 
  4. * @param p >0 .位数 
  5. * @return @tale: 
  6. * @purpose:得到相应位数已过滤html、script、style 标签的内容 内容结尾 为... 
  7. * @author:Simon - 赵振明 
  8. * @CreationTime:Aug 25, 201011:07:06 AM 
  9. */  
  10. public static String getNoHTMLString(String content,int p){  
  11.     
  12.     if(null==content) return "";  
  13.     if(0==p) return "";  
  14.     
  15.     java.util.regex.Pattern p_script;   
  16.          java.util.regex.Matcher m_script;   
  17.          java.util.regex.Pattern p_style;   
  18.          java.util.regex.Matcher m_style;   
  19.          java.util.regex.Pattern p_html;   
  20.          java.util.regex.Matcher m_html;   
  21.           
  22.      try {   
  23.          String regEx_script = "<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>";  
  24.          //定义script的正则表达式{或<script[^>]*?>[\\s\\S]*?<\\/script> }    
  25.          String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>";   
  26.                //定义style的正则表达式{或<style[^>]*?>[\\s\\S]*?<\\/style> }    
  27.                String regEx_html = "<[^>]+>"//定义HTML标签的正则表达式    
  28.              
  29.                p_script = Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);   
  30.                m_script = p_script.matcher(content);   
  31.                content = m_script.replaceAll(""); //过滤script标签   
  32.                p_style = Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);   
  33.                m_style = p_style.matcher(content);   
  34.                content = m_style.replaceAll(""); //过滤style标签    
  35.              
  36.                p_html = Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);   
  37.                m_html = p_html.matcher(content);   
  38.                  
  39.                content = m_html.replaceAll(""); //过滤html标签    
  40.            }catch(Exception e) {   
  41.                    return "";  
  42.            }   
  43.     
  44.            if(content.length()>p){  
  45.             content = content.substring(0, p)+"...";  
  46.            }else{  
  47.             content = content + "...";  
  48.            }  
  49.     
  50.     
  51.     
  52.    return content;  
  53. }  
分享到:
评论

相关推荐

    Java 中 过滤Html标签

    "Java 中过滤Html标签" Java 中过滤Html标签是指在Java语言中删除或替换HTML标签的过程。...使用正则表达式过滤Html标签是Java中的一种常见技术,可以用来删除恶意代码、防止XSS攻击、显示纯文本等。

    java百度编辑器提交过滤标签方法

    通过编写特定的正则表达式来匹配HTML、CSS和JavaScript标签,并使用`Matcher`类的`replaceAll()`方法将其替换为空字符串或其他指定字符串,从而实现对这些标签的过滤。 #### 示例代码解析 以下代码展示了如何使用...

    HTML代码过滤技术

    HTML代码过滤技术是一种网络安全与网页内容管理的重要手段。在互联网环境中,HTML(HyperText Markup Language)是构建网页的基础,但同时也可能被恶意用户利用来执行有害操作,如注入跨站脚本(XSS)、钓鱼攻击等。...

    过滤HTML元素字符

    在这个例子中,`filterHtml`方法首先使用字符串替换转义了HTML特殊字符,然后使用正则表达式匹配并删除了`&lt;script&gt;`、`&lt;style&gt;`和`&lt;iframe&gt;`这三个常见的危险标签。最后,通过`main`方法调用`filterHtml`来演示过滤...

    java过滤html标签获取纯文本信息的实例

    本实例的代码封装在FilterHtmlUtil类中,提供了一个静态方法Html2Text用于将传入的包含HTML标签的字符串,过滤标签后返回纯文本内容。这个工具类可以在需要从HTML内容中提取文本的任何Java程序中使用。 总结来说,...

    Java实现从Html文本中提取纯文本的方法

    Java实现从Html文本中提取纯文本的方法 在本文中,我们将介绍Java实现从Html文本中提取纯文本的方法。提取纯文本是指从Html文档中去掉所有的Html标签,只保留原始的文本内容。这种技术在实际应用中非常有用,例如从...

    html标签过滤标签jar包

    这个jar包包含了一系列预定义的过滤规则,可以识别并移除或者转义用户提交的HTML字符串中的潜在危险元素,如`&lt;script&gt;`、`&lt;iframe&gt;`、`&lt;style&gt;`等,这些元素如果未经处理就展示在页面上,可能会执行恶意的JavaScript...

    易语言-易语言过滤HTML,JS,CSS,空格,换行符

    易语言提供了多种字符串处理函数,例如“字符串删除前导空白”、“字符串删除尾部空白”以及“字符串替换”,可以用来删除或替换多余的空格和换行符,使得文本更加整洁。 在实现这个功能时,一般会遵循以下步骤: 1...

    SpringBootXSS攻击过滤插件使用XSS是什么解决方案.docx

    - **对表单绑定的字符串类型进行XSS处理**:确保所有从用户处收集的数据都经过适当的转义或过滤。 - **对JSON字符串数据进行XSS处理**:对于通过API接收的数据,同样需要进行严格的验证和转义。 - **提供路由和控制...

    java学习笔记整理

    ##### 3.1 和字符串相关的类:String, StringBuilder, StringBuffer - **String**: 不可变的字符序列,用于表示文本。 - **StringBuilder**: 可变的字符序列,线程不安全,效率较高。 - **StringBuffer**: 可变的...

    HTMLParser提取网页内容

    HTMLParser 是一个用于解析HTML文档的Java库,它允许开发者以结构化的方式处理网页内容,例如提取特定元素、过滤不需要的标签等。在Web抓取或数据挖掘领域,HTMLParser是一个常用的工具,可以帮助我们从HTML源码中...

    xheditor-1.1.14

    说明:这个函数执行时返回的值为上传程序返回的msg变量,可能为字符串或者数组,若为字符串则直接代表url,若是数组,则必需包含一个url的变量,其它可由可开发者自定义 备注:1.0.0 beta2新添加 plugins:自定义...

    javascript过滤危险脚本方法

    下面是他们的字符串规则: 1、&lt;(script|link|style|iframe)(.|\n)*&lt;\/\1&gt;\s* 2、\s*on[a-z]+\s*=\s*(“[^”]+”|'[^’]+’|[^\s]+)\s*(?=&gt;) 3、\s*(href|src)\s*=\s*(“\s*(javascript|vbscript):[^”]+”|’\...

    freemarker总结

    有一种特殊的字符串称为raw字符串,被认为是纯文本,其中的\和{等不具有特殊含义,该类字符串在引号前面加r,下面是一个例子: ${r"/${data}"year""}屏幕输出结果为:/${data}"year" 转义 含义 ...

    jsp已配置好的fckeditor 2.4

    当用户在FCKeditor中编辑完内容并提交表单时,需要将富文本内容转换为HTML字符串,以便保存在数据库或其他存储介质中。这通常通过`FCKeditorAPI`的`GetHTML()`方法完成: ```jsp String editorContent = request....

    利用servlet和json生成easyUI图表

    1. **数据准备**:在Servlet中,你需要创建一个Java对象或集合来存储要展示的数据,然后使用Jackson或Gson库将这些对象转换为JSON字符串。例如,如果你有一个包含销售数据的对象列表,可以使用`ObjectMapper`进行...

    ZendFramework中文文档

    13.3. 从网页上获得Feed 13.4. RSS Feed的使用 13.5. Atom Feed的使用 13.6. 单个Atom条目的处理 13.7. 修改Feed和条目结构 13.8. 自定义Feed和条目类 14. Zend_Filter 14.1. 简介 14.1.1. 什么是过滤器...

    PHP手册2007整合中文版

    String 字符串处理函数 CLXII. Subversion 函数 CLXIII. Shockwave Flash Functions CLXIV. Swish Functions CLXV. Sybase Functions CLXVI. TCP Wrappers Functions CLXVII. Tidy Functions CLXVIII. Tokenizer ...

    PHP5 完整官方 中文教程

    Strings — String 字符串处理函数 SVN — Subversion 函数 SWF — Shockwave Flash Functions swish — Swish Functions Sybase — Sybase Functions TCP Wrappers — TCP Wrappers Functions tidy — Tidy ...

Global site tag (gtag.js) - Google Analytics