网上搜的方法。试了试还挺好用。自己稍微修改了下。。对不起啦原作者
/*** * * @param content 内容String * @param p >0 .位数 * @return @tale: * @purpose:得到相应位数已过滤html、script、style 标签的内容 内容结尾 为... * @author:Simon - 赵振明 * @CreationTime:Aug 25, 201011:07:06 AM */ public static String getNoHTMLString(String content,int p){ if(null==content) return ""; if(0==p) return ""; java.util.regex.Pattern p_script; java.util.regex.Matcher m_script; java.util.regex.Pattern p_style; java.util.regex.Matcher m_style; java.util.regex.Pattern p_html; java.util.regex.Matcher m_html; try { String regEx_script = "<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>"; //定义script的正则表达式{或<script[^>]*?>[\\s\\S]*?<\\/script> } String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>"; //定义style的正则表达式{或<style[^>]*?>[\\s\\S]*?<\\/style> } String regEx_html = "<[^>]+>"; //定义HTML标签的正则表达式 p_script = Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE); m_script = p_script.matcher(content); content = m_script.replaceAll(""); //过滤script标签 p_style = Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE); m_style = p_style.matcher(content); content = m_style.replaceAll(""); //过滤style标签 p_html = Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE); m_html = p_html.matcher(content); content = m_html.replaceAll(""); //过滤html标签 }catch(Exception e) { return ""; } if(content.length()>p){ content = content.substring(0, p)+"..."; }else{ content = content + "..."; } return content; }
转自:http://hi.baidu.com/minglove1986/blog/item/7232497a4d0544e32e73b38f.html
您还没有登录,请您登录后再发表评论
"Java 中过滤Html标签" Java 中过滤Html标签是指在Java语言中删除或替换HTML标签的过程。...使用正则表达式过滤Html标签是Java中的一种常见技术,可以用来删除恶意代码、防止XSS攻击、显示纯文本等。
通过编写特定的正则表达式来匹配HTML、CSS和JavaScript标签,并使用`Matcher`类的`replaceAll()`方法将其替换为空字符串或其他指定字符串,从而实现对这些标签的过滤。 #### 示例代码解析 以下代码展示了如何使用...
HTML代码过滤技术是一种网络安全与网页内容管理的重要手段。在互联网环境中,HTML(HyperText Markup Language)是构建网页的基础,但同时也可能被恶意用户利用来执行有害操作,如注入跨站脚本(XSS)、钓鱼攻击等。...
在这个例子中,`filterHtml`方法首先使用字符串替换转义了HTML特殊字符,然后使用正则表达式匹配并删除了`<script>`、`<style>`和`<iframe>`这三个常见的危险标签。最后,通过`main`方法调用`filterHtml`来演示过滤...
本实例的代码封装在FilterHtmlUtil类中,提供了一个静态方法Html2Text用于将传入的包含HTML标签的字符串,过滤标签后返回纯文本内容。这个工具类可以在需要从HTML内容中提取文本的任何Java程序中使用。 总结来说,...
Java实现从Html文本中提取纯文本的方法 在本文中,我们将介绍Java实现从Html文本中提取纯文本的方法。提取纯文本是指从Html文档中去掉所有的Html标签,只保留原始的文本内容。这种技术在实际应用中非常有用,例如从...
这个jar包包含了一系列预定义的过滤规则,可以识别并移除或者转义用户提交的HTML字符串中的潜在危险元素,如`<script>`、`<iframe>`、`<style>`等,这些元素如果未经处理就展示在页面上,可能会执行恶意的JavaScript...
易语言提供了多种字符串处理函数,例如“字符串删除前导空白”、“字符串删除尾部空白”以及“字符串替换”,可以用来删除或替换多余的空格和换行符,使得文本更加整洁。 在实现这个功能时,一般会遵循以下步骤: 1...
- **对表单绑定的字符串类型进行XSS处理**:确保所有从用户处收集的数据都经过适当的转义或过滤。 - **对JSON字符串数据进行XSS处理**:对于通过API接收的数据,同样需要进行严格的验证和转义。 - **提供路由和控制...
##### 3.1 和字符串相关的类:String, StringBuilder, StringBuffer - **String**: 不可变的字符序列,用于表示文本。 - **StringBuilder**: 可变的字符序列,线程不安全,效率较高。 - **StringBuffer**: 可变的...
HTMLParser 是一个用于解析HTML文档的Java库,它允许开发者以结构化的方式处理网页内容,例如提取特定元素、过滤不需要的标签等。在Web抓取或数据挖掘领域,HTMLParser是一个常用的工具,可以帮助我们从HTML源码中...
说明:这个函数执行时返回的值为上传程序返回的msg变量,可能为字符串或者数组,若为字符串则直接代表url,若是数组,则必需包含一个url的变量,其它可由可开发者自定义 备注:1.0.0 beta2新添加 plugins:自定义...
下面是他们的字符串规则: 1、<(script|link|style|iframe)(.|\n)*<\/\1>\s* 2、\s*on[a-z]+\s*=\s*(“[^”]+”|'[^’]+’|[^\s]+)\s*(?=>) 3、\s*(href|src)\s*=\s*(“\s*(javascript|vbscript):[^”]+”|’\...
有一种特殊的字符串称为raw字符串,被认为是纯文本,其中的\和{等不具有特殊含义,该类字符串在引号前面加r,下面是一个例子: ${r"/${data}"year""}屏幕输出结果为:/${data}"year" 转义 含义 ...
当用户在FCKeditor中编辑完内容并提交表单时,需要将富文本内容转换为HTML字符串,以便保存在数据库或其他存储介质中。这通常通过`FCKeditorAPI`的`GetHTML()`方法完成: ```jsp String editorContent = request....
1. **数据准备**:在Servlet中,你需要创建一个Java对象或集合来存储要展示的数据,然后使用Jackson或Gson库将这些对象转换为JSON字符串。例如,如果你有一个包含销售数据的对象列表,可以使用`ObjectMapper`进行...
13.3. 从网页上获得Feed 13.4. RSS Feed的使用 13.5. Atom Feed的使用 13.6. 单个Atom条目的处理 13.7. 修改Feed和条目结构 13.8. 自定义Feed和条目类 14. Zend_Filter 14.1. 简介 14.1.1. 什么是过滤器...
String 字符串处理函数 CLXII. Subversion 函数 CLXIII. Shockwave Flash Functions CLXIV. Swish Functions CLXV. Sybase Functions CLXVI. TCP Wrappers Functions CLXVII. Tidy Functions CLXVIII. Tokenizer ...
Strings — String 字符串处理函数 SVN — Subversion 函数 SWF — Shockwave Flash Functions swish — Swish Functions Sybase — Sybase Functions TCP Wrappers — TCP Wrappers Functions tidy — Tidy ...
相关推荐
"Java 中过滤Html标签" Java 中过滤Html标签是指在Java语言中删除或替换HTML标签的过程。...使用正则表达式过滤Html标签是Java中的一种常见技术,可以用来删除恶意代码、防止XSS攻击、显示纯文本等。
通过编写特定的正则表达式来匹配HTML、CSS和JavaScript标签,并使用`Matcher`类的`replaceAll()`方法将其替换为空字符串或其他指定字符串,从而实现对这些标签的过滤。 #### 示例代码解析 以下代码展示了如何使用...
HTML代码过滤技术是一种网络安全与网页内容管理的重要手段。在互联网环境中,HTML(HyperText Markup Language)是构建网页的基础,但同时也可能被恶意用户利用来执行有害操作,如注入跨站脚本(XSS)、钓鱼攻击等。...
在这个例子中,`filterHtml`方法首先使用字符串替换转义了HTML特殊字符,然后使用正则表达式匹配并删除了`<script>`、`<style>`和`<iframe>`这三个常见的危险标签。最后,通过`main`方法调用`filterHtml`来演示过滤...
本实例的代码封装在FilterHtmlUtil类中,提供了一个静态方法Html2Text用于将传入的包含HTML标签的字符串,过滤标签后返回纯文本内容。这个工具类可以在需要从HTML内容中提取文本的任何Java程序中使用。 总结来说,...
Java实现从Html文本中提取纯文本的方法 在本文中,我们将介绍Java实现从Html文本中提取纯文本的方法。提取纯文本是指从Html文档中去掉所有的Html标签,只保留原始的文本内容。这种技术在实际应用中非常有用,例如从...
这个jar包包含了一系列预定义的过滤规则,可以识别并移除或者转义用户提交的HTML字符串中的潜在危险元素,如`<script>`、`<iframe>`、`<style>`等,这些元素如果未经处理就展示在页面上,可能会执行恶意的JavaScript...
易语言提供了多种字符串处理函数,例如“字符串删除前导空白”、“字符串删除尾部空白”以及“字符串替换”,可以用来删除或替换多余的空格和换行符,使得文本更加整洁。 在实现这个功能时,一般会遵循以下步骤: 1...
- **对表单绑定的字符串类型进行XSS处理**:确保所有从用户处收集的数据都经过适当的转义或过滤。 - **对JSON字符串数据进行XSS处理**:对于通过API接收的数据,同样需要进行严格的验证和转义。 - **提供路由和控制...
##### 3.1 和字符串相关的类:String, StringBuilder, StringBuffer - **String**: 不可变的字符序列,用于表示文本。 - **StringBuilder**: 可变的字符序列,线程不安全,效率较高。 - **StringBuffer**: 可变的...
HTMLParser 是一个用于解析HTML文档的Java库,它允许开发者以结构化的方式处理网页内容,例如提取特定元素、过滤不需要的标签等。在Web抓取或数据挖掘领域,HTMLParser是一个常用的工具,可以帮助我们从HTML源码中...
说明:这个函数执行时返回的值为上传程序返回的msg变量,可能为字符串或者数组,若为字符串则直接代表url,若是数组,则必需包含一个url的变量,其它可由可开发者自定义 备注:1.0.0 beta2新添加 plugins:自定义...
下面是他们的字符串规则: 1、<(script|link|style|iframe)(.|\n)*<\/\1>\s* 2、\s*on[a-z]+\s*=\s*(“[^”]+”|'[^’]+’|[^\s]+)\s*(?=>) 3、\s*(href|src)\s*=\s*(“\s*(javascript|vbscript):[^”]+”|’\...
有一种特殊的字符串称为raw字符串,被认为是纯文本,其中的\和{等不具有特殊含义,该类字符串在引号前面加r,下面是一个例子: ${r"/${data}"year""}屏幕输出结果为:/${data}"year" 转义 含义 ...
当用户在FCKeditor中编辑完内容并提交表单时,需要将富文本内容转换为HTML字符串,以便保存在数据库或其他存储介质中。这通常通过`FCKeditorAPI`的`GetHTML()`方法完成: ```jsp String editorContent = request....
1. **数据准备**:在Servlet中,你需要创建一个Java对象或集合来存储要展示的数据,然后使用Jackson或Gson库将这些对象转换为JSON字符串。例如,如果你有一个包含销售数据的对象列表,可以使用`ObjectMapper`进行...
13.3. 从网页上获得Feed 13.4. RSS Feed的使用 13.5. Atom Feed的使用 13.6. 单个Atom条目的处理 13.7. 修改Feed和条目结构 13.8. 自定义Feed和条目类 14. Zend_Filter 14.1. 简介 14.1.1. 什么是过滤器...
String 字符串处理函数 CLXII. Subversion 函数 CLXIII. Shockwave Flash Functions CLXIV. Swish Functions CLXV. Sybase Functions CLXVI. TCP Wrappers Functions CLXVII. Tidy Functions CLXVIII. Tokenizer ...
Strings — String 字符串处理函数 SVN — Subversion 函数 SWF — Shockwave Flash Functions swish — Swish Functions Sybase — Sybase Functions TCP Wrappers — TCP Wrappers Functions tidy — Tidy ...