`
booby325
  • 浏览: 386506 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

java去除html tags

阅读更多
public static String regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>";  
 public static String regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>"; 
 public static String regEx_html = "<[^>]+>";
 
 public static Pattern p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);
 public static Pattern p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);
 public static Pattern p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);
 
 public static String getOptimizedData(String inputString) {
      if (inputString == null) {
           return inputString;
      }
  
      //stripping script tags whether the tag contains "\n" or "\r" or not.
      Matcher m_script = p_script.matcher(inputString);
      String htmlStr = m_script.replaceAll("");
 
      //stripping style tags whether the tag contains "\n" or "\r" or not.
      Matcher m_style = p_style.matcher(htmlStr);
      htmlStr = m_style.replaceAll("");
 
      //stripping html tags but continue to have the "\n" and "\r" in right place.
      Matcher m_html = p_html.matcher(htmlStr);
      htmlStr = m_html.replaceAll("");
 
      return htmlStr;
 }
 

 

分享到:
评论

相关推荐

    java实现国际化源码

    这里的`parameter`属性值应匹配资源bundle的完全限定类名,但去掉`.properties`扩展名。 现在,我们可以在Action类或者JSP页面中使用这些本地化字符串。在Action类中,可以使用`ActionContext`获取`Message...

    JAVA自定义标签例子

    在Java世界中,自定义标签(Custom Tags)是JSP(JavaServer Pages)技术的一个重要特性,它允许开发者创建可重用的组件,类似于HTML标签,但具备更强大的功能和灵活性。这种技术使得代码更加清晰,提高了开发效率,...

    java使用htmlparser提取网页纯文本例子

    \n\n在实际应用中,通常还需要进行一些额外的处理,例如去除重复的换行符、多余的空格,以及对链接、邮箱地址等特殊格式的处理,以便获得更干净的文本数据。这需要根据具体需求进行相应的代码优化。\n\n总的来说,...

    HTMLParser抽取Web网页正文信息.doc

    HTMLParser 是一个强大的Java库,专门用于解析HTML文档。它能够帮助开发者有效地提取网页中的主要内容,去除噪声,如导航条、广告和版权信息。在Web网页正文信息抽取中,HTMLParser扮演了关键角色。 首先,要使用...

    struts学习笔记

    同时,需要在JSP页面中导入相应的Taglib,如`&lt;%@taglib prefix="bean" uri="http://struts.apache.org/tags-bean"%&gt;`。 4. **Struts与JSTL结合**: Struts标签和JSTL标签可以协同工作,提供更强大的页面逻辑。例如...

    jsp定制标签库.pdf

    传统上,定制动作的实现仅限于Java类,这种方式不仅限制了参与者的范围,而且在生成复杂内容时,必须依赖`println()`方法输出HTML代码,而这正是JSP技术致力于改进的地方。 #### 二、标记文件:定制动作的新途径 ...

    JSTL标签所需要的tld文件

    **JSTL(JavaServer Pages Standard Tag Library)**是Java Web开发中的一种标准标签库,它为JSP页面提供了一套强大的标签集合,用于简化HTML和XML文档的编写。JSTL标签通常比纯Java脚本更加简洁、易读且易于维护。...

    fckedit编辑器

    现在的web.xml文件没有标签了,应该直接在jsp文件中使用:&lt;%@ taglib uri="http://fckeditor.net/tags-fckeditor" prefix="FCK" %&gt; 6. 映射: 上面文件中两个servlet的映射分别为:/editor/filemanager/browser/...

    cms后台管理

    一 Jeecms安装过程 ...&lt;id name="id" type="java.lang.Integer" column="id"&gt;&lt;generator class="identity"/&gt;&lt;/id&gt; &lt;property name="title" column="title" type="java.lang.String" not-null="true" /&gt; ...

    jstl 函数标签 资料

    JSTL(JavaServer Pages Standard Tag Library)是一个用于JSP的标准标签库,它提供了一系列的标签来简化JSP页面中的代码。在这些标签中,函数标签(Function Tags)是JSTL的重要组成部分,它们提供了对字符串操作、...

    J2EE中的struts2表单细节处理

    1. **Struts2自定义标签**: Struts2提供了一套丰富的标签库,`struts-tags`,简化了HTML表单的创建和处理。例如,`&lt;s:form&gt;`、`&lt;s:textfield&gt;`和`&lt;s:submit&gt;`等标签,它们不仅能够方便地绑定到Action类的属性,还...

Global site tag (gtag.js) - Google Analytics