`
jiangjingxiaoxuan
  • 浏览: 33706 次
  • 性别: Icon_minigender_2
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

去掉内容中的HTML代码

阅读更多

以下代码会将内容中的全部HTML代码删除:

参数input为所要进行操作的字符串,参数length为字符串的长度,本人调用此类FilterHTML中的方法splitAndFilterString时,一定要事先对字符串进行空判断,否则将会报异常!

public class FilterHTML {
 public static String splitAndFilterString(String input, int length) {
  if (input == null || input.trim().equals("")) {
   return "";
  }
  // 去掉所有html元素,
  String str = input.replaceAll("\\&[a-zA-Z]{1,10};", "").replaceAll(
    "<[^>]*>", "");
  str = str.replaceAll("[(/>)<]", "");
  int len = str.length();
  if (len <= length) {
   return str;
  } else {
   str = str.substring(0, length);
   str += "......";
  }
  return str;
 }
}

分享到:
评论

相关推荐

    去掉Html页中的标签代码

    描述中的“去除Html页中标签的代码,用法很简单,很实用”表明这是一个简单易用的函数,能够快速有效地从HTML字符串中移除所有相关的HTML标签,生成一个只包含文本内容的结果。 标签“去掉”、“Html”和“标签”...

    去除HTML标记的代码

    这段ASP代码提供了一种简单有效的方法来去除HTML标签并对文本长度进行限制,适合应用于需要处理用户输入内容的场景。通过正则表达式来识别和移除HTML标签可以确保不会保留任何格式化信息,从而避免了潜在的安全问题...

    解析字符串去除HTML代码,保留文字,图片,视频

    用正则表达式,去除字符串中的HTML代码并保留文字,图片,视频。

    C# 去除所有HTML代码

    ### C#去除所有HTML代码的方法解析 在处理Web页面或者从HTML文档中提取纯文本时,经常需要将HTML标签及特殊字符实体去除,以便获得干净的文本内容。本篇文章将详细解析一个用C#编写的函数,该函数可以有效地去除...

    去除html标记,读取html文件源代码

    这个任务涉及到“去除html标记”这一知识点,它主要是通过解析HTML源代码并移除所有的标签,只保留文本内容。在本场景中,提供的源代码可能是一个解决方案,用于读取HTML文件并去除其中的HTML标记。 首先,我们来...

    html5去掉图片背景颜色

    ### HTML5去掉图片背景颜色 在HTML5中,去除图片背景颜色主要涉及到Canvas元素的应用以及JavaScript的编程技术。本文将详细介绍如何利用HTML5 Canvas技术来实现去除图片背景颜色的效果。 #### 一、HTML5 Canvas...

    去除编辑器样式中HTML

    在网页开发过程中,我们经常需要处理富文本编辑器生成的内容,这些内容可能包含了各种HTML标签和样式,有时候为了保持页面的统一性和整洁性,我们需要去除编辑器生成的HTML样式。这个过程涉及到HTML解析、DOM操作...

    java过滤html代码

    在Java编程中,"java过滤html代码"是一个常见的需求,主要目的是为了安全考虑,比如防止XSS(跨站脚本攻击)或者为了提取纯文本内容。这个任务可以通过使用正则表达式来实现,正如描述中提到的那样。下面我们将详细...

    html代码优化原理与技巧

    通过上述的HTML代码优化原理与技巧,我们可以显著提升网页的加载速度和用户体验,同时也有助于网站在搜索引擎中的排名。在实际开发过程中,应结合具体情况灵活运用这些方法,以实现最佳的优化效果。

    去掉内容里的html标签

    这段代码中,`replaceAll`方法使用正则表达式`\\*?\\&gt;`匹配任何开始于`并结束于`&gt;`的字符串,也就是HTML标签,并将它们替换为空字符串,从而达到去HTML化的效果。`.*?`是懒惰匹配,防止贪婪匹配导致整个HTML文档被一...

    HTML代码过滤技术

    HTML代码过滤技术是一种网络安全与网页内容管理的重要手段。在互联网环境中,HTML(HyperText Markup Language)是构建网页的基础,但同时也可能被恶意用户利用来执行有害操作,如注入跨站脚本(XSS)、钓鱼攻击等。...

    Java html代码解析

    在IT领域,尤其是在Web开发和数据处理中,Java HTML代码解析是一个重要的技术环节。这个话题主要涉及如何使用Java处理HTML文档,提取其中的数据或者进行内容分析。本文将深入探讨Java库Jsoup及其在HTML解析中的应用...

    取新闻网页内容去掉html标记和空格

    本主题聚焦于如何利用C++编程语言实现这一目标,去除HTML标记和空格,使得获取的网页内容更加整洁且易于处理。以下是关于这个过程的详细知识点: 1. **HTML解析**:HTML(超文本标记语言)是用于构建网页结构的标准...

    java代码-正则去除HTML代码中的A标签

    本话题主要关注如何使用Java和正则表达式来移除HTML代码中的A标签,这些A标签通常用于创建超链接。 A标签在HTML中用于定义超链接,其基本结构如下: ```html 链接文本 ``` 在Java中,我们可以使用`java.util....

    html代码大全

    以上HTML代码涵盖了网页设计中的基础与进阶技术,熟练掌握这些代码将有助于开发者构建功能丰富的网页。然而,随着Web标准的发展,如HTML5和CSS3的普及,一些旧的HTML元素和属性已不再推荐使用,开发者应关注现代Web...

    asp中去掉所有HTML标记得到纯文本代码

    asp中去掉所有HTML标记得到纯文本代码,并截取字符串。适用于做企业网站时,首页显示公司简介的一部分内容用...

    html转换xml代码

    - 使用`OutputStreamWriter`将转换后的HTML内容写入到临时文件中。 2. **Tidy参数配置**: - `setXmlOut(true)`:设置输出格式为XML。 - `setDropFontTags(true)`:移除所有`&lt;font&gt;`标签。 - `...

    php过滤危险html代码

    通过上述内容的学习,我们可以了解到如何使用PHP编写一个简单的过滤器函数来过滤潜在的恶意HTML代码。这种过滤方法不仅可以提高网站的安全性,还能确保页面布局的稳定性。在实际应用中,可以根据具体需求调整正则...

    好用清除html的jquery插件

    标题中的“好用清除html的jquery插件”指的是一个jQuery扩展,它的主要功能是去除HTML代码中的冗余或不需要的元素,以保持内容的整洁和纯净。这种插件对于处理用户输入的数据、显示干净的文本或者优化网页性能等方面...

Global site tag (gtag.js) - Google Analytics