`
shuzheng5201314
  • 浏览: 203291 次
  • 来自: 北京
社区版块
存档分类
最新评论

replaceALL方法的对HTML的处理

 
阅读更多

 

 

经常需要从网络上抓取一些HTML信息,然后就需要处理HTML为纯文本格式

more="<html> <body>asdf<br> sadfasdf</body></html>";

 more = more.replaceAll("<(.*?)>", " ");//清除所有HTML标签
 more = more.replaceAll(" +", "");//替换所有连续的空格为一个空格
 more = more.replaceAll("\r", "");
 more = more.replaceAll("\n", "");//将ASCII所有换行回车符去掉

现在的more就是一个纯文本格式的字符串了

分享到:
评论

相关推荐

    jQuery中replaceAll()方法用法实例

    在jQuery库中,`replaceAll()`方法是一个非常实用的函数,它允许我们用匹配的DOM元素或HTML字符串替换现有的DOM元素。这个方法对于动态更新页面内容和实现复杂的DOM操作非常有用。接下来,我们将深入探讨`replaceAll...

    java过滤html代码

    当然,这种方法并不是万能的,它可能无法处理复杂的HTML结构,例如嵌套的标签、属性、注释等。对于更复杂的情况,可以使用专门处理HTML的库,如Jsoup,它可以解析和操作HTML文档,提供更安全和强大的过滤功能。 ...

    Java中转义字符反斜杠\的代替方法及repalceAll内涵解析

    Java中转义字符反斜杠的代替方法及repalceAll内涵解析 ...Java中转义字符反斜杠的代替方法需要根据不同的情况选择合适的方法,例如使用StringEscapeUtils工具类或replaceAll方法,以便正确地处理字符串转义问题。

    java html串转换成文本串

    另外,如果你的项目中不允许引入外部库,也可以使用Java的标准库`javax.swing.text.html.parser.ParserDelegator`,但这需要对HTML解析器有更深入的理解,使用起来相对复杂。 总的来说,Java中将HTML字符串转换为...

    去掉所有的html标签

    在给定的代码片段中,`stripTags`方法接受一个名为`HTMLString`的字符串参数,该参数包含了待处理的HTML文本。此方法的目标是移除这个字符串中的所有HTML标签,并返回一个只包含文本内容的新字符串。 #### 正则...

    jsp动态生成html 3种方法

    该方法的基本思想是预先准备一个HTML模板文件,然后在JSP页面中读取这个模板文件,并利用字符串替换功能将模板中的占位符替换成实际的内容,最后将处理后的字符串写入一个新的HTML文件中。 **步骤详解:** 1. **...

    去掉内容里的html标签

    学习和掌握这些方法,可以帮助我们更好地处理HTML文本,提高数据处理的效率和准确性。而`TextHtml.java`这个文件名可能是该博客提供的一个示例代码文件,用于演示如何去掉HTML标签的具体实现。在实际操作中,可以...

    Java 中 过滤Html标签

    // 异常处理 } return textStr; } } ``` 这个类提供了一个静态方法FilterHtmlText,输入一个含有Html标签的字符串,输出一个不含Html标签的字符串。 使用正则表达式过滤Html标签是Java中的一种常见技术,可以...

    Java生成HTML网页代码,希望对大家有帮助

    - **字符串操作**:`replaceAll`方法用于全局替换字符串中的匹配模式,是动态生成HTML时非常有用的工具。 - **文件I/O操作**:熟练掌握`FileInputStream`和`FileOutputStream`的使用,对于读写文件至关重要。 - **...

    Java中替换HTML标签的方法代码

    总的来说,Java中的`replaceAll()`方法是处理HTML标签的基础手段,而更高级的HTML处理通常需要借助专门的解析库。了解这些基础技巧对于任何Java开发者来说都是有益的,特别是在处理与HTML相关的数据时。

    JAVA实现html转义字符及css清除_.docx

    在Web开发中,经常需要处理用户提交的数据,为了避免XSS攻击等问题,通常需要对这些数据进行一定的处理,比如转义HTML特殊字符、清除HTML标签以及从CSS样式中提取有用的信息等。本文将详细介绍如何使用Java来实现...

    Java 语言实现清除带 html 标签的内容方法

    需要注意的是,这两个方法都较为基础,可能无法处理复杂的HTML结构,如嵌套标签、属性等。对于更复杂的情况,推荐使用成熟的库如 Jsoup,它提供了更强大的解析和清洗HTML的功能。 总结来说,Java中清除HTML标签的...

    JAVA过滤标签实现将html内容转换为文本的方法示例

    4. 使用halfTag变量来标记特殊的html标签:在将html内容转换为文本时,需要对一些特殊的html标签进行特殊处理,例如img标签、table标签等。可以使用halfTag变量来标记这些特殊的html标签,并对其进行特殊处理。 5. ...

    IE.JS解决IE兼容性问题方法汇总

    它的核心目标是让这些老旧版本的IE能够更好地遵循W3C的标准,提升对CSS2、CSS3选择器的支持,并修复HTML和CSS的一些常见问题。特别是对于透明PNG图像的显示,在IE5和IE6中,这是一个显著的问题,因为这些浏览器默认...

    过滤HTML元素字符

    这主要涉及到对用户输入的数据进行清理和安全处理,以防止跨站脚本(XSS)攻击和其他潜在的安全威胁。本文将深入探讨如何过滤HTML元素字符,以及在Java中实现这一功能的方法。 首先,理解HTML过滤的必要性至关重要...

    将jsp转化为静态的html文件输出

    在这个示例中,我们首先定义了一些变量,如标题、内容和编辑者等,然后读取了一个模板文件 `template.htm` 并将其内容替换为具体的值,最后将处理后的 HTML 内容保存为一个新的 HTML 文件。 ##### 2. 模板文件 `...

    个人搜索引擎开发的三种高亮显示的方法小结

    这种方法不仅能够处理复杂的查询,还支持对多个字段进行高亮,更加灵活和高效。 ### 3. 结合JSP页面动态生成高亮显示 在Web应用中,高亮显示往往需要与前端页面结合,以动态展示高亮结果。这里提到了使用JSP页面来...

    java百度编辑器提交过滤标签方法

    通过编写特定的正则表达式来匹配HTML、CSS和JavaScript标签,并使用`Matcher`类的`replaceAll()`方法将其替换为空字符串或其他指定字符串,从而实现对这些标签的过滤。 #### 示例代码解析 以下代码展示了如何使用...

    javascript常用方法

    - `HtmlEncode(text)`:对字符串中的特殊字符进行转义,防止HTML注入。 2. 正则表达式: 在上述的`replaceAll`和`trim`函数中,正则表达式被用来匹配和替换特定的字符或模式。例如,`/\s+/`匹配一个或多个连续的...

    jQuery文档处理.

    4. 替换元素:`replaceWith()`和`replaceAll()`可以实现元素间的替换。 三、属性操作(Attribute Manipulation) 通过`attr()`和`removeAttr()`,我们可以轻松地获取或设置元素的属性值。例如,`$('img').attr('src...

Global site tag (gtag.js) - Google Analytics