`

使用jsoup 对HTML 文档清理防止脚本注入

 
阅读更多

 

jsoup 在提供强大的 API 同时,人性化方面也做得非常好。在做网站的时候,经常会提供用户评论的功能。有些用户比较淘气,会搞一些脚本到评论内容中,而这些脚本可能会破坏整个页面的行为,更严重的是获取一些机要信息,例如 XSS 跨站点攻击之类的。

jsoup 对这方面的支持非常强大,使用非常简单。看看下面这段代码:

public static String getTrueValue(String key){

String unsafe = key; 

String safe = Jsoup.clean(unsafe, Whitelist.basic()); 

return safe ;

}


分享到:
评论

相关推荐

    android使用jsoup 解析html文件

    - 在处理网络数据时,确保遵循安全实践,如使用HTTPS和防止跨站脚本攻击(XSS)。 - `jsoup`并不支持完整的DOM解析,对于复杂的DOM操作,可能需要考虑其他库,如`Jsoup`与`jsoup-dom`结合使用。 总结,`jsoup`为...

    使用Jsoup对Html文件解析

    在本文中,我们将深入探讨如何使用Jsoup解析HTML文件,并进一步将解析的数据导出到Excel表格。 首先,我们需要理解Jsoup的基本用法。Jsoup的核心在于`Connection`和`Document`对象。`Connection`用于建立与网页的...

    使用 jsoup 对 HTML 文档进行解析和操作

    **使用 jsoup 对 HTML 文档进行解析和操作** 在网页抓取、数据提取或网页自动化过程中,处理HTML文档是一项常见的任务。Jsoup 是一个用Java编写的库,它提供了非常方便的方法来解析、操作和提取HTML文档中的数据。...

    使用Jsoup解析html网页

    6. **节点操作**:Jsoup允许我们对元素进行增删改查的操作,如添加新的元素、删除元素、更新属性值或替换元素内容。 ### 示例代码 下面是一个简单的示例,展示了如何使用Jsoup连接到一个网页,选择特定元素并提取...

    jsoup中文帮助文档

    为了避免跨站脚本(XSS)攻击,可以使用 `Jsoup.clean()` 方法清洗不受信任的 HTML。这个过程会移除潜在的恶意内容,同时保持 HTML 结构的完整性。 ```java String untrustedHtml = "<script>alert('XSS');...

    jsoup1.10.3包和jsoupApi帮助文档

    **jsoup1.10.3包和jsoupApi帮助文档** Jsoup是一个非常流行的Java库,用于处理和解析HTML。在IT行业中,特别是在Web爬虫和数据抓取领域,jsoup扮演着至关重要的角色。jsoup1.10.3是这个库的一个稳定版本,提供了...

    SpringBoot整合XssFilter,Jsoup等实现请求参数的过滤,处理Xss攻击及sql注入.zip

    Springboot中会使用FilterRegistrationBean来注册Filter,Filter是Servlet规范里面的,属于容器范围,Springboot中没有web.xml,那Springboot中,不用管Filter是如何交给Ser...SpringBoot整合XssFilter,Jsoup等实现...

    JsoupAPI(jsoup帮助文档)

    此外,Jsoup对内存和CPU使用进行了优化,使其适合处理大型HTML文档。 总之,Jsoup API是处理和解析HTML的强大工具,其易用性和灵活性使其在Web爬虫、网页数据提取和HTML文档操作中广泛应用。结合CSS选择器的便利性...

    jsoup和jtidy 对html操作,将不规范的html转换为xhtml

    1. 首先,使用jsoup解析HTML文档,它会自动修复一些基本的HTML错误。 2. 然后,如果需要进一步规范化,可以将jsoup处理后的结果传递给Jtidy,Jtidy将不规范的HTML转换为符合XHTML标准的文档。 3. 最后,根据需求,...

    Jsoup解析html中文文档

    在处理不可信来源的HTML时,jsoup提供了安全的清理功能,帮助防止XSS攻击: ```java String html = "<p>Hello, ('XSS')>world!</p>"; Cleaner cleaner = new Cleaner(new Whitelist().addTags("p", "b")); ...

    Android使用Jsoup技术解析HTML

    **Android使用Jsoup技术解析HTML** Jsoup是一个Java库,专为处理真实世界的HTML而设计。在Android开发中,我们经常需要从网页抓取数据,比如解析新闻标题、获取图片链接或者提取用户评论等。Jsoup提供了一种简单、...

    JSOUP的中文文档

    - XSS防护:JSOUP可以消除不受信任的HTML,以防止跨站脚本攻击。`Jsoup.clean(inputHtml, Whitelist)`方法可以清理输入的HTML,只保留指定的安全标签和属性。 7. **URL处理**: - JSOUP能够处理相对和绝对URL,...

    Jsoup操作解析Html文件

    至于提供的"新建文件夹",可能包含了一些示例代码或HTML文件,用于演示如何使用Jsoup进行操作。在实际项目中,可以参考这些文件来加深理解和应用Jsoup。记得,通过阅读和实践这些示例,可以更好地掌握Jsoup的用法,...

    jsoup 中文 api 文档

    2. **解析(Parse)**: 使用 `Jsoup.parse()` 可以将 HTML 字符串或文件解析为 `Document` 对象,这是 jsoup 中的根节点,代表整个 HTML 结构。 **二、文档对象(Document)** 1. **元素选择器(Selector)**: `...

    Jsoup源码以及chm文件

    7. 安全性:Jsoup遵循同源策略,以防止跨站脚本攻击(XSS)。在处理用户输入时,可以使用Jsoup进行安全的HTML转义。 关于“chm文件”,它可能包含了Jsoup的API参考、使用示例和最佳实践。通过这个文档,你可以快速...

    jsoup解析html所需包1.7.3

    2. **jsoup-1.7.3-javadoc.jar**:这个文件包含了JSoup库的Java文档,是开发者理解和使用JSoup的重要参考资料。通过查看Javadoc,开发者可以了解每个类、接口和方法的详细信息,包括参数、返回值、异常等,有助于...

    jsoup-1.14.3-API文档-中文版.zip

    赠送jar包:jsoup-1.14.3.jar;...使用方法:解压翻译后的API文档,用浏览器打开“index.html”文件,即可纵览文档内容。 人性化翻译,文档中的代码和结构保持不变,注释和说明精准翻译,请放心使用。

    jsoupAPI解析html

    提供的文件`jsoup-1.7.2_API.CHM`和`jsoup1.6.1全.zip`包含了不同版本的jsoup API文档和库文件。CHM文件是Windows帮助文档格式,可以直接查看API详情。zip文件则包含了完整的源码和库文件,方便进一步学习和开发。 ...

    Jsoup解析html

    6. 清理HTML:Jsoup还有一个强大的功能是清洗不安全的HTML,它可以移除潜在的恶意脚本,确保在插入用户输入时的安全性。 7. 数据提取:在Web爬虫或网页数据提取场景中,Jsoup非常有用。例如,可以提取表格数据、...

Global site tag (gtag.js) - Google Analytics