一、写在前面的话
这篇文章主要介绍博客自动生成目录的功能,以及怎么来生成漂亮的目录。
为什么要有目录呢?一篇很长的文章,有了目录后就可以定位到想看的位置。这是非常方便的!
1、自动生成目录原理
1 |
public static List<String> Anchor = new ArrayList<String>(){{
|
01 |
public String htmlAnchor(String html) {
|
02 |
Document doc = Jsoup.parseBodyFragment(html);
|
03 |
Elements anchors = doc.select( "*" );
|
05 |
for (Element anchor : anchors){
|
06 |
String tagName = anchor.tagName().toLowerCase();
|
07 |
if (Anchor.contains(tagName) && anchor.hasText()) {
|
09 |
anchor.before( "<span id='OSC_" +tagName+ "_" +String.valueOf(i)+ "'></span>" );
|
12 |
return doc.body().html();
|
01 |
public String htmlContent(String html) {
|
02 |
StringBuffer content = new StringBuffer();
|
03 |
Document doc = Jsoup.parseBodyFragment(html);
|
04 |
Elements anchors = doc.select( "*" );
|
06 |
for (Element anchor : anchors) {
|
07 |
String tagName = anchor.tagName().toLowerCase();
|
08 |
if (Anchor.contains(tagName) && anchor.hasText()) {
|
10 |
content.append( "<li class='osc_" +tagName+ "'><a href='#OSC_" +tagName+ "_" +String.valueOf(i)+ "'>" +anchor.text()+ "</a></li>" );
|
13 |
return content.toString();
|
2、写OSChina博客的时候怎么自动生成呢?
(1)、可视化编辑器
设置每一段落的小标题,如上图标题1、标题2、标题3...,也可以在html代码中使用h1、h2、h3...标签
(2)、MarkDown编辑器
markdown编辑器,只要在标题的前面添加“#”,标题(h1~h6)可使用相应个数的#来生成,如下
1 |
### this is a level- 3 header ###
|
将生成 h3 标签
更多markdown语法 http://www.oschina.net/question/100267_75314
最后发表的时候别忘了把自动生成目录勾选为 是
3、怎么使生成的目录比较好看?
h1生成的目录是顶级目录,依次是h2、h3...
不同级别的标题使用不同的h标签,对应的markdown编辑器就是“#”号的个数,可视化编辑器就是“标题1”、“标题2”选项...
二、最后的话
返回到这篇博客的前面,目录是不是挺好看的呢
注:目前可视化编辑器和markdown编辑器只能生成到h5标签,h6无效, markdown预览的时候只到h3(预览由js解析,最终显示是由java解析的)。
转自:http://my.oschina.net/zino/blog/125689
分享到:
相关推荐
jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jarjsoup-...
**JSoup库与JSoup-Annotations** JSoup是一款强大的Java库,专为处理HTML文档而设计,它提供了方便的API,使得抓取和解析HTML变得简单易行。JSoup能够模拟浏览器的行为,理解和构建DOM树,进而允许开发者通过CSS...
Ajax-kotlin-headlessbrowser-selenium-jsoup-parser.zip,科特琳製_____,ajax代表异步javascript和xml。它是多种web技术的集合,包括html、css、json、xml和javascript。它用于创建动态网页,其中网页的小部分在不...
在IT行业中,网络爬虫和自动化测试经常需要模拟用户的登录行为,以便访问受保护的网页内容。...通过这种方式,开发者可以自动化获取并分析网站上的数据,为数据分析、内容监控或其他自动化任务提供便利。
基于java的开发源码-HTML解析器 jsoup.zip 基于java的开发源码-HTML解析器 jsoup.zip 基于java的开发源码-HTML解析器 jsoup.zip 基于java的开发源码-HTML解析器 jsoup.zip 基于java的开发源码-HTML解析器 jsoup.zip ...
此外,Jsoup还提供了文本提取、属性获取、链接处理等功能,使得解析和分析网页内容变得非常便捷。 在异步爬虫实现中,通常会用到Java的非阻塞I/O框架,如NIO(New IO)或更高级的Netty。这些框架允许爬虫并发地处理...
**jsoup库详解** ...在“jsoup-1.11.2.jar”文件中,封装了所有这些功能,而“jsoup-1.11.2.txt”文件则可能提供了关于这个版本的详细信息。开发者可以结合这两个资源,轻松地将jsoup集成到自己的Java项目中。
Android Web Scraping App using Jsoup Library I'll scrap here, the first portion of this page My expected output is like this screenshot. These data are not on a webview of predefined in the App. ...
commons-lang3-3.3.2、jsoup-1.13.1和JsoupXpath-0.3.2,要是实现JsoupXpath必须要加载依赖包commons-lang3-3.3.2、jsoup-1.13.1。
在jsoup 1.6.1版本中,我们可以看到这个库已经相当成熟,提供了丰富的功能和优化。以下是一些关于jsoup的关键知识点: 1. **HTML解析**:jsoup的核心能力在于它强大的HTML解析机制。它使用了名为"Jsoup Parser"的...
至于文件"libs",这通常指的是包含库文件的目录,其中"jsoup-1.11.2.jar"和"JsoupXpath-0.3.2"是Java的库文件,需要添加到项目的类路径(ClassPath)中才能在Java程序中使用。 总的来说,Jsoup和JsoupXpath为Java...
2. **jsoup-1.11.2-sources.jar**:这个文件包含了jsoup源代码,对于开发者来说,这是一个宝贵的资源。通过查看源代码,你可以深入了解jsoup的工作原理,以及如何实现特定的解析和操作功能。 3. **jsoup-1.11.2-...
为了深入了解并使用这个项目,你可以查看解压后的"website-parser-with-jsoup-master"文件夹中的源代码,包括主类、配置文件以及可能存在的样例数据。此外,学习Jsoup的官方文档和相关教程,将有助于你更好地理解和...
不知道官方作者为什么不加上代理功能,此版本正好加上了代理IP功能使用方法如:Jsoup.connect(urls).proxy(Proxy.Type.HTTP, "ip地址", 8080)
- **jsoup-1.13.1-sources.jar**:包含了JSoup库的源代码,便于开发者查看和学习内部实现,对于调试和自定义功能非常有用。 - **jsoup-1.13.1-javadoc.jar**:包含了JSoup的API文档,提供了详细的类和方法描述,是...
赠送jar包:jsoup-1.14.3.jar; 赠送原API文档:jsoup-1.14.3-javadoc.jar; 赠送源代码:jsoup-1.14.3-sources.jar; 赠送Maven依赖信息文件:jsoup-1.14.3.pom; 包含翻译后的API文档:jsoup-1.14.3-javadoc-API...
- **jsoup-1.10.2.jar**:这是Jsoup的核心库文件,用于在项目中引入和使用Jsoup的功能。 - **jsoup-1.10.2-sources.jar**:包含了Jsoup的源代码,可供开发者查看和学习内部实现。 在实际开发中,Jsoup广泛应用于...
jsoup-1.11.2.jar JsoupXpath-0.3.2.jar jsoup-1.11.2-sources.jar jsoup-1.11.2-javadoc.jar 解析读取xml或html文档的工具类