本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
fantaxy025025 - johnsmith9th
- zysnba
- xiangjie88
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wy_19921005
- vipbooks
- benladeng5225
- e_e
- wallimn
- javashop
- ranbuijj
- fantaxy025025
- jickcai
- zw7534313
- qepwqnp
- 解宜然
- ssydxa219
- zysnba
- sichunli_030
- sam123456gz
- 龙儿筝
- arpenker
- tanling8334
- kaizi1992
- gaojingsong
- xpenxpen
- jh108020
- wiseboyloves
- ganxueyun
- xyuma
- xiangjie88
- wangchen.ily
- Jameslyy
- luxurioust
- lemonhandsome
- mengjichen
- jbosscn
- zxq_2017
- lzyfn123
- nychen2000
- forestqqqq
- wjianwei666
- ajinn
- zhanjia
- Xeden
- hanbaohong
- java-007
- 喧嚣求静
- kingwell.leng
- mwhgJava
- lich0079
最新文章列表
使用jsoup去解析历史在今天的html内容
package com.test;
import java.net.URL;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
/**
*@Author:liangjilong
...
java操作html字符串
业务描述:在我们系统中要这样一个需求,我们会将html当作字符串保存在数据库中,然后再后期通过Java需要操作这个html比如增加一个文件框,改变其结构,添加事件。
解决方案:jsoup Java HTML解析器
使用方法:
1.导入jar包。可以使用maven帮你下载这个jar包和源码
<dependency>
<groupId>org.jsoup</g ...
使用 jsoup 对 HTML 文档进行解析和操作
来源:https://www.ibm.com/developerworks/cn/java/j-lo-jsouphtml/
jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。本文主要介绍如何使用 jsoup 来进行常用的 HTML ...
JAVA调用CSDN接口发博文
使用用户名密码登录以获取cookies,随后使用获得的cookies就可以进行诸如发博文等任意操作了。
import java.util.HashMap;
import java.util.Map;
import org.jsoup.Connection;
import org.jsoup.Connection.Method;
import org.jsoup.Connect ...
使用JSoup+CSSPath采集和讯网人物信息
使用JSoup+CSSPath采集和讯网人物信息
代码见github
模型类:
public class Person {
private String name;
//基本信息
private Map<String, String> basicInfos;
//教育经历
List<String> ...
Jsoup解析HTML代码标签与属性
package com.app.jsoup;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
/**
*@Author:liangjilong
*@Date:2013-8 ...
使用jsoup解析http/https协议网页内容通用方法
import java.net.MalformedURLException;
import java.net.URL;
import java.security.SecureRandom;
import java.security.cert.CertificateException;
import java.security.cert.X509Certificate;
import ja ...
Dom4j组装XML,Jsoup解析XML相互用
package com.app.duapp;
import java.io.BufferedWriter;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStreamWriter;
impor ...
Spring quartz定时结合Jsoup和Dom4j使用解析百度地图API
<?xml version="1.0" encoding="utf-8" ?>
<GeocoderSearchResponse>
<status>0</status>
<result>
<location>
<lat>39.9834240714 ...
Jsoup解析百度音乐API的xml
package com.app.duapp;
import java.net.URLEncoder;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Te ...
HttpURLConnection 和HttpClient+Jsoup处理标签抓取页面和模拟登录
HttpURLConnection抓取
package com.app.html;
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.i ...
jsoup 返回400错误分析
今天在用jsoup验证700多个网址是否能正常显示打开的时候,发现好多都返回了400状态码,手动打开这部分返回状态码的网址,发现部分是返回的404,部分能正常显示。真是奇怪了。然后google了一下,400到底是什么错误。400:(错误请求) 服务器不理解请求的语法。因为PM急着要结果,果断换成selenium,判断页面标题是否有NOT FOUND,结果正常。
完后,再看这个400, ...
我来模仿iTeye登录(HttpClient)
1.利用HttpClient模拟iteye登录
package com.home.action.test.http;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.CookieHandler;
import ja ...
jsoup解析html/根据关键词拿到论坛帖子信息
以论坛《宽带山》为例,需要根据给定的关键词,取得关于该关键词的所有帖子,包括人气数,发帖主题,回复数,发表人,发表时间,帖子链接,帖子详细文本内容等。
详细代码如下:
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
impor ...
初次接触HttpClient4.0
HttpClient程序包是一个实现了 HTTP 协议的客户端编程工具包,要想熟练的掌握它,必须熟悉 HTTP协议。一个最简单的调用如下:
Java代码
import java.io.IOException;
import org.apache.http.HttpResponse;
import org.apache.http.client.Cl ...