- 浏览: 449270 次
- 性别:
- 来自: 北京
博客专栏
-
Jeecg快速开发平台
浏览量:0
文章分类
- 全部博客 (1498)
- java (109)
- jeecg (140)
- minidao (18)
- 移动 (4)
- git (1)
- svn (2)
- maven (3)
- mybatis (5)
- 快速开发 (60)
- 代码生成器 (23)
- 培训 (1)
- 微信 (8)
- 微信二次开发 (7)
- 微营销 (1)
- easyui (2)
- springmvc (3)
- 微网站 (2)
- 开源年会 (1)
- mongodb (2)
- 架构师 (1)
- 工作流 (2)
- 架构培训 (1)
- 微信开发 (3)
- 插件开发 (1)
- 支付窗 (2)
- jeecg,JEEWX,集群定时任务 (0)
- 简易工具,开源,easypoi (2)
- jeecg,数据权限 (1)
- jeecg,高级查询 (2)
- jeecg,部门管理 (1)
- jeecgonline,唯一性校验 (1)
- jeecg,组织机构 (1)
- jeecg,接口权限 (1)
- jeecg,java,online表单,表单填值 (4)
- jeecg,接口 (1)
- jeecg,java,online自定义 (2)
- jeecg,表单配置,树形表单 (1)
- jeecg,Redis (1)
- 摘要: JEECG 是一款基于代码生成器的J2EE快速开发平台,开源界“小普元”超越传统商业企业级开发平台。引领新的开发模式(Online Coding模式(自定义表单)->代码生成器模式->手工MERGE智能开发), 可以帮助解决Java项目60%的重复工作,让开发更多关注业务逻辑。既能快速提高开发效率,帮助公司节省人力成本,同时又不失灵活性。她可以用于所有的Web应用程序,如:MIS,CRM,OA,ERP,CMS,网站后台,微信管家,等等,当然,您也可以对她进行深度定制,以做出更强系统。 (0)
- jeewx (7)
- 捷微 (2)
- JAVA微信管家 (0)
- 企业微信 (1)
- 微信,JEEWX,企业微信,微信二次开发,java微信管家 (3)
- JEEWX,微信企业号,企业微信,java (1)
- 微信SDK (3)
- jeecg,ng2-admin,Angular4 (1)
- jeecg,企业应用,JEasyPoi (7)
- Excel (2)
- Word (2)
- 企业应用 (4)
- JEasyPoi (1)
- 小程序 (6)
- webstorm (1)
- 开源社区, (1)
- Bootstrap (3)
- Vue (5)
- Spring (3)
- 插件开发,jeecg-P3, (2)
- 持久层,Mybatis,Hibernate,jeecg (2)
- easypoi,poi (1)
- 简易导入导出 (1)
- 工作流,快速开发平台 (1)
- jeecg,小程序,java,开源 (4)
- jeewx,小程序,H5活动,营销活动 (3)
- 代码生成器,plupload (1)
- java,砍价,捷微,H5 (1)
- 微服务 (1)
- JavaScript (1)
最新评论
-
a3617096:
这个jar包哪里有下载的?
【JEECG插件集成文档】JEECG在线聊天插件 - 集成文档 -
ppm218:
我用maven 下载不了jar啊,有哪位仁兄可以发一下给我吗? ...
【JEECG技术文档】JEECG在线聊天插件功能集成文档 -
lijing_smile:
jeecg 你好!在线聊天集成到jeecg_3.6.3中去但是 ...
【JEECG技术文档】JEECG在线聊天插件功能集成文档 -
来去无痕:
链接都过期了
开源社区JAVA视频网盘分享 -
LinApex:
已经失效了
【jeecg-mybatis版本】 mybatis+spring mvc 完美整合方案 查询,保存,更新,删除自动生成
JSOUP初探
JSOUP是偶然看到的一个处理HTML的JAVA 类库,其官方网址是:http://jsoup.org/
1、编写相关的试用程序(只需要在工程中引用jsoup-1.3.3.jar即可):
- importjava.io.File;
- importjava.io.IOException;
- importorg.jsoup.Jsoup;
- importorg.jsoup.nodes.Document;
- importorg.jsoup.select.Elements;
- publicclassTest{
- publicstaticvoidmain(String[]args){
- Testt=newTest();
- t.parseFile();
- }
- publicvoidparseString(){
- Stringhtml="<html><head><title>blog</title></head><bodyonload='test()'><p>ParsedHTMLintoadoc.</p></body></html>";
- Documentdoc=Jsoup.parse(html);
- System.out.println(doc);
- Elementses=doc.body().getAllElements();
- System.out.println(es.attr("onload"));
- System.out.println(es.select("p"));
- }
- publicvoidparseUrl(){
- try{
- Documentdoc=Jsoup.connect("http://www.baidu.com/").get();
- Elementshrefs=doc.select("a[href]");
- System.out.println(hrefs);
- System.out.println("------------------");
- System.out.println(hrefs.select("[href^=http]"));
- }catch(IOExceptione){
- e.printStackTrace();
- }
- }
- publicvoidparseFile(){
- try{
- Fileinput=newFile("input.html");
- Documentdoc=Jsoup.parse(input,"UTF-8");
- //提取出所有的编号
- Elementscodes=doc.body().select("td[title^=IA]>a[href^=javascript:view]");
- System.out.println(codes);
- System.out.println("------------------");
- System.out.println(codes.html());
- }catch(IOExceptione){
- e.printStackTrace();
- }
- }
- }
import java.io.File; import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; public class Test { public static void main(String[] args) { Test t = new Test(); t.parseFile(); } public void parseString() { String html = "<html><head><title>blog</title></head><body onload='test()'><p>Parsed HTML into a doc.</p></body></html>"; Document doc = Jsoup.parse(html); System.out.println(doc); Elements es = doc.body().getAllElements(); System.out.println(es.attr("onload")); System.out.println(es.select("p")); } public void parseUrl() { try { Document doc = Jsoup.connect("http://www.baidu.com/").get(); Elements hrefs = doc.select("a[href]"); System.out.println(hrefs); System.out.println("------------------"); System.out.println(hrefs.select("[href^=http]")); } catch (IOException e) { e.printStackTrace(); } } public void parseFile() { try { File input = new File("input.html"); Document doc = Jsoup.parse(input, "UTF-8"); // 提取出所有的编号 Elements codes = doc.body().select("td[title^=IA] > a[href^=javascript:view]"); System.out.println(codes); System.out.println("------------------"); System.out.println(codes.html()); } catch (IOException e) { e.printStackTrace(); } } }
2、parseString的输出:
- <html>
- <head>
- <title>blog</title>
- </head>
- <bodyonload="test()">
- <p>ParsedHTMLintoadoc.</p>
- </body>
- </html>
- test()
- <p>ParsedHTMLintoadoc.</p>
<html> <head> <title>blog</title> </head> <body onload="test()"> <p>Parsed HTML into a doc.</p> </body> </html> test() <p>Parsed HTML into a doc.</p>
3、parseUrl的输出:
- <ahref="/gaoji/preferences.html">设置</a>
- <ahref="http://passport.baidu.com/?login&tpl=mn">登录</a>
- <ahref="http://news.baidu.com">新闻</a>
- <ahref="http://tieba.baidu.com">贴吧</a>
- <ahref="http://zhidao.baidu.com">知道</a>
- <ahref="http://mp3.baidu.com">MP3</a>
- <ahref="http://image.baidu.com">图片</a>
- <ahref="http://video.baidu.com">视频</a>
- <ahref="http://map.baidu.com">地图</a>
- <ahref="#"name="ime_hw">手写</a>
- <ahref="#"name="ime_py">拼音</a>
- <ahref="#"name="ime_cl">关闭</a>
- <ahref="http://hi.baidu.com">空间</a>
- <ahref="http://baike.baidu.com">百科</a>
- <ahref="http://www.hao123.com">hao123</a>
- <ahref="/more/">更多>></a>
- <aid="st"onclick="this.style.behavior='url(#default#homepage)';this.setHomePage('http://www.baidu.com')"href="http://utility.baidu.com/traf/click.php?id=215&url=http://www.baidu.com">把百度设为主页</a>
- <ahref="http://e.baidu.com/?refer=888">加入百度推广</a>
- <ahref="http://top.baidu.com">搜索风云榜</a>
- <ahref="http://home.baidu.com">关于百度</a>
- <ahref="http://ir.baidu.com">AboutBaidu</a>
- <ahref="/duty/">使用百度前必读</a>
- <ahref="http://www.miibeian.gov.cn"target="_blank">京ICP证030173号</a>
- ------------------
- <ahref="http://passport.baidu.com/?login&tpl=mn">登录</a>
- <ahref="http://news.baidu.com">新闻</a>
- <ahref="http://tieba.baidu.com">贴吧</a>
- <ahref="http://zhidao.baidu.com">知道</a>
- <ahref="http://mp3.baidu.com">MP3</a>
- <ahref="http://image.baidu.com">图片</a>
- <ahref="http://video.baidu.com">视频</a>
- <ahref="http://map.baidu.com">地图</a>
- <ahref="http://hi.baidu.com">空间</a>
- <ahref="http://baike.baidu.com">百科</a>
- <ahref="http://www.hao123.com">hao123</a>
- <aid="st"onclick="this.style.behavior='url(#default#homepage)';this.setHomePage('http://www.baidu.com')"href="http://utility.baidu.com/traf/click.php?id=215&url=http://www.baidu.com">把百度设为主页</a>
- <ahref="http://e.baidu.com/?refer=888">加入百度推广</a>
- <ahref="http://top.baidu.com">搜索风云榜</a>
- <ahref="http://home.baidu.com">关于百度</a>
- <ahref="http://ir.baidu.com">AboutBaidu</a>
- <ahref="http://www.miibeian.gov.cn"target="_blank">京ICP证030173号</a>
<a href="/gaoji/preferences.html">设置</a> <a href="http://passport.baidu.com/?login&tpl=mn">登录</a> <a href="http://news.baidu.com">新闻</a> <a href="http://tieba.baidu.com">贴吧</a> <a href="http://zhidao.baidu.com">知道</a> <a href="http://mp3.baidu.com">MP3</a> <a href="http://image.baidu.com">图片</a> <a href="http://video.baidu.com">视频</a> <a href="http://map.baidu.com">地图</a> <a href="#" name="ime_hw">手写</a> <a href="#" name="ime_py">拼音</a> <a href="#" name="ime_cl">关闭</a> <a href="http://hi.baidu.com">空间</a> <a href="http://baike.baidu.com">百科</a> <a href="http://www.hao123.com">hao123</a> <a href="/more/">更多>></a> <a id="st" onclick="this.style.behavior='url(#default#homepage)';this.setHomePage('http://www.baidu.com')" href="http://utility.baidu.com/traf/click.php?id=215&url=http://www.baidu.com">把百度设为主页</a> <a href="http://e.baidu.com/?refer=888">加入百度推广</a> <a href="http://top.baidu.com">搜索风云榜</a> <a href="http://home.baidu.com">关于百度</a> <a href="http://ir.baidu.com">About Baidu</a> <a href="/duty/">使用百度前必读</a> <a href="http://www.miibeian.gov.cn" target="_blank">京ICP证030173号</a> ------------------ <a href="http://passport.baidu.com/?login&tpl=mn">登录</a> <a href="http://news.baidu.com">新闻</a> <a href="http://tieba.baidu.com">贴吧</a> <a href="http://zhidao.baidu.com">知道</a> <a href="http://mp3.baidu.com">MP3</a> <a href="http://image.baidu.com">图片</a> <a href="http://video.baidu.com">视频</a> <a href="http://map.baidu.com">地图</a> <a href="http://hi.baidu.com">空间</a> <a href="http://baike.baidu.com">百科</a> <a href="http://www.hao123.com">hao123</a> <a id="st" onclick="this.style.behavior='url(#default#homepage)';this.setHomePage('http://www.baidu.com')" href="http://utility.baidu.com/traf/click.php?id=215&url=http://www.baidu.com">把百度设为主页</a> <a href="http://e.baidu.com/?refer=888">加入百度推广</a> <a href="http://top.baidu.com">搜索风云榜</a> <a href="http://home.baidu.com">关于百度</a> <a href="http://ir.baidu.com">About Baidu</a> <a href="http://www.miibeian.gov.cn" target="_blank">京ICP证030173号</a>
3、parseFile的输出:
- <ahref="javascript:view('67530','67530','0');">IA100908-002</a>
- <ahref="javascript:view('67529','67529','0');">IA100908-001</a>
- <ahref="javascript:view('67544','67544','0');">IA100908-016</a>
- <ahref="javascript:view('67364','67364','0');">IA100903-008</a>
- <ahref="javascript:view('67363','67363','0');">IA100903-007</a>
- <ahref="javascript:view('66104','66104','0');">IA100710-013</a>
- <ahref="javascript:view('57916','57916','0');">IA100515-013</a>
- <ahref="javascript:view('56962','56962','0');">IA100430-022</a>
- <ahref="javascript:view('66958','66958','0');">IA100830-001</a>
- <ahref="javascript:view('66319','66319','0');">IA100713-003</a>
- <ahref="javascript:view('66317','66317','0');">IA100713-001</a>
- <ahref="javascript:view('66321','66321','0');">IA100713-005</a>
- <ahref="javascript:view('66967','66967','0');">IA100830-010</a>
- <ahref="javascript:view('66999','66999','0');">IA100831-001</a>
- <ahref="javascript:view('67377','67377','0');">IA100904-004</a>
- <ahref="javascript:view('67378','67378','0');">IA100904-005</a>
- <ahref="javascript:view('3271','3271','0');">IA080115-031</a>
- ------------------
- IA100908-002
- IA100908-001
- IA100908-016
- IA100903-008
- IA100903-007
- IA100710-013
- IA100515-013
- IA100430-022
- IA100830-001
- IA100713-003
- IA100713-001
- IA100713-005
- IA100830-010
- IA100831-001
- IA100904-004
- IA100904-005
- IA080115-031
<a href="javascript:view('67530','67530','0');">IA100908-002</a> <a href="javascript:view('67529','67529','0');">IA100908-001</a> <a href="javascript:view('67544','67544','0');">IA100908-016</a> <a href="javascript:view('67364','67364','0');">IA100903-008</a> <a href="javascript:view('67363','67363','0');">IA100903-007</a> <a href="javascript:view('66104','66104','0');">IA100710-013</a> <a href="javascript:view('57916','57916','0');">IA100515-013</a> <a href="javascript:view('56962','56962','0');">IA100430-022</a> <a href="javascript:view('66958','66958','0');">IA100830-001</a> <a href="javascript:view('66319','66319','0');">IA100713-003</a> <a href="javascript:view('66317','66317','0');">IA100713-001</a> <a href="javascript:view('66321','66321','0');">IA100713-005</a> <a href="javascript:view('66967','66967','0');">IA100830-010</a> <a href="javascript:view('66999','66999','0');">IA100831-001</a> <a href="javascript:view('67377','67377','0');">IA100904-004</a> <a href="javascript:view('67378','67378','0');">IA100904-005</a> <a href="javascript:view('3271','3271','0');">IA080115-031</a> ------------------ IA100908-002 IA100908-001 IA100908-016 IA100903-008 IA100903-007 IA100710-013 IA100515-013 IA100430-022 IA100830-001 IA100713-003 IA100713-001 IA100713-005 IA100830-010 IA100831-001 IA100904-004 IA100904-005 IA080115-031
补充下,input.html的基本结果如图:
JSOUP是偶然看到的一个处理HTML的JAVA 类库,其官方网址是:http://jsoup.org/
1、编写相关的试用程序(只需要在工程中引用jsoup-1.3.3.jar即可):
- importjava.io.File;
- importjava.io.IOException;
- importorg.jsoup.Jsoup;
- importorg.jsoup.nodes.Document;
- importorg.jsoup.select.Elements;
- publicclassTest{
- publicstaticvoidmain(String[]args){
- Testt=newTest();
- t.parseFile();
- }
- publicvoidparseString(){
- Stringhtml="<html><head><title>blog</title></head><bodyonload='test()'><p>ParsedHTMLintoadoc.</p></body></html>";
- Documentdoc=Jsoup.parse(html);
- System.out.println(doc);
- Elementses=doc.body().getAllElements();
- System.out.println(es.attr("onload"));
- System.out.println(es.select("p"));
- }
- publicvoidparseUrl(){
- try{
- Documentdoc=Jsoup.connect("http://www.baidu.com/").get();
- Elementshrefs=doc.select("a[href]");
- System.out.println(hrefs);
- System.out.println("------------------");
- System.out.println(hrefs.select("[href^=http]"));
- }catch(IOExceptione){
- e.printStackTrace();
- }
- }
- publicvoidparseFile(){
- try{
- Fileinput=newFile("input.html");
- Documentdoc=Jsoup.parse(input,"UTF-8");
- //提取出所有的编号
- Elementscodes=doc.body().select("td[title^=IA]>a[href^=javascript:view]");
- System.out.println(codes);
- System.out.println("------------------");
- System.out.println(codes.html());
- }catch(IOExceptione){
- e.printStackTrace();
- }
- }
- }
import java.io.File; import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; public class Test { public static void main(String[] args) { Test t = new Test(); t.parseFile(); } public void parseString() { String html = "<html><head><title>blog</title></head><body onload='test()'><p>Parsed HTML into a doc.</p></body></html>"; Document doc = Jsoup.parse(html); System.out.println(doc); Elements es = doc.body().getAllElements(); System.out.println(es.attr("onload")); System.out.println(es.select("p")); } public void parseUrl() { try { Document doc = Jsoup.connect("http://www.baidu.com/").get(); Elements hrefs = doc.select("a[href]"); System.out.println(hrefs); System.out.println("------------------"); System.out.println(hrefs.select("[href^=http]")); } catch (IOException e) { e.printStackTrace(); } } public void parseFile() { try { File input = new File("input.html"); Document doc = Jsoup.parse(input, "UTF-8"); // 提取出所有的编号 Elements codes = doc.body().select("td[title^=IA] > a[href^=javascript:view]"); System.out.println(codes); System.out.println("------------------"); System.out.println(codes.html()); } catch (IOException e) { e.printStackTrace(); } } }
2、parseString的输出:
- <html>
- <head>
- <title>blog</title>
- </head>
- <bodyonload="test()">
- <p>ParsedHTMLintoadoc.</p>
- </body>
- </html>
- test()
- <p>ParsedHTMLintoadoc.</p>
<html> <head> <title>blog</title> </head> <body onload="test()"> <p>Parsed HTML into a doc.</p> </body> </html> test() <p>Parsed HTML into a doc.</p>
3、parseUrl的输出:
- <ahref="/gaoji/preferences.html">设置</a>
- <ahref="http://passport.baidu.com/?login&tpl=mn">登录</a>
- <ahref="http://news.baidu.com">新闻</a>
- <ahref="http://tieba.baidu.com">贴吧</a>
- <ahref="http://zhidao.baidu.com">知道</a>
- <ahref="http://mp3.baidu.com">MP3</a>
- <ahref="http://image.baidu.com">图片</a>
- <ahref="http://video.baidu.com">视频</a>
- <ahref="http://map.baidu.com">地图</a>
- <ahref="#"name="ime_hw">手写</a>
- <ahref="#"name="ime_py">拼音</a>
- <ahref="#"name="ime_cl">关闭</a>
- <ahref="http://hi.baidu.com">空间</a>
- <ahref="http://baike.baidu.com">百科</a>
- <ahref="http://www.hao123.com">hao123</a>
- <ahref="/more/">更多>></a>
- <aid="st"onclick="this.style.behavior='url(#default#homepage)';this.setHomePage('http://www.baidu.com')"href="http://utility.baidu.com/traf/click.php?id=215&url=http://www.baidu.com">把百度设为主页</a>
- <ahref="http://e.baidu.com/?refer=888">加入百度推广</a>
- <ahref="http://top.baidu.com">搜索风云榜</a>
- <ahref="http://home.baidu.com">关于百度</a>
- <ahref="http://ir.baidu.com">AboutBaidu</a>
- <ahref="/duty/">使用百度前必读</a>
- <ahref="http://www.miibeian.gov.cn"target="_blank">京ICP证030173号</a>
- ------------------
- <ahref="http://passport.baidu.com/?login&tpl=mn">登录</a>
- <ahref="http://news.baidu.com">新闻</a>
- <ahref="http://tieba.baidu.com">贴吧</a>
- <ahref="http://zhidao.baidu.com">知道</a>
- <ahref="http://mp3.baidu.com">MP3</a>
- <ahref="http://image.baidu.com">图片</a>
- <ahref="http://video.baidu.com">视频</a>
- <ahref="http://map.baidu.com">地图</a>
- <ahref="http://hi.baidu.com">空间</a>
- <ahref="http://baike.baidu.com">百科</a>
- <ahref="http://www.hao123.com">hao123</a>
- <aid="st"onclick="this.style.behavior='url(#default#homepage)';this.setHomePage('http://www.baidu.com')"href="http://utility.baidu.com/traf/click.php?id=215&url=http://www.baidu.com">把百度设为主页</a>
- <ahref="http://e.baidu.com/?refer=888">加入百度推广</a>
- <ahref="http://top.baidu.com">搜索风云榜</a>
- <ahref="http://home.baidu.com">关于百度</a>
- <ahref="http://ir.baidu.com">AboutBaidu</a>
- <ahref="http://www.miibeian.gov.cn"target="_blank">京ICP证030173号</a>
<a href="/gaoji/preferences.html">设置</a> <a href="http://passport.baidu.com/?login&tpl=mn">登录</a> <a href="http://news.baidu.com">新闻</a> <a href="http://tieba.baidu.com">贴吧</a> <a href="http://zhidao.baidu.com">知道</a> <a href="http://mp3.baidu.com">MP3</a> <a href="http://image.baidu.com">图片</a> <a href="http://video.baidu.com">视频</a> <a href="http://map.baidu.com">地图</a> <a href="#" name="ime_hw">手写</a> <a href="#" name="ime_py">拼音</a> <a href="#" name="ime_cl">关闭</a> <a href="http://hi.baidu.com">空间</a> <a href="http://baike.baidu.com">百科</a> <a href="http://www.hao123.com">hao123</a> <a href="/more/">更多>></a> <a id="st" onclick="this.style.behavior='url(#default#homepage)';this.setHomePage('http://www.baidu.com')" href="http://utility.baidu.com/traf/click.php?id=215&url=http://www.baidu.com">把百度设为主页</a> <a href="http://e.baidu.com/?refer=888">加入百度推广</a> <a href="http://top.baidu.com">搜索风云榜</a> <a href="http://home.baidu.com">关于百度</a> <a href="http://ir.baidu.com">About Baidu</a> <a href="/duty/">使用百度前必读</a> <a href="http://www.miibeian.gov.cn" target="_blank">京ICP证030173号</a> ------------------ <a href="http://passport.baidu.com/?login&tpl=mn">登录</a> <a href="http://news.baidu.com">新闻</a> <a href="http://tieba.baidu.com">贴吧</a> <a href="http://zhidao.baidu.com">知道</a> <a href="http://mp3.baidu.com">MP3</a> <a href="http://image.baidu.com">图片</a> <a href="http://video.baidu.com">视频</a> <a href="http://map.baidu.com">地图</a> <a href="http://hi.baidu.com">空间</a> <a href="http://baike.baidu.com">百科</a> <a href="http://www.hao123.com">hao123</a> <a id="st" onclick="this.style.behavior='url(#default#homepage)';this.setHomePage('http://www.baidu.com')" href="http://utility.baidu.com/traf/click.php?id=215&url=http://www.baidu.com">把百度设为主页</a> <a href="http://e.baidu.com/?refer=888">加入百度推广</a> <a href="http://top.baidu.com">搜索风云榜</a> <a href="http://home.baidu.com">关于百度</a> <a href="http://ir.baidu.com">About Baidu</a> <a href="http://www.miibeian.gov.cn" target="_blank">京ICP证030173号</a>
3、parseFile的输出:
- <ahref="javascript:view('67530','67530','0');">IA100908-002</a>
- <ahref="javascript:view('67529','67529','0');">IA100908-001</a>
- <ahref="javascript:view('67544','67544','0');">IA100908-016</a>
- <ahref="javascript:view('67364','67364','0');">IA100903-008</a>
- <ahref="javascript:view('67363','67363','0');">IA100903-007</a>
- <ahref="javascript:view('66104','66104','0');">IA100710-013</a>
- <ahref="javascript:view('57916','57916','0');">IA100515-013</a>
- <ahref="javascript:view('56962','56962','0');">IA100430-022</a>
- <ahref="javascript:view('66958','66958','0');">IA100830-001</a>
- <ahref="javascript:view('66319','66319','0');">IA100713-003</a>
- <ahref="javascript:view('66317','66317','0');">IA100713-001</a>
- <ahref="javascript:view('66321','66321','0');">IA100713-005</a>
- <ahref="javascript:view('66967','66967','0');">IA100830-010</a>
- <ahref="javascript:view('66999','66999','0');">IA100831-001</a>
- <ahref="javascript:view('67377','67377','0');">IA100904-004</a>
- <ahref="javascript:view('67378','67378','0');">IA100904-005</a>
- <ahref="javascript:view('3271','3271','0');">IA080115-031</a>
- ------------------
- IA100908-002
- IA100908-001
- IA100908-016
- IA100903-008
- IA100903-007
- IA100710-013
- IA100515-013
- IA100430-022
- IA100830-001
- IA100713-003
- IA100713-001
- IA100713-005
- IA100830-010
- IA100831-001
- IA100904-004
- IA100904-005
- IA080115-031
<a href="javascript:view('67530','67530','0');">IA100908-002</a> <a href="javascript:view('67529','67529','0');">IA100908-001</a> <a href="javascript:view('67544','67544','0');">IA100908-016</a> <a href="javascript:view('67364','67364','0');">IA100903-008</a> <a href="javascript:view('67363','67363','0');">IA100903-007</a> <a href="javascript:view('66104','66104','0');">IA100710-013</a> <a href="javascript:view('57916','57916','0');">IA100515-013</a> <a href="javascript:view('56962','56962','0');">IA100430-022</a> <a href="javascript:view('66958','66958','0');">IA100830-001</a> <a href="javascript:view('66319','66319','0');">IA100713-003</a> <a href="javascript:view('66317','66317','0');">IA100713-001</a> <a href="javascript:view('66321','66321','0');">IA100713-005</a> <a href="javascript:view('66967','66967','0');">IA100830-010</a> <a href="javascript:view('66999','66999','0');">IA100831-001</a> <a href="javascript:view('67377','67377','0');">IA100904-004</a> <a href="javascript:view('67378','67378','0');">IA100904-005</a> <a href="javascript:view('3271','3271','0');">IA080115-031</a> ------------------ IA100908-002 IA100908-001 IA100908-016 IA100903-008 IA100903-007 IA100710-013 IA100515-013 IA100430-022 IA100830-001 IA100713-003 IA100713-001 IA100713-005 IA100830-010 IA100831-001 IA100904-004 IA100904-005 IA080115-031
补充下,input.html的基本结果如图:
相关推荐
jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jar,jsoup-1.15.3.jarjsoup-...
**Jsoup API 深入解析** Jsoup 是一个用于处理和解析HTML的Java库,它提供了强大的功能,使得在Java程序中操作HTML文档变得简单而直观。在Jsoup 1.10.2版本中,这个API进一步优化了对HTML的处理能力,提供了丰富的...
Jsoup 提供 DOM 风格的方法(如 `getElementById()`, `getElementsByTag()`, `select(String cssQuery)` 等)来遍历 Document 对象并抽取所需数据。例如,你可以通过 CSS 选择器选取元素,然后提取它们的属性、文本...
**JSoup:Java的网页抓取与解析库** JSoup是一个用Java编写的开源库,专为处理HTML文档而设计。它提供了丰富的API,使得开发者能够轻松地抓取、解析和操作网页内容。JSoup的核心功能包括从网络或本地文件系统获取...
赠送jar包:jsoup-1.14.3.jar; 赠送原API文档:jsoup-1.14.3-javadoc.jar; 赠送源代码:jsoup-1.14.3-sources.jar; 赠送Maven依赖信息文件:jsoup-1.14.3.pom; 包含翻译后的API文档:jsoup-1.14.3-javadoc-API...
Jsoup在Web抓取、数据分析和网页爬虫项目中广泛应用。本文将深入探讨Jsoup 1.5.2和1.6这两个版本的主要特性、变化以及如何在项目中使用它们。 首先,让我们了解Jsoup的基本功能。Jsoup的核心功能包括: 1. **HTML...
**jsoup库详解** jsoup是一个Java库,用于处理实际世界中的HTML。它提供了一种易于使用的API,用于提取和操作数据,具有浏览器一样的解析和筛选能力。在Java爬虫领域,jsoup扮演着至关重要的角色,使得开发者能够...
在jsoup 1.6.1版本中,我们可以看到这个库已经相当成熟,提供了丰富的功能和优化。以下是一些关于jsoup的关键知识点: 1. **HTML解析**:jsoup的核心能力在于它强大的HTML解析机制。它使用了名为"Jsoup Parser"的...
1. `jsoup.jar`:Jsoup的主要库文件,包含了所有的类和方法,导入此文件即可在项目中使用Jsoup。 2. `README.md`或`README.txt`:文件说明,介绍如何使用Jsoup以及可能的注意事项。 3. `LICENSE`:Jsoup的许可协议,...
Jsoup的核心功能包括: 1. HTML解析:Jsoup能够解析各种各样的HTML源码,无论是干净的结构化HTML还是充满乱七八糟标签的真实网页。它能处理HTML5和HTML4,甚至一些常见的错误格式也能被正确解析。 2. DOM操作:...
**JSoup库与JSoup-Annotations** JSoup是一款强大的Java库,专为处理HTML文档而设计,它提供了方便的API,使得抓取和解析HTML变得简单易行。JSoup能够模拟浏览器的行为,理解和构建DOM树,进而允许开发者通过CSS...
《深入理解Java库:Jsoup解析与应用》 在Java编程世界中,Jsoup是一个非常重要的库,尤其在处理HTML文档和数据抓取时。标题中的"org.jsoup.jar"是Jsoup库的核心组件,它是Jsoup项目的二进制发布形式,包含了所有...
**jsoup1.10.3包和jsoupApi帮助文档** Jsoup是一个非常流行的Java库,用于处理和解析HTML。在IT行业中,特别是在Web爬虫和数据抓取领域,jsoup扮演着至关重要的角色。jsoup1.10.3是这个库的一个稳定版本,提供了...
**使用Jsoup获取网页内容并修改** Jsoup是一款强大的Java库,它允许开发者方便地解析、操作和提取HTML内容。在Android开发中,Jsoup常用于网页数据抓取和页面内容的处理。以下将详细解释如何使用Jsoup来实现这个...
`jsoup-1.11.3-javadoc.jar`包含了该版本的API文档,方便开发者查阅和理解每个方法的功能和用法,而`jsoup-1.11.3-sources.jar`则包含源代码,对于学习和调试Jsoup的内部实现非常有帮助。 Jsoup 的核心功能主要包括...
**jsoup库详解** jsoup是一个Java库,它专注于处理HTML和XML文档,提供了一种简单、优雅的方式来抓取和操作网页数据。这个库的名字来源于"JavaScript Object Soup"的缩写,暗示了它能将HTML文档转化为易于操作的...
org.jsoup 架包
**Jsoup.jar 包及说明文档** Jsoup是一款在Java平台上广泛使用的HTML解析库,它的主要功能是解析HTML文档,并提供了强大的数据提取和操作能力。Jsoup的核心特性在于其能够模拟浏览器的行为,对HTML进行理解和解析,...
Jsoup的主要功能 1)从一个URL,文件或字符串中解析HTML 2)使用DOM或CSS选择器来查找、取出数据 3)可操作HTML元素、属性、文本 注意:jsoup是基于MIT协议发布的,可放心使用于商业项目。 Jsoup的主要功能 1)...