`
roddy
  • 浏览: 18039 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Java Read Html

    博客分类:
  • Java
 
阅读更多
Need Jar:
jsoup-1.8.1.jar



public static void main(String[] args) {
		String content="";
		try {
			content = executeGet("qq.com","t.qq.com","pgv_pvi=2633264128; RK=AWkaEwm4WM; ptcz=b94a87c80a0a85ceec47cd63566d582d7110bb329e378f2ef066185e9b957333; pt2gguin=o0002442254; ts_refer=url.cn/sorry; wbilang_10000=zh_TW; mb_reg_quick=1; wb_regf=%3B0%3B%3Bapi.t.qq.com%3B0; pgv_info=ssid=s1646546122; ts_last=t.qq.com/snow13000521; pgv_pvid=6340134792; o_cookie=2442254; ts_uid=9369757478");
		} catch (IOException e1) {
			// TODO Auto-generated catch block
			e1.printStackTrace();
		}
		org.jsoup.nodes.Document doc = (org.jsoup.nodes.Document) Jsoup.parse(content);
		
    	org.jsoup.nodes.Element element = doc.getElementById("mainWrapper");
    	org.jsoup.nodes.Document doc2 = (org.jsoup.nodes.Document) Jsoup.parse(element.getElementsByClass("avatar").toString());
    	Elements elements = doc2.select("a[href]");
    	String qqUrl = "";
    	for(org.jsoup.nodes.Element ele : elements){
    		qqUrl = ele.attr("href");
    	}
    	
    	//To get region
    	try {
			content = executeGet("qq.com","t.qq.com","pgv_pvi=2633264128; RK=AWkaEwm4WM; ptcz=b94a87c80a0a85ceec47cd63566d582d7110bb329e378f2ef066185e9b957333; pt2gguin=o0002442254; ts_refer=url.cn/sorry; wbilang_10000=zh_TW; mb_reg_quick=1; wb_regf=%3B0%3B%3Bapi.t.qq.com%3B0; pgv_info=ssid=s1646546122; ts_last=t.qq.com/snow13000521; pgv_pvid=6340134792; o_cookie=2442254; ts_uid=9369757478");
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		//System.out.println(content);
		if(content.length()>0){
			org.jsoup.nodes.Document docAuthor = (org.jsoup.nodes.Document) Jsoup.parse(content);
			Elements elementAuthors = docAuthor.getElementsByClass("ico_location");
			if(elementAuthors.size()>0){
				org.jsoup.nodes.Element elementAuthor = elementAuthors.get(0).nextElementSibling();
				System.err.println("==QQ Region==== "+elementAuthor.text());
			}
		}
	}
分享到:
评论

相关推荐

    用Java输出HTML文件

    ### 用Java输出HTML文件:关键技术与实践 在数字化时代,高效管理个人互联网资源成为一项基本技能。将收藏夹中的互联网快捷方式转换成HTML文件,不仅便于存储和分享,还能跨设备访问,提升网络资源利用效率。本文...

    ReadHtml.java

    读取Html文件,利用正则表达式提取html里面所有a标签的url和文本,

    html5实现摄像头拍照并使用java进行照片保存

    在本文中,我们将深入探讨如何使用HTML5实现摄像头拍照功能,并结合Java技术将拍摄的照片保存到服务器。HTML5的WebRTC(Real-Time Communication)API为我们提供了访问用户设备摄像头的能力,而Java作为后端语言,...

    java+html+mysql一款最简单的登录,增加,删除,修改的html项目

    使用Java的JDBC(Java Database Connectivity)接口,可以连接并操作MySQL数据库,执行SQL查询来完成数据的CRUD(Create, Read, Update, Delete)操作。 8. **Servlet**:虽然在描述中未直接提到,但Servlet可能是...

    java源码包---java 源码 大量 实例

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    java源码包3

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    java源码包2

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    java成绩管理系统

    3. CRUD操作:系统必须支持基本的数据操作,即创建(Create)、读取(Read)、更新(Update)和删除(Delete),这通常通过SQL语句实现,如INSERT INTO、SELECT FROM、UPDATE和DELETE。 4. 控制器与业务逻辑:在...

    java socket 视频流转发socket

    while ((bytesRead = in.read(buffer)) != -1) { // 处理读取的视频数据,例如写入到另一个Socket } ``` 4. **转发视频流**:处理接收到的视频数据后,服务器可能需要将数据转发到其他地方,比如另一个...

    Java实现Html转PDF

    BufferedImage image = ImageIO.read(new URL(htmlContent.replaceFirst("src=\"", "http://"))); // 解析图片URL ByteArrayOutputStream baos = new ByteArrayOutputStream(); ImageIO.write(image, "JPEG", ...

    用java实现音频捕捉

    根据给定的文件信息,我们可以总结出以下关于“用Java实现音频捕捉”的相关知识点: ### 一、项目概述 此项目旨在使用Java编程语言来实现音频的捕捉与处理功能。项目核心是通过Java标准库中的`javax.sound.sampled...

    java9 sdk api specification docs API参考文档 英文版 HTML格式

    2. JShell (Read-Eval-Print Loop, REPL): 这是一个新的命令行工具,允许开发者即时测试和运行Java代码片段,提高了开发和调试的效率。 3. Process API增强:Java 9对处理外部进程的API进行了改进,提供了更强大的...

    Java applet程序设计

    image = ImageIO.read(url); } catch (Exception e) { System.err.println(e); } } public void paint(Graphics g) { g.drawImage(image, 0, 0, this); } } ``` Applet还可以接收来自HTML页面的参数,这在...

    java生成二维码_java将二维码转换成base64

    BufferedImage image = ImageIO.read(new File("qrcode.png")); ByteArrayOutputStream baos = new ByteArrayOutputStream(); ImageIO.write(image, "PNG", baos); byte[] imageBytes = baos.toByteArray(); ...

    java socket 中文教程

    Java Socket是Java编程语言中用于网络通信的核心API,它提供了低级别的、面向连接的、基于TCP/IP协议的网络通信服务。本教程将深入探讨Java Socket的相关知识点,旨在帮助开发者理解和掌握如何在Java环境中构建网络...

    Java操作USB源代码

    E:. │ .classpath ... │ ReadWrite.c │ resource.h │ sources │ sys.dsp │ sys.dsw │ sys.ncb │ sys.opt │ sys.plg │ Wmi.c │ └─Debug E:\android_svn\215256673JavaUSBComplete>

    JAVA实验报告三java输入输出.docx

    这部分代码通过`System.in.read(buffer)`方法读取用户从键盘输入的字符,存入字节数组`buffer`中。然后通过`System.out.print`和`System.out.write`方法将数组内容显示在控制台。 - 步骤二:文件读取与转换 这...

    java 切割图片 可预览,完整效果

    在Java编程语言中,处理图片上传并进行剪切是一项常见的任务,尤其在Web应用或图形处理软件中。本文将深入探讨如何使用Java实现这个功能,包括图片上传、预览以及剪切的完整流程。 首先,我们需要理解图片上传的...

    java编写的小型计算器

    程序使用 `System.in.read()` 获取字符输入,通过 `switch` 语句处理不同情况。当用户输入 '1'、'2' 或 '3' 时,程序会打印出相应的奖品信息;输入其他字符或空格则提示无奖品。 通过这个实验,学习者能够掌握 Java...

    java使用itext生成pdf的代码示例

    String htmlContent = FileUtils.readFileToString(new File("path_to_your_html_file.html"), StandardCharsets.UTF_8); PdfGenerator.htmlToPdf(htmlContent, "output_path.pdf"); ``` 这样,你就成功地使用Java...

Global site tag (gtag.js) - Google Analytics