java网页抓取其中2个字符串 - ITeye问答

问答首页 → Web前端技术

0 0

java网页抓取其中2个字符串10

http://wwwapps.ups.com/WebTracking/track?HTMLVersion=5.0&loc=zh_CN&Requester=UPSHome&WBPM_lid=homepage%2Fct1.html_pnl_trk&trackNums=H8952323185&track.x=%E8%BF%BD%E8%B8%AA

抓取该页面的：运输日期和签收人

Java java网页抓取

2012年6月27日 21:13

qizi456258
1
0 0 5

1个答案按时间排序按投票排序

0 0

采纳的答案

有空研究研究XPath,你能很轻松的取到页面上所有的信息。

private static void getTrackInfo(String html) throws Exception {
	
	DOMParser parser = new DOMParser();
	parser.parse(html);
	Node node = parser.getDocument();
	
	NodeList dllist = XPathAPI.selectNodeList(node, "//DL");
	System.out.println(dllist.getLength());
	
	//运送信息
	//--运送日期
	System.out.println(deleteSpace(dllist.item(2).getTextContent()));		
	//--寄存地址
	System.out.println(deleteSpace(dllist.item(3).getTextContent()));		
	//--签收人
	System.out.println(deleteSpace(dllist.item(4).getTextContent()));
	
	//其他信息		
	//--发货或收款日期/类型/重量
	System.out.println(deleteSpace(dllist.item(5).getTextContent()));		
	//--收件人
	System.out.println(deleteSpace(dllist.item(6).getTextContent()));
	
}

2012年6月28日 10:34

rensanning
216
0 0 12

添加评论

相关推荐

java抓取网页数据: 在“java抓取网页数据”这个主题中，我们将深入探讨如何利用Java来抓取并处理互联网上的信息。首先，我们要了解什么是网络爬虫。网络爬虫（Web Crawler）是自动遍历互联网的程序，通过抓取网页内容并存储在本地，...

java简单抓取网页内容: 在Java编程语言中，抓取网页内容是一项常见的任务，尤其对于数据分析、信息提取以及网络爬虫等应用场景。本文将深入探讨如何使用Java实现简单的网页内容抓取，适合初学者入门学习。首先，我们需要理解网页抓取的...

字符串转图片且加水印or抓取网站转为图片: 总的来说，字符串转图片、图片加水印以及网站转图片是Java中图像处理和网页渲染的实用技巧，广泛应用于网页设计、信息安全和数据分析等领域。熟练掌握这些技能，能够帮助开发者更好地实现各种定制化的图像处理需求。

java抓取网站数据: ### Java抓取网站数据知识点详解 #### 一、概述在现代互联网开发中，抓取网站数据是一项重要的技能。无论是进行市场调研、竞品分析还是数据挖掘，掌握如何使用Java来抓取数据都是十分必要的。本篇文章将详细介绍...

java抓取网页内容--生成静态页面: 在Java编程中，生成静态页面是一种常见的技术，它涉及到网页内容的抓取和存储。这个程序的主要目的是从指定的URL抓取网页内容，并将其保存为一个HTML文件，即静态页面。下面将详细讲解这个过程涉及的关键知识点。 1...

网页抓取例子: 这可能是一个Java服务器页面（JSP）文件，用于展示如何在Java环境中进行网页抓取。JSP是创建动态Web内容的一种方式，通常与Servlet一起使用，可以嵌入Java代码来处理HTTP请求并生成HTML响应。以下是对网页抓取及其...

暑假培训学习笔记之 java字符串拆分: 字符串拆分在实际开发中非常常见，比如日志分析、CSV文件解析、网页抓取等领域。通过灵活运用正则表达式，我们可以高效地处理各种格式的文本数据。通过深入理解正则表达式和`split()`方法，开发者能够更好地处理...

Java抓取网页图片链接地址: ### Java抓取网页图片链接地址 #### 知识点概览本文将详细介绍如何使用Java编程语言抓取网页上的图片链接。此技术广泛应用于网络爬虫、数据分析等领域，能够帮助开发者快速获取所需的图像资源。 #### 技术背景与...

一个用java实现的抓取网站程序: 通过这些库，开发者可以更高效地处理网页内容，而不是手动处理字符串。防屏蔽功能则体现了爬虫的智能性。网站通常会设置反爬策略，如IP限制、User-Agent检测等。为应对这些策略，程序可能需要动态改变请求头（如...

Java处理Excel，Word，网页数据抓取: 在开发过程中，我们可能还需要处理数据的序列化和反序列化，JSON-P（Java API for JSON Processing）或Gson库可以将Java对象转换为JSON字符串，反之亦然，便于数据在网络间传输。总的来说，Java提供了丰富的库和...

java爬虫抓取网页数据教程(20210809124656).pdf: 根据提供的文件信息，文档标题为“java爬虫抓取网页数据教程”，此文件属于IT技术类教程，特别关注于Java编程语言在编写网络爬虫方面的应用。在这份教程中，将会涉及到使用HttpClient工具在Java环境中抓取网页数据的...

htmlparser实现从网页上抓取数据: 本文将详细介绍如何使用HTMLParser从网页上抓取数据，并通过一个具体的Java代码示例来演示其实现过程。 #### HTMLParser简介 HTMLParser是一个纯Java编写的HTML解析库，其最大的特点在于不需要依赖其他Java库即可...

网页抓取之新方法 (在java程序中使用jQuery): 在Java程序中使用jQuery进行网页抓取可以极大地提高效率，因为jQuery是一个强大的JavaScript库，它提供了丰富的DOM操作和事件处理功能，使得我们可以更方便地解析和操作HTML文档。在Java中实现jQuery的集成，我们...

Java抓取URL/Email实例源码: 通过学习这个实例源码，开发者不仅可以掌握基础的网页抓取技术，还能了解到如何结合Java标准库和第三方库来提升效率和准确性。在实际应用中，还需要注意处理异常、设置超时、控制爬虫速度，以及可能需要的分布式爬虫...

JAVA线程根据给定URL生成网页快照: 我们可以使用Jsoup的`outerHtml()`方法将整个文档转换为字符串，然后写入到本地文件： ```java String snapshotHtml = doc.outerHtml(); FileOutputStream out = new FileOutputStream("snapshot.html"); out.write...

网页爬虫工具能够抓取网页信息的软件: 【描述】中提到，PClawer需要用户掌握正则表达式，这表明该工具的使用门槛相对较高，因为正则表达式是一种强大的文本处理语言，可以用来精确匹配和提取网页中的特定字符串或模式。正则表达式（Regular Expression...

详解Java两种方式简单实现：爬取网页并且保存: 获取到输入流后，将其转换为字符串，最后将字符串保存到本地文件。接下来是使用`HttpClient`的实现，它是Apache HTTP组件的一部分，提供了更高级别的HTTP客户端功能。以下是一个基本的使用示例： ```java import ...

java_zhizhu.rar_java LinkFilter_抓取网页_蜘蛛_蜘蛛程序: 这个过程可能涉及到字符串处理、正则表达式匹配等技术。 5. **数据存储**：提取出来的信息通常需要存储起来，以便后续分析或展示。Java提供了多种数据存储方式，如文件系统、数据库（JDBC）、NoSQL数据库（如...

基于Java的网页分析代码: 在这个项目中，可能使用Java的强大的网络和字符串处理功能来抓取、解析和理解网页内容。网页分析通常包括两个主要步骤：网页抓取和网页解析。网页抓取是通过HTTP或HTTPS协议从互联网上下载网页的过程，这可以通过...

获得字符串数据: 通常，这样的文件会包含一个或多个类，这些类定义了获取网络字符串数据的方法和逻辑。总的来说，从网络获取字符串数据涉及到网络编程、字符编码、输入/输出流的使用等多个IT知识点。掌握这一过程对于进行Web开发、...

Ask-but

我的问答 FAQ | 勋章

相关推荐

已解决问题

未解决问题

排行榜

查看全部排名>>

Global site tag (gtag.js) - Google Analytics