`

获取网页内容

阅读更多
import java.io.IOException;
import java.io.InputStream;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;


public class InputStreamExample {

	public InputStreamExample() {
	}

	public static void main(String[] args) {
		try {
			URL url = new URL(
					"http://www.uni-card.net/updateV2.php?usernum=15904060643&tel2=15904060643&qnck=03261099659903239&qncpw=829516006350133025");
			try {
				URLConnection c = url.openConnection();
				String txtContent = "";
				InputStream is;
				int ch;
				try {
					is = c.getInputStream();
					ch = is.read();
					while(ch != -1) {
						txtContent = txtContent + (char) ch;
						ch = is.read();
					}
					is.close();
				} catch(IOException io1) {
					System.out.println("IOException: " + io1.toString());
				}
				// get the html content
				txtContent = new String(txtContent.getBytes("8859_1"), "utf-8");
				
				int pos1 = txtContent.indexOf("<title");
				int pos2 = txtContent.indexOf("</title>");
				txtContent = txtContent.substring(pos1, pos2);

				System.out.println(txtContent);
				if("<title>优尼->提示页面".equals(txtContent)) {
					System.out.println("一样");
				} else {
					System.out.println("不一样");
				}

			} catch(IOException io2) {
				System.out.println("IOException: " + io2.toString());
			}

		} catch(MalformedURLException e) {
			System.out.println("MalformedURLException:" + e.toString());
		}

	}

}
 
分享到:
评论

相关推荐

    抓取网站内容,获取网站内容,读取网站所有内容,抓取网页内容

    4. **抓取网页内容**:这与“获取网站内容”相似,但可能更侧重于特定页面而非整个网站。可能需要指定URL,并针对单个页面进行解析。 5. **获取网页内容**:同样,这涉及到解析HTML并提取所需信息。使用`...

    android获取网页内容

    在Android平台上,获取网页内容是常见的任务,常用于网络数据的抓取、解析或展示。这一过程涉及到多个关键知识点,包括网络请求库的使用、HTML解析以及数据处理。以下将详细讲解这些步骤。 首先,我们需要一个网络...

    JAVA通过url获取网页内容

    在网页抓取程序中,需要获取网页内容以存储到数据库中。在 web 服务中,需要获取网页内容以提供给用户。 五、获取网页内容的注意事项 在获取网页内容时,需要注意以下几点: * 需要检查 URL 是否正确,以免出现...

    抓取网站内容

    网站内容抓取,也称为网页抓取或网络爬虫,是一种自动提取网页数据的技术。它在互联网上广泛应用于搜索引擎优化、数据分析、市场研究、新闻监控等领域。本篇将深入探讨这个主题,帮助你理解如何抓取网站内容以及相关...

    java简单抓取网页内容

    在Java编程语言中,抓取网页内容是一项常见的任务,尤其对于数据分析、信息提取以及网络爬虫等应用场景。本文将深入探讨如何使用Java实现简单的网页内容抓取,适合初学者入门学习。 首先,我们需要理解网页抓取的...

    c#多线程抓取网页内容

    ### C#多线程网页内容抓取技术解析 #### 概述 在现代互联网应用开发中,网页抓取是一项常见的需求,特别是在数据挖掘、搜索引擎等领域。传统的单线程抓取方式往往因效率低下而不适用于大规模的数据采集场景。本文...

    java简单的抓取网页内容的程序

    java简单的抓取网页内容的程序java简单的抓取网页内容的程序java简单的抓取网页内容的程序java简单的抓取网页内容的程序java简单的抓取网页内容的程序java简单的抓取网页内容的程序java简单的抓取网页内容的程序java...

    C# 抓取网页内容帮助方法

    C# 抓取网页内容帮助方法,能投通过标签自动匹配想要输出的内容

    java爬虫抓取网页内容,下载网站图片

    在本场景中,我们将重点讨论如何利用Java编写爬虫来抓取网页内容并下载其中的图片。 首先,我们需要了解网络爬虫的基本原理。网络爬虫通过发送HTTP请求到目标网站,获取返回的HTML文档,然后解析这个文档以提取出...

    java抓取网页内容源代码

    ### Java抓取网页内容源代码解析与扩展 在IT领域,网页抓取(或称网络爬虫)是一项关键技能,广泛应用于数据收集、市场分析、搜索引擎优化等多个方面。本篇文章将深入探讨一个Java编写的网页内容抓取代码,旨在帮助...

    http协议+socket获取网页内容源代码

    http协议+socket获取网页内容源代码。

    网页爬虫自动抓取网页内容

    网页爬虫,也被称为网络爬虫或数据抓取工具,是一种自动化程序,它按照特定的规则遍历互联网上的网页,收集所需的信息。在信息技术领域,爬虫被广泛应用于数据分析、市场研究、搜索引擎优化等多个场景。了解如何构建...

    抓取网页内容

    首先,我们来了解一下如何抓取网页内容。最基础的方法是使用HTTP库,如Python的requests库,它可以发送HTTP请求到指定URL并接收服务器的响应。例如,你可以使用以下代码来获取一个网页的HTML: ```python import ...

    米云视频抓取插件 一键获取网页内容视频源地址下载 浏览器插件

    一键获取网页内容视频源地址下载 浏览器插件,适合大部分浏览器可用 插件获取下载格式: flv、hlv、f4v、mp4、mp3、wma、wav、m4a、letv、ts、webm、 ogg、ogv、acc、mov、mkv、m3u8 MIME类型:video/* audio/*...

    模拟浏览器抓取网页内容(审查元素中内容)

    利用HtmlAgilityPack可以轻松获取网页内容,但是无法获取动态加载的内容, 通过webBrowser模拟浏览器,获取网页内容。 大致思路: 1、webBrowser加载网页 (如有Ajax动态加载分页的网站,需要配合页面动作,直到页面...

    asp如何远程获取网页内容

    在ASP中,远程获取网页内容通常涉及到HTTP请求和响应处理,这对于数据分析、信息抓取或者监控其他网站的状态非常有用。以下是一些关于如何在ASP中实现远程获取网页内容的关键知识点: 1. **HTTP协议**:首先,理解...

    c++获取网页指定内容

    "C++获取网页指定内容"这个主题涉及到使用C++编程语言来编写网络爬虫,以抓取特定网页上的信息。这里我们将深入探讨如何使用C++进行网络爬虫开发,以及涉及到的相关知识点。 首先,要构建一个C++网络爬虫,你需要...

    Delphi模拟搜索引擎蜘蛛抓取网页内容.rar

    在IT领域,搜索引擎蜘蛛(也称为网络爬虫)是用于自动遍历互联网并抓取网页内容的程序。这个"Delphi模拟搜索引擎蜘蛛抓取网页内容.rar"文件提供了一个使用Delphi编程语言实现的简单示例,帮助我们理解搜索引擎蜘蛛的...

    htmlparser抓取网页内容

    本项目以"htmlparser抓取网页内容"为主题,具体实践了如何利用HTMLParser库来从国家专利局的网站上抓取专利状态信息。 首先,我们要理解HTMLParser的工作原理。HTMLParser是Python的内置库,它提供了一个基础的事件...

    抓取网页图片,css和js

    网页抓取通常通过网络爬虫实现,这是一种自动遍历互联网并抓取网页内容的程序。爬虫通过HTTP或HTTPS协议与服务器交互,请求网页并解析HTML内容。对于JavaScript驱动的动态网页,可能需要使用如Selenium等工具来模拟...

Global site tag (gtag.js) - Google Analytics