获取指定URL html 代码 - - ITeye博客

`

qq529618567

浏览: 11450 次
性别:
来自: 重庆

最近访客更多访客>>

liulingzhou99

Luo_da

qq_anqi

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

获取指定URL html 代码

博客分类：

j2se

阅读更多

public class Test {

	    public static void main(String[] args) {
	        try {
	            java.net.URL url = new java.net.URL("http://2dspace.tk");
	            java.net.URLConnection conn = url.openConnection();
	            conn.connect();
	            String[] temp = conn.getContentType().split("=");
	            String encoding = temp[temp.length-1];
	            System.out.println("" + conn.getContentType());
	            System.out.println("" + conn.getContentEncoding());//获取页面编码
	            System.out.println("" + conn.getContentLength());
	            System.out.println("" + conn.getDate());
	            System.out.println("" + conn.getExpiration());
	            System.out.println("" + conn.getLastModified());
	            StringBuffer contentBuffer = new StringBuffer();
	            java.io.InputStream is = conn.getInputStream();
	            java.io.BufferedReader reader = new java.io.BufferedReader(new java.io.InputStreamReader(is, encoding));
	            //java.io.BufferedReader reader = new java.io.BufferedReader(new java.io.InputStreamReader(is));
	            String inputLine = null;
	            while ((inputLine = reader.readLine()) != null) {
	                contentBuffer.append(inputLine);
	                contentBuffer.append("\n");
	            }
	            is.close();
	            System.out.println(new String(contentBuffer.toString()
	            		.getBytes(),"gbk"
	            		)
	            		);
	        } catch (java.net.MalformedURLException e) {
	            e.printStackTrace();
	        } catch (java.io.IOException e) {
	            e.printStackTrace();
	        }
	    }
	}

分享到：

Oracle 游标使用 | 创建访问本地文件系统的信任APPLET

2011-12-22 13:06
浏览 1160
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

获取指定URL页面HTML数据类: `获取指定URL页面HTML数据类`是一个关键功能，它允许程序通过HTTP协议从指定的URL抓取HTML内容。这个过程通常被称为网页抓取或网络爬虫，对于数据分析、网页解析、自动化测试等多种任务都有着重要作用。以下是对这个...

获得指定Url的HTML页面: 在IT领域，获取指定URL的HTML页面是一项基本且重要的任务，尤其在网页抓取、数据分析、网络监控等应用场景中极为常见。以下是从标题、描述、标签以及部分内容中提炼出的关键知识点，旨在深入解析如何通过模拟...

java 通过指定的URL可以获取网页的源代码: 在实际应用中，你可能会将获取到的网页源代码存储到文件或数据库中，或者进一步解析HTML内容。上述代码只是一个基础示例，实际使用时可能需要处理异常、超时和其他网络相关的问题。在进行网络编程时，了解HTTP协议的...

正则+url获取指定网站数据信息: 本篇将详细讲解如何利用Java编程语言，结合正则表达式和URL来获取指定网站的数据信息。首先，我们需要了解URL。URL是互联网上资源的唯一地址，它包含了协议类型（如http或https）、服务器地址、路径以及可能的查询...

获得指定的url在缓存中的路径(3KB): 综合以上信息，可以推断这是一个使用Visual Basic编写的程序，其目标是获取指定URL在本地缓存的路径。具体实现可能涉及到对Windows API的调用，例如使用`WinInet`库，通过函数如`FindFirstUrlCacheEntry`和`...

一个自动获取网址html代码的网页: 标题中的“一个自动获取网址html代码的网页”指的是一个在线工具或者服务，它允许用户输入一个网站URL，然后该工具会自动抓取并显示该网页的HTML源代码。这个功能对于网页开发者、SEO优化人员或者网络分析者来说非常...

android获取网络图片、html代码: 在Android开发中，获取网络资源是一项常见的任务，包括获取网络图片和HTML代码。这些操作能够丰富应用程序的内容，提供更佳的用户体验。以下将详细介绍如何在Android应用中实现这两个功能。一、获取网络图片并显示...

C# 获取网页中的全部 URL 源代码: 通过以上步骤，你就可以用C#编写一个简单的程序，从指定的网页中获取所有的URL了。这只是一个基础的示例，实际的爬虫可能需要更复杂的逻辑，例如处理JavaScript动态加载的页面、登录验证、模拟浏览器行为等。

js获取url参数: 通过上述分析，我们不仅理解了如何使用JavaScript来获取URL中的参数，还深入探讨了正则表达式的构建以及如何优化代码结构。在实际开发中，掌握这些技巧将有助于我们更高效地解决问题，并提高代码的可维护性和可读性...

网页自动跳转代码html有进度条: 这段代码首先获取了进度条元素，然后定义了总进度和当前进度。`startProgress`函数用于启动进度条动画。它使用`setInterval`定时器每50毫秒更新一次进度条的宽度，直到达到总进度，然后跳转到新的页面。为了在页面...

VC获取网页源代码,用来修改其源代码: 这段代码会在浏览器环境中向指定URL发送请求，并在控制台打印出源代码。当你获取了网页源代码后，可能会有需要修改它的场景。例如，你可能想替换某个特定的HTML元素，或者调整CSS样式。在Python中，可以使用`...

java URL转PDF文件: 这段代码会打开指定URL的连接，并获取到网页的输入流。然后，我们需要解析HTML内容。Java中可以使用Jsoup库来解析HTML，它提供了一个易于使用的API来处理HTML文档。安装Jsoup后，我们可以这样做： ```java ...

jsoup根据url解析html: 首先，通过`Jsoup.connect(url).get()`获取指定URL的HTML文档。这里使用了一个具体的例子`http://www1.17k.com/book/182745.html`。 ```java Document doc = Jsoup.connect(url).get(); ``` ##### 2. 提取元数据 ...

获取指定页面的Google PR值的PHP程序代码: 由于Google已经关闭了官方的PageRank查询服务，所以我们需要找到其他方法，如使用第三方API或者解析网页源代码来间接获取PR值。 3. **extractPR()**: 这个函数是核心部分，它解析从fetchPage()获取的HTML内容，寻找...

JS使用ajax方法获取指定url的head信息中指定字段值的方法: 本文主要介绍如何使用Ajax方法获取指定URL的HEAD信息中的特定字段值。首先，让我们深入理解Ajax的工作原理。Ajax的核心是XMLHttpRequest对象，它是一个内置的JavaScript对象，可以向服务器发送异步HTTP请求，并...

网页截图有源码可截取指定url的图，有源码: 本项目提供了有源码的解决方案，可以截取指定URL的网页图片，对于开发者来说，这是一个很好的学习和实践的资源。在这一项目中，我们看到几个关键的文件： 1. **Default.aspx**：这是ASP.NET Web应用程序的默认...

python抽取指定url页面的title方法: 通过这篇文章的介绍和代码示例，我们可以了解到用Python实现网络爬虫中抽取指定url页面的title方法的基本原理和方法，这不仅对初学者是一个很好的学习实例，对有经验的开发者来说，也是一个值得参考的实践案例。...

网页源代码获取——Python程序_爬虫_URLpython_boundvk4_: 标题中的“网页源代码获取——Python程序_爬虫_URLpython_boundvk4_”指的是使用Python编程语言编写的一个爬虫程序，其主要功能是抓取指定URL的网页源代码，并将其保存到文本文件中。这个程序可能对初学者或进行网络...

网页定时跳转代码实例适用于asp，php，html定时跳转网页: 网页定时跳转是一种常见的网页交互功能，用于在用户打开页面后，在特定时间间隔后自动将页面重定向到另一个URL。这种技术在很多场景下都非常实用，例如广告展示、页面更新通知或者临时页面的过渡等。在ASP、PHP和...

获取网页的Html文件源代码: 在描述中提到的程序示例，是用编程方式实现的，它访问指定的URL（例如"www.xiaonei.com"），并将返回的HTML内容写入名为`result.txt`的文本文件中。这种方法对于批量处理或自动化流程非常有用。需要注意的是，获取...

Global site tag (gtag.js) - Google Analytics