`

获取指定URL html 代码

    博客分类:
  • j2se
 
阅读更多
public class Test {

	    public static void main(String[] args) {
	        try {
	            java.net.URL url = new java.net.URL("http://2dspace.tk");
	            java.net.URLConnection conn = url.openConnection();
	            conn.connect();
	            String[] temp = conn.getContentType().split("=");
	            String encoding = temp[temp.length-1];
	            System.out.println("" + conn.getContentType());
	            System.out.println("" + conn.getContentEncoding());//获取页面编码
	            System.out.println("" + conn.getContentLength());
	            System.out.println("" + conn.getDate());
	            System.out.println("" + conn.getExpiration());
	            System.out.println("" + conn.getLastModified());
	            StringBuffer contentBuffer = new StringBuffer();
	            java.io.InputStream is = conn.getInputStream();
	            java.io.BufferedReader reader = new java.io.BufferedReader(new java.io.InputStreamReader(is, encoding));
	            //java.io.BufferedReader reader = new java.io.BufferedReader(new java.io.InputStreamReader(is));
	            String inputLine = null;
	            while ((inputLine = reader.readLine()) != null) {
	                contentBuffer.append(inputLine);
	                contentBuffer.append("\n");
	            }
	            is.close();
	            System.out.println(new String(contentBuffer.toString()
	            		.getBytes(),"gbk"
	            		)
	            		);
	        } catch (java.net.MalformedURLException e) {
	            e.printStackTrace();
	        } catch (java.io.IOException e) {
	            e.printStackTrace();
	        }
	    }
	}

分享到:
评论

相关推荐

    获取指定URL页面HTML数据类

    `获取指定URL页面HTML数据类`是一个关键功能,它允许程序通过HTTP协议从指定的URL抓取HTML内容。这个过程通常被称为网页抓取或网络爬虫,对于数据分析、网页解析、自动化测试等多种任务都有着重要作用。以下是对这个...

    获得指定Url的HTML页面

    在IT领域,获取指定URL的HTML页面是一项基本且重要的任务,尤其在网页抓取、数据分析、网络监控等应用场景中极为常见。以下是从标题、描述、标签以及部分内容中提炼出的关键知识点,旨在深入解析如何通过模拟...

    java 通过指定的URL可以获取网页的源代码

    在实际应用中,你可能会将获取到的网页源代码存储到文件或数据库中,或者进一步解析HTML内容。上述代码只是一个基础示例,实际使用时可能需要处理异常、超时和其他网络相关的问题。在进行网络编程时,了解HTTP协议的...

    正则+url获取指定网站数据信息

    本篇将详细讲解如何利用Java编程语言,结合正则表达式和URL来获取指定网站的数据信息。 首先,我们需要了解URL。URL是互联网上资源的唯一地址,它包含了协议类型(如http或https)、服务器地址、路径以及可能的查询...

    获得指定的url在缓存中的路径(3KB)

    综合以上信息,可以推断这是一个使用Visual Basic编写的程序,其目标是获取指定URL在本地缓存的路径。具体实现可能涉及到对Windows API的调用,例如使用`WinInet`库,通过函数如`FindFirstUrlCacheEntry`和`...

    一个自动获取网址html代码的网页

    标题中的“一个自动获取网址html代码的网页”指的是一个在线工具或者服务,它允许用户输入一个网站URL,然后该工具会自动抓取并显示该网页的HTML源代码。这个功能对于网页开发者、SEO优化人员或者网络分析者来说非常...

    android获取网络图片、html代码

    在Android开发中,获取网络资源是一项常见的任务,包括获取网络图片和HTML代码。这些操作能够丰富应用程序的内容,提供更佳的用户体验。以下将详细介绍如何在Android应用中实现这两个功能。 一、获取网络图片并显示...

    C# 获取 网页中 的 全部 URL 源代码

    通过以上步骤,你就可以用C#编写一个简单的程序,从指定的网页中获取所有的URL了。这只是一个基础的示例,实际的爬虫可能需要更复杂的逻辑,例如处理JavaScript动态加载的页面、登录验证、模拟浏览器行为等。

    js获取url参数

    通过上述分析,我们不仅理解了如何使用JavaScript来获取URL中的参数,还深入探讨了正则表达式的构建以及如何优化代码结构。在实际开发中,掌握这些技巧将有助于我们更高效地解决问题,并提高代码的可维护性和可读性...

    网页自动跳转代码html有进度条

    这段代码首先获取了进度条元素,然后定义了总进度和当前进度。`startProgress`函数用于启动进度条动画。它使用`setInterval`定时器每50毫秒更新一次进度条的宽度,直到达到总进度,然后跳转到新的页面。 为了在页面...

    VC获取网页源代码,用来修改其源代码

    这段代码会在浏览器环境中向指定URL发送请求,并在控制台打印出源代码。 当你获取了网页源代码后,可能会有需要修改它的场景。例如,你可能想替换某个特定的HTML元素,或者调整CSS样式。在Python中,可以使用`...

    java URL转PDF文件

    这段代码会打开指定URL的连接,并获取到网页的输入流。 然后,我们需要解析HTML内容。Java中可以使用Jsoup库来解析HTML,它提供了一个易于使用的API来处理HTML文档。安装Jsoup后,我们可以这样做: ```java ...

    jsoup根据url解析html

    首先,通过`Jsoup.connect(url).get()`获取指定URL的HTML文档。这里使用了一个具体的例子`http://www1.17k.com/book/182745.html`。 ```java Document doc = Jsoup.connect(url).get(); ``` ##### 2. 提取元数据 ...

    获取指定页面的Google PR值的PHP程序代码

    由于Google已经关闭了官方的PageRank查询服务,所以我们需要找到其他方法,如使用第三方API或者解析网页源代码来间接获取PR值。 3. **extractPR()**: 这个函数是核心部分,它解析从fetchPage()获取的HTML内容,寻找...

    JS使用ajax方法获取指定url的head信息中指定字段值的方法

    本文主要介绍如何使用Ajax方法获取指定URL的HEAD信息中的特定字段值。 首先,让我们深入理解Ajax的工作原理。Ajax的核心是XMLHttpRequest对象,它是一个内置的JavaScript对象,可以向服务器发送异步HTTP请求,并...

    网页截图 有源码 可截取指定url的图,有源码

    本项目提供了有源码的解决方案,可以截取指定URL的网页图片,对于开发者来说,这是一个很好的学习和实践的资源。 在这一项目中,我们看到几个关键的文件: 1. **Default.aspx**:这是ASP.NET Web应用程序的默认...

    python抽取指定url页面的title方法

    通过这篇文章的介绍和代码示例,我们可以了解到用Python实现网络爬虫中抽取指定url页面的title方法的基本原理和方法,这不仅对初学者是一个很好的学习实例,对有经验的开发者来说,也是一个值得参考的实践案例。...

    网页源代码获取——Python程序_爬虫_URLpython_boundvk4_

    标题中的“网页源代码获取——Python程序_爬虫_URLpython_boundvk4_”指的是使用Python编程语言编写的一个爬虫程序,其主要功能是抓取指定URL的网页源代码,并将其保存到文本文件中。这个程序可能对初学者或进行网络...

    网页定时跳转代码实例适用于asp,php,html定时跳转网页

    网页定时跳转是一种常见的网页交互功能,用于在用户打开页面后,在特定时间间隔后自动将页面重定向到另一个URL。这种技术在很多场景下都非常实用,例如广告展示、页面更新通知或者临时页面的过渡等。在ASP、PHP和...

    获取网页的Html文件 源代码

    在描述中提到的程序示例,是用编程方式实现的,它访问指定的URL(例如"www.xiaonei.com"),并将返回的HTML内容写入名为`result.txt`的文本文件中。这种方法对于批量处理或自动化流程非常有用。 需要注意的是,获取...

Global site tag (gtag.js) - Google Analytics