public class Test {
public static void main(String[] args) {
try {
java.net.URL url = new java.net.URL("http://2dspace.tk");
java.net.URLConnection conn = url.openConnection();
conn.connect();
String[] temp = conn.getContentType().split("=");
String encoding = temp[temp.length-1];
System.out.println("" + conn.getContentType());
System.out.println("" + conn.getContentEncoding());//获取页面编码
System.out.println("" + conn.getContentLength());
System.out.println("" + conn.getDate());
System.out.println("" + conn.getExpiration());
System.out.println("" + conn.getLastModified());
StringBuffer contentBuffer = new StringBuffer();
java.io.InputStream is = conn.getInputStream();
java.io.BufferedReader reader = new java.io.BufferedReader(new java.io.InputStreamReader(is, encoding));
//java.io.BufferedReader reader = new java.io.BufferedReader(new java.io.InputStreamReader(is));
String inputLine = null;
while ((inputLine = reader.readLine()) != null) {
contentBuffer.append(inputLine);
contentBuffer.append("\n");
}
is.close();
System.out.println(new String(contentBuffer.toString()
.getBytes(),"gbk"
)
);
} catch (java.net.MalformedURLException e) {
e.printStackTrace();
} catch (java.io.IOException e) {
e.printStackTrace();
}
}
}
分享到:
相关推荐
`获取指定URL页面HTML数据类`是一个关键功能,它允许程序通过HTTP协议从指定的URL抓取HTML内容。这个过程通常被称为网页抓取或网络爬虫,对于数据分析、网页解析、自动化测试等多种任务都有着重要作用。以下是对这个...
在IT领域,获取指定URL的HTML页面是一项基本且重要的任务,尤其在网页抓取、数据分析、网络监控等应用场景中极为常见。以下是从标题、描述、标签以及部分内容中提炼出的关键知识点,旨在深入解析如何通过模拟...
在实际应用中,你可能会将获取到的网页源代码存储到文件或数据库中,或者进一步解析HTML内容。上述代码只是一个基础示例,实际使用时可能需要处理异常、超时和其他网络相关的问题。在进行网络编程时,了解HTTP协议的...
本篇将详细讲解如何利用Java编程语言,结合正则表达式和URL来获取指定网站的数据信息。 首先,我们需要了解URL。URL是互联网上资源的唯一地址,它包含了协议类型(如http或https)、服务器地址、路径以及可能的查询...
综合以上信息,可以推断这是一个使用Visual Basic编写的程序,其目标是获取指定URL在本地缓存的路径。具体实现可能涉及到对Windows API的调用,例如使用`WinInet`库,通过函数如`FindFirstUrlCacheEntry`和`...
标题中的“一个自动获取网址html代码的网页”指的是一个在线工具或者服务,它允许用户输入一个网站URL,然后该工具会自动抓取并显示该网页的HTML源代码。这个功能对于网页开发者、SEO优化人员或者网络分析者来说非常...
在Android开发中,获取网络资源是一项常见的任务,包括获取网络图片和HTML代码。这些操作能够丰富应用程序的内容,提供更佳的用户体验。以下将详细介绍如何在Android应用中实现这两个功能。 一、获取网络图片并显示...
通过以上步骤,你就可以用C#编写一个简单的程序,从指定的网页中获取所有的URL了。这只是一个基础的示例,实际的爬虫可能需要更复杂的逻辑,例如处理JavaScript动态加载的页面、登录验证、模拟浏览器行为等。
通过上述分析,我们不仅理解了如何使用JavaScript来获取URL中的参数,还深入探讨了正则表达式的构建以及如何优化代码结构。在实际开发中,掌握这些技巧将有助于我们更高效地解决问题,并提高代码的可维护性和可读性...
这段代码首先获取了进度条元素,然后定义了总进度和当前进度。`startProgress`函数用于启动进度条动画。它使用`setInterval`定时器每50毫秒更新一次进度条的宽度,直到达到总进度,然后跳转到新的页面。 为了在页面...
这段代码会在浏览器环境中向指定URL发送请求,并在控制台打印出源代码。 当你获取了网页源代码后,可能会有需要修改它的场景。例如,你可能想替换某个特定的HTML元素,或者调整CSS样式。在Python中,可以使用`...
这段代码会打开指定URL的连接,并获取到网页的输入流。 然后,我们需要解析HTML内容。Java中可以使用Jsoup库来解析HTML,它提供了一个易于使用的API来处理HTML文档。安装Jsoup后,我们可以这样做: ```java ...
首先,通过`Jsoup.connect(url).get()`获取指定URL的HTML文档。这里使用了一个具体的例子`http://www1.17k.com/book/182745.html`。 ```java Document doc = Jsoup.connect(url).get(); ``` ##### 2. 提取元数据 ...
由于Google已经关闭了官方的PageRank查询服务,所以我们需要找到其他方法,如使用第三方API或者解析网页源代码来间接获取PR值。 3. **extractPR()**: 这个函数是核心部分,它解析从fetchPage()获取的HTML内容,寻找...
本文主要介绍如何使用Ajax方法获取指定URL的HEAD信息中的特定字段值。 首先,让我们深入理解Ajax的工作原理。Ajax的核心是XMLHttpRequest对象,它是一个内置的JavaScript对象,可以向服务器发送异步HTTP请求,并...
本项目提供了有源码的解决方案,可以截取指定URL的网页图片,对于开发者来说,这是一个很好的学习和实践的资源。 在这一项目中,我们看到几个关键的文件: 1. **Default.aspx**:这是ASP.NET Web应用程序的默认...
通过这篇文章的介绍和代码示例,我们可以了解到用Python实现网络爬虫中抽取指定url页面的title方法的基本原理和方法,这不仅对初学者是一个很好的学习实例,对有经验的开发者来说,也是一个值得参考的实践案例。...
标题中的“网页源代码获取——Python程序_爬虫_URLpython_boundvk4_”指的是使用Python编程语言编写的一个爬虫程序,其主要功能是抓取指定URL的网页源代码,并将其保存到文本文件中。这个程序可能对初学者或进行网络...
网页定时跳转是一种常见的网页交互功能,用于在用户打开页面后,在特定时间间隔后自动将页面重定向到另一个URL。这种技术在很多场景下都非常实用,例如广告展示、页面更新通知或者临时页面的过渡等。在ASP、PHP和...
在描述中提到的程序示例,是用编程方式实现的,它访问指定的URL(例如"www.xiaonei.com"),并将返回的HTML内容写入名为`result.txt`的文本文件中。这种方法对于批量处理或自动化流程非常有用。 需要注意的是,获取...