`
jt5
  • 浏览: 31835 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
文章分类
社区版块
存档分类

根据URL获取网页源码

 
阅读更多
根据给定的URL获取源码,同时还需要页面的Encoding
public String getPageSource() {
		StringBuffer sb = new StringBuffer();
		try {
			//构建一URL对象
			URL url = new URL(pageUrl);
			//使用openStream得到一输入流并由此构造一个BufferedReader对象
			BufferedReader in = new BufferedReader(new InputStreamReader(url
					.openStream(), encoding));
			String line;
			//读取www资源
			while ((line = in.readLine()) != null) {
				sb.append(line);
				sb.append("\n");
			}
			in.close();
		} catch (Exception ex) {
			sb.append(ex.toString());
			System.err.println(ex);
		}
		return sb.toString();
	}
分享到:
评论

相关推荐

    Java源代码根据URL获取因特网网页源文件.rar

    这个RAR文件包含的"说明.txt"可能是详细的操作指南,而"根据URL获取因特网网页源文件"可能是一个Java源代码示例,用于演示如何实现这一功能。以下是对这个主题的详细讲解: 1. **网络编程基础**: 在Java中,进行...

    获取网页源代码。支持从txt中获取URL以及导出txt文件

    获取网页源代码的过程则涉及到网络请求。在Python中,可以使用`requests`库来实现这一功能。发送GET请求到URL,然后调用`.text`属性即可获取到响应的HTML源代码。例如: ```python import requests url = ...

    [转帖]通过WebView获取访问网页的源代码

    1. 要获取网页源代码,可以使用WebView的`evaluateJavascript()`方法,该方法允许在JavaScript环境中执行代码,并将结果作为字符串返回。可以编写一个JavaScript函数来获取页面的HTML内容: ```javascript function...

    VC获取网页源代码,用来修改其源代码

    在IT行业中,获取网页源代码是一项基础而重要的技能,尤其对于开发者来说,它可能是为了分析网页结构、抓取数据或是进行自动化测试等目的。在这个场景中,"VC"可能指的是Visual C++,一种广泛使用的C++集成开发环境...

    获取网页源代码

    总之,“获取网页源代码”工具简化了获取网页源码的过程,为开发者和研究人员提供了便利,是理解网页结构、进行数据抓取或自动化任务的重要辅助工具。它利用HTTP协议和URL机制,直接暴露了网页的后台内容,使得...

    java 通过指定的URL可以获取网页的源代码

    在Java编程语言中,获取网页源代码是一项基本的网络操作,通常用于爬虫、数据分析或者自动化测试等场景。这个过程涉及到Java的`java.net`和`java.io`这两个核心包中的类和方法。下面我们将详细讲解如何实现这个功能...

    VC++ 获取网页源代码

    10. 实际代码示例:编写一个简单的VC++程序,包含上述步骤,可以实现从指定URL获取网页源代码的功能。程序应包括必要的错误检查,并将源代码输出到控制台或保存到文件。 以上就是使用VC++获取网页源代码的核心技术...

    vb,Webbrowser1获取网页源码

    下面我们将详细探讨如何使用VB中的`WebBrowser1`控件来获取网页源码。 首先,我们需要在VB项目中添加`WebBrowser1`控件。打开VB开发环境,选择工具箱,如果`WebBrowser`控件不在默认视图中,可以通过点击“更多控件...

    VC++ 获取网页源代码.rar

    6. **使用libcurl在VC++中获取网页源代码**:首先,需要将libcurl库添加到VC++项目中,然后调用libcurl的函数,如`curl_easy_init`、`curl_easy_setopt`(设置请求选项,如URL和数据处理回调函数)和`curl_easy_...

    bat获取网页源码并保存txt到指定位置

    bat获取网页源码并保存txt到指定位置

    js(javascript)获取网页源码

    //直接通过XMLHttpRequest对象获取远程网页源代码 function getSource() { var url = document.getElementById("url").value; //获取目标地址信息 //地址为空时提示用户输入 if (url == "") { alert("请输入...

    根据url获取网页Option到本地

    在IT行业中,尤其是在Web开发领域,经常需要从网站上抓取数据或模拟用户交互行为,例如根据URL获取网页上的特定信息。在这个场景中,我们关注的是如何从用户输入的URL获取下拉框(Dropdown List)的数据,并将其保存...

    C#获取网页源代码的5种方法

    ### C# 获取网页源代码的五种方法 在软件开发特别是网络爬虫或者自动化测试领域,经常需要通过程序抓取网页源代码。本篇文章将详细介绍五种使用C#语言实现的网页源代码抓取方法,并对每种方法进行详细解析。 #### ...

    VB.NET获取网页源码

    代码中展示了一种获取网页源码的方法,主要分为以下几个步骤: 1. **创建WebRequest对象**: ```vb.net Dim request As Net.WebRequest = WebRequest.Create(...

    通过URL地址获取网页生成jpg图片

    Apache HttpClient是一个广泛使用的HTTP客户端库,它可以让我们方便地从URL获取网页内容。引入该库后,我们可以通过以下代码片段发送GET请求获取网页HTML: ```java CloseableHttpClient httpClient = HttpClients....

    JAVA线程根据给定URL生成网页快照

    至于标签"源码",可能意味着提供的压缩包`snapshot.zip`中包含了实现上述功能的源代码。你可以解压文件,查看其中的代码以获取更具体的实现细节。 总结来说,生成网页快照涉及的关键知识点包括: 1. 使用`java.net`...

    获取网页源码代码

    创建一个连接,发送GET请求头,然后接收服务器返回的数据,这便是获取网页源码的基本步骤。 下面是一个简单的C++示例,使用libcurl获取网页源码: ```cpp #include #include int main() { CURL *curl; ...

    Java图形界面获取网页的源代码

    在这个项目中,JFrame被用作主窗口,而JTextField可能被用来输入网址,JButton则可能作为触发获取网页源码操作的按钮。 2. **URL和URLConnection类**: Java的`java.net.URL`类代表统一资源定位符,它是互联网上的...

    android获取网页源码

    android下一个获取制定url的一个页面源代码的例子简单例子,因为找了几个都无法正常运行。源码获取部分代码来源于http://blog.csdn.net/honglei_zh/article/details/8537394

Global site tag (gtag.js) - Google Analytics