java中根据url抓取html页面内容的方法

浏览 4410 次

锁定老帖子主题：java中根据url抓取html页面内容的方法精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (3)
作者	正文
siye1982 等级: 初级会员性别: 文章: 19 积分: 90 来自: 北京	发表时间：2009-02-01 最后修改：2009-02-01 相关推荐: jsoup-1.13.1.jar Java爬虫经典框架抓取网页内容 java抓取html页面指定内容,java中根据url抓取html页面内容的方法 java 抓取网页_JAVA使用爬虫抓取网站网页内容的方法 java 抓取网页乱码,Java URL抓取页面内容乱码有关问题解决方法 java url获取 html body,java模拟浏览器请求抓取页面，无法抓取body里的内容更多相关推荐 import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.HttpURLConnection; import java.net.URL; public class URLUtil { public static String getHtml(String urlString) { try { StringBuffer html = new StringBuffer(); URL url = new URL(urlString); HttpURLConnection conn = (HttpURLConnection) url.openConnection(); InputStreamReader isr = new InputStreamReader(conn.getInputStream()); BufferedReader br = new BufferedReader(isr); String temp; while ((temp = br.readLine()) != null) { html.append(temp).append("\n"); } br.close(); isr.close(); return html.toString(); } catch (Exception e) { e.printStackTrace(); return null; } } public static void main(String[] args) { System.out.println(URLUtil.getHtml("http://www.163.com")); } } 声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

论坛首页 → 入门技术版

跳转论坛: