【URL】检索baidu首页将包含超链接的<a ></a> 打印出来

miaoge

浏览: 110344 次
性别:
来自: 嘉兴

最近访客更多访客>>

ssydxa219

liuzhize520

1539264608

bbls1983

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

WPJ1009编程题

百度 .net

1.检索baidu首页将包含超链接的<a ></a> 打印出来
（如<a href="http://news.baidu.com">新 闻</a> 这种形式打印）

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;

/**
 * @author $KangMiao$
 * 检索百度首页将包含超链接的行打印出来
 * 就是把包含"<a"的行打印出来
 */

public class PrintURLInfo01 {
	private String path;

	public PrintURLInfo01(String path) {
		super();
		this.path = path;
	}
	
	//打印有超链接的url方法
	public void printUrl() {
		try {
			URL url = new URL(path);
			BufferedReader br = new BufferedReader(new InputStreamReader(url
					.openStream()));
			String temp = "",str = "";
			int a = 0,b = 0;
			while ((temp = br.readLine()) != null) {
		//indexOf("",int)带两个参数的，后面参数是指从哪个索引处开始查；这里用while是因为读取的一行中可能包含多个超链接
			   while(temp.indexOf("<a href=",b)!=-1){
				 a = temp.indexOf("<a href=",b+1);
				 b = temp.indexOf("a>",a);
				 str = temp.substring(a, b+2);
				 System.out.println(str);
				}
			 //还原0，表示重新从0索引处开始查找
			   a = 0;  
			   b = 0;
			}
			br.close();
		} catch (MalformedURLException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}

	public static void main(String[] args) {
		PrintURLInfo01 print = new PrintURLInfo01("http://www.baidu.com");
		print.printUrl();

	}
}

打印结果如下：

<a href="/gaoji/preferences.html">设置</a>
<a href="http://passport.baidu.com/?login&tpl=mn">登录</a>
<a href="http://news.baidu.com">新 闻</a>
<a href="http://tieba.baidu.com">贴 吧</a>
<a href="http://zhidao.baidu.com">知 道</a>
<a href="http://mp3.baidu.com">MP3</a>
<a href="http://image.baidu.com">图 片</a>
<a href="http://video.baidu.com">视 频</a>
<a href="http://map.baidu.com">地 图</a>
<a href="#" name="ime_hw">手写</a>
<a href="#" name="ime_py">拼音</a>
<a href="#" name="ime_cl">关闭</a>
<a href="http://hi.baidu.com">空间</a>
<a href="http://baike.baidu.com">百科</a>
<a href="http://www.hao123.com">hao123</a>
<a href="/more/">更多>></a>
<a href="http://e.baidu.com/?refer=888">加入百度推广</a>
<a href="http://top.baidu.com">搜索风云榜</a>
<a href="http://home.baidu.com">关于百度</a>
<a href="http://ir.baidu.com">About Baidu</a>
<a href="/duty/">使用百度前必读</a>
<a href="http://www.miibeian.gov.cn" target="_blank">京ICP证030173号</a>

分享到：

【WebMail】利用commons.fileupload组件进 ... | 【HRMS】解决当点击系统的退出按钮后，怎么 ...

2010-10-11 17:21
浏览 1094
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

【URL】检索baidu首页将包含超链接的<a ></a> 打印出来

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

【URL】检索baidu首页将包含超链接的<a ></a> 打印出来

评论

发表评论

相关推荐

【Socket网络通信】利用TCP/IP协议实现从服务端的文件中读取数据打印到客户端的控制台，服务端对客户端输入过来的数据做出响应

【Socket网络通信】利用TCP/IP协议实现服务端与客户端的双向聊天

【Socket网络通信】写一个服务器(客户端)可以接收客户端（服务器）的数据，并可以把数据保存在“name-yyyy-MMM-dd.txt”的文件中

【多线程】做一个放号器, 多个线程同时申请号码不重复.

【多线程】 将一个大于200M的视频文件，用4个线程copy到另外一个目录里去

【Properties类】从控制台输入用户名和密码，与属性文件prop.txt中的数据进行验证登录

【I/O流】压缩一个文件夹，包括文件夹下的所有文件、子文件夹；解压文件方法；压缩文件名为中文乱码的处理

【I/O流】在一个目录下创建一个文本文件,并向文件里写入当前的创建时间,要求文件名的格式为YYYYmmDDHHMMss.txt

【I/O流】读取控制台数据写入文件中，当文件大小超过50个字符时自动创建一个文件来存放，依次循环

【集合类】关于List与Map集合的第二题（有一个存放学生类的集合list，打印出每个班级的总分和平均分如题：）

【集合类】关于List与Map集合第一题（将字符串分组存放到list中，然后再根据不同的键值放到map中）

【递归】古典问题：有一对兔子，从出生后第3个月起每个月都生一对兔子···

【File类】监听判断指定的某个文件是否被修改，如果被修改， 就在控制台打印出“File changed…”

【I/O流】把一个文件夹里的所有文件包括文件夹 一并原样拷贝到另一个目录中

【File类】遍历文件夹下的所有文件包括所有子目录，把该文件夹下的所有文件的文件路径名打印出来

【Date类】打印万年历；1.判断当前月有多少天；2.判断第一天星期几；

【String类】求字符串中有多少种字符,以及每种字符的重复次数（个数）?

最近访客更多访客>>

【多线程】将一个大于200M的视频文件，用4个线程copy到另外一个目录里去

【File类】监听判断指定的某个文件是否被修改，如果被修改，就在控制台打印出“File changed…”

【I/O流】把一个文件夹里的所有文件包括文件夹一并原样拷贝到另一个目录中