java 获取网页网址

hje

浏览: 288148 次
性别:
来自: 广州

最近访客更多访客>>

1jianzhan

zlf3865072

b1170912188

zhaoshijie

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

java 知识

Java Socket .net Web

package web;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.net.InetAddress;
import java.net.Socket;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class TestSock {

public void TestSocket()
    {
    }
public static void main(String args[])
    {

        String strServer = "www.163.com";

        String strPage = "/";

        try
        {

            int port = 80;

            InetAddress addr = InetAddress.getByName(strServer);


            Socket socket = new Socket(addr, port);


            BufferedWriter wr = new BufferedWriter(new OutputStreamWriter(socket.getOutputStream(), "UTF-8"));
            wr.write("GET " + strPage + " HTTP/1.0\r\n");
            wr.write("HOST:" + strServer + "\r\n");
            wr.write("Accept:*/*\r\n");
            wr.write("\r\n");
            wr.flush();


            BufferedReader rd = new BufferedReader(new InputStreamReader(socket.getInputStream(),"UTF-8"));
            String line;

            while ((line = rd.readLine()) != null)
            {
    String reg = "(http\\://[a-za-z0-9]{0,100}[.]{0,1})[^.\\s]*?\\.(com|cn|net|org|biz|info|cc|tv)";
    //Pattern pattern = Pattern.compile("(http://|https://){1}([a-zA-Z]+)(.)(1)(.)(com|cn|com/cn|tw)");
    Pattern pattern = Pattern.compile(reg);
    Matcher matcher = pattern.matcher(line);
    StringBuffer buffer = new StringBuffer();
    while(matcher.find()){
        buffer.append(matcher.group());
        buffer.append("\r\n");
        System.out.println(buffer.toString());

    }
            }
            wr.close();
            rd.close();
        }
        catch (Exception e)
        {
            e.printStackTrace();
        }
    }

}

分享到：

flex 正则表达式查找xml节点名 | div 加载顺序

2009-03-11 11:21
浏览 1090
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论