`
386648753
  • 浏览: 871 次
  • 性别: Icon_minigender_1
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

关于读取网页源码。。。

阅读更多
package com.free.html.util;

import java.io.*;
import java.net.*;

public class ReadHtml {

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		// TODO Auto-generated method stub
	//	readJSP("http://www.yz91.net/zpxx.asp");
		readHtml("http://www.yz91.net/zpxx.asp","gb2312");
	//	getStaticPage("http://www.yz91.net/zpxx.asp","gb2312");
	}
	
	public static void readHtml(String utl,String bm ){
		try {
			
			URL url=new URL(utl);
			HttpURLConnection  con=(java.net.HttpURLConnection)url.openConnection();
			con.connect();
			BufferedReader br=new BufferedReader(new InputStreamReader(con.getInputStream(),bm));
			
			FileOutputStream fos =new FileOutputStream("D:\\My Documents\\word.txt");
			OutputStreamWriter osw =new OutputStreamWriter(fos,"utf-8");
			BufferedWriter bw=new BufferedWriter(osw);
			int a;
			StringBuilder temp = new StringBuilder();
			while((a=br.read())!=-1){
				System.out.println(br.readLine());            //这里后台输出。。。信息后面再代码后面给出 有点问题
				bw.write(br.readLine());
				bw.flush();									//这里写到txt里  总是少第一个<html>  
			//	temp.append((char)a);
                        //      bw.write(temp);
			//	System.out.println(temp.toString());               这里后台输出正常  
			}
			br.close();
			bw.close();
			con.disconnect();
		
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	}

}




问题1.使用System.out.println(br.readLine()); 后台输出的问题:
html>
head>
meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
title>详见扬州人力资源网(www.yz91.net) ,扬州数字电视“扬州就业”栏目</title>
/head>
body>
table width="100%" border="1" align="center"  cellpadding="0" cellspacing="0">
<tr >
   <td >单位名称</td>
   <td >岗位</td>
   <td align="center">年龄</td>
   <td align="center">男</td>
   <td align="center">女</td>
   <td align="center">不限</td>
   <td align="center">文化程度</td>
   <td >待遇</td>
   <td >联系人</td>
   <td >联系电话</td>
</tr>

tr>
td width="30%">扬州统一机械有限公司</td>
   <td >技术员</td>
   <td >18-50</td>
   <td >1</td>
   <td >0</td>
   <td >0</td>
   <td >大专</td>
   <td >930+</td>
   <td >桑耿娟</td>
   <td >0514-85550686 13064889698</td>
/tr>

//.....类似

tr>
td width="30%">扬州青青环保成套设备有限公司</td>
   <td >文员</td>
   <td >18-50</td>
   <td >0</td>
   <td >5</td>
   <td >0</td>
   <td >大专</td>
   <td >930+</td>
   <td ></td>
   <td ></td>
/tr>

/table>
/body>
/html>

大概问题就是 少左尖括号。

问题2.把流写入txt后总少头上<html>这一个标签,不管是用bw.write(br.readLine());还是用 bw.write((char)a);


求教大大们了  
分享到:
评论
1 楼 386648753 2012-03-17  
失误了。。。while里面已经用a=read()把每行第一个字符给读掉了。。。。

相关推荐

    易语言源码超速读取网页源码.rar

    易语言源码超速读取网页源码.rar 易语言源码超速读取网页源码.rar 易语言源码超速读取网页源码.rar 易语言源码超速读取网页源码.rar 易语言源码超速读取网页源码.rar 易语言源码超速读取网页源码.rar

    易语言源码易语言读取网页源码.rar

    易语言源码易语言读取网页源码.rar 易语言源码易语言读取网页源码.rar 易语言源码易语言读取网页源码.rar 易语言源码易语言读取网页源码.rar 易语言源码易语言读取网页源码.rar 易语言源码易语言读取网页源码....

    C#读取网页源码(获取网页源码)

    c# 读取网页源码 c# 读取网页源码 c# 读取网页源码 c# 读取网页源码

    快速读取网页源码.zip易语言项目例子源码下载

    这个“快速读取网页源码.zip”压缩包包含了一个易语言项目的示例源码,主要目的是教用户如何快速地获取网页的HTML源代码,这对于网页抓取、数据分析等任务非常有用。下面我们将深入探讨相关知识点。 1. **HTTP协议*...

    易语言超速读取网页源码模块

    在互联网编程中,读取网页源码是一项基本技能,它涉及到网络通信和网页解析。这个模块通过封装网络请求和HTML解析过程,简化了原本复杂的过程,让初学者能够快速上手。在实际应用中,这可以用于网页爬虫、数据分析等...

    易语言脚本读取网页源码.rar

    在这个"易语言脚本读取网页源码.rar"压缩包中,包含的是使用易语言编写脚本以获取网页源码的相关教程和示例代码。 首先,我们要理解什么是网页源码。网页源码是构成网页的基本元素,由HTML、CSS和JavaScript等语言...

    易语言源码快速读取网页源码.rar

    在"易语言源码快速读取网页源码.rar"这个压缩包中,我们主要讨论的是如何使用易语言来实现对网页源码的快速获取。这一知识点在互联网数据抓取、网页分析等领域有着广泛的应用。 首先,我们需要了解易语言中的网络...

    易语言超速读取网页源码模块.zip易语言项目例子源码下载

    本压缩包“易语言超速读取网页源码模块.zip”提供了易语言项目的源码示例,特别适合初学者以及对网络编程感兴趣的开发者进行学习和参考。 在易语言中,读取网页源码是一项基础但重要的技能,尤其在网络爬虫或数据...

    易语言源码易语言快速读取网页源码.rar

    易语言源码易语言快速读取网页源码.rar 易语言源码易语言快速读取网页源码.rar 易语言源码易语言快速读取网页源码.rar 易语言源码易语言快速读取网页源码.rar 易语言源码易语言快速读取网页源码.rar 易语言源码...

    易语言源码易语言脚本读取网页源码.rar

    易语言源码易语言脚本读取网页源码.rar 易语言源码易语言脚本读取网页源码.rar 易语言源码易语言脚本读取网页源码.rar 易语言源码易语言脚本读取网页源码.rar 易语言源码易语言脚本读取网页源码.rar 易语言源码...

    易语言源码易语言超速读取网页源码模块.rar

    易语言源码易语言超速读取网页源码模块.rar 易语言源码易语言超速读取网页源码模块.rar 易语言源码易语言超速读取网页源码模块.rar 易语言源码易语言超速读取网页源码模块.rar 易语言源码易语言超速读取网页源码...

    易语言超速读取网页

    在实际的网络编程中,读取网页源码是一项基础且重要的任务,它可以用于爬虫开发、数据分析、网页自动化等多种用途。 首先,易语言提供了丰富的网络模块,如HTTP请求模块,使得开发者能够方便地向服务器发送HTTP请求...

    超速读取网页源码.zip易语言项目例子源码下载

    总的来说,“超速读取网页源码.zip”易语言项目例子为我们提供了一个实用的学习平台,让我们能够掌握网页源码的读取与解析技术,同时也能体验到易语言在处理网络任务上的便捷性。通过深入研究这个项目,不仅可以提升...

    读取网页源码(不会出现网页乱码)

    本节将详细介绍如何正确地读取网页源码,避免出现乱码,并特别关注在处理压缩文件格式时的源代码读取。 首先,我们需要了解网页源码的获取方式。在Java中,我们可以使用`java.net.URL`和`java.io.InputStreamReader...

    易语言超速读取网页源码.ec

    易语言超速读取网页源码模块,比易语言自带的功能要快5倍。

    易语言源码超速读取网页源码.7z

    总的来说,"易语言源码超速读取网页源码.7z" 提供了一个学习和实践易语言网络编程的好机会,它涉及到网络通信、数据解析、错误处理等多个编程领域,对于想要提升易语言编程技能的开发者来说,是一份宝贵的资源。...

    VB.NET获取网页源码

    最后将读取到的网页源码显示在`Tbx1`控件中。 #### 三、优化与注意事项 虽然以上代码能够有效获取网页源码,但在实际应用中还应注意以下几点: - **异常处理**:网络请求可能遇到各种异常,如连接超时、服务器...

    易语言脚本读取网页源码.zip易语言项目例子源码下载

    "易语言脚本读取网页源码.zip" 是一个包含易语言项目的压缩包,提供了如何使用易语言来读取网页源码的示例代码。这个项目对个人学习技术、学生的毕业设计以及小团队的项目开发都具有很好的参考价值。 在编程领域,...

    js(javascript)获取网页源码

    远程网页源代码读取&lt;/title&gt; &lt;style type="text/css"&gt; /* 页面字体样式 */ body, td, input, textarea { font-family:Arial; font-size:12px; } &lt;/style&gt; &lt;script type="text/javascript"&gt; //用于创建...

Global site tag (gtag.js) - Google Analytics