`
sbpya
  • 浏览: 615642 次
  • 性别: Icon_minigender_1
  • 来自: 杭州,长沙
社区版块
存档分类
最新评论

一个实用的例子:JSP抓取网页代码的程序

阅读更多

 

 

< %@ page contentType="text/html;charset=gb2312"%>
< % 

String sCurrentLine; 

String sTotalString; 

sCurrentLine=""; 

sTotalString=""; 

java.io.InputStream l_urlStream; 

java.net.URL l_url = new java.net.URL("http://www.163.net/"); 

java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection(); 

l_connection.connect(); 

l_urlStream = l_connection.getInputStream(); 

java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream)); 

while ((sCurrentLine = l_reader.readLine()) != null) 

sTotalString+=sCurrentLine; 

out.println(sTotalString); 

%>

后记 

  虽然代码比较简单,但是,我认为根据这个,可以实现“网络爬虫”的功能,比如从页面找href连接,然后再得到那个连接,然后再“抓”,不停止地(当然可以限定层数),这样,可以实现“网页搜索”功能。 

分享到:
评论

相关推荐

    网页抓取例子

    在本例中,我们关注的标题是“网页抓取例子”,这表明我们将探讨如何实现一个简单的网页抓取程序。描述部分虽然为空,但我们可以从提供的博文链接(https://guoyiqi.iteye.com/blog/735515)中获取更多信息,它可能...

    JSP搜索引擎的研究与实现(源代码+论文+答辩PPT).zip

    通过JSP,我们可以构建用户交互性强、可扩展性好的Web应用,而搜索引擎正是这类应用的一个典型例子。 搜索引擎的核心组成部分包括爬虫、索引、查询解析和排序。在JSP实现中,爬虫负责从互联网上抓取网页数据,这...

    页面静态化实例,jsp转化成html

    JSP是Java平台上的一个服务器端脚本语言,它允许开发者在HTML代码中嵌入Java代码,以动态生成网页内容。然而,每次用户请求JSP页面时,服务器都需要解析其中的Java代码,生成HTML并发送到客户端。这一过程对于高流量...

    Jsp开发遇到的70个问题及解决方法记录

    - **问题描述**:如何实现一个简单的Web爬虫来抓取网页内容。 - **解决方案**:可以使用Java语言编写一个简单的Web爬虫,通过`URL`类来获取网页内容,并递归地抓取链接中的其他页面。需要注意的是,应遵守网站的...

    基于Java的实例源码-毕业论文:搜索引擎系统附源代码.zip

    标题中的“基于Java的实例源码-毕业论文:搜索引擎系统附源代码.zip”指的是一个包含Java编程语言实现的搜索引擎系统的毕业设计项目。这个项目可能是为了展示如何构建一个基本的搜索引擎,帮助用户在特定数据集或者...

    urlrewrite简单例子

    总的来说,urlrewrite是一个强大的工具,它让开发者能够在不修改应用程序代码的情况下,轻松地实现动态页面静态化,提升网站的性能和SEO效果。通过熟练掌握urlrewrite的规则和技巧,你可以更好地优化你的Web项目,为...

    spring live 中文版

    - **下载Struts和Spring**:为了搭建一个完整的Web应用程序示例,本书介绍了如何下载并配置Struts和Spring框架。 - **创建项目目录和ant build文件**:本书详细解释了如何构建项目的目录结构,并使用Ant工具进行自动...

    hibernate 帮助文档

    **4.1 一个简单的POJO例子** - **实体类定义**:定义一个简单的POJO作为实体类。 - **构造方法实现**:提供默认的构造方法。 - **标识属性**:定义主键属性。 - **非final类使用**:使用非最终类以支持序列化或代理...

    现隐藏的内容.docx

    例如,如果在应用程序中发现了UpdateData.jsp和EditData.jsp,可以推测可能存在DeleteData.jsp等类似的文件。对于豌豆学院的例子,个人中心的不同模块如personCenter、personInfo等,暗示了可能存在其他的类似命名的...

    Python验证码截取识别代码实例

    1. **Selenium**:一个强大的网页自动化工具,可以模拟用户行为,如点击按钮、填写表单等。在这里,它用于打开网页并定位验证码元素。 2. **webdriver**:Selenium的一部分,用于驱动浏览器。在这个例子中,我们使用...

    java 缓存机制

    JSP文件中的例子展示了如何使用`HttpSession`来保持用户会话,通过`getAttribute`和`setAttribute`方法来存储和读取数据。而Cookie则是一种客户端存储机制,通过设置`setDomain`和`setMaxAge`,可以在多个子域之间...

    php使用curl模拟登录后采集页面的例子

    在本例中,我们将讨论如何使用PHP的cURL功能来模拟登录一个网站并抓取登录后的页面内容。首先,我们需要确保PHP的cURL模块已经正确安装和启用。 开启PHP cURL模块的步骤如下: 1. 将`libeay32.dll`和`ssleay32.dll...

    pgae-examples:Dan Sanderson 所著的“Google App Engine 编程”书籍随附的即用型示例

    **Google App Engine (GAE)** 是一个由 Google 提供的平台,用于开发和托管基于 Web 的应用程序。它提供了全面的服务,包括服务器空间、数据库、负载均衡以及自动扩展功能,允许开发者专注于编写应用代码,而无需...

    基于javeEE云计算与大数据培训视频和源码完整版最新

    可能包含的源码项目可能涉及到用户管理、数据抓取、流式处理、机器学习模型训练等,这些都是大数据和云计算应用场景的实际例子。 总之,这个培训资源提供了全面学习JavaEE在云计算和大数据环境下开发的途径,无论是...

Global site tag (gtag.js) - Google Analytics