< %@ page contentType="text/html;charset=gb2312"%>
< %
String sCurrentLine;
String sTotalString;
sCurrentLine="";
sTotalString="";
java.io.InputStream l_urlStream;
java.net.URL l_url = new java.net.URL("http://www.163.net/");
java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection();
l_connection.connect();
l_urlStream = l_connection.getInputStream();
java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream));
while ((sCurrentLine = l_reader.readLine()) != null)
{
sTotalString+=sCurrentLine;
}
out.println(sTotalString);
%>
后记
虽然代码比较简单,但是,我认为根据这个,可以实现“网络爬虫”的功能,比如从页面找href连接,然后再得到那个连接,然后再“抓”,不停止地(当然可以限定层数),这样,可以实现“网页搜索”功能。
分享到:
相关推荐
在本例中,我们关注的标题是“网页抓取例子”,这表明我们将探讨如何实现一个简单的网页抓取程序。描述部分虽然为空,但我们可以从提供的博文链接(https://guoyiqi.iteye.com/blog/735515)中获取更多信息,它可能...
通过JSP,我们可以构建用户交互性强、可扩展性好的Web应用,而搜索引擎正是这类应用的一个典型例子。 搜索引擎的核心组成部分包括爬虫、索引、查询解析和排序。在JSP实现中,爬虫负责从互联网上抓取网页数据,这...
JSP是Java平台上的一个服务器端脚本语言,它允许开发者在HTML代码中嵌入Java代码,以动态生成网页内容。然而,每次用户请求JSP页面时,服务器都需要解析其中的Java代码,生成HTML并发送到客户端。这一过程对于高流量...
- **问题描述**:如何实现一个简单的Web爬虫来抓取网页内容。 - **解决方案**:可以使用Java语言编写一个简单的Web爬虫,通过`URL`类来获取网页内容,并递归地抓取链接中的其他页面。需要注意的是,应遵守网站的...
标题中的“基于Java的实例源码-毕业论文:搜索引擎系统附源代码.zip”指的是一个包含Java编程语言实现的搜索引擎系统的毕业设计项目。这个项目可能是为了展示如何构建一个基本的搜索引擎,帮助用户在特定数据集或者...
总的来说,urlrewrite是一个强大的工具,它让开发者能够在不修改应用程序代码的情况下,轻松地实现动态页面静态化,提升网站的性能和SEO效果。通过熟练掌握urlrewrite的规则和技巧,你可以更好地优化你的Web项目,为...
- **下载Struts和Spring**:为了搭建一个完整的Web应用程序示例,本书介绍了如何下载并配置Struts和Spring框架。 - **创建项目目录和ant build文件**:本书详细解释了如何构建项目的目录结构,并使用Ant工具进行自动...
**4.1 一个简单的POJO例子** - **实体类定义**:定义一个简单的POJO作为实体类。 - **构造方法实现**:提供默认的构造方法。 - **标识属性**:定义主键属性。 - **非final类使用**:使用非最终类以支持序列化或代理...
例如,如果在应用程序中发现了UpdateData.jsp和EditData.jsp,可以推测可能存在DeleteData.jsp等类似的文件。对于豌豆学院的例子,个人中心的不同模块如personCenter、personInfo等,暗示了可能存在其他的类似命名的...
1. **Selenium**:一个强大的网页自动化工具,可以模拟用户行为,如点击按钮、填写表单等。在这里,它用于打开网页并定位验证码元素。 2. **webdriver**:Selenium的一部分,用于驱动浏览器。在这个例子中,我们使用...
JSP文件中的例子展示了如何使用`HttpSession`来保持用户会话,通过`getAttribute`和`setAttribute`方法来存储和读取数据。而Cookie则是一种客户端存储机制,通过设置`setDomain`和`setMaxAge`,可以在多个子域之间...
在本例中,我们将讨论如何使用PHP的cURL功能来模拟登录一个网站并抓取登录后的页面内容。首先,我们需要确保PHP的cURL模块已经正确安装和启用。 开启PHP cURL模块的步骤如下: 1. 将`libeay32.dll`和`ssleay32.dll...
**Google App Engine (GAE)** 是一个由 Google 提供的平台,用于开发和托管基于 Web 的应用程序。它提供了全面的服务,包括服务器空间、数据库、负载均衡以及自动扩展功能,允许开发者专注于编写应用代码,而无需...
可能包含的源码项目可能涉及到用户管理、数据抓取、流式处理、机器学习模型训练等,这些都是大数据和云计算应用场景的实际例子。 总之,这个培训资源提供了全面学习JavaEE在云计算和大数据环境下开发的途径,无论是...