0 0

局域网web应用搜索引擎选哪种架构好呢?????5

请教一下大家,我想做一个系统页面抓取系统,这个功能就是可以把我这内网局域网的

其他正运行着的web系统的某个链接得到以后可以把该页面的显示的表格等数据内容抓取出来并显示在我的

系统页面上,相当于可以是个系统功能结果的汇集吧。

不知道采取什么样的技术实现,需要用到搜索引擎的爬虫技术吗??望有经验者赐教!感谢!

问题补充:
我只是想知道我这样的需求,是否需要采用搜索引擎技术?还是单独获取每个页面的HTML然后解析HTML就可以呢?
问题补充:
MASHUP需要每个需要柔和的系统提供相应的API,我这里还有一些老系统,难道要对每个系统都进行适应性的改造吗?不太现实啊,可能我需要的只是每个系统页面的结果HTML信息提取再重新重组吧,如何实现呢?
2010年1月12日 20:16

5个答案 按时间排序 按投票排序

0 0

采纳的答案

没必要用搜索引擎技术,
单独获取每个页面的HTML然后解析HTML就可以了
这就是mashup的变体而已,

2010年1月14日 10:34
0 0

用httpparser组件来解析html得到你要的内容

2010年1月14日 10:26
0 0

这要根据具体的web应用,总体比较各种架构的性能

2010年1月13日 09:45
0 0

看你想要是的系统功能结果的汇集
这不就是mashup,

2010年1月12日 20:30
0 0

引用
运行着的web系统

搜索引擎是带延迟的。

2010年1月12日 20:29

相关推荐

    基于Linux的搜索引擎的设计与实现.pdf

    Linux操作系统因其开源、免费、稳定和安全性高的特性,被选为搜索引擎的底层系统。在成本上,Linux显著低于商业操作系统,如Windows NT,而且源代码公开,允许开发者根据需要进行定制和优化。在稳定性方面,Linux...

    ASP局域网文件共享及检索系统的设计与开发(源代码+论文).rar

    ASP.NET是一种强大的Web应用程序开发框架,由微软公司推出,它基于.NET Framework,为开发者提供了构建动态网站、Web应用和服务的强大工具。在这个“ASP局域网文件共享及检索系统的设计与开发”项目中,我们可以深入...

    ASP局域网文件共享及检索系统的设计与开发(源代码+论文).zip

    可以使用搜索引擎技术,如Lucene.NET,来实现高效检索。 5. 数据库设计:存储用户信息、文件元数据、权限设置等内容,数据库设计需考虑到数据的一致性、完整性和扩展性。 6. Web编程:ASP技术结合HTML、CSS和...

    ASP.NET 开发局域网文件共享及检索系统的设计与开发(源代码+论文)

    ASP.NET是一种基于.NET Framework的Web应用程序开发平台,由微软公司推出,主要用于构建动态网站、Web应用程序和服务。在“ASP.NET 开发局域网文件共享及检索系统的设计与开发(源代码+论文)”这个项目中,我们可以...

    局域网组建、管理与维护-B答案宣贯.pdf

    7. **搜索引擎**:虽然不是局域网的基本组成部分,但搜索引擎是网络信息检索的重要工具,可以帮助用户在大量数据中查找所需内容。 8. **完整性**:在网络管理中,数据完整性是指确保数据在传输过程中不被篡改或丢失...

    ASP局域网文件共享及检索系统的设计与开发(源代码+设计说明书).zip

    检索功能是系统的关键部分,可能涉及全文搜索引擎的实现。这通常包括建立索引,对文件内容进行分词,然后通过关键词匹配来快速定位到相关文件。索引可以存储在内存中以提高检索速度,而分词算法则决定了搜索的准确性...

    Web安全深度剖析(张柄帅)

    《Web安全深度剖析》总结了当前流行的高危漏洞的形成原因、攻击手段及解决方案,并通过大量的示例代码复现漏洞原型,制作模拟环境,更好地帮助读者深入了解Web应用程序中存在的漏洞,防患于未然。 《Web安全深度剖析...

    基于Web的CAD教学管理系统的设计与开发.pdf

    系统应具备用户友好的界面设计,以及强大的搜索引擎功能,以帮助教师和学生快速找到所需的资料。同时,系统还需要具备在线互动功能,如论坛、即时通讯工具等,以便促进师生和学生之间的互动交流。 此外,系统还需...

    计算机网络与Internet应用试题和答案.pdf

    9. 搜索引擎的定义:搜索引擎是一个应用程序,用于在网上搜索相关信息。 10. 网络信息安全:这是一个跨学科的领域,涉及到计算机科学、网络技术、通信技术、密码学等多方面知识。 11. 对称加密与非对称加密:这...

    ASP局域网文件共享及检索系统的设计与开发(源代码).rar

    系统可能使用全文搜索引擎或者基于文件元数据的查询方法,让用户能够快速找到所需的文件。对于大型文件库,这通常需要设计一个能够快速响应查询的数据库结构,比如B树或者哈希表,以实现高效的查找性能。 此外,源...

    ssd1 unit 1超详细 课件

    “Searching the Web”部分则涉及搜索引擎的工作原理,以及如何有效地进行网络搜索。这包括了关键词的选择、搜索引擎优化(SEO)的概念,以及如何识别和避免网络陷阱。 电子商务(Commerce on the Web)是现代Web不...

    基于web的论坛的设计与实现

    - **C/S架构**:客户端-服务器模式,虽然在本案例中未提及,但作为一种传统架构,它强调了客户端与服务器之间的紧密联系,适合局域网内的应用。 #### 7. 结论与展望 在线论坛系统通过整合先进的Web开发技术和...

    ASP局域网文件共享及检索系统的设计与开发(源代码+论文)【ASP】.zip

    ASP(Active Server Pages)是微软开发的一种服务器端脚本环境,它允许开发人员在网页上动态生成内容,非常适合构建Web应用程序。 该项目的核心组成部分包括以下几个方面: 1. **文件存储架构**:系统需要设计一个...

    最火专业网络工程论文题目.docx

    4. **静态Web技术研究**:关注静态网站的构建和优化,以提高页面加载速度和搜索引擎优化。 5. **语义Web服务关键技术研究**:研究如何通过语义技术增强Web服务的发现、组合和理解能力。 6. **面向语义Web服务的...

    计算机专业毕设精选-ASP局域网文件共享及检索系统的设计与开发(源代码+论文).rar

    3. **全文检索**:系统内置全文搜索引擎,可对局域网内的所有文件进行快速检索,支持关键词搜索、模糊搜索等多种检索方式。 4. **用户管理**:提供用户注册、登录、权限管理等功能,确保系统的安全性。 5. **日志...

    计算机网络与Internet应用试题和答案.doc

    7. 搜索引擎:Yahoo是目录搜索引擎,它通过人工分类的方式组织网页;而Google是基于关键词的全文搜索引擎,提供更智能的搜索结果。 8. 网络信息安全:网络信息安全是一门综合学科,涉及计算机科学、密码学、通信...

Global site tag (gtag.js) - Google Analytics