相关推荐
-
Nutch公开课从搜索引擎到网络爬虫
课程背景:Nutch诞生于2002年8月,是Apache旗下的一个用Java实现的开源搜索引擎项目,自Nutch1.2版本之后,Nutch已经从搜索引擎演化为网络爬虫,接着Nutch进一步演化为两大分支版本:1.X和2.X,最大的区别在于2.X对...
-
NUTCH公开课:从搜索引擎到网络爬虫
Hadoop是大数据的核心技术之一,而Nutch集Hadoop之大成,是Hadoop的源头。学习Hadoop,没有数据怎么办?用Nutch抓!学了Hadoop的Map Reduce以及HDFS,没有实用案例怎么办?学习Nutch!Nutch的很多代码是用Map Reduce...
-
开源力量公开课1-32期课件下载
...第一期 ...开源力量公开课第1期-生产环境下的Java排错调优-施懿民 ...第二期 ...开源力量公开课第2期-Go, 基于连接与组合的语言-许式伟 ...第三期 ...开源力量公开课第3期:2小时学会iOS应用开发 ...开源力量公开课第4期-M...
-
python3.6爬虫库_python3.6 网络爬虫
《精通Python网络爬虫:核心技术、框架与项目实战》——导读前 言为什么写这本书网络爬虫其实很早就出现了,最开始网络爬虫主要应用在各种搜索引擎中。在搜索引擎中,主要使用通用网络爬虫对网页进行爬取及存储。...
-
大数据基础课02 从萌芽到爆发,大数据经历了哪些发展?
从大数据概念的提出到现在有四十年的时间,但是我们可以预见,大数据的发展绝对不会止步于前,甚至可以说,大数据的发展才刚刚步入正常的轨道。同时,根据我自己的经验,列举了在当前互联网公司中,大数据相关的工作...
-
Nutch+Solr学习笔记
最近学习搜索引擎,以下为整理学习笔记:
-
【WEB搜索技术】课程学习大纲与学习感悟
导论(1)Web搜索的定义①Web搜索(2)Web搜索的发展背景①搜索引擎(3)Web搜索的挑战性(4)Web搜索的科学价值(5)1.5 Web搜索的研究状况①理论研究②语音搜索方面的研究③图像搜索的理论研究2.搜索引擎基础(1)搜索引擎体系...
-
关于搜索引擎及其开发
托google、百度们成功的福,搜索引擎火了半边天。很多人都想跨到这个行业里边来。前两天在公司里边面试了一些人,基本上没有感到满意。不是说从业经验不够,有些也已经工作了三年、四年。不过我估计,或者说是猜想,...
-
数据采集及预处理——针对“数据”“采集”“预处理”的理解与解析
网络数据采集3.ETL三. 预处理总结 前言 一、 数据 在计算机系统中,各种字母、数字符号的组合、语音、图形、图像等统称为数据,数据经过加工后就成为信息。 数据(data)是事实或观察的结果,是对客观事物的逻辑...
-
搜索引擎方案,仅脑构思
多媒体作业,自己定义一个多媒体搜索引擎,并写出方案,留下来,做个纪念 爬虫 (1) 通过网络爬虫大量地下载网页(可以考虑使用诸如Apache Nutch等开源网络爬虫) (2) 通过正则表达式等方式对网页内容进行去噪,过滤...
-
关于搜索引擎及其开发[转]
作者:xwjbs 来自:http://blog.csdn.net/xwjbs 托google、百度们成功的福,搜索引擎火了半边天。很多人都想跨到这个行业里边来。前两天在公司里边面试了一些人,基本上没有感到满意。不是说从业经验不够,有些也...
-
Nutch&Solr小计
新开一篇专门记Nutch&Solr。 版本 Nutch版本 Nutch目前是两条线路开发,所以2.x并不比1.x来的高,来的新。 1.x(目前,最新1.8,默认搭配hadoop1.2,可以搭配hadoop2.2。)2.x(目前,最新2.2.1,默认搭配hadoop1.2...
-
爬虫大全,爬虫工具汇总
开源爬虫 开发语言 软件名称 软件介绍 许可证 Java Arachnid 微型爬虫框架,含有一个小型 HTML 解析器。是一个基于Java的web spider框架.它包含一个简单的HTML剖析器能够...
-
JAVA002打飞机游戏设计(程序+论文).zip
Java项目课程设计,包含源码+数据库+论文
-
基于Java的视频会议系统(程序+论文).zip
Java项目课程设计,包含源码+数据库+论文
-
(源码)基于Raspberry Pi Pico的智能自主两轮机器人小车系统.zip
# 基于Raspberry Pi Pico的智能自主两轮机器人小车系统 ## 项目简介 本项目围绕智能自主两轮机器人小车展开,借助Raspberry Pi Pico微控制器、多种传感器以及PID(比例 积分 微分)控制器,达成高效导航、障碍物规避和条形码识别等功能。目标是打造一款能在预设轨道行驶、巧妙避开障碍物并通过红外传感器识别条形码的机器人小车。 ## 项目的主要特性和功能 1. 基本运动控制借助电机传感器,实现小车在上下左右等多个方向的简单移动。 2. 速度精准调控运用PID控制器和编码器,对小车速度进行有效调节与控制。 3. 导航与路径规划可将迷宫转化为可打印地图,并依据生成的地图找出最短路径。 4. 障碍物检测利用超声波传感器测定与障碍物的最小和最大距离,进而避开障碍物。 5. 特殊信息识别通过红外传感器实现线路跟踪和条形码检测。 6. 方位获取借助磁传感器获取罗盘方位值。 7. 数据优化采用滤波技术提升传感器数据的准确性和精度。
-
图书馆管理系统项目源码.zip
Java项目web的课程设计,包含源码+数据库+论文
-
基于springboot的医院后台管理系统的设计与实现(完整Java源码+数据库sql文件+项目文档+Java项目编程实战+编程练手好项目).zip
信息数据从传统到当代,是一直在变革当中,突如其来的互联网让传统的信息管理看到了革命性的曙光,因为传统信息管理从时效性,还是安全性,还是可操作性等各个方面来讲,遇到了互联网时代才发现能补上自古以来的短板,有效的提升管理的效率和业务水平。传统的管理模式,时间越久管理的内容越多,也需要更多的人来对数据进行整理,并且数据的汇总查询方面效率也是极其的低下,并且数据安全方面永远不会保证安全性能。结合数据内容管理的种种缺点,在互联网时代都可以得到有效的补充。结合先进的互联网技术,开发符合需求的软件,让数据内容管理不管是从录入的及时性,查看的及时性还是汇总分析的及时性,都能让正确率达到最高,管理更加的科学和便捷。本次开发的医院后台管理系统实现了病房管理、病例管理、处方管理、字典管理、公告信息管理、患者管理、药品管理、医生管理、预约医生管理、住院管理、管理员管理等功能。系统用到了关系型数据库中王者MySql作为系统的数据库,有效的对数据进行安全的存储,有效的备份,对数据可靠性方面得到了保证。并且程序也具备程序需求的所有功能,使得操作性还是安全性都大大提高,让医院后台管理系统更能从理念走到现实,确确实实的
-
(源码)基于Go语言和Vue3的New Bing演示站点.zip
# 基于Go语言和Vue3的New Bing演示站点 ## 项目简介 本项目是基于Go语言和Vue3开发的微软New Bing演示站点,能让用户拥有和New Bing一致的UI体验,支持ChatGPT提示词,在国内也能使用,基本兼容微软Bing AI的所有功能,用户无需登录即可进行畅聊。 ## 项目的主要特性和功能 1. 服务器选择灵活Bing官方聊天服务器不可用时,可通过ModHeader添加请求头或本地部署中转服务聊天服务器可在设置中切换,默认的Cloudflare Workers有请求数限制,推荐自行部署。 2. 国内可用部署服务器需直连www.bing.com不重定向CN,支持配置socks连接。 3. 支持提示词库支持现有开源ChatGPT提示词库。 4. 高级功能体验需要画图等高级功能时,登录微软账号设置用户Cookie即可体验。 5. 问题解决方式多样遇到问题可依次尝试点击左下角按钮、刷新页面、清理浏览器缓存及Cookie。
-
(源码)基于React框架的水印插件系统.zip
# 基于React框架的水印插件系统 ## 项目简介 这是一个基于React框架的水印插件系统,旨在提供一种方便、灵活的方式来为你的React应用添加水印功能。通过该插件,你可以轻松地为网页内容添加自定义的水印,包括主文本、副文本以及一系列可配置的水印样式。 ## 项目的主要特性和功能 1. 灵活的水印文本配置支持主文本和副文本,满足多种需求。 2. 丰富的水印样式选项提供多种样式配置,如颜色、旋转角度、字体大小、字体粗细、字体族等,以满足不同场景下的水印需求。 3. 易于集成通过npm安装后,可以方便地引入并使用水印组件。 4. 适配性强支持React的编译环境,确保在各种环境下都能正常工作。 ## 安装使用步骤 1. 安装插件 首先,通过npm安装该水印插件 bash npm install tntdreactwatermark save 2. 引入并使用插件
8 楼 yangshangchuan 2014-02-19 00:18
7 楼 yangshangchuan 2013-09-18 05:10
6 楼 啦登2010 2013-09-16 15:14
5 楼 yangshangchuan 2013-09-16 01:23
4 楼 yangshangchuan 2013-09-14 17:45
3 楼 qdj6679 2013-09-13 13:22
2 楼 luoshengsha 2013-09-12 09:54
1 楼 fat1 2013-09-11 10:46