- 浏览: 109570 次
- 性别:
最新评论
-
hjl416148489:
留言下载:http://www.sucaihuo.com/se ...
PHP留言板开发 -
a6129181:
咋样啊,我也在做数据挖掘。同行嘛。也是爬去数据分析,一塌糊涂。 ...
《推荐系统》所带给我的所感所悟 -
a6129181:
stcasshern 写道请问下能够分享一下详细代码吗?最近在 ...
用webmagic实现的网络爬虫 -
liuxu9900:
模拟登录有实现吗
用webmagic实现的网络爬虫 -
stcasshern:
请问下能够分享一下详细代码吗?最近在研究webmagic分页+ ...
用webmagic实现的网络爬虫
文章列表
[置顶] 现在才发现,开车和语言是一样的
- 博客分类:
- 生活
现在才发现,开车和语言是一样的
开车和计算机语言是一样的,C照的车是私家车,c++就像手动挡,java就像自动挡。
开车的时候大家选择的大多数是自动挡,学车的时候基本都选C1照
自动挡的没有离合器,就像java的垃圾回收,用户不用关心车速是否在合适的档位,就像程序员不用关心是否溢出。
自动挡不需要挂档(或者说没有复杂的档位),手动挡档位明确,对于新手来说,挂档常常让新手头疼,很多新手开车不顺,死火都是不会挂档导致的,于是默默选择了自动挡,而如果用好了档位,不仅可以省油,而且更自由更安全,档位就像是指针,对于“老司机”它是灵活的,自由的,高效的,而对于“小白”来说,每
深入分析各排序算法
排序是一个非常常见的问题:
排序分为内部排序和外部排序;内部排序:内部排序是指待排序列完全存放在内存中所进行的排序过程,适合不太大的元素序列。
排序算法算是认识算法的一个基础,七种排序算法:冒泡排序,选择排序,快速排序,堆排序,shell排序,基数排序,归并排序。
时间复杂度与空间复杂度:
排序算法的效率是一个大问题,然而衡量效率的最好办法之一就是通过计算各排序算法的时间复杂度和空间复杂度,空间复杂度是相对来说比较好分析的,时间复杂度就相对比较难。
首先我们先看看各个排序的时间复杂度:
[置顶] 《推荐系统》所带给我的所感所悟
- 博客分类:
- 读书感悟
《推荐系统》所带给我的所感所悟
<!--[endif]-->
寒假趁着有时间读了一本叫做《推荐系统》的书,选择这本书并不是得到了某位大神的推荐,只是单纯地觉得它封面高大上,正好我对数据挖掘,机器学习这类领域很感兴趣,所以就一时冲动买了。在家里被我忽略了十多天后,终于忍不了了,毕竟59块钱那么贵,所以痛下决心把他读完。
事实证明我是瞎猫撞上死耗子了。这本书的确比较适合像我这样的小白。现在我将简单谈谈我读完这本书的收获,顺便给自己点个赞,哈哈
内容以及小结:
这本书首先介绍了“协同过滤推荐”,“基于内容的推荐”,“基于知识的推荐”三个推荐系统,读完前三章,需要对这三个推荐系 ...
用maven在liunx上将java程序进行打包
随着Maven运用越来越广泛,使用Maven对java程序进行打包变得十分必要,下面我将介绍maven打包方法,对写好的maven程序进行打包;
没有用过maven的朋友可以先看看这篇博客:
http://448230305.iteye.com/admin/blogs/2172780
我使用的编译器是IDEA,感觉比
Maven入门介绍
1. 安装 Maven
Maven 是 Apache 基金会的顶级项目,一般情况下,被 Apache 看中的都不会是烂货。
我们可以从 http://maven.apache.org/ 下载 Maven 开发包,其实就是一个压缩包,下载完毕后,解压一下,配置一下环境变量就可以用了。
假设我们刚刚下载了一个 apache-maven-3.1.1-bin.zip
死锁问题入门知识
今天我们一起来学习死锁,一起沐黎文伟老师的春风(我的操作系统老师叫做黎文伟),呵呵呵。
什么是死锁:
是指两个或两个以上的进程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去。
产生死锁的原因主要是:因为系统资源不足。
Java的Unicode编码转化(多种情况处理方法)
Java转unicode转中文的情况使用的场景很多,是一个很常见的需求,按理来说,这样的功能应该被java集成起来,不过很遗憾,java提供的方法很烂,很多时候我们需要自己去写。
好在这个需求的源代码网上很多,在查资料的过程中,我找到啦好几种,下面我将我找到的资料分享和我自己实现的方法提供给大家;希望大家能有个参考;
1、java中使用的是unicode编码,所以如果我们得到的本身就是一个
用webmagic实现的网络爬虫
网络蜘蛛(网络爬虫)Web Spider是一个非常形象的比喻,如果我们的网络是一个蜘蛛网,每个节点就是一个网站,联系每个节点的蜘蛛丝就是我们网站的连接。网络爬虫的原理其实不难理解——通过网页的链接地址来寻找网页,从 网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。
网络爬虫的实现:
正则表达式
用通配符类比正则表达式:
很可能你使用过Windows/Dos下用于文件查找的通配符(wildcard),也就是*和?。如果你想查找某个目录下的所有的Word文档的话,你会搜索*.doc。在这里,
Openstack架构解析(学习汇总)
OpenStack是一个云平台管理的项目,它不是一个软件。这个项目由几个主要的组件组合起来完成一些具体的工作。
想要了解openstack,第一步我们可以观察他的概念图:
(本图来自互联网)
二叉树的实现
这是我复习的第三部分,二叉树的实现,这次需要的代码比较少,所以把主函数贴出来了,注释也很清晰,所以大家直接看代码吧:
//树
#ifndef BINNODE_H
#define BINNODE_H
template<class Elem>
class BinNode{
public:
顺序栈和链栈是我复习的第二部分,同样是把之前的代码整理出来,发布给大家,实现的方法并不
难,毕竟是最基本的方法嘛。关于代码的解释已经写成注释。所以不用多说了。大家好好看代码吧~
下面的代码是栈的实习,完整代码实现下载地址;
//顺序栈
//
#ifndef ASTACK_H
#defineASTACK_H
#include"Stack.h"
template <class
最近在重新复习C++基础知识点,复习到链表和顺序表,把之前的代码整理出来给大家参考;
我的注释算是比较详细的,所以就不做过多解释了;
贴代码的话只把具体实现贴出来,如果想要完整代码的我已经提供下载链接了哦,希望对大家有帮助:
首先是纯虚函数,两个表都继承此函数:headlist.h
#ifndef LISTHEAD_H
#defineLISTHEAD_H
#include
C++与java对比
大一到大三,我课外课内使用过很多语言,大一是c++,紧接着是java、php,再后来是python,天下语言都是相通的,不过每个程序员都应该掌握一个最称手的兵器,java虽然成熟通用却不高效,php开发网站方便但同样不高效,唯有两个语言可以入我的法眼:python和c++,python方面快捷,开发效率高,好用。C++效率高,我感兴趣的方向是数据挖掘,以后也希望做一个后台程序员,也许c++会用的比较多,而且我心目中的理想公司也在大范围使用。因此决定重新拾起。
可是c++并不是我使用最多的语言,我使用最多的语言是java,为了梳理思路和方便以后的学习,我决定整理出他们 ...
C++指针——数组指针/函数指针
指针对于新手来说是一件非常头疼的事情,特别是二重指针,第一此看的时候一知半解的,在拥有一定的代码量积累之后,终于鼓起勇气再看一遍,其他指针的知识点还好,到了二重指针、函数指针这里就有些难度了,多看了些资料,终于把它攻克了,下面把资料整理出来,以供大家参考:
首先鸣谢以下资料,如果作者有哪些讲得不清楚的可以参考一下下面资料,这篇文章就是根据下面资料整理出来的:
http://www.cnblogs.com/ggjucheng/archive/2011/12/13/2286391.html
http://bbs.51cto.com/thread-10172 ...