`
anylin
  • 浏览: 14143 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
文章列表
  Taste简介 Mahout 是apache下的一个java语言的开源大数据机器学习项目,与其他机器学习项目不同的是,它的算法多数是mapreduce方式写的,可以在hadoop上运行,并行化处理大规模数据。   协同过滤在mahout里是由一个叫taste的引 ...
  欧几里德相似度(Euclidean Distance) 最初用于计算欧几里德空间中两个点的距离,以两个用户x和y为例子,看成是n维空间的两个向量x和y,  xi表示用户x对itemi的喜好值,yi表示用户y对itemi的喜好值,他们之前的欧几里德距离 ...
当用log4j记录日志时,如果记录的日志量非常大,日志文件迅速增长,IO负载提高,会导致log的输出函数( 如log.info())等响应较慢。此时,我们就想把log的输出放到单独的线程中,这样调用端就可以快速返回,实现异步化。   log4j提供了一个AsyncAppender来实现日志的异步输出,AsyncAppender有一个buffersize属性,用于控制AsyncAppender的内存日志信息队列长度。当日志的打印到文件的速度赶不上调用端传给AsyncAppender的速度时, AsyncAppender就把未输出到文件的日志信息存放到这个队列中,当这个队列塞满后,AsyncAp ...
1. 为什么要手动实现自增长ID        mongodb的Collection在插入数据时,如果没有指定'_id'字段,系统会自动产生一个'_id', 产生的规则类似UUID。由于这个ID的长度比较长,如果在一个Collection中存储大量数据时,会带来比较大的空间浪费。所以就由了自定义'_id'的需求,比如定义'_id'的类型为int。那么如何实现这个自定义id类似mysql的auto_increment特性呢,mongodb没有提供这样的功能,需要我们手动去实现。   2. 实现原理   假设要为CollectionB实现自增长ID, 需要引入另外一个专门计算'_id'的 ...
Global site tag (gtag.js) - Google Analytics