`
菜鸟老师
  • 浏览: 22338 次
  • 性别: Icon_minigender_1
  • 来自: 广州
最近访客 更多访客>>
社区版块
存档分类
最新评论
文章列表
http://www.models.life.ku.dk/source/iCDF/index.asp About iCDF The most common chromatographic format is a so-called netCDF format, which is a format that most manufacturers of chromatographic software support. However, the transfer to other software packages is not straightforward and requ ...
王 程明 (wangchengming.jlu@gmail.com ), 硕士研究生, 吉林大学计算机科学与技术学院 2009 年 2 月 05 日 本 文介绍了一个跨平台的自动化构建系统 CMake 在 linux 上的使用方法。 CMake 是一个比 automake 更加容易使用的工具,能够使程序员从复杂的编译连接过程中解脱出来。文中通过一些例子介绍使用 CMake 处理多源文件目录的方法、查找并使用其他开发包的方法以及生成 debug 版和 release 版程序的方法。 <!-- START RESERVED FOR FUTURE USE INCLUDE F ...
    Mahout项目只提供四种距离度量方法,和三种加权距离度量方法,其中四种距离度量方法如下所示。 CosineDistanceMeasure(余弦距离度量法),如果v1、v2分别表示两个向量,则他们之间的距离为 v1*v2/(|v1|*|v2|) EuclideanDistanceMeasure(欧氏距离度量法)详情可以参考我另一篇文章:马氏距离和欧氏距离的介绍 http://54pe.iteye.com/admin/blogs/478242 ManhattanDistanceMeasure(曼哈顿距离度量法)曼哈顿距离度量法比如有意思,又叫出租车度量方法。计算方法为:d ...
    线性代数的知识已经差不多都忘记了,现在补习下。       马氏距离是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧式距离不同 ...
  1、前言 在进行机器学习研究时,最重要的就是数据,而数据离不开矩阵和向量,所以,我觉得分析mahout项目最先从矩阵和向量开始。在分析之前,我比较关注以下几个问题。 1、它是怎么通过矩阵来保存数据; 2、提供那些计算方法来计算矩阵; 3、提供什么方法来生成矩阵; 4、......   2、API   首先,看一下org.apache.mahout.matrix 类的API, 2.1、接口汇总 Interface Summary BinaryFunction This interface allows the formu ...
HDFS具有如下几大特点: [list=1] [*]硬件错误 [*]流式数据访问 [*]大规模数据集 [*]简单的一致性模型 [*]异构软硬件平台间的可移植性 [/list] 学习HDFS重点要明白Namenode 和 Datanode的功能。Namenode是一个中心服务器,负责管理文件系统的名字空间(namespace)以及客户端对文件的访问,一般集中中只有一个Namenode,但随着集群中文件数量的增大,Namenode需求的内存也会增加,启动时间也会加长,所以可以考虑Secondary NameNode。Datanode主要是存放数据。  
The article is from Yahoo Hadoop Tutorial, I just transtlate it to Chinese . 介绍 HDFS是专门为TB或者PB级大数据设计的分布式文件管理系统,并且提供高吞吐量的数据信息。文件被存储在允许冗余的分布式计算机群上,以确保分布式程序可以高可效性、高耐用性的使用数据。这一章将介绍HDFS的设计架构和如何使用HDFS 本章的主要重点 了解通用分布式文件存储系统和HDFS的基本原因,并了解HDFS和通用分布式文件存储系统的关系 学习如何通过命令提示行来设置和使用HDFS 学习如何在运用程序中使用HDFS 能用分布式文件 ...
Global site tag (gtag.js) - Google Analytics