文章列表
http://www.models.life.ku.dk/source/iCDF/index.asp
About iCDF
The most common chromatographic format is a
so-called netCDF format, which is a format that most manufacturers of
chromatographic software support. However, the transfer to other software
packages is not straightforward and requ ...
- 2009-11-21 02:06
- 浏览 2067
- 评论(0)
王 程明
(wangchengming.jlu@gmail.com
), 硕士研究生, 吉林大学计算机科学与技术学院
2009 年 2 月 05 日
本
文介绍了一个跨平台的自动化构建系统 CMake 在 linux 上的使用方法。 CMake 是一个比 automake
更加容易使用的工具,能够使程序员从复杂的编译连接过程中解脱出来。文中通过一些例子介绍使用 CMake
处理多源文件目录的方法、查找并使用其他开发包的方法以及生成 debug 版和 release 版程序的方法。
<!-- START RESERVED FOR FUTURE USE INCLUDE F ...
- 2009-11-13 18:29
- 浏览 2066
- 评论(0)
Mahout项目只提供四种距离度量方法,和三种加权距离度量方法,其中四种距离度量方法如下所示。
CosineDistanceMeasure(余弦距离度量法),如果v1、v2分别表示两个向量,则他们之间的距离为 v1*v2/(|v1|*|v2|)
EuclideanDistanceMeasure(欧氏距离度量法)详情可以参考我另一篇文章:马氏距离和欧氏距离的介绍
http://54pe.iteye.com/admin/blogs/478242
ManhattanDistanceMeasure(曼哈顿距离度量法)曼哈顿距离度量法比如有意思,又叫出租车度量方法。计算方法为:d ...
- 2009-09-27 15:58
- 浏览 2144
- 评论(0)
线性代数的知识已经差不多都忘记了,现在补习下。
马氏距离是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧式距离不同 ...
- 2009-09-26 22:29
- 浏览 8866
- 评论(0)
1、前言
在进行机器学习研究时,最重要的就是数据,而数据离不开矩阵和向量,所以,我觉得分析mahout项目最先从矩阵和向量开始。在分析之前,我比较关注以下几个问题。
1、它是怎么通过矩阵来保存数据;
2、提供那些计算方法来计算矩阵;
3、提供什么方法来生成矩阵;
4、......
2、API
首先,看一下org.apache.mahout.matrix 类的API,
2.1、接口汇总
Interface
Summary
BinaryFunction
This interface allows the formu ...
- 2009-07-02 16:58
- 浏览 3405
- 评论(0)
HDFS具有如下几大特点:
[list=1]
[*]硬件错误
[*]流式数据访问
[*]大规模数据集
[*]简单的一致性模型
[*]异构软硬件平台间的可移植性
[/list]
学习HDFS重点要明白Namenode 和 Datanode的功能。Namenode是一个中心服务器,负责管理文件系统的名字空间(namespace)以及客户端对文件的访问,一般集中中只有一个Namenode,但随着集群中文件数量的增大,Namenode需求的内存也会增加,启动时间也会加长,所以可以考虑Secondary NameNode。Datanode主要是存放数据。
- 2009-06-17 22:45
- 浏览 1786
- 评论(0)
The article is from Yahoo Hadoop Tutorial, I just transtlate it to Chinese .
介绍
HDFS是专门为TB或者PB级大数据设计的分布式文件管理系统,并且提供高吞吐量的数据信息。文件被存储在允许冗余的分布式计算机群上,以确保分布式程序可以高可效性、高耐用性的使用数据。这一章将介绍HDFS的设计架构和如何使用HDFS
本章的主要重点
了解通用分布式文件存储系统和HDFS的基本原因,并了解HDFS和通用分布式文件存储系统的关系
学习如何通过命令提示行来设置和使用HDFS
学习如何在运用程序中使用HDFS
能用分布式文件 ...
- 2009-06-17 22:24
- 浏览 2004
- 评论(0)