table可统计数据的频数
tapply可根据因子、向量和要计算的函数计算
> class<-c(1,2,3,2,1,2,1,3)
> class
[1] 1 2 3
> c(81,65,72,88,73,91,56,90)->student
> class
[1] 1 2 3 2 1 2 1 3
>factor(class)->class
> tapply(student,class,mean)
1 2 3
70.00000 81.33333 81.00000
> tapply(student,class,min)
1 2 3
56 65 72
> tapply(student,class,max)
1 2 3
81 91 90
> table(class)
class
1 2 3
3 3 2
>
Apply a Function Over a Ragged Array
Description
Apply a function to each cell of a ragged array, that is to each (non-empty) group of values given by a unique combination of the levels of certain factors.
Usage
tapply(X, INDEX, FUN = NULL, ..., simplify = TRUE)
Arguments
X |
an atomic object, typically a vector.
|
INDEX |
list of factors, each of same length as X . The elements are coerced to factors by as.factor .
|
FUN |
the function to be applied, or NULL . In the case of functions like + , %*% , etc., the function name must be backquoted or quoted. If FUN is NULL , tapply returns a vector which can be used to subscript the multi-way array tapply normally produces.
|
... |
optional arguments to FUN : the Note section.
|
simplify |
If FALSE , tapply always returns an array of mode "list" . If TRUE (the default), then if FUN always returns a scalar, tapply returns an array with the mode of the scalar.
|
Value
If FUN
is not NULL
, it is passed to match.fun
, and hence it can be a function or a symbol or character string naming a function.
When FUN
is present, tapply
calls FUN
for each cell that has any data in it. If FUN
returns a single atomic value for each such cell (e.g., functions mean
or var
) and when simplify
is TRUE
, tapply
returns a multi-way array containing the values, and NA
for the empty cells. The array has the same number of dimensions as INDEX
has components; the number of levels in a dimension is the number of levels (nlevels()
) in the corresponding component of INDEX
. Note that if the return value has a class (e.g. an object of class "Date"
) the class is discarded.
Note that contrary to S, simplify = TRUE
always returns an array, possibly 1-dimensional.
If FUN
does not return a single atomic value, tapply
returns an array of mode list
whose components are the values of the individual calls to FUN
, i.e., the result is a list with a dim
attribute.
When there is an array answer, its dimnames
are named by the names of INDEX
and are based on the levels of the grouping factors (possibly after coercion).
For a list result, the elements corresponding to empty cells are NULL
.
Note
Optional arguments to FUN
supplied by the ...
argument are not divided into cells. It is therefore inappropriate for FUN
to expect additional arguments with the same length as X
.
References
Becker, R. A., Chambers, J. M. and Wilks, A. R. (1988) The New S Language. Wadsworth & Brooks/Cole.
See Also
the convenience functions by
and aggregate
(using tapply
); apply
, lapply
with its versions sapply
and mapply
.
Examples
require(stats)
groups <- as.factor(rbinom(32, n = 5, prob = 0.4))
tapply(groups, groups, length) #- is almost the same as
table(groups)
## contingency table from data.frame : array with named dimnames
tapply(warpbreaks$breaks, warpbreaks[,-1], sum)
tapply(warpbreaks$breaks, warpbreaks[, 3, drop = FALSE], sum)
n <- 17; fac <- factor(rep(1:3, length = n), levels = 1:5)
table(fac)
tapply(1:n, fac, sum)
tapply(1:n, fac, sum, simplify = FALSE)
tapply(1:n, fac, range)
tapply(1:n, fac, quantile)
## example of ... argument: find quarterly means
tapply(presidents, cycle(presidents), mean, na.rm = TRUE)
ind <- list(c(1, 2, 2), c("A", "A", "B"))
table(ind)
tapply(1:3, ind) #-> the split vector
tapply(1:3, ind, sum)
分享到:
相关推荐
### R语言常用函数详解 ...这些函数覆盖了数据管理、字符串处理、数学运算、数组操作以及线性代数等多个方面,对于学习和使用R语言进行数据分析非常重要。掌握这些基本函数将有助于更高效地进行数据处理和分析工作。
本文将详细介绍R语言中常用的几种数据汇总函数:`tapply()`、`by()`、`aggregate()`、`rowsum()`以及`tabulate`/`table`,并提供相应的实例帮助理解。 #### 二、`tapply()`函数 **函数定义:** `tapply()`函数...
对于从事数据分析、meta分析、实验设计等领域的专业人士而言,掌握R语言中的常用函数至关重要。本文将详细介绍R语言中的关键函数及其应用场景。 #### 二、Meta分析基础 **Meta分析**是一种统计方法,它能够整合来自...
本节课后习题旨在巩固 R 语言编程基础第四章的知识点,涵盖了函数、控制流和数据处理等方面的内容。 一、掌握使用常用函数及 apply 函数族处理数据的方法 * 使用 lapply 函数计算列表 x 中的最大值、最小值和中位...
R语言最初是由Ross Ihaka和Robert Gentleman在新西兰奥克兰大学开发的,后来得到了广泛的社区支持和发展。 ##### 1.1 R语言环境 - **开源:** R语言是完全免费的开源软件,可以在多种操作系统上运行。 - **交互式:*...
此外,还可以学习到如何利用tapply函数按类别计算均值,以及如何进行偏度和峰度的计算,这些都是衡量数据分布特征的重要指标。 基础绘图部分则涵盖了散点图、饼图、直方图和箱线图的绘制,通过不同的图形,我们可以...
- **入门训练**:为了快速上手R语言,建议先从简单的例子入手,逐步掌握基本语法和常用函数。 #### 简单操作;数值与向量 - **向量与赋值**:在R中,向量是最基本的数据结构之一。可以使用`c()`函数将多个元素组合...
R语言提供了详尽的帮助文档,用户可以通过内置的帮助系统获取函数和功能的相关信息。例如,输入`?function_name`即可查看特定函数的帮助文档。 #### 八、R的命令、对大小写的敏感性等 - **命令**:R中的命令遵循...
- **R与统计**:R语言最初是为统计分析而设计的,因此它内置了大量的统计函数和方法,如线性回归、非线性回归、时间序列分析等。 - **R与视窗系统**:R在Windows平台上提供了良好的支持,包括图形界面安装程序和图形...
R语言提供了一个高度可定制的编程环境,用户可以在此环境中进行数据处理、统计分析和图表绘制等工作。该环境支持交互式编程,即用户可以直接在命令行中输入代码并立即看到结果,非常适合快速原型开发和数据探索。 #...
### R语言入门教程知识点梳理 #### 一、绪论与基础知识 **1.1 R语言环境** - **定义**: R是一种用于统计计算和图形展示的编程语言...R语言不仅功能强大,而且易于学习和使用,是进行数据分析和统计工作的理想工具。
### R语言入门知识点详解 #### 一、R语言概述与初步使用 ...以上内容涵盖了R语言入门所需的基础知识和技术要点,对于初学者来说是非常宝贵的资源。通过理解和掌握这些知识点,可以更快地进入R语言的实际应用中。
这份《R语言教程》是对R语言初学者和进阶用户都十分有价值的参考资料,通过逐步深入地介绍R语言的各个方面,使读者能够全面掌握R语言的各项技能,并在数据分析、统计计算和图形绘制等领域中应用自如。
本教程将详细讲解R语言中的一些关键函数,这些函数广泛应用于数据预处理和初步分析阶段。 1. **数据类型与数据结构**: 在R中,数据可以分为基本类型(如数值、字符、逻辑)和复杂结构(如向量、矩阵、数据框和...
- **相关软件和文档**:除了核心的R语言之外,还有许多与之相关的软件包和文档资源,这些资源极大地扩展了R的功能边界,使得用户能够根据自己的需求选择合适的工具。 - **R与统计**:R语言最初就是为了统计分析而...
- R语言中的命令和函数名称是区分大小写的。 - 变量名也应遵循同样的规则,即`Var1`和`var1`被视为不同的变量。 **1.9 对已输入命令的记忆和更改** R提供了一个命令历史记录的功能,用户可以通过上下箭头键来回...
### R语言知识点总结 #### 一、R语言概述与基础 **1.1 R语言环境** R语言是一种专为统计计算而设计的编程语言,它提供了丰富的图形展示和数据...以上总结了R语言的基础知识和进阶技巧,希望对学习R语言有所帮助。
在大数据分析领域,R语言因其强大的统计计算能力和丰富的可视化库,成为了数据科学家和分析师的首选工具之一。本主题“R语言:大数据分析中的统计方法及应用”深入探讨了如何利用R语言来处理、分析和解释大规模数据...
《R语言入门》是一本专门为初学者设计的英文原版电子书,适合用Kindle等电子设备随身携带和阅读。R语言是一种用于统计计算和图形表示的编程语言和环境,广泛应用于数据科学领域。本书深入浅出地介绍了R语言的基础...
《R实战》是一本专为R语言初学者设计的书籍,旨在帮助读者快速掌握R语言的基本操作和数据分析技能。本书作者罗伯特·I·卡巴科夫(Robert I. Kabacoff)在书中详细介绍了如何使用R进行数据处理、分析以及绘图等核心...