随着R语言开发的深入,不得不对R中基础的数据类型进行深入了解。
0. 数据类型,主要有以下几个类型
logical, integer, double, complex, character, or raw.
可以根据as.nameOfType()和is.nameOfType来进行转化和真值判断。
1. 数据结构
1.1 向量(Vectors)
class(vector)的结果为相对应的数据类型
1.1.1 使用c()构造向量
p <- c(2,3,5,7)
1.1.2 当向量索引增加时,向量自动增加。
for(i in 1:length(p)){
p[i] <- i
}
1.1.3 使用seq()构造向量
se<-seq(1,10,1)
1.2 数组(Arrays)
class(array)的结果为“array”
1.2.1 使用array(vector, num=length(vector), dimname)构造数组
arr<-array(vec,5,"test")
1.3 列表(lists)
是general form的一种向量,但是可以包含不同的数据类型。这里list比较像C中的struct数据结构。
class(list)的结果为“list”
1.3.1 使用list()构造列表
a <- list(name="Joe", 4, foo=c(3,8,9))
1.3.2 使用a[[num]]来提取列表中某一栏数据
a[[1]]等价于a$name
如果超出list的长度,则会显示错误。 如:a[[4]]
1.4 矩阵(matrices)
在R语言中,没有固定的矩阵数据类型,他是通过对多个向量的组合形成的。
class(matrix)的结果为“matrix”
1.4.1 使用array()构造矩阵
通过array()构造的矩阵可以增加矩阵的维度。
m1 <- array( c(1,2,3,4,5,6), dim=c(2,3) )
m2 <- array(data=c(firstMatrix,secondMatrix),dim=c(rownumber,columnnumber,2))
1.4.2 使用matrix()构造矩阵
y <- matrix(c(1:9), nrow = 3, ncol = 3)
1.4.3 使用cbind()和rbind构造矩阵
PE <- c(0,0,0,0,1,0,0)
EE <- c(0,0,0,0,1,0,0)
SN <- c(0,0,0,0,1,0,0)
FC <- c(0,0,0,0,0,1,1)
BI <- c(0,0,0,0,0,1,1)
UF <- c(0,0,0,0,0,0,0)
TU <- c(0,0,0,0,0,0,0)
utaut.inner <- cbind(PE,EE,SN,FC,BI,UF,TU)
1.5 数据框(data.frame)
从其他语言中理解来说,就是数据库中的表(table),Excel中的表(sheet)。表中的列就是字段,变量;表中的行就是记录,样本。
class(utaut)的结果为“data.frame”
1.5.1 使用read.table()构造数据框
在之前的博客中已经介绍过一些方法,如read.csv()等
http://penergy.iteye.com/blog/2042719
1.5.2 使用data.frame()构造数据框
x <- 1:4; n <- 10; M <- c(10, 35); y <- 2:4
frame1<-data.frame(x, n)
xtest<-frame1$x //返回向量(vectors)数据结构
1.6 因子(factor)
为处理分类数据提供的一种有效方法
//假定我们有一份来自澳大利亚所有州和行政区的信息样本 以及他们各自所在地的州名。
state <- c("tas", "sa", "qld", "nsw", "nsw", "nt")
//创建因子factor:
statef <- factor(state)
statef
[1] tas sa qld nsw nsw nt
Levels: nsw nt qld sa tas
2. 总结
这一篇主要是讲述基本数据结构和数据类型。在下一期会讲解如何使用这些数据结构,比如矩阵运算,向量运算等。
参考:
http://blog.fens.me/rhadoop-r-basic/
分享到:
相关推荐
学习R语言的基础语法和数据结构(如向量、矩阵、列表和数据框)是进行大数据分析的前提。 二、大数据处理 在R中,传统的数据处理方式可能无法应对大数据的规模。因此,我们需了解如何使用像`data.table`包这样的...
根据提供的文档内容,我们可以总结出以下几个关键的知识点: ### 一、为什么学习R语言 R语言作为一种统计计算和...以上是R语言基础知识的重要组成部分,掌握这些内容有助于更好地使用R语言进行数据分析和统计计算。
以上是基于所提供的标题、描述、标签和部分内容所提炼出的主要知识点,涵盖了R语言的基础使用、数据结构、数据处理、统计分析等多个方面。通过对这些知识点的学习和掌握,可以有效地利用R语言进行数据分析和绘图。
首先,文件名中的"第1章 R语言概述"可能涵盖R语言的历史、安装与配置、R Studio的使用以及R的基本语法,如变量的创建、数据类型(包括向量、矩阵、列表和数据框)以及基本的运算符。这部分内容是所有R语言学习的起点...
本文旨在对R语言的基础知识进行系统的总结和复习,涵盖R语言的基础知识、数据对象和数据读写、数据处理和操作等方面。 第一章 R语言概述 R语言是一种自由开放的编程语言,专门用于统计计算和绘图。R语言提供了丰富...
《R语言编程基础》是一本全面介绍R语言的教材,涵盖了从基础知识到高级应用的多个领域,旨在帮助读者深入理解和掌握这门强大的统计分析和数据可视化工具。在本压缩包中,你将找到与R语言编程相关的源数据和代码,...
通过本篇内容的学习,读者可以了解到如何利用R语言进行金融数据分析的基础知识和实践技能。无论是在学术研究还是实际工作中,《金融数据分析导论:基于R语言》都是一本值得深入研究的重要参考资料。掌握了这些知识后...
在R语言中,有六种基本数据结构,包括向量、矩阵、数组、列表、数据框和因子。向量是R语言中最基本的数据结构,由一组相同类型的元素组成,可以是数值型、字符型或逻辑型等。矩阵是由同类型的元素组成的二维数据结构...
此外,书中还可能涵盖数据框(data frames)和列表(lists),这些是R语言处理复杂数据时不可或缺的数据结构。数据框可以视为不同类型的列组合成的表格,而列表则能容纳各种不同类型的数据,非常灵活。 总的来说,...
R语言的数据类型和数据结构也是非常重要的概念。R语言中所有的东西都被称作对象(object),对象有很多种类可以包含各种类型的数据。R语言中常见的数据类型有字符型、数值型、整型、复数型、逻辑型和因子型等。 字符...
R语言是基于S语言的统计分析系统,FREE和S-PLUS的分支,主要用于数据分析、统计模拟、数据挖掘和机器学习等领域。 R语言的特点: * 完全免费和开源的统计分析软件系统 * 具有强大的数据处理和计算能力 * 具有丰富...
了解如何创建和操作这些基本数据结构是R语言编程的基础。 - 控制流:学习如何使用条件语句(if/else)、循环(for, while)来控制程序的执行流程。 - 函数:R语言是函数式编程语言,熟悉自定义函数的编写有助于...
首先,基础篇会介绍R语言的基本语法和环境设置,包括如何安装和配置R语言环境、R Studio的使用、数据类型和数据结构(如向量、矩阵、列表、数据框和因子)的理解以及基本的数据操作。此外,还会讲解R语言中的控制流...
本资源主要讲解R语言中的数据结构,包括向量、矩阵、数组和数据框等。以下是对应的知识点: 一、向量(vector) * 向量是一种一维数组,用于存储数值型、字符型或逻辑型数据 * 在R语言中,向量的元素类型必须相同...
3. R语言的语法和数据结构:包括学习变量的定义、数据类型(如向量、矩阵、数据框等)、数据操作(筛选、排序、合并等)。 4. 统计分析基础:涉及基础的统计概念和方法,例如均值、中位数、方差、标准差等描述性...
### R语言数据可视化基础知识点概览 #### 一、R语言概述 - **R语言**是一种广泛应用于统计分析、图形绘制的语言和环境。它作为**GNU系统**的一部分,是一款开源软件,可免费下载使用。 - **下载地址**:...
该课程涵盖了 R 语言的基本概念、数据类型、数据结构、数据处理、函数、控制流、数据可视化、Rattle 工具等方面的内容。 一、课程的性质 在大数据时代,数据分析技术已经在商业、经济及其他领域中发挥着重要作用。...
1. **基础图表类型**:R语言提供了多种基础图表类型,包括直方图、散点图、线图、饼图和箱型图等。例如,`ggplot2`包是R中用于创建高质量图形的流行库,它基于Wickham的“Grammar of Graphics”概念,允许用户通过...