R语言中数据结构

R语言还是有点古老感觉,数据结构没有Python中那么好用。以下简单总结一下R语言中经常使用的几个数据结构。

向量:

R中的向量能够理解为一维的数组,每一个元素的mode必须同样,能够用c(x:y)进行创建。如x <- c(1:9)。

矩阵:

R中的矩阵能够理解为二维数组,每个元素必需要有同样的mode,使用matrix进行创建。matrix的形式为:

matrix(vector, nrow=number_of_rows, ncol=number_of_columns, byrow=logical_value, dimnames=list(rownames, colnames)),该函数中,vector中为矩阵的元素,nrow表示行数,ncol表示列数,byrow为一个布尔向量表示是否依照行为主进行填充,默认依照列为主,dimnames为可选的制定行和列的名称。

数组:

R中的数组使用array进行创建,与向量或者矩阵不同的是。array能够是多维的。array中的数据相同是相同mode的,array函数的像是例如以下:

array(vector, dimensions, dimnames)。当中vector包括array中的元素,dimensions是一个向量指定array各个维度的大小,dimnames是一个list指定各个维度相应的名称。

数据框:

数据框是我们经常使用的进行数据分析的数据存储方式,和数据库的每一行相应一个记录,每一列相应一个字段,数据框使用data.frame(name1=col1, name2=col2,...)进行创建。注意是列主导。

列表:

R中的列表和Python中的dict非常像,使用list进行创建,是行为主导的。list的形式为list(name1=object1, name2=object2,...)。