R语言 数据集

第二章 创建数据集

  1.R语言的数据类型

    数值型、字符型、逻辑型、复数型(虚数)和原生型(字节)

  2.数据结构

    a.向量:存储数值型、字符型和逻辑型数据的一维数组

      > a=c(1,2,3,4,5)#创建 组合功能的函数c()

      > a

      [1] 1 2 3 4 5

      > a[c(1,4)]#访问 方括号+向量中指定的元素

      [1] 1 4

    b.矩阵:二维数组

      mymatrix=matrix(1:20,nrow=5,ncol=4,byrow=TRUE,dimnames=list(rnames,cnames))#创建

      #参数:元素,行,列,是否按行填充,行列的标签

      mymatrix[i,j]#访问 方括号+向量中指定的元素

    c.数据:与矩阵类似,但唯独可以大于2

      z=array(1:24,c(2,3,4),dimname=list(dim1,dim2,dim3))#创建

      #参数:元素,a*b*c维,维数行列标签

      z[1,2,3]#访问 方括号+向量中指定的元素

    d.数据框:不同列可以包含不同数据类型的数据

      mydata=data.frame(coll,coll,coll)#创建 coll为列向量,可任意类型

      mydata[1:2]#访问 得到数据框

      mydata$coll#访问 得到向量

      attach(mydata)#访问 得到向量

        summary(mydata)

        polt(coll,coll)

      detach(mydata)#最好分析单个数据框

      with(mydata,{

        coll1=summary(coll2)##访问并处理数据框的数据

      })#赋值仅在此函数的括号生效

    e.因子:类别变量和有序类别变量在R中称为因子

      diabetes=factor(data,ordered=TRUE,levels=c(....))#创建

      #参数:元素,是否按照有序变量对待,自定义级别

    f.列表:一些对象的有序结合,允许整合若干对象到单个对象名下

      mylist=list(tittle="hello!",ages=coll,coll)#创建

      mylist[[2]]#访问 双重方括号

      mylist[["ages"]]

  3.数据的输入

    a.键入数据

      mydata=edit(dataname)#键入数据

    b.从带分隔符的文本文件导入数据

      data=read.table("mydata.csv",header=TRUE,sep=",",row.name="XXX")#导入csv

      #参数:文件名,首行逻辑值,分隔符,将XXX指定为行标识符

      其他略......