R语言 入门知识--常用操作和例子

1 R的下载、安转 (转)

R有很多的版本,支持目前主流的操作系统MAC、Linux和WINDOWS系列。因为我个人是在WINDOWS下用R的,所以在这里将只介绍WINDOWS下R的下载&安装。

下载R:

你可以从世界各地很多网站上下载到R,官方的中国下载点是:

http://www.lmbe.seu.edu.cn/CRAN/bin/windows/base/

在我写这篇文章的时候,最新的版本是R-2.2.1版。

在网络上有一篇被翻译过来的R入门教材,可以在这里找到 :R 導論(入門)

安装R:

1,双击R-2.2.1-win32.exe文件,进入安装画面。

2,在Welcome to the R for Windows Setup Wizard的画面中,单击NEXT。

3,在License Agreement的画面中,选择[I accept the agreement],然后单击NEXT。

4,在Select Destination Location的画面中,可以自行设定安装目录,默认为:[C:\Program Files\R\R-2.2.1],单击NEXT。

5,在接下来的过程中一律选则NEXT安装即可。

2 简单的数学计算、数学函数以及如何编辑R程序

1,用R进行简单的计算:

我们可以用R进行以下各类运算。

加法 +

减法 -

乘法 *

除法 /

幂运算 ^

整数商 %/%

余数 %%

例如:

输入: (1 + 2 - 3 * 4) / 5^6

结果: [1] -0.000576

2,R中还有很多的数学函数可以使用,比如说开方函数、对数函数等等。

例如:

输入: sqrt(2)

结果:[1] 1.414213

你还可以使用多个函数进行计算。例如:

输入: sqrt(100) + round(100) / log10(100)

结果:[1] 60 下面介绍的是R中可以使用的数学函数。

sqrt : 开平方函数

abs : 绝对值函数

exp : 2.71828…

expm1 : 当x的绝对值比1小很多的时候,它将能更加正确的计算exp(x)-1

log : 对数函数

log10 : 对数(底为10)函数

log2 : 对数(底为2)函数

sin : 正弦函数

cos : 余弦函数

tan : 正切函数

asin : 反正弦函数

acos : 反余弦函数

atan : 反正切函数

sinh : 超越正弦函数

cosh : 超越余弦函数

tanh : 超越正切函数

asinh : 反超越正弦函数

acosh : 反超越余弦函数

atanh : 反超越正切函数

logb : 和log函数一样

log1px : 当x的绝对值比1小很多的时候,它将能更加正确的计算log(1+x)

gamma : Γ函数(伽玛函数)

lgamma : 等同于log(gamma(x))

ceiling : 返回大于或等于所给数字表达式的最小整数

floor : 返回小于或等于所 给数字表达式的最大整数

trunc : 截取整数部分

round : 四舍五入

signif(x,a) : 数据截取函数 x:有效位 a:到a位为止

3,R程序的输入/编辑

你可以直接在R的环境里输入R命令执行计算,也可以用任何一款文本编辑器进行编程。R程序的默认文件名后缀是[ .R ]。

4,环境设置函数options()

用options()命令可以设置一些环境变量。

比如说:

options(digits=10)

这个命令,可以把R的整数表示能力设为10位。

options(warn=-1)

这个命令,可以忽视任何警告。(warn=1时,为不放过任何警告)

……

使用help(options)可以查看详细的参数信息。

RWEKA:

WEKA是一个JAVA写的数据挖掘的工具,RWEKA则是在R中调用WEKA的一个界面。

扩展包说明&下载地址(英文):http://cran.r-project.org/src/contrib/Descriptions/RWeka.html

3、R的数据类型

R中包含以下的基本数据类型。

空值(NULL)

意义 :该对象里什么都没有(甚至连0也没有)

欠损值、不定值(NA),非数(NaN),无限大(Inf)

意义 :NA:表示数据缺损;NaN:表示用数字无法表示;Inf:无限大

复数(complex)

意义 :复数

字符串(character)

意义 :不是单一的字符,而是用双/单引号括起来的字符

逻辑值(logical)

意义 :T表示真,F表示假

4_关于R的一些基本知识

首先看一下这一次要讲的内容。

在用R进行数据分析和计算的时候,将会用到很多变量、函数、数组等等。而对象则是对所有这些变量、函数、数组等的总称。比如说,下面这个式子:x <- 2通常我们会说,x是一个变量,我们通过赋值运算把它的值设为2。但是在R里,不论我们是给一个变量赋值也好,还是对一个数组进行初始化也好,我们统统把它称为[对象]。

什么是对象(Object)

如何改变工作目录

关于扩展包(库函数)

R的数据类型

环境设置函数options()

接下来,我们一个一个的简单介绍。

1,什么是对象(Object)

在用R进行数据分析和计算的时候,将会用到很多变量、函数、数组等等。而对象则是对所有这些变量、函数、数组等的总称。

比如说,下面这个式子:

x <- 2

下面的对象是R的预设对象。我们在命名自己的对象时,是不能与下面这些对象重名的。

break

else

for

function

if

TRUE

in

next

repeat

return

while

FALSE

另外:

使用objects()函数,还可以查看目前存在的对象名。

使用rm()函数,可以消除自己所定义过的对象。( 例如: rm(killme) )

使用rm(list=ls(all=TRUE))命令,可以消除自己所定义过的所有的对象。

命名对象时,要注意大小写。(例如:x和X是两个不同的对象)

2、如何改变工作目录

你可以用getwd()命令来查看当前目录,也可以用类似setwd(”c:/usr”)的命令来更改当前的目录。

你还可以用dir()命令来查看当前目录里的文件。(好像回到了dos时代…呵呵)

3、关于扩展包(库函数)

R有很好的扩展性能,默认下R自带了以下的扩展包。

base:R的基本扩展包

boot:R的启动函数库

class:Classification的函数库

cluster:进行聚类分析计算的函数库

foreign:读取其它的统计软件(如:SAS…)等生成的文件的函数库

grid:grid图像函数库

KernSmooth:进行核函数密度估计运算的函数库

lattice:lattice图像函数库

MASS:在『Modern Applied Statistics with S』中出现的数据与函数库

methods:定义了在R中用于对象的各种方法、类、程序以及工具。

mgcv:GCV和一般加法模型GAM(generalized additive model)的函数库

nlme:线性混合效果模型和非线性混合效果模型的函数库

nnet:

rpart:使用了再归算法的分类和回归树的函数库

spatial:

splines:splines回归的函数库

stats:R的统计函数库

stats4:S4类的统计函数库

survival:

tcltk:Tcl/Tk的接口函数库

tools:用于扩展包开发和管理的函数库

utils:

另外:

使用library(help=”扩展包名”)命令可以查看该扩展包的详细信息

使用library(扩展包名)命令可以使用该扩展包

使用search()命令可以查看现在已经读取的扩展包

使用detach(”package:扩展包名”)命令可以卸载某个扩展包

使用data()命令可以查看当前可使用的数据对象

使用data(package = “扩展包名”)命令可以查看在该扩展包中的数据对象

扩展包的安装:

使用下面的命令,可以联网安装扩展包。

options(CRAN=”http://cran.r-project.org”)

install.packages(”扩展包名”)

如果你已经下载了扩展包的ZIP压缩文件,你可以用下面的命令指定路径安装扩展包。

install.packages(”路径名/文件名.zip”, contriburl = NULL)

例如:install.packages(”c:/adapt_1.0-4.zip”, contriburl = NULL)