练习回顾:
建立起始值为-3,增量值为5.5,终止值为44的一位数组x
x<-c(0,1,0,1)
y<-c(0,0,1,1)
只比较第一个元素
a<-10;b<-5
加减乘除
余数、整除、绝对值、判断正负
幂, 自然常用e的幂, 平方根, 对数
a<-10
b<-5
c<-4
c的b次幂 c的1/b次幂 c的b/10次幂
自然常数e的1次幂和3次幂
以2为底的8对数、以10为底100的对数
【实验目的】
1)熟悉R语言的基本数据类型
2)熟悉R语言的基本操作
3)熟悉R语言因子的主要运算函数
【实验原理】
在R语言里操作和接触的所有东西都称作对象(object)。对象有很多种类 可以包含各种类型的数据。R 语言里所有的东西都被称为对象,R语言中常见的数据类型有几下几种,分别是字符型 (character)、数值型 (numeric)、复数型 (complex)以及逻辑型 (logical)。通过mode()函数可以查看一个对象的类型。
R语言中的基本运算包括以下:数学计算,比较运算,运算函数,向量常用统计函数,矩阵常用函数集合运算,向量化,从文件中读取数据,概率分布,循环和条件操作。
R语言的数据对象主要包括向量(vector),矩阵(matrix),因子(factors),列表(list),数据框(data frame)函数( function)。 因子是用于对数据进行分类并将其存储为级别的数据对象。 它们可以存储字符串和整数。 它们在具有有限数量的唯一值的列中很有用。 像“男性”,“女性”和True,False等。它们在统计建模的数据分析中很有用。使用factor()函数通过将向量作为输入创建因子
【实验环境】
本次环境是:win7/2008 64位系统+ R 3.3.3
【实验步骤】
一、打开R语言的界面
1.1双击桌面上的程序R x64 3.3.3,出现如下画面,则打开成功。如图所示
二、因子
2.1因子介绍。
因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数。因子表示分类变量,有序因子表示有序变量。生成因子数据对象的函数是factor(),语法是factor(data, levels, labels, ...),其中data是数据,levels是因子水平向量,labels是因子的标签向量。
生成一个向量、显示向量的内容、根据向量来生成因子,使用的factor()函数、显示因子的内容。
数据多一点可以更好的观察
2.2因子的创建。
生成因子数据对象的函数是factor(),语法是factor(data, levels, labels, ...),其中data是数据,levels是因子水平向量,labels是因子的标签向量。
上面结果可以看出通过labels项,把值替换为labels中设置的标签。
可以看出可以通过标签向量设置不同的标签。
2.3设置部分标签。
当labels中向量的个数少于实际的标签数时,未被设置标签的元素的标签将会NAN.
2.4把因子转换为一个字符向量。
使用as.vector()函数把因子转换为一个字符向量
2.5把因子转换为一个数字向量。
使用as.numeric()函数把因子转换为一个数字向量
注意对比数字向量和字符向量的区别。
2.6创建一个有序的因子。
使用ordered()函数来创建一个有序的因子
2.4将一般的数据分组并且转换为因子。
用cut()函数将一般的数据转换成因子或有序因子
可以看出将exam向量分成了三组,同时转变成了因子的形式。
2.5 cut()函数切分成自己设置的组。
可以通过修改breaks参数来切分成自己设置的组
2.6验证cut()切分之后是否变为因子。
可以看出通过切分,数据变成了因子。
2.7查看cut()之后的因子标签。
可以看出与上面我们通过breaks来切分的设置是一致的。
2.8切分之后的数据变成有序因子。
使用ordered()命令