电脑装配网

R语言基本数据对象之因子的了解

 人阅读 | 作者pangding | 时间:2023-06-04 09:04

练习回顾:

建立起始值为-3,增量值为5.5,终止值为44的一位数组x

x<-c(0,1,0,1)

y<-c(0,0,1,1)

只比较第一个元素

a<-10;b<-5

加减乘除

余数、整除、绝对值、判断正负

幂, 自然常用e的幂, 平方根, 对数

a<-10

b<-5

c<-4

c的b次幂 c的1/b次幂 c的b/10次幂

自然常数e的1次幂和3次幂

以2为底的8对数、以10为底100的对数

【实验目的】

1)熟悉R语言的基本数据类型

2)熟悉R语言的基本操作

3)熟悉R语言因子的主要运算函数

【实验原理】

在R语言里操作和接触的所有东西都称作对象(object)。对象有很多种类 可以包含各种类型的数据。R 语言里所有的东西都被称为对象,R语言中常见的数据类型有几下几种,分别是字符型 (character)、数值型 (numeric)、复数型 (complex)以及逻辑型 (logical)。通过mode()函数可以查看一个对象的类型。

R语言中的基本运算包括以下:数学计算,比较运算,运算函数,向量常用统计函数,矩阵常用函数集合运算,向量化,从文件中读取数据,概率分布,循环和条件操作。

R语言的数据对象主要包括向量(vector),矩阵(matrix),因子(factors),列表(list),数据框(data frame)函数( function)。 因子是用于对数据进行分类并将其存储为级别的数据对象。 它们可以存储字符串和整数。 它们在具有有限数量的唯一值的列中很有用。 像“男性”,“女性”和True,False等。它们在统计建模的数据分析中很有用。使用factor()函数通过将向量作为输入创建因子

【实验环境】

本次环境是:win7/2008 64位系统+ R 3.3.3

【实验步骤】

一、打开R语言的界面

1.1双击桌面上的程序R x64 3.3.3,出现如下画面,则打开成功。如图所示

二、因子

2.1因子介绍。

因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数。因子表示分类变量,有序因子表示有序变量。生成因子数据对象的函数是factor(),语法是factor(data, levels, labels, ...),其中data是数据,levels是因子水平向量,labels是因子的标签向量。

生成一个向量、显示向量的内容、根据向量来生成因子,使用的factor()函数、显示因子的内容。

数据多一点可以更好的观察

2.2因子的创建。

生成因子数据对象的函数是factor(),语法是factor(data, levels, labels, ...),其中data是数据,levels是因子水平向量,labels是因子的标签向量。

上面结果可以看出通过labels项,把值替换为labels中设置的标签。

可以看出可以通过标签向量设置不同的标签。

2.3设置部分标签。

当labels中向量的个数少于实际的标签数时,未被设置标签的元素的标签将会NAN.

2.4把因子转换为一个字符向量。

使用as.vector()函数把因子转换为一个字符向量

2.5把因子转换为一个数字向量。

使用as.numeric()函数把因子转换为一个数字向量

注意对比数字向量和字符向量的区别。

2.6创建一个有序的因子。

使用ordered()函数来创建一个有序的因子

2.4将一般的数据分组并且转换为因子。

用cut()函数将一般的数据转换成因子或有序因子

可以看出将exam向量分成了三组,同时转变成了因子的形式。

2.5 cut()函数切分成自己设置的组。

可以通过修改breaks参数来切分成自己设置的组

2.6验证cut()切分之后是否变为因子。

可以看出通过切分,数据变成了因子。

2.7查看cut()之后的因子标签。

可以看出与上面我们通过breaks来切分的设置是一致的。

2.8切分之后的数据变成有序因子。

使用ordered()命令


文章标签:

本文链接:『转载请注明出处』