R百分位数
提示
- 百分位数定义:百分位数是统计学中的一个概念,表示在一组数据中有多少比例的数值低于某个特定值。
- 计算百分位数的 R 函数:在 R 中,
quantile()
函数用于计算一组数据的百分位数,可以指定一个或多个百分比来获取对应的百分位数值。 - 应用于数据框:R 也支持在数据框的特定列上计算百分位数,这使得在复杂数据集中分析和比较数据变得更加方便。
百分位数是一种统计度量,表明数据中有多少百分比的值低于该数值。
例如,70th 百分位数是指低于该值的 70% 的观测值所处的位置。
在 R 中计算百分位数
在 R 中,我们使用 quantile()
函数来计算百分位数。例如,
marks <- c(97, 78, 57, 64, 87)
# 计算 marks 的第70百分位数
result <- quantile(marks, 0.70)
print(result)
输出
70%
85.2
在上面的例子中,我们使用了 quantile()
函数来计算 marks
向量的 70th 百分位数。注意代码,
quantile(marks, 0.70)
这里,
marks
- 要计算百分位数的向量- 0.70 - 百分位数的值。对于第 70 百分位数,我们使用 0.70 参数
在 R 中计算向量的多个百分位数
我们使用 c()
函数一次性传递多个百分位数给 quantile()
函数。例如,
marks <- c(97, 78, 57, 64, 87)
# 计算 marks 的第70、50和80百分位数
result <- quantile(marks, c(0.7, 0.5, 0.8))
print(result)
输出
70% 50% 80%
85.2 78.0 89.0
在这里,我们使用了 c()
函数一次性传递多个百分位数:0.7, 0.5, 0.8 给 quantile()
函数。
因此,quantile()
分别返回了 marks
的 70th、50th 和 80th 百分位数。
在 R 数据框中计算百分位数
R 允许我们计算特定 数据框 列的百分位数。例如,
# 创建一个数据框
dataframe1 <- data.frame (
Name = c("Juan", "Kay", "Jay", "Ray", "Aley"),
Age = c(22, 15, 19, 30, 23),
ID = c(101, 102, 103, 104, 105)
)
# 计算 Age 列的第55和27百分位数
result <- quantile(dataframe1$Age, c(0.55, 0.27))
print(result)
输出
55% 27%
22.20 19.24
在这里,我们计算了 dataframe1
数据框中 Age
列的 55th 和 27th 百分位数。