跳到主要内容

R百分位数

提示
  1. 百分位数定义:百分位数是统计学中的一个概念,表示在一组数据中有多少比例的数值低于某个特定值。
  2. 计算百分位数的 R 函数:在 R 中,quantile() 函数用于计算一组数据的百分位数,可以指定一个或多个百分比来获取对应的百分位数值。
  3. 应用于数据框:R 也支持在数据框的特定列上计算百分位数,这使得在复杂数据集中分析和比较数据变得更加方便。

百分位数是一种统计度量,表明数据中有多少百分比的值低于该数值。

例如,70th 百分位数是指低于该值的 70% 的观测值所处的位置。

在 R 中计算百分位数

在 R 中,我们使用 quantile() 函数来计算百分位数。例如,

marks <- c(97, 78, 57, 64, 87)

# 计算 marks 的第70百分位数
result <- quantile(marks, 0.70)

print(result)

输出

70%
85.2

在上面的例子中,我们使用了 quantile() 函数来计算 marks 向量的 70th 百分位数。注意代码,

quantile(marks, 0.70)

这里,

  • marks - 要计算百分位数的向量
  • 0.70 - 百分位数的值。对于第 70 百分位数,我们使用 0.70 参数

在 R 中计算向量的多个百分位数

我们使用 c() 函数一次性传递多个百分位数给 quantile() 函数。例如,

marks <- c(97, 78, 57, 64, 87)

# 计算 marks 的第70、50和80百分位数
result <- quantile(marks, c(0.7, 0.5, 0.8))

print(result)

输出

70%  50%  80%
85.2 78.0 89.0

在这里,我们使用了 c() 函数一次性传递多个百分位数:0.7, 0.5, 0.8quantile() 函数。

因此,quantile() 分别返回了 marks70th50th80th 百分位数。

在 R 数据框中计算百分位数

R 允许我们计算特定 数据框 列的百分位数。例如,

# 创建一个数据框
dataframe1 <- data.frame (
Name = c("Juan", "Kay", "Jay", "Ray", "Aley"),
Age = c(22, 15, 19, 30, 23),
ID = c(101, 102, 103, 104, 105)
)

# 计算 Age 列的第55和27百分位数
result <- quantile(dataframe1$Age, c(0.55, 0.27))

print(result)

输出

 55%   27%
22.20 19.24

在这里,我们计算了 dataframe1 数据框中 Age 列的 55th27th 百分位数。