本文带你实战R学生成绩描述统计分析。包括缺失值处理,生成学生成绩排名,计算标准差、中位数、平均数等描述性数据指标。最后进行数据转换,并生产各科成绩的箱线图。
加载数据
library(dplyr)
library(readr)
score <- read_csv("data/score.csv",
na="NA",
col_types = cols(col_character(),col_character(),col_number(),col_number()))
head(score)
# id name lang math
# <chr> <chr> <dbl> <dbl>
# 1 1 薛晨杰 86 94
# 2 2 顾桎浩 96 85
# 3 3 周一岩 97 94
# 4 4 唐文涛 77 83
# 5 5 金慧 46 54
# 6 6 龚月 97 95
计算总分和成绩排名
首先处理缺失值,NA使用0代替;接着计算总分(语文+数学);后面计算语文、数学排名,最后是总排名。
library(ggplot2)
total <- score %>%
replace(is.na(.), 0) %>%
mutate(tp = lang+math) %>%
arrange(-lang) %
本文参考链接:https://blog.csdn.net/neweastsun/article/details/121735121