2023 – 2024学年第1学期2021级 R语言考试试题(机考)

本文是一份R语言的考试试题,涉及数据导入、数据处理、统计分析及图表制作。学生需创建RStudio项目,处理cholesterol数据集,统计治疗方案,筛选特定数据并保存,分析CO2数据集,转换因子变量,绘制盒型图,以及处理father.son数据进行线性回归分析。同时,试题要求学生处理gdp数据的缺失值,绘制年份与GDP关系图并保存图片。

2023 – 2024学年第1学期2021级 R语言考试试题(机考)
专业:生物信息学 班级: 学号: 姓名

一、工作目录是R中的重要概念。R在这个目录中查找你要加载的文件,也将你要保存的文件放在这个目录中。请为本次考试单独创建你的RStudio项目(Project),要求以你的学号命名,将本项目相关的所有文件放在你的工作目录,包括你的输入数据、R脚本、分析结果以及图形。在完成题目后,将对应的结果以截图添加在本试题对应的位置作为电子版答卷,截图中要求显示出你的脚本、分析结果及图形,考试结束前将电子版答卷和该项目的所有文件打包压缩发送至邮箱,邮件主题写明班级学号和姓名。
注意:
(1)不要在脚本中使用绝对路径,因为不利于他人查看和运行你的脚本:没有任何人会和你具有完全相同的目录设置。
(2)在脚本文件中添加适当的注释,这样可以明确相应R语句所答的题目,并且注释可以说明你的代码使之更易读。

二、cholesterol.txt文件中包含了接受降低胆固醇药物治疗(trt)不同疗法后患者的治疗效果(response)数据。按要求完成下面内容(25分):
(1)将cholesterol.txt文件导入到R中为数据集cholesterol(文件中的分隔符是逗号(,)(5分);
(2)使用函数统计一共有几种治疗方案,以及每组治疗方案(trt)的患者数量(10分);
(2)筛选cholesterol数据集中的候选药物(drugD 和 drugE)的数据,生成数据对象selectedData(5分);
(3)将数据对象selectedData以txt格式保存至工作路径,以制表符分割,要求命名为“你的姓名拼音的首字母大写+selectedData”(5分)。