R语言数据可视化:plot()、qplot()与ggplot()函数全解析
立即解锁
发布时间: 2025-09-02 01:34:05 阅读量: 4 订阅数: 9 AIGC 

# R语言数据可视化:plot()、qplot()与ggplot()函数全解析
## 1. R语言数据可视化概述
R语言提供了多种数据可视化的方式,主要通过函数来生成图形。一些函数能快速创建实用的可视化图形,而另一些函数组合起来则可以创建高度定制的复杂图像。
### 1.1 主要绘图函数介绍
- **plot()**:最基础且通用的绘图函数,它可以根据输入对象的类别创建相应的图像。
- **par()、layout()和split.screen()**:用于设置全局绘图参数和布局选项。
- **qplot()和ggplot()**:来自ggplot2包,在很多方面比早期的R函数更易于使用。
### 1.2 软件版本和硬件信息
- **软件版本**:使用的R版本为4.0.1和4.0.3,RStudio版本为1.3.595和1.3.1093。
- **硬件信息**:示例使用的计算机是运行macOS Catalina版本10.15.5的MacBook Air。
### 1.3 图形设备
R语言将图形对象打开在图形设备中。默认情况下,图形对象会显示在计算机屏幕上,但也可以使用几种图像格式将其保存到文件中。R和RStudio提供了通过菜单链接将图形对象保存为图像文件的方式,R会自动打开和关闭相关设备。若要通过代码操作图形设备,可以参考相关帮助页面。
|操作|参考信息|
| ---- | ---- |
|打开特定类型图像文件的图形设备|Section 6.1.1和“device”帮助页面|
|管理图形设备|Section 6.1.2和dev.cur()帮助页面|
## 2. plot()函数详解
### 2.1 plot()函数基础
plot()函数可以根据特定R类别的对象创建图形,图形可能包含文本、线条、点和/或图像,图形区域可以用颜色或图案填充。显示的图形类型取决于要显示的对象类别,例如,单个时间序列(类为ts的对象)会生成随时间变化的线图。
### 2.2 参数和默认值
默认情况下,图形通常使用黑色线条和文本,具有预设的线条、点和文本大小及粗细。可以在plot()函数中设置改变图形属性的参数,这些参数可用于更改线条、点或文本颜色、线条宽度或样式、点或文本大小、绘图字符、文本样式和字体粗细,以及填充颜色或图案。还可以设置轴标签的替代文本,为图形添加主标题和副标题,并更改标题或标签中文本的方向、样式和粗细。
### 2.3 辅助函数
在首次调用plot()函数后,可以使用辅助函数向原始图形添加图形信息。这些函数可用于在原始图形上叠加其他图形,并为图形添加注释。例如,可以向散点图添加回归线,或在图形中包含图例。常见的辅助函数包括title()、axis()、text()、points()、lines()等。
### 2.4 方法
函数的方法是指该函数所定义的对象类别。在graphics和stats包中,plot()函数定义了29种方法。在实际使用中,通常使用plot.default()版本,它接受x和可能的y作为要绘制的对象,并绘制x与索引值或y与x的散点图。但由于R在运行plot()时会自动确定要使用的方法,因此在调用plot()时不需要使用“.default”扩展名。
### 2.5 示例
下面是一个使用sunspot.year时间序列的示例,展示了使用默认参数和设置部分参数的绘图效果。
```r
# 加载数据集
data("sunspot.year")
# 使用par()函数设置一行两个图形
par(mfrow = c(1, 2))
# 绘制默认参数的图形
plot(sunspot.year)
# 绘制设置部分参数的图形
plot(sunspot.year, main = "Sunspot Year Plot", xlab = "Year", ylab = "Sunspot Number", col = "red")
# 恢复默认的绘图布局
par(mfrow = c(1, 1))
```
这个示例展示了如何使用par()函数在一个图形中绘制多个图形,以及如何设置plot()函数的参数来改变图形的外观。
## 3. plot()函数的参数分类
### 3.1 数据集
这里使用的是datasets包中的LifeCycleSavings数据集。要将数据集加载到工作区并查看其内容,可以按以下步骤操作:
1. 在R提示符下输入以下代码加载数据集:
```r
data( "LifeCycleSavings" )
```
2. 在RStudio中,双击“LifeCycleSavings”(在右上角窗格的Environment窗口的Data部分),控制台将显示数据集的内容。
该数据集包含50个观测值和5个变量,具体信息如下:
|变量|描述|
| ---- | ---- |
|sr|总个人储蓄|
|pop15|15岁以下人口的百分比|
|pop75|75岁以上人口的百分比|
|dpi|实际人均可支配收入|
|ddpi|dpi的增长率|
### 3.2 影响整体外观的参数
#### 3.2.1 标签和轴限制
可以通过设置参数来更改图形的标签和轴限制,例如:
```r
plot(LifeCycleSavings$sr, LifeCycleSavings$dpi, main = "Savings vs Disposable Income", xlab = "Savings Ratio", ylab = "Disposable Income", xlim = c(0, 20), ylim = c(0, 3000))
```
#### 3.2.2 框类型、纵横比、注释和扩展绘图
还可以设置其他参数来改变图形的框类型、纵横比,添加注释和进行扩展绘图。例如:
```r
plot(LifeCycleSavings$sr, LifeCycleSavings$dpi, type = "p", bty = "o", asp = 1, ann = TRUE, xaxs = "i", yaxs = "i")
```
### 3.3 点和线
#### 3.3.1 绘图类型
plot()函数支持多种绘图类型,例如:
- “p”:绘制点
- “l”:绘制线
- “b”:绘制点和线
- “c”:绘制线(不绘制点)
- “o”:绘制点和线(线覆盖点)
- “h”:绘制直方图样式的线
- “s”:绘制阶梯线
- “S”:绘制反向阶梯线
- “n”:不绘制任何内容
```r
# 绘制点图
plot(LifeCycleSavings$sr, LifeCycleSavings$dpi, type = "p")
# 绘制线图
plot(LifeCycleSavings$sr, LifeCycleSavings$dpi, type = "l")
```
#### 3.3.2 pch和lty参数
pch参数用于指定点的样式,lty参数用于指定线的类型。例如:
```r
plot(LifeCycleSavings$sr, LifeCycleSavings$dpi, pch = 16, lty = 2)
```
### 3.4 细节设置
#### 3.4.1 颜色
可以使用col参数来设置点、线和文本的颜色。例如:
```r
plot(LifeCycleSavings$sr, LifeCycleSavings$dpi, col = "red")
```
#### 3.4.2 字体和字体家族
可以使用font和family参数来设置文本的字体和字体家族。例如:
```r
plot(LifeCycleSavings$sr, LifeCycleSavings$dpi, main = "Savings vs Disposable Income", font.main = 2, family = "serif")
```
#### 3.4.3 字符大小
可以使用cex参数来设置字符大小。例如:
```r
plot(LifeCycleSavings$sr, LifeCycleSavings$dpi, cex = 1.5)
```
#### 3.4.4 线条细节
可以使用lwd、lend、ljoin和lmitre参数来设置线条的细节。例如:
```r
plot(LifeCycleSavings$sr, LifeCycleSavings$dpi, lwd = 2, lend = 2, ljoin = 2, lmitre = 2)
```
#### 3.4.5 坐标轴设置
可以使用参数来更改坐标轴的颜色、线宽、刻度标记长度和间距等。例如:
```r
plot(LifeCycleSavings$sr, LifeCycleSavings$dpi, col.axis = "blue", lwd.ticks = 2)
```
#### 3.4.6 对数刻度
可以使用log参数来使用对数刻度。例如:
```r
plot(LifeCycleSavings$sr, LifeCycleSavings$dpi, log = "xy")
```
mermaid流程图:
```mermaid
graph LR
A[开始] --> B[加载LifeCycleSavings数据集]
B --> C[设置绘图参数]
C --> D[绘制图形]
D --> E[结束]
```
## 4. qplot()和ggplot()函数介绍
### 4.1 qplot()和ggplot()函数基础
ggplot2包中的qplot()和ggplot()函数为plot()函数提供了替代方案。默认情况下,qplot()和ggplot()生成的图形比plot()生成的默认图形看起来更好。对于简单的图形,qplot()就足以生成美观的图形,而ggplot()提供了更多的绘图选项。
### 4.2 ggplot2包的语法
在ggplot2包中,可以使用theme()或以“theme_”开头的预设主题函数来定义图形的主题。要绘制的对象是“映射”,可以在aes()函数中进行分配。要显示的图像类型是几何图形或统计量,可以通过以“geom_”或“stat_”开头的函数进行分配。可以使用aes()、“aes_”函数、“geom_”函数、“stat_”函数和/或其他格式化函数来更改图形的外观。
### 4.3 示例
下面是一个使用ggplot()函数的简单示例:
```r
library(ggplot2)
# 创建ggplot对象
ggplot(LifeCycleSavings, aes(x = sr, y = dpi)) +
geom_point() +
labs(title = "Savings vs Disposable Income", x = "Savings Ratio", y = "Disposable Income")
```
这个示例展示了如何使用ggplot()函数创建一个散点图,并添加标题和轴标签。
## 5. 附录中的绘图函数
除了plot()、qplot()和ggplot()函数外,graphics和stats包中还有许多绘图函数。这些函数对于数据清理、数据探索和/或模型拟合非常有用。附录中按要显示的对象类型对这些函数进行了分类:
- **附录A**:用于列联表和离散数据的绘图函数
- **附录B**:用于连续变量的绘图函数
- **附录C**:用于绘制多个图形的函数
- **附录D**:用于平滑数据的函数
- **附录E**:用于时间序列分析的绘图函数
- **附录F**:其他绘图函数
这些函数中的许多可以使用plot()函数使用的图形参数。通过使用这些函数,可以更方便地进行数据可视化和分析。
## 6. ggplot()函数的主题和美学设置
### 6.1 主题函数
#### 6.1.1 theme()函数
theme()函数用于自定义图形的主题。可以通过设置各种元素来改变图形的外观,如背景颜色、文本样式等。例如:
```r
library(ggplot2)
ggplot(LifeCycleSavings, aes(x = sr, y = dpi)) +
geom_point() +
theme(
panel.background = element_rect(fill = "lightblue"),
axis.title = element_text(size = 14, color = "red")
)
```
#### 6.1.2 预设主题函数
ggplot2包提供了一些预设的主题函数,如theme_minimal()、theme_bw()等,使用这些函数可以快速改变图形的整体风格。例如:
```r
ggplot(LifeCycleSavings, aes(x = sr, y = dpi)) +
geom_point() +
theme_minimal()
```
#### 6.1.3 主题操作
可以在已有的主题基础上进行修改,或者将不同的主题元素组合使用。例如:
```r
custom_theme <- theme_minimal() +
theme(
panel.grid.major = element_line(color = "gray"),
axis.text = element_text(size = 12)
)
ggplot(LifeCycleSavings, aes(x = sr, y = dpi)) +
geom_point() +
custom_theme
```
### 6.2 美学函数
美学函数用于定义图形的美学属性,如颜色、大小、形状等。可以在aes()函数中设置这些属性,也可以在具体的几何图形函数中进行设置。例如:
```r
ggplot(LifeCycleSavings, aes(x = sr, y = dpi, color = factor(pop15 > 20))) +
geom_point(size = 3)
```
|美学属性|设置方式|示例|
| ---- | ---- | ---- |
|颜色|color|`aes(color = factor(pop15 > 20))`|
|大小|size|`geom_point(size = 3)`|
|形状|shape|`aes(shape = factor(pop75 > 5))`|
mermaid流程图:
```mermaid
graph LR
A[开始] --> B[创建ggplot对象]
B --> C[设置美学属性]
C --> D[选择主题]
D --> E[添加几何图形]
E --> F[结束]
```
## 7. ggplot2包的几何、统计、注释和边框函数
### 7.1 几何函数
几何函数用于定义图形的基本形状,如点、线、柱状图等。常见的几何函数有geom_point()、geom_line()、geom_bar()等。例如:
```r
# 绘制柱状图
ggplot(LifeCycleSavings, aes(x = factor(pop15 > 20))) +
geom_bar()
```
### 7.2 统计函数
统计函数用于对数据进行统计计算,并将结果可视化。例如,stat_summary()可以计算数据的均值和置信区间,并绘制相应的图形。
```r
ggplot(LifeCycleSavings, aes(x = factor(pop15 > 20), y = sr)) +
stat_summary(fun = mean, geom = "bar")
```
### 7.3 注释函数
#### 7.3.1 annotate()函数
annotate()函数用于在图形中添加注释,如文本、矩形等。例如:
```r
ggplot(LifeCycleSavings, aes(x = sr, y = dpi)) +
geom_point() +
annotate("text", x = 15, y = 2000, label = "High savings area")
```
#### 7.3.2 annotation_custom()和ggplotGrob()函数
annotation_custom()和ggplotGrob()函数可以用于添加自定义的图形元素。例如:
```r
library(gtable)
grob <- rectGrob(gp = gpar(fill = "red", alpha = 0.2))
ggplot(LifeCycleSavings, aes(x = sr, y = dpi)) +
geom_point() +
annotation_custom(grob, xmin = 10, xmax = 20, ymin = 1500, ymax = 2500)
```
#### 7.3.3 annotation_logticks()函数
annotation_logticks()函数用于在对数坐标轴上添加刻度标记。例如:
```r
ggplot(LifeCycleSavings, aes(x = sr, y = dpi)) +
geom_point() +
scale_x_log10() +
annotation_logticks(sides = "b")
```
#### 7.3.4 annotation_map()和annotation_raster()函数
annotation_map()和annotation_raster()函数可以用于添加地图和栅格图像。
### 7.4 边框函数
borders()函数用于在图形中添加边框。例如:
```r
ggplot(LifeCycleSavings, aes(x = sr, y = dpi)) +
geom_point() +
borders("state", fill = NA, colour = "black")
```
## 8. ggplot2包的格式化和绘图管理工具
### 8.1 比例、坐标和引导函数
#### 8.1.1 影响颜色、大小、形状和线型的比例函数
比例函数用于控制美学属性的映射方式,如scale_color_manual()可以手动设置颜色映射。例如:
```r
ggplot(LifeCycleSavings, aes(x = sr, y = dpi, color = factor(pop15 > 20))) +
geom_point() +
scale_color_manual(values = c("blue", "red"))
```
#### 8.1.2 设置评估顺序
可以通过设置函数的顺序来控制图形的绘制顺序。例如:
```r
ggplot(LifeCycleSavings, aes(x = sr, y = dpi)) +
geom_point() +
scale_x_continuous(limits = c(0, 20)) +
scale_y_continuous(limits = c(0, 3000))
```
#### 8.1.3 使用比例和坐标函数格式化坐标轴
可以使用scale_x_continuous()、scale_y_log10()等函数来格式化坐标轴。例如:
```r
ggplot(LifeCycleSavings, aes(x = sr, y = dpi)) +
geom_point() +
scale_x_continuous(breaks = seq(0, 20, 5)) +
scale_y_log10()
```
#### 8.1.4 引导和绘制键函数
引导函数用于控制图例的显示方式,如guides()函数。例如:
```r
ggplot(LifeCycleSavings, aes(x = sr, y = dpi, color = factor(pop15 > 20))) +
geom_point() +
guides(color = guide_legend(title = "Population < 15"))
```
### 8.2 切割、汇总和分面函数
#### 8.2.1 切割函数
切割函数用于将数据进行分组,如cut()函数。例如:
```r
LifeCycleSavings$sr_group <- cut(LifeCycleSavings$sr, breaks = 3)
ggplot(LifeCycleSavings, aes(x = sr_group, y = dpi)) +
geom_boxplot()
```
#### 8.2.2 汇总函数和分辨率函数
汇总函数用于对数据进行汇总计算,如summarize()函数。分辨率函数用于控制图形的分辨率。
#### 8.2.3 分面函数
分面函数用于将数据分成多个子图进行展示,如facet_wrap()和facet_grid()。例如:
```r
ggplot(LifeCycleSavings, aes(x = sr, y = dpi)) +
geom_point() +
facet_wrap(~ factor(pop15 > 20))
```
### 8.3 绘图、自动绘图和原型函数
#### 8.3.1 ggsave()、plot()和print()函数
ggsave()函数用于保存图形,plot()和print()函数用于显示图形。例如:
```r
p <- ggplot(LifeCycleSavings, aes(x = sr, y = dpi)) +
geom_point()
ggsave("plot.png", p)
print(p)
```
#### 8.3.2 autoplot()和autolayer()函数
autoplot()和autolayer()函数可以自动绘制图形和添加图层。
#### 8.3.3 原型函数
ggplot2包中的原型函数可以用于创建图形的原型。
|函数类型|作用|示例|
| ---- | ---- | ---- |
|比例函数|控制美学属性映射|`scale_color_manual()`|
|分面函数|创建子图|`facet_wrap()`|
|保存函数|保存图形|`ggsave()`|
mermaid流程图:
```mermaid
graph LR
A[开始] --> B[选择数据]
B --> C[设置比例和坐标]
C --> D[使用切割和汇总函数]
D --> E[添加分面]
E --> F[保存或显示图形]
F --> G[结束]
```
0
0
复制全文
相关推荐










