R语言数据可视化:指南、绘图及相关函数详解
立即解锁
发布时间: 2025-09-02 01:34:14 阅读量: 6 订阅数: 4 AIGC 

### R 语言数据可视化:指南、绘图及相关函数详解
#### 1. 指南函数设置
在绘图时,可通过在比例函数中设置 `guide` 参数来使用指南函数。`guide` 参数可以是引号括起来的名称,也可以是完整的函数,例如 `guide="bins"` 或 `guide=guide_bins()`。具体函数的参数可查看相应的帮助页面。
#### 2. 影响坐标轴的指南函数
- **guide_axis()**:该函数有六个参数,可用于设置坐标轴标签、处理坐标轴刻度标签重叠的情况、设置标签角度、坐标轴位置以及绘图顺序。
- **guide_none()**:可与 `x` 和 `y` 比例函数配合使用,用于分配坐标轴标签,但不显示刻度线和刻度标签。通过 `title` 参数分配坐标轴标签,通过 `position` 参数指定标签位置,可设置为 “bottom”、“left”、“top” 或 “right”。
#### 3. 影响缩放变量键的指南函数
| 函数名称 | 适用数据类型 | 功能描述 |
| ---- | ---- | ---- |
| `guide_none()` | 非坐标轴比例函数 | 抑制缩放变量的键显示 |
| `guide_legend()` | 未分箱连续数据、分箱连续数据、离散数据 | 设置带有缩放变量键的图例 |
| `guide_bins()` | 未分箱连续数据、分箱连续数据、离散数据 | 设置带有不同步骤的条带,在步骤交点处显示级别 |
| `guide_colorsteps()` | 未分箱连续数据、分箱连续数据、离散数据 | 是 `guide_bins()` 的一种变体,键为填充了比例颜色的矩形 |
| `guide_colorbar()` | 连续数据(未分箱或分箱) | 对于未分箱连续数据,绘制连续渐变颜色比例;对于分箱比例,行为类似于 `guide_colorsteps()` |
#### 4. guides() 函数使用
`guides()` 函数用于轻松为绘图分配一组指南。该函数没有指定的参数,而是将每个指南分配给应用该指南的美学参数,各指南之间用逗号分隔。结果可分配一个名称,该名称可用于添加到 `ggplot()` 的函数中,且名称添加到几何或统计函数时不包含括号,无需使用比例函数。
示例代码如下:
```R
gd=guides(
size=guide_legend(
title="dpi"
),
color=guide_legend(
title=NULL
)
)
ggplot(
LifeCycleSavings,
aes( pop75, pop15 )
) +
geom_point(
aes(
size=as.numeric(
as.factor(
cut( dpi, 5 )
)
),
color=after_scale(
grey( (size+1)/12 )
)
)
) + gd
```
在上述代码中,首先将指南分配给对象 `gd`,设置好绘图后,在几何函数后包含名称 `gd` 来运行指南。注意,指南不是在比例函数中设置的。
#### 5. 绘制关键函数
有 16 个绘制关键函数,函数名称以 `draw_key_` 开头,后面跟着几何图形的名称,可用的几何图形名称有 `point`、`abline`、`rect` 等,具体如下:
- `point`
- `abline`
- `rect`
- `polygon`
- `blank`
- `boxplot`
- `crossbar`
- `path`
- `vpath`
- `dotplot`
- `pointrange`
- `smooth`
- `text`
- `label`
- `vline`
- `timeseries`
关键样式由几何和统计函数自动分配,但默认样式可以更改。通过将绘制关键函数分配给几何和统计函数中的 `key_glyph` 参数来更改样式,分配形式可以是引号括起来的几何图形名称,也可以是不带结尾括号且不加引号的完整函数名,例如 `key_glyph="abline"` 或 `key_glyph=draw_key_abline`。
#### 6. 切割、汇总和分面函数
- **切割函数**:用于将连续(数值)向量离散化,`ggplot2` 包中有三个切割函数:`cut_interval()`、`cut_number()` 和 `cut_width()`。这些函数基于基本函数中的 `cut()` 函数,可使用 `cut()` 的参数以及各自帮助页面中列出的参数。第一个参数 `x` 表示要切割成离散因子级别的数值向量。
- `cut_interval()`:根据 `n`(等长区间的数量)或 `length`(等长区间的长度)将数据范围切割成区间。若选择 `n`,区间宽度为数值向量范围除以 `n`;若选择 `length`,该值不一定能整除数据向量范围,函数会确定区间的起始值。`n` 和 `length` 都接受单元素数值向量。
- `cut_number()`:只有一个参数 `n`,表示区间数量,其行为类似于选择 `n` 时的 `cut_interval()`。
- `cut_width()`:提供更多灵活性。除 `x` 外,指定的参数有 `width`(区间宽度)、`center`(第一个区间的中心)、`boundary`(第一个区间的起始点)和 `closed`(区间是左闭还是右闭)。`width`、`center` 和 `boundary` 接受单元素数值向量,`width` 无默认值,`center` 和 `boundary` 的默认值为 `NULL`。`closed` 接受单元素字符向量,值必须为 “left” 或 “right”,默认值为 “right”,即区间右闭。
- **汇总函数和 resolution() 函数**
- **汇总函数**:`ggplot2` 包中的汇总函数与以 `stat_summary` 开头的统计汇总函数配合使用。统计汇总函数接受 `fun` 参数,可将汇总函数分配给该参数。其中四个汇总函数基于 `Hmisc` 包中的函数,运行这些函数时 `Hmisc` 包必须安装,但无需加载,这些函数包括 `mean_cl_boot()`、`mean_cl_normal()`、`median_hilow()` 和 `mean_sdl()`,第五个函数是 `mean_se()`。所有汇总函数都接受两个参数:`x` 表示要汇总的数值向量,`...` 表示 `Hmisc` 包中对应函
0
0
复制全文
相关推荐










