多维数据在不同坐标系统中的可视化分析
立即解锁
发布时间: 2025-08-17 00:17:54 订阅数: 2 

### 多维数据在不同坐标系统中的可视化分析
#### 1. 多维超立方体与聚类
在多维空间中,我们首先关注超立方体的概念。一个 n 维超立方体是由一组 n 维点 {w} 构成,这些点在每个维度 Xi 上与一个 n 维点 a 的距离不超过 r,即 {w: ∀i di(w, a) ≤ r},我们将这组 n 维点记为 w(a, r)。
有如下重要结论:
- **结论 3.14**:对于 n 维超立方体 w(a, r) 内的任意 n 维点 w,其 CPC 图 w* 是点 a 的 CPC 图 a* 在每个维度上平移不超过距离 r 得到的。
- **证明**:设 a = (a1, a2, …, an),则超立方体中最远的点 w 为 w = (a1 ± r, a2 ± r, …, an ± r)。如果这些点相对于 a 的平移不超过 r,那么其他所有点的平移也在 r 以内。在 CPC 中,w 表示为一个有向图 w*,连接着成对的点 (w1, w2) → (w3, w4) → … → (wn - 1, wn)。若对于所有 i,wi = ai + r,那么 w 的 (w1, w2) = (a1 + r, a2 + r) 相对于 a 的第一对 (a1, a2) 平移了 (r, r)。同理,w 的每一对 (wi, wi + 1) 相对于 a 的 (ai, ai + 1) 都有相同的平移 (r, r)。所以,要得到 w 的图 w*,只需在 a 的图上在 X 坐标和 Y 坐标上分别平移 r。当某些 wi = ai - r 时,也会有类似的平移 (-r, r) 或 (r, -r),且最大距离仍为 r。
现在考虑两类 n 维向量,它们分别位于两个不同的超立方体中,且满足性质 Q:超立方体 W(a, r) 和 W(b, r) 的中心 a 和 b 在每个维度 Xi 上的距离大于 2r,即 Di(a, b) > 2r,且对于所有的 i 和 j 有 ai < bj。
- **结论 3.15**:具有性质 Q 的超立方体 W(a, r) 和 W(b, r) 中所有 n 维点的 CPC 表示图的节点不会重叠。
- **证明**:当 wk 和 ws 都在 W(a, r) 内时,maxDi(wk, ws) = 2r 且 max Di(wk, a) = r;同理,当 wk 和 ws 都在 W(b, r) 内时,也有 maxDi(wk, ws) = 2r 且 maxDi(wk, b) = r。在 n 维空间中,如果超立方体 W(a, r) 和 W(b, r) 重叠,那么必然存在一个维度 Xi 使得 Di(a, b) ≤ 2r,因为这个距离必须小于或等于每个超立方体内的最大距离之和 r + r。这与性质 Q 要求的对于所有 Xi 都有 Di(a, b) > 2r 相矛盾。这个距离足以保证来自这些超立方体的 n 维点的图不重叠,因为对于所有的 i 和 j 有 ai < bj,即图 b* 的最低节点会高于图 a* 的最高节点。
对于不满足性质 Q 的情况,我们可以通过反转某些坐标来使两个超立方体不重叠。例如,在 4 维空间中,设 a = (1, 4, 4, 1),b = (4, 1, 1, 4),r = 1。超立方体 W(a, r) 和 W(b, r) 在 4 维空间中不重叠,但在 CPC 的 2 维表示中,图 a* 是箭头 (1, 4) → (4, 1),图 b* 是箭头 (4, 1) → (1, 4),它们是同一条线但方向相反。假设每个坐标 Xi 的值在 [0, 5] 区间内,我们反转坐标 X2 和 X3,得到反转后的坐标 X2′ 和 X3′,对于每个 n 维点 x,x2′ = 5 - x,x3′ = 5 - x。这样就得到 a′ = (1, 1, 1, 1),b′ = (4, 4, 4, 4),它们的图 (1, 1) → (1, 1) 和 (4, 4) → (4, 4) 不再重叠。
结论 3.15 的好处在于,如果两类数据分别位于这样不重叠的超立方体中,那么在 CPC 可视化中无需事先知道这些超立方体的中心和边长就能看到它们的分离。而通过分析方法发现这种分离则需要搜索合适超立方体的中心和边长。
对于分析聚类,我们需要选择 n 维点作为起始点,并且聚类结果对这些点的选择很敏感。由于不知道超立方体的中心和边长,我们需要搜索大量的超立方体。此外,聚类目标函数的选择本身也具有很大的主观性。
下面通过表格总结超立方体相关的重要信息:
| 概念 | 定义 | 相关结论 |
| ---- | ---- | ---- |
| n 维超立方体 w(a, r) | 一组 n 维点 {w},在每个维度 Xi 上与点 a 的距离不超过 r | 结论 3.14、结论 3.15 |
| 性质 Q | 超立方体 W(a, r) 和 W(b, r) 的中心 a 和 b 在每个维度 Xi 上的距离大于 2r,且 ai < bj | 用于判断超立方体图是否重叠 |
其流程可以用如下 mermaid 流程图表示:
```mermaid
graph TD;
```
0
0
复制全文
相关推荐









