高维数据二维可视化:方法、限制与关系表示
发布时间: 2025-08-17 00:17:54 阅读量: 2 订阅数: 3 

### 高维数据二维可视化:方法、限制与关系表示
#### 1. L1 距离性质与固定单点方法
在偶数维度 $n$ 的情况下,对于每个 $i$,向量 $x_i$ 和 $y_i$ 位于同一坐标 $X_i$ 上。由于 GLC - CC1 中向量 $x_i$ 和 $y_i$ 的构建过程,它们的差异是标量差异。总 L1 距离 $D^*(x^*, y^*)$ 是 $x^*$ 和 $y^*$ 所有节点间 L1 距离之和,根据上述距离性质,它等于 GLC - CC1 中 $x$ 和 $y$ 之间的距离,即:
$D^*(x^*, y^*) = \sum_{i = 1,3,5,\cdots,n - 1} |n_{x_{i,i + 1}} - n_{y_{i,i + 1}}| = \sum_{i = 1,3,5,\cdots,n - 1} (|x_i - y_i| + |x_{i + 1} - y_{i + 1}|) = \sum_{i = 1}^{n} |x_i - y_i| = D(x, y)$
对于奇数维度 $n$,我们复制最后一个坐标来得到此结论。
#### 2. 单点算法
GLC - CC 表示法具有认知优势,与 GLC - PC 和 GLC - SC 相比,其在二维中的占用空间小两倍,这使得在二维中表示多个高维数据时遮挡更小。此外,它还能将任意给定的高维点 $(x_1, x_2, \cdots, x_n)$ 无损地表示为单个二维点,实现这一表示的是单点(SP)算法,步骤如下:
1. **选择基点**:在平面上选择任意二维点 $A = (a_1, a_2)$,称为锚点;选择高维点 $x = (x_1, x_2, \cdots, x_n)$,称为基点;选择一组正常数 $c_1, c_2, \cdots, c_n$,作为坐标 $X_1, X_2, \cdots, X_n$ 的长度。
2. **计算坐标点**:计算二维点 $O_1 = (a_1 - x_1, a_2 - x_2)$ 和 $E_1 = (a_1 - x_1 + c_1, a_2 - x_2)$,坐标线 $X_1$ 定义为定位向量 $X_1 = (O_1, E_1)$。
3. **定义新坐标点**:定义点 $O_1$ 和 $O_2$,$O_2 = O_1$,$E_2 = (a_1 - x_1, a_2 - x_2 + c_2)$,坐标线 $X_2$ 定义为向量 $X_2 = (O_2, E_2)$。
4. **重复步骤**:对所有其他坐标重复步骤 2 和 3,构建坐标系 $X_1, X_2, \cdots, X_n$。
该算法创建了参数化移位配对坐标(PSPC)系统,其中每对后续坐标在移位的笛卡尔坐标中绘制。在由单点算法构建的坐标系 $X_1, X_2, \cdots, X_n$ 中,给定基点 $x = (x_1, x_2, \cdots, x_n)$ 和锚点 $A$,高维点 $x$ 通过 GLC - CC 算法一对一映射到单个二维点 $A$。
#### 3. 基于单点算法的陈述
GLC - CC 和 SP 算法结合的另一个优势是,给定基点 $x = (x_1, x_2, \cdots, x_n)$ 周围的高维超立方体的所有高维点都映射到由以下方形算法定义的正方形内的图形。方形算法步骤如下:
1. **构建超立方体**:构建以基点 $x = (x_1, x_2, \cdots, x_n)$ 为中心,到其面的距离为 $d$ 的超立方体 $H$。超立方体的 $2n$ 个节点 $N$ 为 $(x_1 + ad, x_2 + ad, \cdots, x_n + ad)$,其中 $a = 1$ 或 $a = -1$,例如 $(x_1 + d, x_2 + d, \cdots, x_n + d)$,$(x_1 - d, x_2 - d, \cdots, x_n - d
0
0
相关推荐










