在线社交网络链接稳定性检测方法与实验分析
立即解锁
发布时间: 2025-08-23 00:41:12 阅读量: 2 订阅数: 9 

### 在线社交网络链接稳定性检测方法与实验分析
#### 1. 稳定链接检测概述
在社交网络中,链接的稳定性检测至关重要。以往有研究提出基于活动的方法来确定社交链接的强度(稳定性)。与传统基于友谊结构的方法不同,该方法聚焦于活动网络中常被忽视的方面。随着时间推移,社交链接会因社交交易活动的变化而变强(稳定)或变弱(不稳定)。例如,对Facebook上链接活动的观察发现,仅依赖链接出现次数作为衡量指标的链接预测任务并不准确,活动网络中的链接会随时间快速波动,而且随着社交网络的发展,链接强度(稳定性)的衰减与社交活动的减少相关。
还有研究从常见的链接挖掘任务角度,对链接及其对应结构的认知进行了概述,这些任务包括对象排名、群体检测、集体分类、链接预测和子图发现等。其方法侧重于通过挖掘和明确建模数据实例间的时间感知链接来寻找数据中的模式。
#### 2. 检测稳定链接的方法
##### 2.1 多变量向量自回归(MVVA)
- **核心思路**:选择时间序列回归技术作为计算网络中链接稳定性指数的主要方法。对于小规模数据集,向量回归方法(VAR)是一种简单而有效的分析手段。时间序列回归通常有两种形式,即用于预测的简化(主要)形式和用于结构分析的结构(扩展)形式。本研究采用结构框架作为识别链接稳定性的核心方法之一,它能将关系行为与社交场景中的已知动态模型进行基准对比,还可用于研究对突发干扰的响应,如世界事件(如英国脱欧)带来的冲击。
- **数学模型**:
- 多元线性回归模型通过考虑多个独立变量关系来估计因变量的状态,MVVA进一步通过时间关联多线性回归关系。给定一系列过去的因变量观测值 $Y_{\tau}$,可以通过以下数学公式预测当前时间的未观测因变量 $Y_t$:
\[Y_t = B_0 + \sum_{n = 0, \tau = 0}^{m, t - n} (G_nY_{\tau} + \varepsilon_{\tau})\]
其中,$B_0$ 是残差常数数组,$\varepsilon_{\tau}$ 是零方差协方差的误差向量。
- 在提出的MVVA模型中,确定了六个变量对链接稳定性起着关键作用。这些变量是通过对自变量和因变量观测值之间的相关性、散点图和简单回归进行研究确定的。时间 $t$ 的稳定性矩阵由这六个独立变量的预测贡献计算得出。定义节点特征相似度的稳定性指数为 $N(S)_t$、累积频率为 $F(Q)_t$、情感为 $I(S)_t$、信任为 $R(S)_t$、中介性为 $B(S)_t$ 和交易为 $W(S)_t$,则所有六个特征的稳定性贡献矩阵 $S_t$ 为:$S_t = [N(S)_t, F(Q)_t, I(S)_t, R(S)_t, B(S)_t, W(S)_t]^T$。
- 从结构角度,模型的数学公式为:
\[A S_t = \beta_0 + \sum_{\tau = 1}^{p} (\beta_{\tau} S_{t - \tau}) + U_t\]
其中,$A$ 是通过过去变化确定的内生变量(动态特征稳定性贡献)之间的受限相关矩阵,$\beta_0$ 和 $\beta_{\tau}$ 是通过普通最小二乘法(OLS)估计的结构参数,$U_t$ 是由不稳定世界事件引起的与时间无关的干扰。
- 其主要形式为:
\[S_t = C_t + \sum_{\tau = 1}^{m, t - n} G_{\tau} S_{\tau} + \varepsilon_t\]
其中,$C_t = A^{-1} * \beta_0$,$G_{\tau} = A^{-1} * \beta_{\tau}$,残差误差 $\varepsilon_t = A^{-1} * U_t$。
- 定义特征速率耦合比 $w_t$ 为由于结构干扰对内生特征观测值的加权脉冲响应。特征速率耦合比的计算公式为:
\[\sum_{\tau = 1}^{n} w_{U_{\tau}} = \sum_{\tau = 1}^{n} (\dot{w}_{U_{\tau - 1}} * [F_{U_{\tau}} - F_{U_{\tau - 1}}])\]
其中,$\dot{w}_{U_{\tau - 1}}$ 是一阶导数响应滞后,用于衡量社交活动的动量向量,$F_{U_{\tau}}$ 和 $F_{U_{\tau - 1}}$ 分别是当前和滞后时间框架的内生特征观测向量。
- 结构自回归模型可表示为社交干扰的向量和:
\[S_{i}^{t} = \mu + \sum_{i = 0}^{k} w_{t, i} S_{t, i}\]
其中,$S_{i}^{t}$ 是稳定性矩阵,$w_{t, i}$ 是时间 $t$ 的特征速率耦合比,$S_{t, i}$ 是稳定性贡献,$\mu$ 是脉冲残差常数。
- **局限性**:MVVA模型也存在一些缺点。涉及矩阵 $M$ 的Cholesky分解的OLS问题的复杂度至少为 $O(C^2N)$,其中 $N$ 是样本数据大小,$C$ 是特征总数。随着社交网络复杂度的增加,还可能出现过拟合和多重共线性问题。
以下是MVVA模型相关变量的说明表格:
| 变量 | 含义 |
| ---- | ---- |
| $Y_t$ | 当前时间的未观测因变量 |
| $B_0$ | 残差常数数组 |
| $\varepsilon_{\tau}$ | 零方
0
0
复制全文
相关推荐









