时空数据中的主题感知社交强度推断
立即解锁
发布时间: 2025-08-22 01:46:32 阅读量: 2 订阅数: 17 


网络时代的个性化标签推荐系统
### 时空数据中的主题感知社交强度推断
#### 1. 社交强度推断概述
社交强度推断由四个阶段构成,具体如下:
1. **检测时空窗口(SW)**:确定合适的时空窗口,用于后续分析。
2. **提取主题**:挖掘能够生成所有共现行为集合的主题。
3. **训练每个主题对社交强度的贡献**:将训练数据中人员的共现行为分解为不同比例的主题,并根据社交连接图计算主题对社交强度的贡献。
4. **计算社交强度**:根据一对人员的共现行为,推断他们的社交强度。
例如,假设有两个时空窗口:$sw1 = \langle 游乐园, [8:00, 9:00] \rangle$ 和 $sw2 = \langle 咖啡馆, [20:00, 21:00] \rangle$,提取出两个主题:$\{ \langle sw1, 0.9 \rangle, \langle sw2, 0.1 \rangle \}$ 和 $\{ \langle sw1, 0.1 \rangle, \langle sw2, 0.9 \rangle \}$。人员 1 和 2 的共现行为可以表示为 $\{ 0.5, 0.5 \}$,即由两个主题各占 50% 生成。若前一个主题对社交强度的贡献为 0.7,后一个为 0.9,则社交强度可估算为 $50\% \times 0.7 + 50\% \times 0.9 = 0.8$,这表明两人很可能是朋友。
下面是社交强度推断的框架流程图:
```mermaid
graph LR
A[时空窗口检测] --> B[主题挖掘]
B --> C[主题贡献训练]
C --> D[社交强度推断]
E[位置数据] --> A
F[社交连接图] --> C
G[数据集] --> A
G --> F
```
#### 2. 挖掘主题
为了描述主题生成共现行为的过程,我们引入以下符号:
| 符号 | 解释 |
| ---- | ---- |
| N | 时空窗口(SW)的总数 |
| swn | 第 n 个时空窗口 |
| K | 主题的总数 |
| β | 一个 $K \times N$ 的矩阵,其中 $\beta_{k,n}$ 表示主题 k 在时空窗口 n 产生共现的概率 |
| D | 共现行为的总数 |
| w | 一个 $D \times N$ 的矩阵,其中 $w_{d,n}$ 表示第 d 对人员在时空窗口 n 共现的概率 |
| θ | 一个 $D \times K$ 的矩阵,其中 $\theta_{d,k}$ 表示主题 k 在第 d 个共现行为中所占的比例 |
| z | 一个 $D \times N$ 的矩阵,其中 $z_{d,n}$ 表示第 d 对人员在时空窗口 n 的共现行为所分配的主题 |
主题生成共现行为的生成模型如下:
- 对于每个主题 k,从 Dirichlet 分布 $Dir(\eta)$ 中抽取 $\beta_k$。
- 对于共现行为 d,从 Dirichlet 分布 $Dir(\alpha)$ 中抽取 $\theta_d$。
- 对于共现行为 d 中的时空窗口 n:
- 从多项分布 $Multi(\theta_d)$ 中抽取 $z_{d,n}$。
- 从多项分布 $Multi(\beta_{z_{d,n}})$ 中抽取 $w_{d,n}$
0
0
复制全文
相关推荐









