社交媒体争议检测与作者归属识别的创新方法
发布时间: 2025-08-17 00:44:56 阅读量: 1 订阅数: 5 

### 社交媒体争议检测与作者归属识别的创新方法
在当今数字化时代,社交媒体已经成为人们交流和表达观点的重要平台。然而,随之而来的争议话题和虚假信息也给社会带来了诸多挑战。本文将介绍两种创新的技术方法,分别用于社交媒体的争议检测和文本的作者归属识别。
#### 多尺度结构与语义信息融合图卷积网络(MSSF - GCN)用于争议检测
随着社交媒体的广泛传播,其中包含了大量用户之间的激烈讨论。因此,社交媒体上的争议检测是一项具有挑战性且有意义的任务,通常可分为主题级别和帖子级别。
##### 关键贡献
- **构建TPCS图**:融合回复结构关系和情感信息,以情感信息为基础检测各种观点和潜在争议。
- **提出MSSF - GCN**:用于帖子级别的争议检测,能够融合全局结构信息、内容的语义信息和局部邻居信息,以获得全面的特征表示。
- **构建多语言数据集**:包含德语、法语和意大利语,用于争议检测,并与最先进的模型进行评估比较,展示了其优势。
##### 相关工作
目前,大多数模型和方法利用基于Twitter、外部知识、图和语言特征等。例如,TPC - GCN模型整合了主题、帖子和评论的图结构和内容信息,用于帖子级别的争议检测。
##### 方法
- **TPCS图构建**
- **节点**:TPCS图G中有三种不同类型的节点,即主题节点、帖子节点和评论节点。主题节点可视为集成和交换信息的中心节点,也是连接属于该主题的所有帖子节点的根节点。每个评论节点与它回复的帖子节点或评论节点相连。
- **边**:为了考虑情感信息,利用预训练模型(PTMs)计算情感分数作为边的权重。具体来说,将源节点和目标节点的文本内容连接起来,计算情感类别(正、负)及其分数,可视为概率。边权重的定义如下:
\[A[i, j] = Score(i, j)\]
\[Score(i, j) =
\begin{cases}
+ Positive \\
- Negative
\end{cases}\]
其中,\(A \in R^{N×N}\)是邻接矩阵,\(N\)是节点数量。
- **MSSF - GCN网络**
- **全局结构信息嵌入层**:使用GRAPHWAVE学习结构嵌入,它能够捕捉图中节点的结构相似性,并对全局图结构提供关键洞察,且对局部边结构的小扰动具有鲁棒性。学习到的结构嵌入矩阵为\(H_{st} \in R^{N×F_{st}}\),每个节点有\(F_{st}\)维的表示\(h_{st} \in R^{F_{st}}\)。
- **语义信息嵌入层**:应用BERT将每个节点表示为嵌入向量\(h_{se} \in R^{F_{se}}\),该实值向量捕捉了内容的隐藏句法和语义属性。所有节点的语义嵌入矩阵为\(H_{se} \in R^{N×F_{se}}\)。
- **结构和语义信息融合层**:使用注意力机制动态融合结构和语义特征。具体公式如下:
\[F (h_s) = v^T \tanh (W_F h_s
0
0
相关推荐










