利用行为多样性与主动容错保障网络安全与存储稳定
立即解锁
发布时间: 2025-08-20 00:56:45 阅读量: 2 订阅数: 12 

### 利用行为多样性与主动容错保障网络安全与存储稳定
在当今数字化时代,网络安全和存储系统的可靠性是至关重要的议题。一方面,在线社交网络(OSNs)中垃圾信息泛滥,严重威胁用户的隐私和安全;另一方面,数据中心的存储系统面临着硬盘高故障率的挑战,传统的容错机制难以满足高可靠性的需求。本文将围绕这两个关键问题展开探讨,介绍利用行为多样性检测垃圾信息发送者的方法,以及一种主动容错的存储系统方案。
#### 利用行为多样性检测垃圾信息发送者
在OSNs中,垃圾信息发送者(spammers)常常隐藏垃圾信息甚至发起攻击,这些信息包括注入攻击、网络钓鱼、无关广告等。为了有效检测这些垃圾信息发送者,研究人员提出了结合行为特征和现有有效特征的检测系统。
##### 行为特征提取
- **熵与条件熵**:根据公式2,为了计算条件熵,需要确定联合熵H(X, Y)。通过引入马尔可夫模型中的转移概率,将数据集样本转换到马尔可夫模型中,从而确定条件熵的最终值。从绘制的图中可以观察到,大多数垃圾信息发送者的条件熵值低于1.0,而正常账户中只有不超过10%的账户条件熵值低于1.0。这表明垃圾信息发送者在发送消息时的模型比正常用户简单得多,通过条件熵可以识别出善于改变行为模型的伪装垃圾信息发送者。
- **其他特征**:除了行为特征,还利用了基于账户和消息的其他七个有效特征,包括粉丝数量、关注列表中的朋友数量、账户声誉、账户年龄、URL比例、话题标签(#)比例、回复(@)比例和转发比例等。
| 特征类型 | 特征名称 | 特征描述 |
| --- | --- | --- |
| 行为特征 | 熵 | 正常账户发送消息的行为多样性 |
| 行为特征 | 条件熵 | 垃圾信息发送者发送消息的行为简单性 |
| 非行为特征 | 粉丝数量 | 账户的粉丝数量 |
| 非行为特征 | 关注列表中的朋友数量 | 账户关注列表中的朋友数量 |
| 非行为特征 | 账户声誉 | 粉丝数量与相关朋友总数的比例 |
| 非行为特征 | 账户年龄 | 账户的创建时间 |
| 非行为特征 | URL比例 | 账户最近一周发送消息中URL数量与消息总数的比例 |
| 非行为特征 | 话题标签(#)比例 | 账户最近一周发送消息中话题标签(#)数量与消息总数的比例 |
| 非行为特征 | 回复(@)比例 | 账户最近一周发送消息中回复(@)字符数量与消息总数的比例 |
| 非行为特征 | 转发比例 | 账户最近一周发送消息中转发数量与消息总数的比例 |
##### 检测系统评估
- **训练分类器**:利用从新浪微博收集并标注的数据,采用多种机器学习方法(如J48、随机森林和支持向量机)训练有效的分类器。
- **十折交叉验证**:在Weka中对不同的机器学习方法进行十折交叉验证,得到不同方法的准确率和误报率。最终,检测系统的准确率约为91.5%,误报率约为3.4%。
| 机器学习方法 | 准确率 | 误报率 |
| --- | --- | --- |
| J48 | 89.6% | 4.9% |
| 随机森林 | 93.7% | 2.1% |
| 支持向量机(SVM) | 91.2% | 3.3% |
##### 行为特征模型有效性评估
通过对比使用和不使用行为特征的特征集进行重新训练和评估,发现行为特征模型在检测OSNs中的垃圾信息发送者方面更加有效。使用行为特征时,准确率达到91.5%,误报率为3.4%;而不使用行为特征时,准确率为85.4%,误报率为7.2%。
|
0
0
复制全文
相关推荐









