可解释的高性能仇恨与冒犯性言论检测及标注优化

### 可解释的高性能仇恨与冒犯性言论检测及标注优化在当今社会，社交媒体的普及使得信息传播迅速，但同时也带来了仇恨与冒犯性言论的问题。为了降低少数群体基于种族、宗教和残疾等因素受到攻击的可能性，尤其是在倡导言论自由的国家，检测社交媒体平台上的仇恨和冒犯性语言显得尤为重要。 #### 模型构建与评估 - **模型选择与训练** - **AutoGluon**：作为基准模型，将数据集按20%和80%的比例划分为测试集和训练集。设置超参数使用多模型特征，训练多个模型（如文本预测模型），并根据性能通过加权集成或堆叠集成方法进行组合，最后让AutoGluon根据测试和验证分数选择最佳性能算法。 - **ULMFiT**：首先清理数据集，同样按20%和80%划分测试集和训练集。使用文本数据加载器对象调整输入文件格式，借助Fastai深度学习库创建模型，采用Fastai库中的文本分类器学习器（使用Averaged Stochastic Gradient Descent (ASGD) Weight - Dropped LSTM模型），利用预训练模型（在Wikitext 103上训练）并在数据集上进行微调，最终基于20个训练周期和0.003的学习率构建最佳性能分类器。 - **XGBoost不同特征集的F1分数** | 行 | 使用的特征 | 非冒犯性 | 冒犯性 | 仇恨性 | | --- | --- | --- | --- | --- | | (1) | Sent | 0.84 | 0 | 0.62 | | (2) | Sent, POS + NER | 0.86 | 0.17 | 0.70 | | (3) | Sent, POS + NER, Hash + Men | 0.87 | 0.18 | 0.73 | | (4) | Sent, POS + NER, Hash + Men, Text Symb | 0.88 | 0.22 | 0.75 | | (5) | 第(4)行使用的特征, POS + TF - IDF | 0.97 | 0.75 | 0.87 | 从这个表格可以看出，随着特征的不断增加，XGBoost模型在不同类别上的F1分数总体呈现上升趋势。例如，当加入POS + TF - IDF特征后，非冒犯性、冒犯性和仇恨性类别的F1分数都有显著提升。这表明合理选择和组合特征能够有效提高模型的性能。 #### 模型解释为了理解模型预测或标注背后的主要贡献，引入了SHAP（SHapley Additive exPlanations）方法。SHAP使用每个特征对模型预测的重要性值，其方法基于博弈论中的Shapley值，应用于机器学习模型以实现可解释性。通过SHAP力场图解释数据集中的推文，使用SHAP树解释器展示不同特征如何影响模型将推文分类到特定类别。例如，对于推文“if you still hate this nigga xxx http:xxxx”，SHAP重要性值高于基准值，表明“hate”这个词和POS nn（名词）等特征促使该推文被分类为仇恨类，而“count”和“average - syl”等特征则没有起到这样的作用。 #### 模型性能比较 - **原始数据集** | 模型 | 非冒犯性 | 冒犯性 | 仇恨性 | | --- | --- | --- | --- | | XGBoost | 0.97 | 0.87 | 0.75 | | LSTM | 0.96 | 0.91 | 0.38 | | AutoGluon | 0.96 | 0.90 | 0.37 | | ULMFiT | 0.95 | 0.89 | 0.38

最低0.47元/天解锁专栏

赠100次下载

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

可解释的高性能仇恨与冒犯性言论检测及标注优化

相关推荐

专栏目录

可解释的高性能仇恨与冒犯性言论检测及标注优化

相关推荐

ChatGPT技术的语言检测与过滤方法.docx

论文化的差异性及对营销的启示与分析.zip

ChatGPT技术的对话生成优化与用户引导策略.docx

亵渎检查：快速，强大的Python库，用于检查字符串中的冒犯性语言

Login-Validator:一个简单的登录验证器，适用于那些不想在他们的数据库中使用冒犯性昵称的人

guide-aws-hacking:这是保护AWS基础设施安全的冒犯性指南。 希望是，通过了解如何利用各种类型的AWS弱点，您将足够熟练地提供正确的对策

Chrome扩展Hate Block检测冒犯性内容

Python库profanity-check：高效检测冒犯性语言

创建冒犯性昵称过滤的登录验证器

探索含有冒犯性语言的数据集：beleidigung

智能电位采集仪具备高精度电位测量、自动定时采集与存储数据功能，支持远程实时查看运行状态及历史数据曲线，可通过手机或电脑联网访问，异常时自动短信、邮件或APP报警，适用于金属设备防腐监测，提升维护效率

专栏目录

最新推荐

微纳流体对流与传热应用研究

凸轮与从动件机构的分析与应用

磁电六铁氧体薄膜的ATLAD沉积及其特性

自激感应发电机稳态分析与电压控制

MATLAB数值技术：拟合、微分与积分

克里金插值与图像处理：原理、方法及应用

电力系统经济调度与动态经济调度研究

可再生能源技术中的Simulink建模与应用

MATLAB目标对象管理与配置详解

TypeScript高级特性与Cypress测试实践

guide-aws-hacking:这是保护AWS基础设施安全的冒犯性指南。希望是，通过了解如何利用各种类型的AWS弱点，您将足够熟练地提供正确的对策