数据科学在个性预测与信息安全中的应用

# 数据科学在个性预测与信息安全中的应用 ## 一、个性预测相关研究 ### 1.1 基于人类行为数字记录预测个人特质研究人员通过分析互联网上广泛存在的人类社交活动数字记录，尝试预测个人属性。以Facebook点赞数据为例，从“我的个性”应用获取数据集，预测个人是否单身、所属种族、性别和性取向等属性，在性别和种族预测上达到了较高的准确率。运用了线性回归、逻辑回归和奇异值分解三种机制对不同类型变量进行预测，并指出若有合适的训练数据，还可能揭示其他复杂属性。 ### 1.2 利用智能手机数据进行个性研究该研究强调利用智能手机相关的隐私敏感数据来预测用户的个性特质。设计的软件收集通话、短信、蓝牙扫描、通话记录和应用日志等数据，并结合向用户发放的包含性别、年龄等基本信息的问卷，作为最终软件的输入。先对特征与五大个性特质进行统计分析，通过相关性分析得出外向性、宜人性、尽责性、情绪稳定性和开放性，通过回归分析进一步预测通话、短信等日志。最后将用户分为最外向和较不外向两类，采用顺序反向特征选择算法和支持向量机分类器中的径向基函数进行特征选择。 ### 1.3 教育游戏中玩家个性检测使用基于Leary的玫瑰框架板的个性摘录数据集，设计了一种在教育游戏环境中优于人类的自动个性检测机制。以deLearyous游戏项目为例，为增强用户与虚拟角色的自然语言交流设计框架，运用条件随机场、支持向量机和朴素贝叶斯等方法，还认为基于n - 元语法的文本数据分类是一种有效的检测方法，将人分为六种可能的个性类别。 ### 1.4 基于热图像处理和特征脸的人类情绪识别提出一种对人类特征脸进行情绪识别的计算模型。将面部图像转换为热图像，从特征向量矩阵中找到主成分，使用距离分类器对面部表情进行分类。 ### 1.5 利用社交媒体预测个性尝试通过分析Facebook上公开的个人信息，如姓名、宗教、性别、生日、关系状态以及活动和兴趣等，为每个用户提取特征，并在Weka中进行回归分析。使用M5′规则和高斯过程两种算法，通过改进从用户数据中获取的知识，可以回答更复杂的问题并预测更多用户信息。 | 论文 | 论文重点 | 使用的方法 | | --- | --- | --- | | Deep Feature Synthesis | 特征提取 | Deep Feature Synthesis Algorithm、Machine Learning、Clustering (k - means) | | Mastering the Game of Go | 训练 | CNN、Monte Carlo Tree Search | | Mining Big Data to Extract Patterns and Predict Real - Life Outcomes | 提取模式、预测结果 | Singular Value Decomposition、Latent Dirichlet Allocation、SVD | | Image Net Classification with Deep CNN | 学习 | Stochastic Gradient Descent | ### 1.6 面临的挑战 - **数据处理格式**：需要将原始数据处理成神经网络可读的格式。对于具有关系结构的初始数据集，如何聚合这些表是特征工程的重要部分，需要一种通用的方法来处理这种复杂结构。并且，当输入为原始数据时，神经网络的性能更好，可通过将感兴趣的主表与其相邻表连接来实现。 - **预处理的影响**：虽然深度神经网络

最低0.47元/天解锁专栏

赠100次下载

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

数据科学在个性预测与信息安全中的应用

相关推荐

专栏目录

数据科学在个性预测与信息安全中的应用

相关推荐

云计算与大数据在新冠防控中应用.doc

数据挖掘在高校图书馆个性化信息服务中的应用.pdf

电子信息科学在计算机技术中的应用 (2).pdf

新时代数据挖掘在图书馆个性化发展中的应用研究.pdf

数据科学与大数据技术.doc

复杂网络与数据科学.pptx

大数据数据科学和数据产业.ppt

大数据数据科学和数据产业.pptx

大数据与大数据安全介绍与应用PPT.zip

数据科学与大数据技术_.docx

数据仓库学习

No.951 '基于三菱PLC和组态王锅炉控制系统' - 组态王 实用版

专栏目录

最新推荐

医疗科技融合创新：从AI到可穿戴设备的全面探索

灵活且可生存的单点登录与数据去重的数字取证分析

数据科学职业发展与技能提升指南

机器学习中的Transformer可解释性技术深度剖析

抗泄漏认证加密技术解析

认知训练：提升大脑健康的有效途径

机器学习模型训练与高效预测API构建

数据聚类在金融领域的应用与实践

虚拟现实与移动应用中的认证安全：挑战与机遇

基于置信序列的风险限制审计

No.951 '基于三菱PLC和组态王锅炉控制系统' - 组态王实用版