在当前大数据时代背景下,社交媒体作为互联网技术与Web2.0的产物,已经成为人们交流思想、分享生活的重要平台。本文所提及的“基于社交媒体大数据的大学生情感分析研究——以天津某大学为例”,集中探讨了如何利用机器学习算法对大学生在社交媒体平台发布的文本信息进行情感分析,从而获得该群体的情感倾向和特点,为教育管理提供决策支持。
文章定义了社交媒体的概念,将其描述为支持人们书写、分享、评论和讨论的网络平台。在互联网技术的支撑下,社交媒体不仅成为了信息传播和获取的途径,也体现了人们对于社交互动的深层次需求,即被发现、被崇拜、建立关系和发挥影响。
文章特别指出,大学生群体对社交媒体的使用极为频繁,他们倾向于在这些平台上表达自己的意见和看法。因而,社交媒体文本中的评论信息能够较为真实地反映出大学生的情感状态。研究者利用SVM(支持向量机)、KNN(K-最近邻)、DT(决策树)和NB(朴素贝叶斯)四种机器学习算法,构建了情感分类模型,并对情感进行分类。
情感分析的核心任务是识别文本中的情感倾向、极性及其主客观性。在该研究中,情感被划分为积极情感和消极情感两大类,但也有研究将情感分为积极、消极和中立三类,或者根据情感的强度进行五级分类。除此之外,情感还可根据情绪表达进行划分,如快乐、悲哀、褒扬、贬斥等。
文章中提到的案例研究,针对天津某大学157名学生在2019年1月至2020年2月期间的13048条微博文本数据进行情感分析。研究发现,大学生在社交媒体上的情感表达存在负向情感集中的时间段,主要集中在2019年11月以及2020年1月至2月之间。在这两个时间段内,学生群体较为关注的事件是“军训”“期末”和“疫情”。通过对这些情感特点的分析,学校管理者可以有针对性地进行干预,以缓解学生的负面情绪,促进其心理健康。
在研究设计方面,文章强调了训练集和测试集的作用。训练集用于构建和训练情感分类模型,而测试集则用来验证模型的有效性,即模型能否准确识别出正确的情感分类标签。
该研究不仅有利于教育工作者更好地理解学生的情感状态,也为学校管理层提供了决策参考。通过对社交媒体大数据的深入分析,可以发现大学生的关注焦点和情感变化趋势,从而为学校的心理健康教育和危机干预提供依据。
文章提到了研究的局限性和未来研究方向。例如,研究仅限于微博平台的数据,没有覆盖更多种类的社交媒体。此外,研究也未考虑可能影响情感表达的其他因素,如文化背景、语言差异等。未来的研究可以扩展到更多社交媒体平台,包括国际化的社交网络,以获得更全面的分析视角。
通过分析大学生在社交媒体上发布的内容,可以获取其情感倾向,从而为学校管理提供科学参考,有利于提高教育管理工作的针对性和实效性。同时,本研究也指出了未来研究可以拓展的方向,即结合更多数据来源和维度,进行更深入的情感分析研究。