Gaussian LDA(高斯LDA)简介

本文介绍了发表在2015年ACL会议上的论文,该文提出了一种使用多元高斯分布替换LDA中词生成过程的方法,并通过快速的collapsed Gibbs sampling算法进行求解。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。
未经本人允许禁止转载

论文来源

Das R, Zaheer M, Dyer C. Gaussian lda for topic models with word embeddings[C]//Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers). 2015, 1: 795-804.

这篇论文发在15年的计算机顶会ACL上,作者来自于卡内基梅隆。

简介

连续的词嵌套模型学习海量的非结构化文本效果非常好,适应于很多自然语言处理任务。在作者的这篇文章中,作者将LDA中词的生成部分换成了多元高斯分布,并采用了一种快速的collapsed Gibbs sampling算法来求解模型。

普通的LDA简介我就不过多介绍了,想了解的请看我之前的相关博客介绍。其生成方式如下:

论文理解


这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

说明

这里涉及到许多贝叶斯公式推理方面的知识,建议大家参考以下内容:
1、《LDA数学八卦》
2、Griffiths T. Gibbs sampling in the generative model of latent dirichlet allocation[J]. 2002.
3、Murphy K P. Conjugate Bayesian analysis of the Gaussian distribution[J]. def, 2007【这个相当好,提供了大量的与高斯分布先验后验的推理细节
4、Bayesian_Data_Analysis,Third_Edition_(Andrew_Gelman)【一本非常学习贝叶斯数据分析非常不错的书籍】

代码详解

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值