
信息传播
文章平均质量分 90
尽拣寒枝不肯栖
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
知名信息传播工具
三个回答:1.姚玲,ad研究生,CB关注者,新媒体进军者。知乎用户、夏川真凉、Freya 等人赞同新浪官方微博评测工具:http://www.weiboreach.com 缺点:开放次数太有限~(1)传播影响:这条微博有多大的微力?它的传播产生了怎样的影响?人们的情绪是积极还是消极?(2)人群里的声音:传播过程中,针对这条微博,大家说的最多的是?哪种声音音量原创 2016-05-18 09:37:37 · 1602 阅读 · 0 评论 -
[python爬虫] Selenium爬取新浪微博内容及用户信息
感谢原作者在进行自然语言处理、文本分类聚类、推荐系统、舆情分析等研究中,通常需要使用新浪微博的数据作为语料,这篇文章主要介绍如果使用Python和Selenium爬取自定义新浪微博语料。因为网上完整的语料比较少,而使用Selenium方法有点简单、速度也比较慢,但方法可行,同时能够输入验证码。希望文章对你有所帮助~源码下载地址:http://download.csdn.net/deta转载 2016-08-25 19:16:09 · 7400 阅读 · 5 评论 -
继续爬xinlang
最开始用的webmagic,后来看scrapy方便实用就用scrapy了 ,后来碰到个编码问题,具体说下。1.爬取时新浪不让爬,然后每次重定向到robot.txt的一个路径。后来索性就爬取整个网页,但是爬取了以后发现里面很多utf8编码,没找到解编码的方法,因为爬取的整个网页中有些部分是汉字可以显示的,有些做了jsp处理的就不能显示汉字了。网上搜的时候发现了一个新东西娇selenium,说是爬原创 2016-08-25 19:14:42 · 568 阅读 · 0 评论