RSS

机器学习有一章节讲朴素贝叶斯从广告中获取地狱倾向,数据源是RSS源,里用到一个工具是Universal Feed Parser(python中最常用的RSS程序库)。下载下来,直接在目录下python setup.py install安装即可。

此时,我还是不太理解RSS这个东西,然后做了下了解。

简易信息聚合(也叫聚合内容)是一种RSS基于XML标准,在互联网上被广泛采用的内容包装和投递协议。RSS(Really Simple Syndication)是一种描述和同步网站内容的格式,是使用最广泛的XML应用。RSS搭建了信息迅速传播的一个技术平台,使得每个人都成为潜在的信息提供者。发布一个RSS文件后,这个RSS Feed中包含的信息就能直接被其他站点调用,而且由于这些数据都是标准的XML格式,所以也能在其他的终端和服务中使用,是一种描述和同步网站内容的格式。[1] RSS可以是以下三个解释的其中一个: Really Simple Syndication;RDF (Resource Description Framework) Site Summary; Rich Site Summary。但其实这三个解释都是指同一种Syndication的技术。

这是百度上的解释,看了还不是太明白。显示的是主要是用在新闻,博客中。然后我在csdn上订阅了自己的博客,发现订阅RSS后,显示的博文是按照时间顺序来的。如图示:


大概理解了,只是基于时间对博文或者新闻内容进行排序,然后显示在一个新的页面之中,页面格式是富文本或者是RDF等格式。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值