
数据挖掘
文章平均质量分 74
冰水比水冰
我是码农,却假装是程序员。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
在Eclipse中安装StatET插件
在Eclipse中安装StatET插件 1.概述 众所周知,很多人进行数据挖掘最喜欢使用的语言是R语言,而可以选择的IDE确有很多种,例如Emacs + ESS,RStudio等等。 今天,我所写的是使用Eclipse + StatET来搭建R语言环境。 2.安装Eclipse 我使用的是Ubuntu13.10的系统,在 http://download.ec原创 2014-07-27 14:39:33 · 6038 阅读 · 0 评论 -
使用ICTCLAS2015进行分词
使用ICTCLAS2015进行分词 在今年的Imagine Cup中使用到了语义分析的部分,其中需要分词作为基础,我是用的是中科院的ICTCLA2015,本篇博客我来讲讲如何使用ICTCLAS2015进行分词 ICTCLAS2015简介中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Co原创 2015-03-24 07:41:59 · 7494 阅读 · 0 评论 -
KNN 在手写识别中的应用(Java 实现)
这篇博文主要介绍了一种基于机器学习的分类方法,K-邻近(KNN),并且使用这种方法来完成了一个简单的手写数字识别系统。 KNN 概述什么是 KNNKNN(K–nearest-neighbor),即 K-邻近算法, 所谓 K 邻近,就是 K 个最近邻居的意思,说的是每个样本都可以用与它最接近的K 个邻居来表示。工作原理存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样原创 2015-09-07 15:48:24 · 5653 阅读 · 0 评论