
search
文章平均质量分 81
rongdmmap
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
提高nutch爬取效率
提高nutch爬取效率分类: 搜索引擎 Nutch 2011-03-09 11:08 638人阅读 评论(0) 收藏 举报Here are the things that could potentially slow down fetching 下面这些是潜在的影响爬取效率的内容: 1) DNS setup 2) The number of crawlers you...原创 2012-06-08 12:47:30 · 106 阅读 · 0 评论 -
使用Apache Solr对数据库建立索引
使用Apache Solr对数据库建立索引 (2011-09-27 17:24:40)转载▼标签: solr 数据库 索引 clob it分类: 架构与开发主要分为两部分,第一部分是对《db-data-config.xml》的配置内容的讲解(属于高级内容),第二部分是DataImportHand...原创 2012-03-13 08:23:46 · 168 阅读 · 0 评论 -
解决DataImportHandler从数据库导入大量数据而内存溢出的问题
解决DataImportHandler从数据库导入大量数据而内存溢出的问题 (2011-09-29 10:46:55)转载▼标签: solr 导入 内存溢出 it分类: 架构与开发Solr有个很方便的处理器叫DataImportHandler,可以通过配置配置db-data-config.xml配置各种数...原创 2012-03-13 08:23:56 · 285 阅读 · 0 评论 -
Solr 创建索引的原理 源码分析
Solr 创建索引的原理 源码分析 (2011-11-02 17:39:07)转载▼标签: solr 创建索引 原理 源码分析 it分类: 架构与开发本次分析以Solr3.3是最新的版本为准,Solr3.3接收客户端的查询索引,新建索引请求都是通过过滤器SolrDispatchFilter来提交给S...原创 2012-03-13 08:24:04 · 156 阅读 · 0 评论 -
Solr Replication (复制) 索引和文件的工作机制
Solr Replication (复制) 索引和文件的工作机制 (2011-11-02 17:40:23)转载▼标签: solr replication 索引 文件 机制 it分类: 架构与开发1 Solr Replication(复制)是怎样工作的 luenc...原创 2012-03-13 08:24:14 · 184 阅读 · 0 评论 -
Solr 查询中fq参数的解析原理
Solr 查询中fq参数的解析原理 (2011-11-02 17:43:03)转载▼标签: solr fq参数解析原理 it分类: 架构与开发首先看Lucene进行索引查询的一个核心方法:IndexSearcher.javapublic void search(Weight weight, Filter fi...原创 2012-03-14 08:13:32 · 861 阅读 · 0 评论 -
Solr 分词器(analyzer)是怎么传到Luence的
Solr 分词器(analyzer)是怎么传到Luence的 (2011-11-02 17:41:48)转载▼标签: solr 分词器 luence it分类: 架构与开发Solr的分词器我们都知道,是配置在schema.xml配置文件中,不同的fieldType我们都可以给他配置分词器。Solr有两个地方分...原创 2012-03-14 08:13:43 · 85 阅读 · 0 评论 -
SOLR的分布式部署
转载:http://blog.sina.com.cn/s/blog_56fd58ab0100vwmh.html SOLR的分布式部署 (2011-12-07 13:03:49)转载▼标签: solr 分布式部署 it分类: 架构与开发需求:实现SOLR主,辅服务器更新同步,每次客户端COMMIT请求都...原创 2012-03-14 08:14:19 · 173 阅读 · 0 评论 -
利用SOLR搭建企业搜索平台 之五(solrj)
利用SOLR搭建企业搜索平台 之五(solrj)博客分类: solrSolr企业应用QtApache编程http://www.dzxiaoshuo.com 相信很多人,在准备提交数据让solr建立索引的那刻,很纳闷,尽管看了不少网上的一些文章,但是我想依然还是有不少不理解的地方。 比如提交一个xml,采用post方式,尽管有些文章说了可以采用httpcl...原创 2012-03-27 14:59:55 · 93 阅读 · 0 评论 -
CommonsHttpSolrServer
CommonsHttpSolrServer CommonsHttpSolrServer 使用HTTPClient 和solr服务器进行通信。Java代码 String url = "http://localhost:8983/solr"; SolrServer server = new CommonsHttpSolrServ...原创 2012-03-28 09:31:36 · 130 阅读 · 0 评论 -
利用SOLR搭建企业搜索平台 之十(数据库数据导入到solr)
利用SOLR搭建企业搜索平台 之十(数据库数据导入到solr)博客分类: solrSolr数据结构数据挖掘ApacheJavahttp://www.dzxiaoshuo.com solr不可谓是个好东西啊,越往下挖掘,他的各种功能逐渐的展现在我的面前,对于solr的架构人员,不得不令人佩服啊。 几天前偶尔看到IBM developmentWor...原创 2012-03-28 09:31:38 · 103 阅读 · 0 评论 -
利用SOLR搭建企业搜索平台 之九(solr的查询语法)
利用SOLR搭建企业搜索平台 之九(solr的查询语法)博客分类: solrSolrXMLhttp://www.dzxiaoshuo.com solr的一些查询语法 1. 首先假设我的数据里fields有:name, tel, address 预设的搜寻是name这个字段, 如果要搜寻的数据刚好就是 name 这个字段,就不需要指定搜寻字段名称...原创 2012-03-28 09:31:39 · 88 阅读 · 0 评论 -
Solr solrconfig.xml的翻译
Solr solrconfig.xml的翻译 (2010-06-30 16:57:56)转载▼标签: solr solrconfig 翻译 it分类: 架构与开发 solrconfig.xmlsolrconfig.xml文件包含了大部分的参数用来配置Solr本身的。dataDir parameter:&l...原创 2012-03-13 08:23:35 · 91 阅读 · 0 评论 -
Solr1.4.0源码分析二 Solr分布式搜索中URL的正确用法和原理
Solr1.4.0源码分析二 Solr分布式搜索中URL的正确用法和原理 转载请务必注明出处:http://guoyunsky.iteye.com/blog/761308 最近要使用Solr做分布式搜索,自己一开始也是从网上搜集一些资料照着做.其中发现对Solr分布式搜索有个误区,会导致搜索结果不正确.比如我这里有两个Shand: 1)htt...原创 2012-02-26 12:13:26 · 93 阅读 · 0 评论 -
Solr Multicore 试用小记
Solr Multicore 试用小记 转载:原文出处:http://blog.chenlb.com/2009/01/try-solr-multicore.htmlSolr Multicore 是 solr 1.3 的新特性。其目的一个solr实例,可以有多个搜索应用。下面来小试一下。官方发布的示例。在solr1.3/example/multicore目录(可以认为是m...原创 2012-02-26 12:13:12 · 122 阅读 · 0 评论 -
(转载)sphinx使用介绍
原文地址:http://www.orczhou.com/index.php/2009/08/sphinx-1/到今天为止校内论坛(Discuz)上的主题数量已经到达了40w,所有回复约500W。随着数据量的增大,DZ自带的站内搜索给数据库的带来的压力越来越大,甚至会导致数据库停止服务(MyISAM在SLOW Query和update并发问题)。取代站内搜索,我们使用了google的自定义搜...原创 2012-02-13 08:20:47 · 99 阅读 · 0 评论 -
Solaris登录模式的切换
Solaris登录模式的切换启动后登录到命令行模式还是图形界面模式....../usr/dt/bin/dtconfig -d 开机进入文字界面/usr/dt/bin/dtconfig -e 开机进入图形界面Or# /etc/rc2.d/ 如果存在 S99dtlogin 那么进入图形界面 否则进入命令行模式可以修改文件名:mv S99dtlogin s99dtlogin...原创 2012-02-14 13:03:14 · 351 阅读 · 0 评论 -
全文搜索引擎介绍(sphinx)
1.Lucence2.sphinx3.Apache Solr一、简介:Coreseek是基于sphinx更完善支持中文搜索功能。故其原理同sphinx,如下:1、sphinx的两个主要进程indexer和searchd。indexer任务是从数据库(或者其他的数据源)收集原始的数据,然后建立相应的索引。searchd则是通过读取indexer建立的索引来响应客户端的请求。2、sph...原创 2012-02-14 13:03:25 · 179 阅读 · 0 评论 -
cygwin设置中文
cygwin设置中文cygwin\home\username\.bashrc# 让ls和dir命令显示中文和颜色 alias ls='ls --show-control-chars --color' alias dir='dir -N --color' # 设置为中文环境,使提示成为中文 export LANG="zh_CN.GBK" ...原创 2012-02-16 12:28:50 · 489 阅读 · 0 评论 -
Lucene的使用
如果你想快速查询你磁盘上文件,或查询邮件、Web页面,甚至查询存于数据库的数据,你都可以借助于Lucene来完成。但是要完成查询就必须先建立索引。首先从Lucene API说起:1、 Lucene API(核心操作类) IndexWriter创建和维护索引(向原索引中添加新Document,设置合并策略、优化等)FSDirectory最主要用来存储索...原创 2012-02-19 13:23:44 · 77 阅读 · 0 评论 -
Lucene的查询语法
Lucene的查询语法博客分类: Lucenejavalucene Lucene的查询语法 Lucene提供了方便您创建自建查询的API,也通过QueryParser提供了强大的查询语言。 本文讲述Lucene的查询语句解析器支持的语法,Lucene的查询语句解析器是使用JavaCC工具生成的词法解析器,它将查询字串解析为Lucene Qu...原创 2012-02-19 13:23:56 · 103 阅读 · 0 评论 -
lucene应用
转载:http://sacredlove.iteye.com/blog/1407769lucene应用博客分类: luceneLucene :其实很简单的,它最主要就是做两件事:建立索引和进行搜索 来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已----因为这一个世界有一种好东西,叫搜索。 IndexWriter:lu...原创 2012-02-19 13:24:09 · 77 阅读 · 0 评论 -
Solr 删除数据的几种方式
转载:Solr 删除数据的几种方式发表于:2010年3月19日 | 分类:Solr | 标签: solr | views(3,595)版权信息: 可以任意转载, 转载时请务必以超链接形式标明文章原文出处, 即下面的声明. 原文出处:http://blog.chenlb.com/2010/03/solr-delete-data.html有时候需要删除 Solr 中...原创 2012-02-22 08:40:49 · 221 阅读 · 0 评论 -
使用 solr php 的输出
转载:使用 solr php 的输出发表于:2009年2月18日 | 分类:Solr | 标签: php, solr | views(1,054)版权信息: 可以任意转载, 转载时请务必以超链接形式标明文章原文出处, 即下面的声明. 原文出处:http://blog.chenlb.com/2009/02/use-solr-php-writer.htmlsolr ...原创 2012-02-22 08:41:02 · 99 阅读 · 0 评论 -
Solr Data Import 快速入门
转载:Solr Data Import 快速入门发表于:2010年3月26日 | 分类:Demo, Solr | 标签: dih, solr | views(4,033)版权信息: 可以任意转载, 转载时请务必以超链接形式标明文章原文出处, 即下面的声明. 原文出处:http://blog.chenlb.com/2010/03/solr-data-import-quic...原创 2012-02-26 12:12:45 · 110 阅读 · 0 评论 -
Solr Multicore 结合 Solr Distributed Searching 切分大索引来搜索
Solr Multicore 结合 Solr Distributed Searching 切分大索引来搜索转载:原文出处:http://blog.chenlb.com/2009/01/solr-multicore-work-with-solr-distributed-searching-to-search-big-index.htmlSolr Distributed S...原创 2012-02-26 12:13:00 · 80 阅读 · 0 评论 -
利用SOLR搭建企业搜索平台 之八(solr 实现去掉重复的搜索结果,打SOLR-236_collapsing.patch补丁)...
引用Bory.Chanhttp://blog.chenlb.com/2009/04/apply-solr-collapsing-patch-remove-duplicate-result.html 打上SOLR-236_collapsing.patch补丁,实现 solr 搜索结果折叠、除去重复的搜索结果,可以实现类似google搜索结果的“站内的其它相关信息 ”。solr collapsing ...原创 2012-03-28 09:31:46 · 214 阅读 · 0 评论