没有合适的资源？快使用搜索试试~ 我知道了~

文库首页开发技术其它python django使用haystack:全文检索的框架(实例讲解)

python django使用haystack:全文检索的框架(实例讲解)

python

django

haystack

7 下载量 168 浏览量 2020-09-21 03:27:52 上传评论收藏 130KB PDF 举报

温馨提示

### Python Django 使用 Haystack 全文检索框架详解 #### 一、Haystack 框架简介 Haystack 是一个为 Django 设计的全文检索库，它允许开发者在多个搜索引擎之间轻松切换，而无需修改大量的代码。Haystack 提供了一个统一的 API 接口来处理全文检索任务，并支持多种搜索引擎如 Whoosh、Elasticsearch 和 Solr 等。 #### 二、准备工作在正式开始使用 Haystack 之前，需要确保以下依赖已经安装完成： 1. **Whoosh**：这是一个纯 Python 编写的全文搜索引擎，Haystack 可以与之配合使用进行全文检索。 ```bash pip install whoosh ``` 2. **Jieba**：一个免费的中文分词包，用于处理中文文本。 ```bash pip install jieba ``` 3. **Django-Haystack**：Haystack 的 Django 版本，用于集成到 Django 项目中。 ```bash pip install django-haystack ``` #### 三、集成 Haystack 到 Django 项目 1. **安装 Haystack 应用** 修改 `settings.py` 文件，将 `'haystack'` 添加到 `INSTALLED_APPS` 中： ```python INSTALLED_APPS = [ # ... 'haystack', ] ``` 2. **配置搜索引擎** 在 `settings.py` 文件中添加搜索引擎配置： ```python HAYSTACK_CONNECTIONS = { 'default': { 'ENGINE': 'haystack.backends.whoosh_cn_backend.WhooshEngine', 'PATH': os.path.join(BASE_DIR, 'whoosh_index'), } } # 当添加、修改、删除数据时，自动生成索引 HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor' ``` 3. **定义索引文件** - 在 `templates/search/indexes/blog/` 目录下创建索引文件（例如 `blog_text.txt`），并定义索引字段： ```txt {{ object.title }} {{ object.text }} {{ object.keywords }} ``` 4. **创建索引模型** 在相应的应用（例如 `blog`）下创建索引文件 `search_indexes.py`，定义索引模型： ```python from haystack import indexes from .models import Post class PostIndex(indexes.SearchIndex, indexes.Indexable): text = indexes.CharField(document=True, use_template=True) def get_model(self): return Post def index_queryset(self, using=None): return self.get_model().objects.all() ``` #### 四、实现中文分词功能 1. **修改 Haystack 文件** - 找到虚拟环境下的 `haystack` 目录，根据使用的 Python 环境定位具体路径。 - 在 `site-packages/haystack/backends/` 目录下创建 `ChineseAnalyzer.py` 文件，用于中文分词： ```python import jieba from whoosh.analysis import Tokenizer, Token class ChineseTokenizer(Tokenizer): def __call__(self, value, positions=False, chars=False, keeporiginal=False, removestops=True, start_pos=0, start_char=0, mode='', **kwargs): t = Token(positions, chars, removestops=removestops, mode=mode, **kwargs) seg_list = jieba.cut(value, cut_all=True) for w in seg_list: t.original = t.text = w t.boost = 1.0 if positions: t.pos = start_pos + value.find(w) if chars: t.startchar = start_char + value.find(w) t.endchar = start_char + value.find(w) + len(w) yield t def ChineseAnalyzer(): return ChineseTokenizer() ``` 2. **复制并修改 Whoosh 后端文件** - 复制 `whoosh_backend.py` 文件为 `whoosh_cn_backend.py`。 - 导入中文分词模块，并更改词语分析类为中文分词器： ```python from .ChineseAnalyzer import ChineseAnalyzer # 更改词语分析类 analyzer = ChineseAnalyzer() ``` #### 五、初始化索引数据执行命令来构建或更新索引： ```bash python manage.py rebuild_index ``` #### 六、创建搜索视图和模板 1. **创建搜索视图** 在相应的应用中创建搜索视图，用于处理用户的搜索请求。 2. **创建搜索模板** 在 `templates/` 目录下创建搜索模板文件，用于显示搜索结果。通过以上步骤，可以成功地在 Django 项目中集成了 Haystack 框架，并实现了全文检索功能，同时支持中文分词处理。这为开发者提供了强大的搜索功能，大大提高了应用程序的用户体验。

python django使用haystack:全文检索的框架(实例讲解)

Django框架 实例 项目

django-haystack Elasticsearch

Python-ABlog是一个Sphinx全文检索引擎的扩展

Python中使用haystack实现django全文检索搜索引擎功能

haystack-elasticsearch-raw-query:这个python类允许您在django-haystack中使用elasticsearch原始查询

django python框架

全文检索案例

全文检索(solr)实例

使用python的信息检索作业（1）

Django+Vue：Python Web全栈开发

Django框架基础教程（一）：简单介绍PythonDjango框架.pdf

基于Python Django框架的实战项目源码

基于Python Django框架的完整后台管理系统源码

Python Django Web开发教程 第1课 Python培训基础教程：django框架搭建和安装 共11页.pptx

简单实用的全文检索模块

详解Python的Django框架中的模版继承

全文搜索引擎

基于python的搜索引擎设计与实现

PYTHON之Django Web框架源码下载

django-haystack：模块化搜索Django

Django+Vue：Python Web全栈开发-Django4.1教程

基于Python和Django的后台管理框架.zip

django-oscar：Python编写的用于 Django 的开源的电子商务框架

Python-Django

使用python+whoosh实现全文检索

CentOS7 安装部署Gitlab服务器

vb中 将byte数组转化为 int16

最新资源

Django框架实例项目

Python Django Web开发教程第1课 Python培训基础教程：django框架搭建和安装共11页.pptx

vb中将byte数组转化为 int16