大数据处理与智能推荐-SpringBoot-MyBatis-ElasticSearch7-SparkMLlib-大众点评搜索推荐系统-基于SpringBoot和MyBatis搭建运.zip资源-CSDN下载

共2000个文件

js：1195个

css：331个

html：140个

需积分: 5 155 浏览量 2025-08-16 21:04:10 上传评论收藏 32.92MB ZIP 举报

大数据处理与智能推荐系统的构建是一个复杂且技术含量高的过程，涉及到多个技术栈和组件的紧密配合。本压缩包文件名为“大数据处理与智能推荐-SpringBoot-MyBatis-ElasticSearch7-SparkMLlib-大众点评搜索推荐系统-基于SpringBoot和MyBatis搭建运.zip”，揭示了开发者在设计和实施推荐系统时所采用的核心技术。 SpringBoot作为一个流行的Java开发框架，它提供了快速开发的能力，简化了基于Spring的应用开发。它的自动配置和内置的Web服务器功能，使得开发者能够更快地搭建起项目的基础结构，从而把更多的精力集中在业务逻辑上。 MyBatis是一个优秀的持久层框架，它支持定制化SQL、存储过程以及高级映射。MyBatis避免了几乎所有的JDBC代码和手动设置参数以及获取结果集。使用MyBatis可以减轻数据库交互时的繁琐性，让开发者更加专注于数据持久层的实现细节。 ElasticSearch7是一个高度可扩展的开源全文搜索引擎，它能够在大数据量的情况下提供实时搜索功能。作为一个基于Lucene构建的搜索引擎，它对于处理海量数据的搜索和分析提供了强大的支持。在本项目中，ElasticSearch7很可能是用来快速检索和分析用户的搜索请求以及历史行为数据。 SparkMLlib是Apache Spark中的机器学习库，提供了大量的机器学习算法的实现，这些算法可以用于数据挖掘和预测分析。在构建推荐系统时，通过SparkMLlib处理和分析大数据，能够提取用户行为特征，并生成个性化的推荐结果。大众点评搜索推荐系统的实现是本项目的核心，通过整合SpringBoot、MyBatis、ElasticSearch7和SparkMLlib，系统能够提供更加智能化和个性化的搜索推荐服务。基于用户的搜索历史和行为数据，推荐系统可以分析用户的喜好，预测用户可能感兴趣的内容，并实时为用户推荐相关的信息。本压缩包中的“附赠资源.docx”可能是项目相关的文档资料，包含了系统设计、架构说明以及可能的使用教程等；“说明文件.txt”可能详细说明了如何部署和运行该系统，以及相关的配置要求和操作步骤；而“dianping-main”很可能是项目的主目录，包含核心代码和配置文件。这个压缩包文件中包含了构建一个基于大数据处理和智能推荐技术的搜索推荐系统的所有关键组件和资源。它不仅展示了一个复杂系统的技术实现，还体现了在大数据环境下，如何综合运用多种技术栈来提升用户体验和系统性能。

资源推荐

资源详情

资源评论

收起资源包目录

大数据处理与智能推荐-SpringBoot-MyBatis-ElasticSearch7-SparkMLlib-大众点评搜索推荐系统-基于SpringBoot和MyBatis搭建运.zip （2000个子文件）

rateit.aspx 290B

components.min.css 493KB

components.css 195KB

bootstrap.css 149KB

bootstrap.css 145KB

bootstrap.css 123KB

bootstrap.min.css 121KB

bootstrapTheme.css 120KB

main.css 120KB

bootstrap.css 118KB

bootstrap.min.css 115KB

bootstrap.min.css 100KB

bootstrap.min.css 98KB

bootstrap.css 84KB

layout.css 60KB

animate.css 60KB

layout.css 50KB

settings.css 49KB

editor_ie7.css 48KB

editor_iequirks.css 47KB

editor_ie8.css 46KB

editor_ie.css 46KB

editor_gecko.css 45KB

editor.css 45KB

layout.min.css 43KB

plugins.min.css 39KB

datatables.css 37KB

plugins.css 35KB

datepicker3.css 33KB

bootstrap-datepicker3.standalone.css 33KB

datatables.min.css 33KB

bootstrap-datepicker3.css 32KB

font-awesome.css 32KB

bootstrap-datepicker3.standalone.min.css 31KB

bootstrap-datepicker3.min.css 31KB

fontello.css 30KB

green-haze.css 29KB

red-intense.css 29KB

default.css 29KB

purple-studio.css 29KB

yellow-orange.css 29KB

blue-steel.css 29KB

red-sunglo.css 29KB

blue-hoki.css 29KB

yellow-crusta.css 29KB

purple-plum.css 29KB

editor.css 28KB

jquery-ui-1.10.3.custom.min.css 27KB

jquery-ui.min.css 26KB

style.css 26KB

font-awesome.min.css 26KB

settings-ie8.css 26KB

bootstrap-theme.css 26KB

light.css 25KB

bootstrap-theme.min.css 24KB

light2.css 24KB

grey.css 23KB

style.min.css 22KB

red-intense.min.css 22KB

yellow-crusta.min.css 22KB

blue-steel.min.css 22KB

blue-hoki.min.css 22KB

purple-plum.min.css 22KB

green-haze.min.css 22KB

red-sunglo.min.css 22KB

purple-studio.min.css 22KB

yellow-orange.min.css 22KB

default.min.css 22KB

lightgreen.css 22KB

darkblue.css 22KB

default.css 22KB

responsive.css 21KB

font-awesome.css 21KB

bootstrap-editable.css 21KB

_all.css 20KB

bootstrap-theme.css 19KB

datepicker.css 18KB

bootstrap-datepicker.standalone.css 18KB

select2.css 17KB

font-awesome.min.css 17KB

bootstrap-theme.min.css 17KB

dialog_ie7.css 17KB

bootstrap-datepicker.css 17KB

select2.css 17KB

dialog_ie8.css 16KB

dialog_iequirks.css 16KB

dialog_ie.css 16KB

bootstrap-datepicker.standalone.min.css 16KB

dialog.css 15KB

bootstrap-datepicker.min.css 15KB

layerslider.css 15KB

select2-bootstrap.min.css 15KB

select2.min.css 15KB

_all.css 14KB

_all.css 12KB

datetimepicker.css 12KB

共 2000 条

# 友情提示 > 1. **学习来自**：[慕课网 ](https://www.imooc.com/)- [龙虾三少](http://www.imooc.com/t/7143508)。 > 2. **全套学习教程**：[《ES7+Spark 构建高相关性搜索服务&千人千面推荐系统》](https://coding.imooc.com/class/391.html) 。 > 3. **Cappuccino个人博客地址**：[在线博客地址](https://cappuccinoj.cn/)。 ps: 如有侵权请联系作者进行删除。 # dianping系统架构 ![image-20220603124545082](http://images.cappuccinoj.cn/PicGoImg/image-20220603124545082.png) # 项目介绍基于大众点评搜索以及推荐业务，使用SpringBoot加mybatis结合前端模板搭建运营后台门店管理功能，借助ElasticSearch的最新版本ES7，完成高相关性进阶搜索服务，并基于spark mllib2.4.4构建个性化千人千面推荐系统。 ### 组织结构 ``` dianping ├── dianping-canal -- 客户端以及调度索引增量 ├── dianping-common -- 工具类及通用代码 ├── dianping-config -- 项目配置 ├── dianping-controller -- 控制层 ├── dianping-dao -- 数据库持久层 ├── dianping-model -- 实体模块 ├── dianping-request -- 请求参数模块 └── dianping-service -- 逻辑层接口 ``` ### 开发环境 | 工具 | 版本号 | 下载 | | ------------- | ------ | ------------------------------------------------------------ | | JDK | 1.8 | https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html | | JDK | 11 | https://repo.huaweicloud.com/java/jdk/ | | Mysql | 5.7 | https://www.mysql.com/ | | Elasticsearch | 7.7.0 | https://www.elastic.co/downloads/elasticsearch | | Logstash | 7.7.0 | https://www.elastic.co/cn/downloads/logstash | | Kibana | 7.7.0 | https://www.elastic.co/cn/downloads/kibana | | Canal | 1.1.5 | https://github.com/alibaba/canal | | Spark MLlib | 2.4.4 | https://spark.apache.org/docs/latest/mllib-guide.html#data-types-algorithms-and-utilities | # ES的搜索原理 - 基于Lucene的分布式、高可用、全文检索的搜索引擎 * 独立的网络上的一个或一组进程节点(可以独立部署运行、中间件、支持分布式) * 对外提供搜索服务(http或transport协议) Elastic Search 7.x 逐渐废弃 transport 协议 * 对内就是一个搜索数据库 # 名词定义 > 提示：7版本中Type被废弃，索引和类型合并为索引！ | Relational database | ElasticSearch | | :----: | :----:| | Database | Index | | Table | Type | | Row | Document | | Column | Field | | Schema | Mapping | | Index | Everything is indexed | | SQL | Query DSL | | SQL | Query DSL | | SELECT * FROM table... | GET http://.. | | UPDATE table SET | PUT http://.. | | DELETE FROM table ... | DELETE http://.. | | INSERT INFO ... | PUT http://.. | ## 索引 * 搜索中的数据库或表定义 * 构建文档的时候的缩影创建 ## 分词 * 搜索是以词为单位做最基本的搜索单元 * 依靠分词器构建分词 * 用分词器构建倒排索引 * 正向索引（以document为索引的入口）和倒排索引（以分词为索引的入口） ## TF-IDF打分 * TF：token frequency, 分词在document字段（待搜索的字段）中出现的次数 * IDF：inverse document frequency, 逆文档频率，代表分词在整个文档中出现的频率，取反 * TFNORM：token frequency normalized 词频归一化 * BM25：解决词频问题（TF公式的分母） | 单词ID | 单词 | 文档频率 | 倒排列表(DocID;TF;<POS>)| | :----: | :----:| :----: | :----:| | 1 | 谷歌 | 5 | (1;1;<1>),(2;1;<1>),(3;2;<1;6>),(4;1;<1>),(5;1;<1>)| | 2 | 地图 | 5 | (1;1;<2>),(2;1;<2>),(3;1;<2>),(4;1;<2>),(5;1;<2>)| | 3 | 之父 | 4 | (1;1;<3>),(2;1;<3>),(4;1;<3>),(5;1;<3>)| | 4 | 跳槽 | 2 | (1;1;<4>),(4;1;<4>)| | 5 | Facebook | 5 | (1;1;<5>),(2;1;<5>),(3;1;<8>),(4;1;<5>),(5;1;<8>)| | 6 | 加盟 | 3 | (2;1;<4>),(3;1;<7>),(5;1;<5>)| | 7 | 创始人 | 1 | (3;1;<3>)| | 8 | 拉斯 | 2 | (3;1;<4>),(5;1;<4>)| | 9 | 离开 | 1 | (3;1;<5>)| | 10 | 与 | 1 | (4;1;<6>)| # 分布式原理 * 分片主从路由 * 负载均衡和读写分离 * 主分片和副本数 # 分布式部署 > 配置文件 elasticsearch.yml ``` #集群名称 cluster.name: dianping-app #节点名称 node.name: node-1 #绑定IP地址 network.host: 127.0.0.1 #http监听端口 http.port: 9200 # 如果是使用阿里云、华为云、腾讯云等进行集群配置可以了解一下这个配置 # network.publish_host: 116.xxx.225.xxx #集群之间的通信端口 transport.tcp.port: 9300 #允许跨域 http.cors.enabled: true http.cors.allow-origin: "*" #发现集群节点 discovery.seed_hosts: ["127.0.0.1:9300", "127.0.0.1:9301", "127.0.0.1:9302"] #是否有资格竞选主节点 cluster.initial_master_nodes: ["127.0.0.1:9300", "127.0.0.1:9301", "127.0.0.1:9302"] ``` # ES语法 ``` DELETE /test PUT /test { "settings": { "number_of_shards": 1, "number_of_replicas": 2 } } DELETE /employee //非结构化方式新建索引 PUT /employee { "settings": { "number_of_shards": 1, "number_of_replicas": 1 } } PUT /employee/_doc/1 { "name":"凯杰2", "age":30 } PUT /employee/_doc/1 { "name":"凯杰3", "age":30 } PUT /employee/_doc/1 { "name":"凯杰3" } //获取索引记录 GET /employee/_doc/1 //指定字段修改 POST /employee/_update/1 { "doc":{ "name":"凯杰4", "age":30 } } //强制指定创建，若已存在，则失败 POST /employee/_create/5 { "name":"兄弟2", "age":29 } //删除某个文档 DELETE /employee/_doc/2 //查询全部文档 GET /employee/_search //使用结构化的方式创建索引 PUT /employee { "settings": { "number_of_replicas": 1, "number_of_shards": 1 }, "mappings": { "properties": { "name":{ "type":"text" }, "age":{ "type":"integer" } } } } //不带条件查询所有记录 GET /employee/_search { "query":{ "match_all": { } } } //分页查询 GET /employee/_search { "query":{ "match_all": { } }, "from":0, "size":2 } //带关键字条件的查询 GET /employee/_search { "query":{ "match":{ "name":"cappucicno" } } } // 排序 GET /employee/_search { "query":{ "match_all": {} }, "sort":[{ "age":{ "order":"desc"} } ] } //带filter GET /employee/_search { "query":{ "bool": { "filter": [ {"match": { "name": "兄" }} ] } } } //带聚合 GET /employee/_search { "query": {"match": { "name": "兄" }}, "sort":[ {"age":{"order":"desc"}} ] , "aggs": { "group_by_age": { "terms": { "field": "age", "size": 10 } } } } //新建一个索引 PUT /movie/_doc/1 { "name":"Eating an apple a day & keeps the doctor away" } GET /movie/_search { "query": { "match": { "name": "awai" } } } //使用analyze api 查看分词状态 GET /movie/_analyze { "field": "name", "text":"Eating an apple a day & keeps the doctor away" } GET /movie/_analyze { "field": "name", "text":"eat" } DELETE /movie //使用结构化的方式重新创建索引 PUT /movie { "settings": { "number_of_shards": 1, "number_of_replicas": 1 }, "mappings": { "properties": { "name":{ "type": "text" , "analyzer": "english" } } } } GET /movie/_search { } //开始玩转tmdb PUT /movie { "settings": { "number_of_shards": 1, "number_of_replicas": 1 }, "mappings": { "properties": { "title":{ "type": "text", "analyzer": "english" }, "tagline":{ "type":"text", "analyzer": "english" }, "rel

评论收藏

内容反馈