图数据库语言Cypher与文档数据库语言MQL详解

立即解锁
发布时间: 2025-08-30 01:03:33 阅读量: 28 订阅数: 15 AIGC
PDF

SQL与NoSQL数据库精要

# 图数据库语言 Cypher 与文档数据库语言 MQL 详解 ## 1. 图数据库语言 Cypher 概述 图数据库语言最早在 20 世纪 80 年代末开始发展。随着互联网和社交媒体的兴起,对高性能图查询语言的兴趣日益增长,因为它们产生了越来越多的图结构数据。图数据库以图结构存储数据,并提供在图转换级别进行数据操作的选项。图数据库由带有节点和边的属性图组成,每个图将一组键值对作为属性存储。图数据库语言基于这一原理,允许使用计算机语言与数据库中的图结构进行交互,并对这些结构的处理进行编程。 图语言和关系语言一样,都是基于集合的。它们处理的图可以定义为顶点、边或路径的集合。图语言允许通过谓词过滤数据,类似于关系语言,这种过滤称为合取查询。过滤图会返回图的节点和/或边的子集,形成一个子图。其底层原理称为子图匹配,即任务是在图中找到符合特定规格的子图。图语言还提供将图中的节点集合聚合为标量值的功能,例如计数、求和或求最小值。 ### 1.1 Cypher 语言简介 Cypher 是一种用于图数据库的声明性查询语言,由 Andrés Taylor 于 2011 年在 Neo4J 公司开发。2015 年,openCypher 作为一个开源项目向公众开放。如今,它已被十多个商业数据库系统使用。2019 年,国际标准化组织(ISO)决定在 2023 年前将 openCypher 进一步发展为名为 GQL 的国际标准。 Neo4J 图数据库使用 Cypher 语言来支持数据库交互脚本的语言接口。Cypher 基于模式匹配机制,具有用于数据查询和数据操作(数据操作语言,DML)的语言命令。不过,Cypher 中的模式定义是隐式完成的,即节点和边的类型是通过将它们的实例作为实际的特定节点和边插入数据库来定义的。Cypher 还包含类似于关系语言的安全机制的直接语言元素,如 GRANT 和 REVOKE 语句。 ### 1.2 创建和填充数据库模式 在 Cypher 中,模式定义是隐式完成的,即抽象数据类(元数据),如节点和边的类型或属性,是通过在插入具体数据值时使用它们来创建的。以下是一个向数据库中插入新数据的示例: ```cypher CREATE (p:Product { productName:'Alice’s Adventures in Wonderland'}) -[:PUBLISHER]-> (o:Organization { name:'Macmillan'}) ``` 此指令会隐式扩展模式。它创建了两个新节点并将它们连接起来。第一个节点 `p` 存储《爱丽丝梦游仙境》产品的记录,第二个节点 `o` 定义了麦克米伦出版社的记录。由于之前不存在“Organization”这种节点类型,因此它被隐式创建。同时,新节点中插入了属性 - 值对,由于“name”属性之前不存在,它也会在模式中被隐式添加,无需额外的命令。此外,在书籍节点和出版社节点之间创建了一个边,边的类型为“PUBLISHER”。假设这是一种新的边类型,它也会被隐式添加到数据库模式中。 若要更改数据,可以使用 `MATCH ... WHERE ... SET` 命令。例如,下面的表达式将指定产品的价格重置为 13.75: ```cypher MATCH (p:Product) WHERE p.productName = 'Alice’s Adventures in Wonderland' SET p.unitPrice = 13.75 ``` 使用 `DELETE` 可以消除指定的节点和边。由于图数据库确保引用完整性,只有当顶点没有连接的边时才能被删除。因此,在删除节点之前,用户必须先删除所有传入和传出的边。以下表达式首先识别与按名称选择的产品连接的所有边,然后消除这些边,最后删除产品节点本身: ```cypher MATCH ()-[r1]->(p:Product), (p)-[r2]->() WHERE p.productName = 'Alice’s Adventures in Wonderland' DELETE r1, r2, p ``` ### 1.3 关系运算符 Cypher 有三个基本命令: - `MATCH`:用于定义搜索模式 - `WHERE`:用于过滤结果的条件 - `RETURN`:用于输出属性、顶点、关系或路径 虽然 Cypher 操作的是图,但属性图可以与关系进行全等映射,因此可以分析 Cypher 的关系运算符。 #### 1.3.1 选择和投影 以下示例返回具有指定产品名称的节点,这对应于在 `WHERE` 子句中指定的关系选择: ```cypher MATCH (p:Product) WHERE p.productName = 'Alice’s Adventures in Wonderland' RETURN p ``` `RETURN` 子句可以输出顶点或属性表。返回整个节点类似于 SQL 中的“SELECT *”。Cypher 还可以以表的形式返回节点和边的属性作为属性值: ```cypher MATCH (p:Product) WHERE p.unitPrice > 55 RETURN p.productName, p.unitPrice ORDER BY p.unitPrice ``` 此查询包括选择、投影和排序。`MATCH` 子句定义了一个模式匹配,过滤图以查找“Product”类型的节点;`WHERE` 子句选择所有价格大于 55 的产品;`RETURN` 子句将这些节点投影到产品名称和价格上,`ORDER BY` 子句按价格对产品进行排序。 #### 1.3.2 笛卡尔积和连接 在 Cypher 中,可以使用以下语法生成两个节点的笛卡尔积: ```cypher MATCH (p:Product), (c:Category) RETURN p.productName, c.categoryName ``` 此命令列出了产品名称和类别名称的所有可能组合。节点的连接,即在笛卡尔积上的选择,是通过按边类型匹配路径模式以图为基础执行的: ```cypher MATCH (p:Product) -[:PART_OF]-> (c:Category) RETURN p.productName, c.categoryName ``` 对于每个产品,此查询列出了它所属的类别,只考虑通过“PART_OF”类型的边连接的产品和类别节点。这相当于“Product”节点类型与“Category”节点类型通过“PART_OF”边类型的内连接。 ### 1.4 内置函数 Cypher 中有可以应用于属性和数据集的内置函数。这些函数作为选择、投影和连接的补充,对于实际使用至关重要。数据分析中一个重要的类别是聚合函数。 #### 1.4.1 聚合函数 Cypher 支持的聚合函数如 `COUNT`、`SUM`、`MIN`、`MAX` 和 `AVG` 是数据分析中重要的内置函数类别。假设我们要生成一个包含所有员工及其下属数量的列表,可以使用以下查询: ```cypher MATCH (e:Employee) <-[:REPORTS_TO]-(sub) RETURN e.employeeID, COUNT(sub.employeeID) ``` 但并非每个员工都有下属,即只有“Employee”类型节点的一个子集有传入的“REPORTS_TO”类型边。使用 `OPTIONAL MATCH` 子句可以列出所有员工,包括没有下属的员工: ```cypher MATCH (e:Employee) OPTIONAL MATCH (e)<-[:REPORTS_TO]-(sub) RETURN e.employeeID, COUNT (sub.employeeID) ``` 使用 `OPTIONAL MATCH` 时,未连接的关联属性将保持为空(NULL)。Cypher 基于三值逻辑,
corwn 最低0.47元/天 解锁专栏
买1年送3月
继续阅读 点击查看下一篇
profit 400次 会员资源下载次数
profit 300万+ 优质博客文章
profit 1000万+ 优质下载资源
profit 1000万+ 优质文库回答
复制全文

相关推荐

LI_李波

资深数据库专家
北理工计算机硕士,曾在一家全球领先的互联网巨头公司担任数据库工程师,负责设计、优化和维护公司核心数据库系统,在大规模数据处理和数据库系统架构设计方面颇有造诣。
最低0.47元/天 解锁专栏
买1年送3月
百万级 高质量VIP文章无限畅学
千万级 优质资源任意下载
千万级 优质文库回答免费看

最新推荐

数据处理与非关系型数据库应用指南

### 数据处理与非关系型数据库应用指南 #### 1. 数据转换与处理 在数据处理过程中,有时需要将 CSV 文件转换为 XML 文档,且 XML 文档可能需符合 XML 模式,甚至要遵循用于商业报告的 XBRL 标准(https://en.wikipedia.org/wiki/XBRL )。 数据转换可以涉及两个或更多数据源,以创建一个新的数据源,其属性需符合所需格式。以下是仅涉及两个数据源 A 和 B 的四种数据转换场景,A、B 数据合并生成数据源 C,且 A、B、C 可以有不同的文件格式: - 包含 A 的所有属性和 B 的所有属性。 - 包含 A 的所有属性和 B 的部分属性。

时间序列、因果关系与文本挖掘:从理论到实践

# 时间序列、因果关系与文本挖掘:从理论到实践 ## 1. 时间序列与因果关系 时间在机器学习和分析领域至关重要。在分析时间序列时,我们需要注意常见的陷阱,并掌握相应的解决方法。以全球温度异常和人类二氧化碳排放为例,我们进行了单变量和双变量时间序列分析。同时,运用格兰杰因果检验来判断大气中二氧化碳水平是否会导致地表温度异常。结果发现,从二氧化碳到温度的格兰杰因果检验的 p 值大于 0.05 但小于 0.10,这表明格兰杰因果检验是研究机器学习问题中因果关系的有效工具。 此外,时间序列分析还有很多值得深入探索的领域,如变化点检测、时间序列分解、非线性预测等,这些方法虽不常被视为机器学习的常用

深入理解块层I/O处理与调度及SCSI子系统

### 深入理解块层 I/O 处理与调度及 SCSI 子系统 #### 1. I/O 调度器概述 I/O 调度是块层的关键功能。当读写请求经过虚拟文件系统的各层后,最终会到达块层。块层有多种 I/O 调度器,不同调度器适用于不同场景。 #### 2. 常见 I/O 调度器及其适用场景 | 使用场景 | 推荐的 I/O 调度器 | | --- | --- | | 桌面 GUI、交互式应用和软实时应用(如音频和视频播放器) | BFQ,可保证对时间敏感应用的良好系统响应性和低延迟 | | 传统机械驱动器 | BFQ 或 MQ - deadline,两者都适合较慢的驱动器,Kyber/none

Vim与Source命令的高效使用指南

### Vim与Source命令的高效使用指南 #### 1. Vim代码片段管理 在Vim中,我们可以创建代码片段文件,以便在编辑时快速插入常用代码。以下是具体步骤: 1. **创建代码片段存储目录**: ```sh [me@linuxbox ~]$ mkdir ~/.vim/snippets [me@linuxbox ~]$ exit ``` 2. **复制文本并创建代码片段文件**: - 在可视模式下高亮并复制文本。 - 打开新缓冲区创建代码片段文件: ``` :e ~/.vim/snippets/gpl.

利用Terraform打造完美AWS基础设施

### 利用 Terraform 打造完美 AWS 基础设施 #### 1. 建立设计框架 在明确基础设施需求后,下一步是建立一个设计框架来指导开发过程。这包括定义用于构建基础设施的架构原则、标准和模式。使用诸如 Terraform 之类的基础设施即代码(IaC)工具,有助于建立一致的设计框架,并确保基础设施达到高标准。 建立设计框架时,有以下重要考虑因素: - 为应用程序或工作负载选择合适的架构风格,如微服务、无服务器或单体架构。 - 根据已定义的需求和设计原则,选择合适的 AWS 服务和组件来构建基础设施。 - 定义基础设施不同组件之间的关系和依赖,以确保它们能平稳高效地协同工作。 -

PHP编程基础与常用操作详解

### PHP编程基础与常用操作详解 #### 1. 变量运算与操作符 在PHP中,变量的运算和操作符的使用是基础且重要的部分。例如: ```php $i += 10; // $i is 110 $i = $i / 2; // $i is 55 $j = $i; // both $j and $i are 55 $i = $j % 11; // $i is 0 ``` 最后一行使用了取模运算符 `%`,它的作用是将左操作数除以右操作数并返回余数。这里 `$i` 为 55,55 除以 11 正好 5 次,没有余数,所以结果为 0。 字符串连接运算符是一个句点 `.`,它的作用是将字符串连接在

打造零食推送机器人:从代码实现到硬件采购指南

# 打造零食推送机器人:从代码实现到硬件采购指南 ## 1. 创建零食推送应用 在构建零食推送应用时,我们已经完成了部分代码编写,以下是相关代码: ```html {% for item in items %} <button formaction="{{ item['code'] }}"> {{ item['icon'] }}<br> {{ item['code'] }} </button> {% end %} </form> </body> </html> ``` 现在,应用的大部分功能已就绪,可以开始运行并测试其部分功能。操作步骤如下:

VisualStudioCode与Git的源代码控制

# Visual Studio Code与Git的源代码控制 ## 1. 软件开发中的协作与Visual Studio Code的支持 软件开发通常离不开协作,无论你是开发团队的一员、参与开源项目,还是与客户有交互的独立开发者,协作都是必不可少的。微软大力支持协作和开源,因此Visual Studio Code提供了一个基于Git的集成源代码控制系统,并且可以扩展到其他版本控制服务提供商。 这个系统不仅包含了Visual Studio Code中开箱即用的用于源代码协作的集成工具,还可以通过使用一些扩展来提升工作效率。这些扩展能帮助你更好地审查代码,并将工作成果推送到基于Git的服务,如A

Linux终端实用工具与技巧

# Linux 终端实用工具与技巧 ## 1. gnuplot 绘图与导出 ### 1.1 绘制方程图形 任何方程都可以用特定方式绘制图形。例如,一个斜率为 5、y 轴截距为 3 的直线方程,可使用以下命令生成图形: ```bash plot 5*x + 3 ``` ### 1.2 导出图形为图像文件 虽然能在终端显示图表,但多数情况下,我们希望将图表导出为图像,用于报告或演示。可按以下步骤将 gnuplot 设置为导出图像文件: 1. 切换到 png 模式: ```bash set terminal png ``` 2. 指定图像文件的输出位置,否则屏幕将显示未处理的原始 png 数据:

x64指令集部分指令详解

# x64指令集部分指令详解 ## 1. ROL/ROR指令 ### 1.1 影响的标志位 |标志位|含义| | ---- | ---- | |O|溢出标志(OF)| |D|方向标志(DF)| |I|中断标志(IF)| |T|陷阱标志(TF)| |S|符号标志(SF)| |Z|零标志(ZF)| |A|辅助进位标志(AF)| |P|奇偶标志(PF)| |C|进位标志(CF)| 其中,ROL和ROR指令会影响OF和CF标志位,具体如下: - ROL:每次移位操作时,最左边的位会复制到CF。 - ROR:每次移位操作时,最右边的位会复制到CF。 - OF:只有按1位移位的形式会修改OF,按CL移