对等电子商务应用中的语义数据管理
1. P2P 系统中的路由算法
在对等(P2P)网络中,Plaxton 路由算法的 P2P 实现会将消息持续转发给用户 ID 比当前用户更接近收件人用户 ID 的用户。像 Pastry、CAN 和 Chord 这些基于分布式哈希表(DHT)的系统,虽采用了略有不同的 Plaxton 路由算法变体,但都优于第一代 P2P 系统的路由算法。它们的通信开销显著降低,因为消息仅会路由到相关用户。
然而,基于 DHT 的系统依赖于 put(key, user - id)
和 get(key)
哈希原语,这导致它们主要局限于精确匹配搜索。例如,对于两个相似但不相同的键 key1
和 key2
,通过基于哈希的 put
原语插入系统后,结果通常截然不同。所以,只有指定插入时使用的精确键的搜索才能成功找到目标,无法进行近似搜索。
为解决这一问题,有相关研究提出了不同的方法:
- 在基于 Chord 的系统中,有架构利用给定范围内可能值的哈希机制来回答范围查询。
- 在基于 CAN 的系统中,将 CAN 空间划分为区域,管理区域的对等节点存储映射到该区域以及相邻区域的值范围信息,通过迭代转发范围查询到管理请求值范围的区域来解决问题。
这些方法主要侧重于构建搜索索引,以便使用选择、连接、聚合等操作符执行类似数据库的查询。但这些索引仅在用户对键名术语达成一致的领域有效,如音乐文件领域。在通用电子商务应用等没有明确定名标准的领域,不同用户可能使用不同术语描述相同或高度相似的对象。因此