【Leetcode刷题篇/面试篇】-前缀树(Trie)

数据结构与算法-前缀树(Trie)

一、前缀树的应用

前缀树是一种树数据结构,用于检索字符串数据集中的键。这一高效的数据结构有多种应用:

  • 自动补全

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mCqAkOG0-1608433358963)(D:\000\前后端学习笔记\笔记\imgs_trie\1.jpg)]

​ 图 1. 谷歌的搜索建议

  • 拼写检查

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-j1bqhmuA-1608433358967)(D:\000\前后端学习笔记\笔记\imgs_trie\2.jpg)]

​ 图2. 文字处理软件中的拼写检查

  • IP 路由 (最长前缀匹配)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-knCBJDBS-1608433358969)(D:\000\前后端学习笔记\笔记\imgs_trie\3.jpg)]

​ 图 3. 使用Trie树的最长前缀匹配算法,Internet 协议(IP)路由中利用转发表选择路径。

  • T9 (九宫格) 打字预测

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wheDiVwn-1608433358971)(D:\000\前后端学习笔记\笔记\imgs_trie\4.jpg)]

图 4. T9(九宫格输入),在 20 世纪 90 年代常用于手机输入

  • 单词游戏

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qLCsA9MJ-1608433358974)(D:\000\前后端学习笔记\笔记\imgs_trie\5.jpg)]

​ 图 5. Trie 树可通过剪枝搜索空间来高效解决 Boggle 单词游戏

还有其他的数据结构,如平衡树和哈希表,使我们能够在字符串数据集中搜索单词。为什么我们还需要 Trie 树呢?尽管哈希表可以在 O(1)O(1) 时间内寻找键值,却无法高效的完成以下操作:

  • 找到具有同一前缀的全部键值。
  • 按词典序枚举字符串的数据集。

Trie 树优于哈希表的另一个理由是,随着哈希表大小增加,会出现大量的冲突,时间复杂度可能增加到 O(n)O(n),其中 nn 是插入的键的数量。与哈希表相比,Trie 树在存储多个具有相同前缀的键时可以使用较少的空间。此时 Trie 树只需要 O(m)O(m) 的时间复杂度,其中 mm 为键长。而在平衡树中查找键值需要 O(m log n)O(mlogn) 时间复杂度。

二、前缀树的数据结构

Trie 树是一个有根的树,其结点具有以下字段:。

  • 最多 RR 个指向子结点的链接,其中每个链接对应字母表数据集中的一个字母。
    本文中假定 RR 为 26,小写拉丁字母的数量。
  • 布尔字段,以指定节点是对应键的结尾还是只是键前缀。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iySvX6j5-1608433358977)(D:\000\前后端学习笔记\笔记\imgs_trie\6.jpg)]

三、前缀树的代码

3.1 TrieNode结点代码

class TrieNode{
    //R links to node children
    private TrieNode[] links;
    
    private final int R = 26;
    
    private boolean isEnd;
    
    public TrieNode(){
        links = new TrieNode[R];
    }
    
    public boolean containsKey(char ch){
        retrurn links[ch-'a']!=null;
    }
    
    public TrieNode get(char ch){
        return links[ch-'a'];
    }
    
    public void put(char ch,TrieNode node){
        links[ch-'a'] = node;
    }
    
    public void setEnd(){
        isEnd = true;
    }
    
    public boolean isEnd(){
        return isEnd;
    }
    
}

3.2 Trie树代码

3.2.1 向Trie树插入键

通过搜索Trie树来插入一个键。我们从根开始搜索它对应于第一个键字符的链接。有两种情况:

  • 链接存在。沿着链接移动到树的下一个子层。算法继续搜索下一个键字符。
  • 链接不存在。创建一个新的结点,并将它与父节点的链接相连,该链接与当前的键字符相匹配。

重复以上步骤,直到达到键的最后一个字符,然后将当前节点标记为结束结点,算法结束。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BXWLInS2-1608433358978)(D:\000\前后端学习笔记\笔记\imgs_trie\7.jpg)]

class Trie{
    private TrieNode root;
    
    public Trie(){
        root = new TrieNode();
    }
    
    // insert into a word into the trie
    public void insert(String word){
        TrieNode node = root;
        for(int i=0;i<word.length();i++){
            char currentChar = word.charAt(i);
            if(!node.containsKey(currentChar)){
                node.put(currentChar,new TrieNode());
            }
            node = node.get(currentChar);
        }
        node.setEnd();
    }
}

3.2.2 向Trie树中查找键

每个键在Trie中表示为从根到内部结点或叶的路径。用第一个键字符从根开始,检查当前节点中与键字符对应的链接。有两种情况:

  • 存在链接。我们移动到该链接后面路径中的下一个节点,并继续搜索下一个键字符。
  • 不存在链接。若已无键字符,且当前节点标记为isEnd,则返回true。否则有两种可能,均返回false
    • 还有键字符剩余,但无法跟随Trie数的键路径,找不到键。
    • 没有键字符剩余,但当前节点没有标记为isEnd。也就是说,待查询找键只是Trie树中另一个键的前缀。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bSuYZpHA-1608433358980)(D:\000\前后端学习笔记\笔记\imgs_trie\8.jpg)]

class Trie{
    //....
    private TrieNode searchPrefix(String word){
        TrieNode node = root;
        for(int i=0;i<word.length();i++){
            char currentChar = word.charAt(i);
            if(node.containsKey(currentChar)){
                node = node.get(currentChar);
            }else{
                return null;
            }
        }
        return node;
    }
    
    public boolean search(String word){
        TrieNode node = searchPrefix(word);
        return node!=null && node.isEnd();
    }
}

3.2.3 查找Trie树中的键前缀

该方法与在 Trie 树中搜索键时使用的方法非常相似。我们从根遍历 Trie 树,直到键前缀中没有字符,或者无法用当前的键字符继续 Trie 中的路径。与上面提到的“搜索键”算法唯一的区别是,到达键前缀的末尾时,总是返回 下true。我们不需要考虑当前 Trie 节点是否用 “isend” 标记,因为我们搜索的是键的前缀,而不是整个键。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WJBZxjFd-1608433358981)(D:\000\前后端学习笔记\笔记\imgs_trie\9.jpg)]

class Trie{
    // ...
    
    public boolean startsWith(String prefix){
        TrieNode root = searchPrefix(prefix);
        return node!=null;
    }
}

3358981)]

class Trie{
    // ...
    
    public boolean startsWith(String prefix){
        TrieNode root = searchPrefix(prefix);
        return node!=null;
    }
}
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

mind_programmonkey

你的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值