【Java面试】HashSet如何去重的?

HashSet 去重实现原理

HashSet 的去重能力依赖于 哈希表(HashMap)equals()/hashCode() 方法的配合,核心逻辑如下:


1. 底层存储结构
  • HashSet 内部使用 HashMap 存储元素(JDK 源码):
    private transient HashMap<E, Object> map;
    
    • 元素作为 HashMap 的 Key,Value 统一为静态空对象 PRESENT(无实际意义)。

2. 去重关键逻辑

当调用 add(E e) 方法时,执行以下步骤:

public boolean add(E e) {
    return map.put(e, PRESENT) == null; // 若Key不存在,返回true
}

去重流程

  1. 计算哈希值
    • 调用元素的 hashCode() 方法,确定存储位置(HashMap 的桶位置)。
  2. 检查哈希冲突
    • 若目标桶为空,直接存入(无重复)。
    • 若桶非空,遍历链表/红黑树,调用 equals() 逐个比较:
      • 存在相同元素equals()返回 true):放弃插入,返回 false
      • 无相同元素:存入新节点,返回 true

3. 关键方法要求
  • hashCode()
    • 必须保证相同对象返回相同值(否则无法定位到正确桶)。
    • 不同对象尽量返回不同值(减少哈希冲突)。
  • equals()
    • 必须严格比较对象内容(如 String 比较字符序列)。

示例String 类的去重

HashSet<String> set = new HashSet<>();
set.add("A");  // 存入 "A"(hashCode=65)
set.add("A");  // 计算相同hashCode,equals()比较为true,拒绝重复
set.add("B");  // 存入 "B"(hashCode=66)

4. 特殊情况处理
  • 哈希冲突
    • 不同对象可能计算相同 hashCode(如 "Aa""BB" 的hashCode均为2112)。
    • 此时依赖 equals() 进一步判断是否为同一对象。
  • 自定义对象
    • 若未重写 hashCode()equals(),默认使用对象地址比较,可能导致逻辑重复但无法去重。

错误示例

class User { String name; }
HashSet<User> set = new HashSet<>();
set.add(new User("Tom"));  // 存入对象A
set.add(new User("Tom"));  // 存入对象B(未重写方法,地址不同,无法去重)

正确做法

class User {
    String name;
    @Override
    public int hashCode() { return name.hashCode(); }
    @Override
    public boolean equals(Object o) { /* 比较name字段 */ }
}

总结

  • 去重本质:通过 hashCode() 快速定位 + equals() 精确判等。
  • 性能依赖:良好的 hashCode() 设计能减少冲突,提升效率。
  • 注意事项
    • 存入自定义对象时,必须正确重写 hashCode()equals()
    • 避免修改已存入 HashSet 的对象的哈希相关字段(会导致内存泄漏)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值