java的两类集合的区分（是否重复）

weixin_43783165

于 2025-06-18 20:10:38 发布

阅读量753

点赞数 10

CC 4.0 BY-SA版权

文章标签： java

在Java集合框架中，集合是否允许元素重复（“重合”）是区分其类型和用途的核心特征之一。这种区别主要体现在List（可重复） 和 Set（不可重复） 两大接口的设计上。以下是两者的详细对比及原理分析：

特性	可重复集合（List）	不可重复集合（Set）
元素重复性	✅ 允许重复元素（如 `[1, 1, 2]`）	❌ 不允许重复元素（如 `{1, 2}`）
顺序性	✅ 严格保持插入顺序（有序）	❌ 默认无序（部分实现如`LinkedHashSet`可保序）
索引访问	✅ 支持按索引随机访问（`get(index)`）	❌ 无索引概念，只能通过迭代器遍历
底层实现	动态数组（`ArrayList`）或链表（`LinkedList`）	哈希表（`HashSet`）或红黑树（`TreeSet`）
判重依据	无内置判重逻辑	依赖 `hashCode()` 和 `equals()`（或 `compareTo()`）

无判重逻辑：以ArrayList为例，其add()方法直接追加元素到数组末尾，不检查是否重复：

public boolean add(E e) {
    ensureCapacity(size + 1);  // 扩容检查
    elementData[size++] = e;   // 直接插入
    return true;
}

判重逻辑：以HashSet为例（底层为HashMap），添加元素时通过哈希值+equals()判断重复：
```
public boolean add(E e) {
    return map.put(e, PRESENT) == null; // 依赖HashMap的键唯一性
}
```
去重过程：
1. 计算哈希码 → 定位桶位置；
2. 若桶非空，遍历链表/树节点，调用equals()逐项比较；
3. 若存在相等元素，拒绝插入（返回false）。
特殊实现：
- TreeSet：基于红黑树排序，通过compareTo()返回值判重（返回0视为重复）。
- LinkedHashSet：在HashSet基础上用链表维护插入顺序。

集合类型	实现类	是否可重复	有序性	适用场景
List	`ArrayList`	✅	插入顺序	频繁随机访问（如按索引查询）
	`LinkedList`	✅	插入顺序	频繁插入/删除（如队列操作）
Set	`HashSet`	❌	无序	快速去重（不关心顺序）
	`LinkedHashSet`	❌	插入顺序	需去重且保留插入顺序
	`TreeSet`	❌	自然/自定义排序	需排序且去重（如排行榜）

💡 注：Map接口（如HashMap）的键（Key）也具备不可重复性，值（Value）可重复。

判重依赖方法一致性：
- 在Set中，若对象未正确重写hashCode()和equals()，会导致重复元素未被识别。
- 示例：两个属性相同的Person对象，若未重写equals()，会被HashSet视为不同对象。
可变对象风险：
- 若Set中元素被修改（影响hashCode()），可能导致无法正确访问或重复元素被错误保留。
性能差异：
- List的contains()需遍历所有元素（O(n)），而HashSet的contains()接近O(1)。
- 频繁判重操作时，优先选Set。

需要重复元素？ → 选List：
- 例如：存储用户操作记录、批量任务列表。
需自动去重？ → 选Set：
- 例如：生成唯一ID集合、统计不重复单词数。
需去重且排序？ → 选TreeSet或LinkedHashSet：
- 例如：按分数排序的学生排名（TreeSet），按访问顺序的缓存（LinkedHashSet）。