博客
关于我
java HashSet
阅读量:339 次
发布时间:2019-03-04

本文共 655 字,大约阅读时间需要 2 分钟。

HashSet底层是HashMap的实现,这种基于哈希表的数据结构能够在O(1)的平均时间内完成插入、删除和查找操作。以下是具体的实现细节:

  • 构造器

    HashSet的构造器调用HashMap的构造器,初始化内部的哈希表。默认情况下,哈希表的大小为16(如果没有指定初始容量)。

  • 添加元素

    HashSet的add方法调用HashMap的put方法,将元素存储进哈希表。每次添加元素时,put方法会计算元素的哈希值,并找到对应的索引位置。如果该位置为空,则新建一个节点并存入;如果不为空,则检查该节点的键与新元素的键是否相同。如果相同,则返回false,否则返回true。

  • 哈希值计算

    HashMap使用 hashCode方法计算元素的哈希值,这个方法不仅考虑元素的内置hashCode,还对哈希值进行了位运算,以减少碰撞概率。

  • 存储逻辑

    put方法将元素存储到哈希表中,并在链表中添加新的节点。链表的最大长度为8,超过这个数目后,链表会被转换为红黑树,以减少查找时间。

  • 树化过程

    当链表长度达到8时,put方法会调用treeify方法,将链表转换为红黑树。这一过程确保了在高负载情况下的查找效率。

  • 扩容机制

    当哈希表的负载因素超过75%时,resize方法会被调用,将表扩展到下一个更大的大小,以确保有足够的空间存储新增的元素。

  • 迁移节点

    当表扩容时,旧表中的节点会被迁移到新表中,保持数据的完整性和一致性。

  • 通过以上机制,HashSet能够在高效的时间复杂度内完成各种集合操作,同时保持内存占用和操作的平衡性。

    转载地址:http://thce.baihongyu.com/

    你可能感兴趣的文章
    Pandas Plots:周末的单独颜色,x 轴上漂亮的打印时间
    查看>>
    Pandas 中的多索引旋转
    查看>>
    Pandas 中的日期范围
    查看>>
    pandas 中的时间序列箱线图
    查看>>
    Pandas 使用指南
    查看>>
    Pandas 对数据框的布尔比较
    查看>>
    pandas 时间序列重新采样结束给定的一天
    查看>>
    pandas 根据不是常量的第三列的值将值从一列复制到另一列
    查看>>
    pandas 根据值从多列中的一列查找
    查看>>
    Pandas 根据布尔条件选择行和列
    查看>>
    pandas 版本兼容特定的蟒蛇和NumPy配置吗?
    查看>>
    pandas 生成excel多级表头
    查看>>
    pandas 读取excel数据,以字典形式输出
    查看>>
    Pandas 读取具有浮点值的 csv 文件会导致奇怪的舍入和小数位数
    查看>>
    pandas 适用,但仅适用于满足条件的行
    查看>>
    pandas 重新采样到每月的特定工作日
    查看>>
    pandas :按移位分组和累加和(GroupBy Shift And Cumulative Sum)
    查看>>
    pandas :检测一个DF和另一个DF之间缺失的列
    查看>>
    Pandas-从具有嵌套列表列表的现有列创建动态列时出错
    查看>>
    Pandas-通过对列和索引的值求和来合并两个数据框
    查看>>