哈希表也叫散列表,哈希表是一种映射型的数据结构。
❝哈希表是根据关键码的值而直接进行访问的数据结构。
❞
就好像老三和老三的工位:有人来找老三,前台小姐姐一指,那个像狗窝一样的就是老三的工位。
总体来说,散列表由两个要素构成:桶数组与散列函数。
散列表使用的桶数组(Bucket array ),其实就是一个容量为 N 的普通数组,只不过在这里,我们将其中的每个单元都想象为一个“桶”(Bucket),每个桶单元里都可以存放一个条目。
比如,所有的关键码都是整数,我们就可以直接将 key 为关键码的那个条目存放在桶单元 A[key]内;为了节省空间,空闲的单元都被置为 null。
例如,吴零、熊大、王二、张三、李四,我们可以把他们放到桶数组对应的位置。
那么查找的时候,我们根据对应的名字编号,直接去找数组的下标就行了,这样一来,时间复杂度就是O(1)。
桶数组
但是老三表示,怎么会老有人的名字老叫什么三、什么四的,起码得叫个"阿刚"、"小明"吧。
那么问题来了,阿刚、小明我们应该放在哪里呢?他们没法直接放到桶数组的对应下标位置。
所以,就引入了我们第二个关键要素哈希函数
。
为了让映射能推广到所有情况,我们需要借助哈希函数 hashFunction映射到桶数组对应的位置。
例如,我们上面说到的一些平平无奇的名字,阿刚、小明……我们要把它们映射到对应的桶中。
哈希函数
一般情况下,哈希函数通过对名字的HashCode进行运算,将名字映射到桶数组对应的索引。
我们最理想的情况,就是通过哈希计算,各个元素找到空闲的坑位,但是现实往往不那么尽如人意,有时候,会发现,心上的城,已经长满了别人家的青藤。
哈希冲突
阿刚和小明映射到了同一个位置,但这个位置只能容下一个人,这就叫哈希碰撞。
所以为了尽可能避免哈希碰撞呢,就需要精心设计哈希函数,我们希望哈希函数满足以下要求:
哈希函数的构造方法有很多,如下图,有些方法见名知义,篇幅所限,就不多讲。
哈希函数构造方法
这里提一下HashMap的哈希函数:
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
整个过程大概如下:
HashMap 哈希函数
hashCode右移16位,正好是32bit的一半。与自己本身做异或操作(相同为0,不同为1)。就是为了混合哈希值的高位和地位,增加低位的随机性。并且混合后的值也变相保持了高位的特征。
int index = hash & (arrays.length-1);
HashMap的哈希函数是非常优秀的设计,很值得学习。
即使再好的设计,也难免发生哈希碰撞。
那么,发生哈希碰撞,应该怎么处理呢?
阿刚和小明在桶中发生了冲突,那我们在桶数组接一个小尾巴——用一个链表将他们俩存起来就可以了。
拉链法
除了这个,还有啥办法呢?
唉,假如我们的桶数组还是有坑位,我们可以重新分配,这就是
使用线性探测法的前提是桶数组里面还有坑位。
常见的线性探测法有:
「开放地址法」就是一旦发生冲突,就去寻找下一个空的散列地址。
寻找下一个空的散列地址叫做探测,常见的探测方法有:线性探测法、二次探测法、随机探测法。
这个方法也很简单,利用不同的哈希函数再求得一个哈希地址,直到不出现冲突为止。
公共溢出区法就是再建一个公共溢出区,存储发生冲突的元素。
在Java的刷题中,我们有两种常用的哈希结构。
一种是HashMap,<Key,Value>型的Hash结构。
一种是HashSet,没有重复元素的集合。
集合 | 底层实现 | 是否有序 | 数值是否可以重复 | 查询效率 | 增删效率 |
---|---|---|---|---|---|
HashMap | 数组/链表/红黑树 | 否 | key不可重复,value可重复 | O(1) | O(1) |
HashSet | 数组/链表/红黑树 | 否 | 不可重复 | O(1) | O(1) |
还记得我们前面做过的求数字出现的次数吗?
判断一个元素是否出现过的场景,保底的我们应该立即想到哈希。
❞
❝LeetCode1.两数之和 是比较典型的使用哈希表的例子,前面已经做过了——[LeetCode通关:数组十七连,真是不简单] ,就不再来一遍了。
❞
☕ 题目:242. 有效的字母异位词 (https://leetcode-cn.com/problems/valid-anagram/)
❓ 难度:简单
描述:
给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。
注意:若 s 和 t 中每个字符出现的次数都相同,则称 s 和 t 互为字母异位词。
示例 1:
输入: s = "anagram", t = "nagaram"
输出: true
示例 2:
输入: s = "rat", t = "car"
输出: false
思路:
既然都说了要用哈希法,就懒得再写暴力法了。
我们可以用HashMap把字符出现的频率存储起来,s 出现一次频率+1,t 出现一次频率,判断最后hash所有位置value是否都为0。
思路很简单,代码实现如下:
public boolean isAnagram(String s, String t) {
if (s.length() != t.length()) {
return false;
}
Map<Character, Integer> map = new HashMap<>();
for (int i = 0; i < s.length(); i++) {
char sChar = s.charAt(i);
char tChar = t.charAt(i);
map.put(sChar, map.getOrDefault(sChar, 0) + 1);
map.put(tChar, map.getOrDefault(tChar, 0) - 1);
}
for (Integer v : map.values()) {
if (v != 0) {
return false;
}
}
return true;
}
还有另外一种实用数组作为哈希表的方法,据说可以加速,但是个人觉得用HashMap的方式比较好理解和记忆。
时间复杂度:O(n)
空间复杂度:O(n)
☕ 题目:1002. 查找常用字符 (https://leetcode-cn.com/problems/find-common-characters/)
❓ 难度:简单
描述:
给定仅有小写字母组成的字符串数组 A,返回列表中的每个字符串中都显示的全部字符(包括重复字符)组成的列表。例如,如果一个字符在每个字符串中出现 3 次,但不是 4 次,则需要在最终答案中包含该字符 3 次。
你可以按任意顺序返回答案。
示例 1:
输入:["bella","label","roller"]
输出:["e","l","l"]
示例 2:
输入:["cool","lock","cook"]
输出:["c","o"]
☕ 题目:349. 两个数组的交集 (https://leetcode-cn.com/problems/intersection-of-two-arrays/)
❓ 难度:简单
描述:
给定两个数组,编写一个函数来计算它们的交集。
示例 1:
输入:nums1 = [1,2,2,1], nums2 = [2,2]
输出:[2]
示例 2:
输入:nums1 = [4,9,5], nums2 = [9,4,9,8,4]
输出:[9,4]
思路:
注意,求交集,是需要去重的。既然说到去重,我们自然想到了HashSet。
我们可以用两个HashSet,set1存储nums1元素,遍历nums2,判断元素是否存在于set1,用set2存储。
很好理解。
两个数组的交集
代码如下:
public int[] intersection(int[] nums1, int[] nums2) {
int len1 = nums1.length;
int len2 = nums2.length;
if (len1 == 0 || len2 == 0) {
return new int[0];
}
Set<Integer> set1 = new HashSet<>();
Set<Integer> set2 = new HashSet<>();
for (int i = 0; i < len1; i++) {
set1.add(nums1[i]);
}
for (int j = 0; j < len2; j++) {
if (set1.contains(nums2[j])) {
set2.add(nums2[j]);
}
}
int[] result = new int[set1.size()];
int k = 0;
for (int value : set2) {
result[k++] = value;
}
return result;
}
时间复杂度:O(n)
空间复杂度:O(n)
☕ 题目:454. 四数相加 II (https://leetcode-cn.com/problems/4sum-ii/)
❓ 难度:中等
描述:
给定四个包含整数的数组列表 A , B , C , D ,计算有多少个元组 (i, j, k, l) ,使得 A[i] + B[j] + C[k] + D[l] = 0。
为了使问题简单化,所有的 A, B, C, D 具有相同的长度 N,且 0 ≤ N ≤ 500 。所有整数的范围在 -228 到 228 - 1 之间,最终结果不会超过 231 - 1 。
「例如:」
输入:
A = [ 1, 2]
B = [-2,-1]
C = [-1, 2]
D = [ 0, 2]
输出:
2
解释:
两个元组如下:
1. (0, 0, 0, 1) -> A[0] + B[0] + C[0] + D[1] = 1 + (-2) + (-1) + 2 = 0
2. (1, 1, 0, 0) -> A[1] + B[1] + C[0] + D[0] = 2 + (-1) + (-1) + 0 = 0
思路:
我们的思路是四个数组分两组,一组存HashMap,另一组和HashMap比较。
public int fourSumCount(int[] nums1, int[] nums2, int[] nums3, int[] nums4) {
Map<Integer, Integer> map = new HashMap<>();
int res = 0;
for (int i = 0; i < nums1.length; i++) {
for (int j = 0; j < nums2.length; j++) {
int sumAB = nums1[i] + nums2[j];
map.put(sumAB, map.getOrDefault(sumAB, 0) + 1);
}
}
for (int i = 0; i < nums3.length; i++) {
for (int j = 0; j < nums4.length; j++) {
int sumCD = -(nums3[i] + nums4[j]);
if (map.containsKey(sumCD)) {
res+=map.get(sumCD);
}
}
}
return res;
}
时间复杂度:O(n²)
空间复杂度:O(n)
☕ 题目:454. 四数相加 II (https://leetcode-cn.com/problems/4sum-ii/)
❓ 难度:简单
描述:
给定一个赎金信 (ransom) 字符串和一个杂志(magazine)字符串,判断第一个字符串 ransom 能不能由第二个字符串 magazines 里面的字符构成。如果可以构成,返回 true ;否则返回 false。
(题目说明:为了不暴露赎金信字迹,要从杂志上搜索各个需要的字母,组成单词来表达意思。杂志字符串中的每个字符只能在赎金信字符串中使用一次。)
示例 1:
输入:ransomNote = "a", magazine = "b"
输出:false
示例 2:
输入:ransomNote = "aa", magazine = "ab"
输出:false
示例 3:
输入:ransomNote = "aa", magazine = "aab"
输出:true
思路
这个题解法也很好像。
用HashMap存储报刊数组字符以及字符出现的次数,遍历赎金信数组,取对应的字符。
注意,这里每个字符只能使用一次,所以取字符的时候需要减1。
代码如下:
public boolean canConstruct(String ransomNote, String magazine) {
Map<Character, Integer> hash = new HashMap<>();
for (int i = 0; i < magazine.length(); i++) {
char m = magazine.charAt(i);
hash.put(m, hash.getOrDefault(m, 0) + 1);
}
for (int i = 0; i < ransomNote.length(); i++) {
char r = ransomNote.charAt(i);
if (!hash.containsKey(r)) {
return false;
}
if (hash.get(r) == 0) {
return false;
}
hash.put(r, hash.get(r) - 1);
}
return true;
}
时间复杂度:O(n)
空间复杂度:O(n)
☕ 题目:202. 快乐数 (https://leetcode-cn.com/problems/happy-number/)
❓ 难度:简单
描述:
编写一个算法来判断一个数 n 是不是快乐数。
「快乐数」定义为:
如果 n 是快乐数就返回 true ;不是,则返回 false 。
示例 1:
输入:19
输出:true
解释:
12 + 92 = 82
82 + 22 = 68
62 + 82 = 100
12 + 02 + 02 = 1
示例 2:
输入:n = 2
输出:false
思路:
这道题解题的关键在于也可能是 无限循环 但始终变不到 1。
。
咱们肯定不能让它取快乐数这个过程无限循环下去,但是它既然循环了,那么各位数的平方和肯定会重复,这就成了判断元素是否出现的问题。
这道题我们可以用HashSet存储平方和,如果当前平方和已经出现过,说明已经开始无限循环。
public boolean isHappy(int n) {
Set<Integer> set = new HashSet<>();
while (true) {
int sum = getSum(n);
//开心数
if (sum == 1) {
return true;
}
//sum出现过
if (set.contains(sum)) {
return false;
} else {
set.add(sum);
}
n = sum;
}
}
/**
* @return int
* @Description: 获取平方和
* @date 2021/8/11 22:41
*/
int getSum(int n) {
int sum = 0;
while (n > 0) {
int temp = n % 10;
sum += temp * temp;
n = n / 10;
}
return sum;
}
时间复杂度:O(logn)
空间复杂度:O(logn)
❝这道题还可以用双指针的方式,用两个数,一个快指针,一个慢指针,如果进入循环,最终两个指针会相遇。
❞
还是一个顺口溜:
总结
❝简单的事情重复做,重复的事情认真做,认真的事情有创造性地做!
参考:
本文由哈喽比特于2年以前收录,如有侵权请联系我们。
文章来源:https://mp.weixin.qq.com/s/BrooSGPGxfx_JePSTjIkUw
京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。
日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。
据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。
今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。
日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。
近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。
据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。
9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...
9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。
据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。
特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。
据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。
近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。
据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。
9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。
《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。
近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。
社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”
2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。
罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。