台湾生活网_台湾人的网上生活家园 -

幸运飞艇注册登录_为什么要重写hashcode和equals方法?初级程序员在面试中很少能说清楚。

  • 时间:
  • 浏览:4

     我在面试 Java初级开发的后后,总是会问:你有如此重写过hashcode方法?不少候选人直接说没写过。你后能 想,或许真的没写过,于是就再通过另另另另有另一个大问题确认:你在用HashMap的后后,键(Key)要素,有如此放过自定义对象?而这俩 后后,候选人说放过,于是另另另另有另一个大问题的回答就自相矛盾了。

    最近问下来,这俩 大问题普遍回答不大好,于是在本文里,就干脆从hash表讲起,讲述HashMap的存数据规则,由此人们就自然清楚上述大问题的答案了。

1 通过Hash算法来了解HashMap对象的高效性

    人们先复习数据形态里的另另另另有另一个知识点:在另另另另有另一个长度为n(假设是300000)的线性表(假设是ArrayList)里,存放着无序的数字;为甚让人们要找另另另另有另一个指定的数字,就不得不通过从头到尾依次遍历来查找,从前的平均查找次数是n除以2(这里是300000)。

人们再来观察Hash表(这里的Hash表纯粹是数据形态上的概念,和Java无关)。它的平均查找次数接近于1,代价相当小,关键是在Hash表里,存装下 其中的数据和它的存储位置是用Hash函数关联的。

    人们假设另另另另有另一个Hash函数是x*x%5。当然实际情形里不为甚让用如此简单的Hash函数,人们这里纯粹为了说明方便,而Hash表是另另另另有另一个长度是11的线性表。为甚让人们要把6装下 其中,如此人们首先会对6用Hash函数计算一下,结果是1,只是人们就把6装下 到索引号是1这俩 位置。同样为甚让人们要放数字7,经过Hash函数计算,7的结果是4,如此它将被装下 索引是4的这俩 位置。这俩 效果如下图所示。

    从前做的好处非常明显。比如人们要从中找6这俩 元素,人们还才能先通过Hash函数计算6的索引位置,为甚让直接从1号索引里找到它了。

不过人们会遇到“Hash值冲突”这俩 大问题。比如经过Hash函数计算后,7和8会有相同的Hash值,对此Java的HashMap对象采用的是”链地址法“的防止方案。效果如下图所示。

 

    具体的做法是,为所有Hash值是i的对象建立另另另另有另一个同义词链表。假设人们在装下 8的后后,发现4号位置为甚让被占,如此就会新建另另另另有另一个链表结点装下 8。同样,为甚让人们要找8,如此发现4号索引里回会8,那会沿着链表依次查找。

    着实人们还是无法彻底防止Hash值冲突的大问题,为甚让Hash函数设计合理,仍能保证同义词链表的长度被控制在另另另另有另一个合理的范围里。这里讲的理论知识不要再说无的放矢,人们能在后文里清晰地了解到重写hashCode方法的重要性。

2 为那此要重写equals和hashCode方法

    当人们用HashMap存入自定义的类时,为甚让不重写这俩 自定义类的equals和hashCode方法,得到的结果会和人们预期的不一样。人们来看WithoutHashCode.java这俩 例子。

在其中的第2到第18行,人们定义了另另另另有另一个Key类;在其中的第3行定义了唯一的另另另另有另一个属性id。当前人们先注释掉第9行的equals方法和第16行的hashCode方法。    

1	import java.util.HashMap;
2	class Key {
3		private Integer id;
4		public Integer getId() 
5	{return id; }
6		public Key(Integer id) 
7	{this.id = id;	}
8	//故意先注释掉equals和hashCode方法
9	//	public boolean equals(Object o) {
10	//		if (o == null || !(o instanceof Key)) 
11	//		{ return false;	} 
12	//		else 
13	//		{ return this.getId().equals(((Key) o).getId());}
14	//	}
15		
16	//	public int hashCode() 
17	//	{ return id.hashCode();	}
18	}
19	
20	public class WithoutHashCode {
21		public static void main(String[] args) {
22			Key k1 = new Key(1);
23			Key k2 = new Key(1);
24			HashMap<Key,String> hm = new HashMap<Key,String>(); 
25			hm.put(k1, "Key with id is 1");		
26			System.out.println(hm.get(k2));		
27		}
28	}

    在main函数里的第22和23行,人们定义了另另另另有另一个Key对象,它们的id回会1,就好比它们是两把相同的都能打开同一扇门的钥匙。

    在第24行里,人们通过泛型创建了另另另另有另一个HashMap对象。它的键要素还才能存放Key类型的对象,值要素还才能存储String类型的对象。

    在第25行里,人们通过put方法把k1和一串字符装下 到hm里; 而在第26行,人们想用k2去从HashMap里得到值;这就好比人们想用k1这把钥匙来锁门,用k2来开门。这是符合逻辑的,但从当前结果看,26行的返回结果回会人们想象中的那个字符串,只是null。

    原因分析分析有另另另另有另一个—如此重写。第一是如此重写hashCode方法,第二是如此重写equals方法。

   当人们往HashMap里放k1时,首先会调用Key这俩 类的hashCode方法计算它的hash值,你后能 把k1装下 hash值所指引的内存位置。

    关键是人们如此在Key里定义hashCode方法。这里调用的仍是Object类的hashCode方法(所有的类回会Object的子类),而Object类的hashCode方法返回的hash值着实是k1对象的内存地址(假设是30000)。

    

    为甚让人们你后能 是调用hm.get(k1),如此人们会再次调用hashCode方法(还是返回k1的地址30000),你后能 根据得到的hash值,能变慢地找到k1。

    但人们这里的代码是hm.get(k2),当人们调用Object类的hashCode方法(为甚让Key里没定义)计算k2的hash值时,着实得到的是k2的内存地址(假设是30000)。为甚让k1和k2是另另另另有另一个不同的对象,只是它们的内存地址一定不要再相同,也只是说它们的hash值一定不同,这只是人们无法用k2的hash值去拿k1的原因分析分析。

    当人们把第16和17行的hashCode方法的注释添加后,会发现它是返回id属性的hashCode值,这里k1和k2的id回会1,只是它们的hash值是相等的。

    人们再来更正一下存k1和取k2的动作。存k1时,是根据它id的hash值,假设这里是3000,把k1对象装下 到对应的位置。而取k2时,是先计算它的hash值(为甚让k2的id也是1,这俩 值也是3000),你后能 到这俩 位置去找。

    但结果会出乎人们意料:明明3000号位置为甚让有k1,但第26行的输出结果依然是null。其原因分析分析只是如此重写Key对象的equals方法。

    HashMap是用链地址法来防止冲突,也只是说,在3000号位置上,有为甚让居于着多个用链表形式存储的对象。它们通过hashCode方法返回的hash值回会3000。

     当人们通过k2的hashCode到3000号位置查找时,着实会得到k1。但k1有为甚让仅仅是和k2具有相同的hash值,但不要再说和k2相等(k1和k2两把钥匙不要再说能开同一扇门),这俩 后后,就须要调用Key对象的equals方法来判断两者与非 相等了。

    为甚让人们在Key对象里如此定义equals方法,系统就不得不调用Object类的equals方法。为甚让Object的固有方法是根据另另另另有另一个对象的内存地址来判断,只是k1和k2一定不要再相等,这只是为那此依然在26行通过hm.get(k2)依然得到null的原因分析分析。

    为了防止这俩 大问题,人们须要打开第9到14行equals方法的注释。在这俩 方法里,只要另另另另有另一个对象回会Key类型,为甚让它们的id相等,它们就相等。

3 对面试大问题的说明

    为甚让在项目里总是会用到HashMap,只是我在面试的后后回会问这俩 大问题∶你有如此重写过hashCode方法?你在使用HashMap时有如此重写hashCode和equals方法?你是为甚会么会写的?

    根据问下来的结果,我发现初级程序员对这俩 知识点普遍没掌握好。重申一下,为甚让人们要在HashMap的“键”要素存放自定义的对象,一定要在这俩 对象里用被委托人的equals和hashCode方法来覆盖Object里的同名方法。 

     本文是从Java核心技术及面试指南这本书中相关内容改编而来。