哈希表及其概念

发布时间:2013-9-10

本文导语: 散列表（Hash table，也叫哈希表），是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫...

散列表（Hash table，也叫哈希表），是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。

哈希是一种重要的存储方法，也是一种重要的查找方法。

它的基本思想是：以关键字K为自变量，通过一个确定的函数f，计算出对应的函数值f (k)，把这个值解释为关键字等于K的结点的存储地址。查找时，再根据要查找的关键字用同样的函数计算地址，然后到相应的存储单元取出要查找的结点。按这个思想建立的表，称为哈希表，称函数f 为哈希函数，称f (k)的值为哈希地址。

基本概念:

(1)若结构中存在关键字和K相等的记录，则必定存储在f(K）的位置上。由此，不需比较便可直接取得所查记录。这个对应关系f称为散列函数(Hash function），按这个思想建立的表为散列表。

(2) 对不同的关键字可能得到同一散列地址，即key1≠key2，而f(key1)=f(key2），这种现象称冲突。具有相同函数值的关键字对该散列函数来说称做同义词。

(3) 综上所述，根据散列函数H(key）和处理冲突的方法将一组关键字映象到一个有限的连续的地址集（区间）上，并以关键字在地址集中的“象”，作为这条记录在表中的存储位置，这种表便称为散列表，这一映象过程称为散列造表或散列，所得的存储位置称散列地址。这个现象也叫散列桶，在散列桶中，只能通过顺序的方式来查找，一般只需要查找三次就可以找到。科学家计算过，当负载因子(load factor)不超过75%，查找效率最高。

(4) 若对于关键字集合中的任一个关键字，经散列函数映象到地址集合中任何一个地址的概率是相等的，则称此类散列函数为均匀散列函数（Uniform Hash function），这就是使关键字经过散列函数得到一个“随机的地址”，从而减少冲突。

哈希表简单实例：

已知线性表的关键字集合为：

S = {and,begin,do,end,for,C++的哈希算法库 hashlib++ iis7站长之家,if,then,until }

则可设哈希表为：

char HT[26][8]

哈希函数H(key)的值，可取关键字key中第一个字母在字母表中的序号（0~25），即 H(key) = key[0]- 'a'.

哈希函数是一个映射，其设定可以很灵活，只要使得任何关键字的哈希函数值都落在表长允许范围内即可。

对不同关键字可能得到同一哈希地址，这一现象称为"冲突"，而发生冲突的关键字对于该哈希函数来说，称为"同义词"。因关键字集合比哈希表长度大，故冲突不可避免。

您可能感兴趣的文章:

本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术，将尽最大努力为读者提供更好的信息聚合和浏览方式。
本站(WWW.)站内文章除注明原创外，均为转载,整理或搜集自网络.欢迎任何形式的转载，转载请注明出处.
转载请注明：文章转载自:[169IT-IT技术资讯]
本文标题:哈希表及其概念

相关文章推荐: