精易论坛

标题: 聊聊精易模块收录的hashmap [打印本页]

作者: SoloCat    时间: 2019-7-24 09:01
标题: 聊聊精易模块收录的hashmap
原帖地址:http://bbs.eyuyan.com/read.php?tid=388960

根据作者给出的测试效率是

连续10万次不同内容存取效率为,存10万次共耗时约280ms ,取10万次共耗时约330ms 。


但是实际上,这个hashmap只适合于小量数据应用,并不适合于大数据应用。


虽然我没有测试,因为代码很明朗,完全也不需要测试。在数据不断增加的情况下。


我指的是数据量,而不是同时多少读 多少写。


举例:map有10W数据。读一次需要5ms,那如果这个数据量是50W ,可能读一次就需要10ms了


这个耗时并不仅限于同时多少读写 而是受数据量影响。

原因呢。是因为他计算hash索引后,指向的同hash索引是用数组来存储不同的键值的。


那也就意味着,hash索引一样的数据越多,他的这个数组的成员就越发的多。


而读取这个键值的代码,又是通过循环数组来对比键值的。可想而知,当map自身数据量多的情况下。哪怕只读一次也会耗时很久。




说这么多,不是否认这个hashmap不行,只是阐述一下,这样的hashmap并不是目前hashmap写法中效率和数据量最优的写法。


只需要把相同hash索引的键值用数组存储,改为用红黑树存储即可,也叫自平衡二叉查找树。


他的优点是可以在最坏情况下也可以做到对数据查找的一个低耗时

还是举例说下:假设一个数组里有1-1000个字符串。。如果需要寻找到其中一个,那用上面hashmap的方式的话
他的查找次数范围可能在1-10000之间循环  可能在第一个 也可能在最后一个。以最坏的情况来说他就是需要循环10000次


红黑树呢,他在10000个数据里面,同样也是数组存储。只需要1-100次cha询就可以找到任意数据。


虽然是举例说明,但是红黑树的优势显而易见,越是数据量大,越能体现红黑树的优势。


去年手撸了一个红黑树。完成了百分之80   增加 cha询 都搞定了。删除后来没写修正红黑树。  有时间重写一波,开源到论坛!




没事扯扯淡,志同道合的人太少了哈。





作者: 山河皆无恙    时间: 2019-7-24 09:08
牛逼~~~~~~~~~~~~~~~~~
作者: 就是那个秋    时间: 2019-7-24 10:39
就看见了倒数第二句话,XXXXX开源到论坛
作者: 花老板    时间: 2019-7-24 10:41
虽然不知道你在说什么 ,但是感觉好厉害
作者: zuandina    时间: 2019-7-24 18:39

牛逼~~~~~~~~~~~~~~~~~
作者: fuchenaa666    时间: 2024-7-23 15:46
厉害厉害厉害




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4