精易论坛

标题: 聊聊精易模块收录的hashmap [打印本页]

作者: SoloCat 时间: 2019-7-24 09:01
标题: 聊聊精易模块收录的hashmap
原帖地址：http://bbs.eyuyan.com/read.php?tid=388960

根据作者给出的测试效率是

连续10万次不同内容存取效率为，存10万次共耗时约280ms ,取10万次共耗时约330ms 。

但是实际上，这个hashmap只适合于小量数据应用，并不适合于大数据应用。

虽然我没有测试，因为代码很明朗，完全也不需要测试。在数据不断增加的情况下。

我指的是数据量，而不是同时多少读多少写。

举例：map有10W数据。读一次需要5ms，那如果这个数据量是50W ，可能读一次就需要10ms了

这个耗时并不仅限于同时多少读写而是受数据量影响。

原因呢。是因为他计算hash索引后，指向的同hash索引是用数组来存储不同的键值的。

那也就意味着，hash索引一样的数据越多，他的这个数组的成员就越发的多。

而读取这个键值的代码，又是通过循环数组来对比键值的。可想而知，当map自身数据量多的情况下。哪怕只读一次也会耗时很久。

说这么多，不是否认这个hashmap不行，只是阐述一下，这样的hashmap并不是目前hashmap写法中效率和数据量最优的写法。

只需要把相同hash索引的键值用数组存储，改为用红黑树存储即可，也叫自平衡二叉查找树。

他的优点是可以在最坏情况下也可以做到对数据查找的一个低耗时

还是举例说下：假设一个数组里有1-1000个字符串。。如果需要寻找到其中一个，那用上面hashmap的方式的话
他的查找次数范围可能在1-10000之间循环可能在第一个也可能在最后一个。以最坏的情况来说他就是需要循环10000次

红黑树呢，他在10000个数据里面，同样也是数组存储。只需要1-100次cha询就可以找到任意数据。

虽然是举例说明，但是红黑树的优势显而易见，越是数据量大，越能体现红黑树的优势。

去年手撸了一个红黑树。完成了百分之80 增加 cha询都搞定了。删除后来没写修正红黑树。有时间重写一波，开源到论坛！

没事扯扯淡，志同道合的人太少了哈。

作者: 山河皆无恙 时间: 2019-7-24 09:08
牛逼~~~~~~~~~~~~~~~~~

作者: 就是那个秋 时间: 2019-7-24 10:39
就看见了倒数第二句话，XXXXX开源到论坛

作者: 花老板 时间: 2019-7-24 10:41
虽然不知道你在说什么，但是感觉好厉害

作者: zuandina 时间: 2019-7-24 18:39

牛逼~~~~~~~~~~~~~~~~~

作者: fuchenaa666 时间: 2024-7-23 15:46
厉害厉害厉害

欢迎光临精易论坛 (https://125.confly.eu.org/)