|
原帖地址:http://bbs.eyuyan.com/read.php?tid=388960
根据作者给出的测试效率是
连续10万次不同内容存取效率为,存10万次共耗时约280ms ,取10万次共耗时约330ms 。
但是实际上,这个hashmap只适合于小量数据应用,并不适合于大数据应用。
虽然我没有测试,因为代码很明朗,完全也不需要测试。在数据不断增加的情况下。
我指的是数据量,而不是同时多少读 多少写。
举例:map有10W数据。读一次需要5ms,那如果这个数据量是50W ,可能读一次就需要10ms了
这个耗时并不仅限于同时多少读写 而是受数据量影响。
原因呢。是因为他计算hash索引后,指向的同hash索引是用数组来存储不同的键值的。
那也就意味着,hash索引一样的数据越多,他的这个数组的成员就越发的多。
而读取这个键值的代码,又是通过循环数组来对比键值的。可想而知,当map自身数据量多的情况下。哪怕只读一次也会耗时很久。
说这么多,不是否认这个hashmap不行,只是阐述一下,这样的hashmap并不是目前hashmap写法中效率和数据量最优的写法。
只需要把相同hash索引的键值用数组存储,改为用红黑树存储即可,也叫自平衡二叉查找树。
他的优点是可以在最坏情况下也可以做到对数据查找的一个低耗时
还是举例说下:假设一个数组里有1-1000个字符串。。如果需要寻找到其中一个,那用上面hashmap的方式的话
他的查找次数范围可能在1-10000之间循环 可能在第一个 也可能在最后一个。以最坏的情况来说他就是需要循环10000次
红黑树呢,他在10000个数据里面,同样也是数组存储。只需要1-100次cha询就可以找到任意数据。
虽然是举例说明,但是红黑树的优势显而易见,越是数据量大,越能体现红黑树的优势。
去年手撸了一个红黑树。完成了百分之80 增加 cha询 都搞定了。删除后来没写修正红黑树。 有时间重写一波,开源到论坛!
没事扯扯淡,志同道合的人太少了哈。
|
|