STL容器之map与hash_map
一、简介
创新互联公司是专业的从江网站建设公司,从江接单;提供网站制作、成都网站制作,网页设计,网站设计,建网站,PHP网站建设等专业做网站服务;采用PHP框架,可快速的进行从江网站开发网页制作和功能扩展;专业做搜索引擎喜爱的网站,专业的做网站团队,希望更多企业前来合作!
就应用来说,map已经是STL标准库的成员,而hash_map暂时还未进入标准库,是扩展ext中的一个功能,但也是非常常用并且非常重要的库。
二、简单对比
首先,要说的是这两种数据结构的都提供了KEY-VALUE的存储和查找的功能。但是实现是不一样的,map是用的红黑树,查询时间复杂度为log(n)。而hash_map是用的哈希表,查询时间复杂度理论上可以是常数,但是消耗内存大,是一种以存储换时间的方法。
树查找,在总查找效率上比不上hash表,但是它很稳定,它的算法复杂度不会出现波动。在一次查找中,你可以断定它最坏的情况下其复杂度不会超过O(log2N)。而hash表就不一样,是O(1),还是O(N),或者在其之间,你并不能把握。
三、hash_map的使用
可见,如果定义完整的hash_map,需要提供
1> 定义__gnu_cxx::hash_map
namespace __gnu_cxx { template <> struct hash{ size_t operator()(const string &s) const { return __stl_hash_string(s.c_str()); } }; }
2> 第四个参数key相等判断函数的意义
int main() { __gnu_cxx::hash_mapmyHashMap; char name1[10] = "zhu"; char name2[10] = "zhu"; myHashMap[name1] = 1; __gnu_cxx::hash_map ::iterator it = myHashMap.find(name2); if (it == myHashMap.end()) cout << "not find" << endl; return 0; }
你会发现,虽然name1和name2都是zhu,但是插入了name1,用name2去查找时,还是查无结果。这是涉及到第四个模板参数,判断key相等,默认的是std::equal_to,而这个函数的定义是用operator==来进行判断的,指针的相等当然就是地址一样了,而name1和name2的地址显然不同。解决办法是用自己指定的函数模板替代默认的。
#include#include #include #include using namespace std; template struct my_equal_to : public binary_function<_Tp, _Tp, bool> { bool operator()(const _Tp& __x, const _Tp& __y) const { return strcmp(__x, __y) == 0; } }; int main() { __gnu_cxx::hash_map , my_equal_to > myHashMap; char name1[10] = "zhu"; char name2[10] = "zhu"; myHashMap[name1] = 1; __gnu_cxx::hash_map , my_equal_to >::iterator it = myHashMap.find(name2); if (it == myHashMap.end()) cout << "not find" << endl; else cout << it->second << endl; return 0; }
用刚刚特化的hash_map
编译使用-Wno-deprecated选项,不然会有backward_warning.h头文件里的告警。
四、肤浅的对比测试(map,系统hash函数的hash_map及自写hash函数的hash_map)
[zhuhuifeng@localhost ~]$ cat /tmp/name.txt | wc -l 25848136 #从现有的游戏数据库里拉了561916个角色名(里面本来就有重复的),然后重复追加了几次,变成了 #2584万行的数据
1.系统hash函数的hash_map实现
#include#include #include #include using namespace std; //特化hash函数的string版本 namespace __gnu_cxx { template <> struct hash { size_t operator()(const string &s) const { return __stl_hash_string(s.c_str()); } }; } //计算当前时间 void curTime() { time_t aTime = time(NULL); struct tm * curtime = localtime(&aTime); char ctemp[20]; strftime(ctemp, 20, "%Y-%m-%d %H:%M:%S" , curtime); cout< fileMap; string temp; //存放每行的临时字符串 int i = 0; //统计总个数 ifstream in; in.open("/tmp/name.txt", ifstream::in); if (!in) { cout << "open file failed" << endl; return 1; } curTime(); //从这里开始计时 while (in >> temp) { if (fileMap.find(temp) == fileMap.end()) { ++i; fileMap[temp] = i; } } curTime(); //计时结束 cout << i << endl; in.close(); return 0; }
#编译 [zhuhuifeng@localhost ~]$ g++ -Wno-deprecated 3.cpp -o hashMap
2.自写hash函数的hash_map
#include#include #include #include using namespace std; struct strHash{ size_t operator()(const string& str) const { unsigned long __h = 0; for (size_t i = 0 ; i < str.size() ; i ++) __h = 107*__h + str[i]; return size_t(__h); } }; void curTime() { time_t aTime = time(NULL); struct tm * curtime = localtime(&aTime); char ctemp[20]; strftime(ctemp, 20, "%Y-%m-%d %H:%M:%S" , curtime); cout< fileMap; string temp; int i = 0; ifstream in; in.open("/tmp/name.txt", ifstream::in); if (!in) { cout << "open file failed" << endl; return 1; } curTime(); while (in >> temp) { if (fileMap.find(temp) == fileMap.end()) { ++i; fileMap[temp] = i; } } curTime(); cout << i << endl; in.close(); return 0; }
#编译 [zhuhuifeng@localhost ~]$ g++ -Wno-deprecated 4.cpp -o strhashMap
3.STL的map
#include#include #include #include
#编译 [zhuhuifeng@localhost ~]$ g++ 2.cpp -o map
4.执行查看结果
[zhuhuifeng@localhost ~]$ ./hashMap #7秒 2015-11-06 16:25:41 2015-11-06 16:25:48 459256 [zhuhuifeng@localhost ~]$ ./strhashMap #8秒,和上面的相差无几 2015-11-06 16:25:50 2015-11-06 16:25:58 459256 [zhuhuifeng@localhost ~]$ ./map #26秒 2015-11-06 16:26:02 2015-11-06 16:26:28 459256
五、总结
这个测试仅仅是个人娱乐,并没有什么实际价值。最后就是一句话,hash_map是基于hash_table实现的,而hash_table是把以双刃剑,用的好效率很高O(1),用的不好奔着O(N)就去了。
六、注意hash_map死循环
这个问题简单说来,就是gnu的实现是,内部有个_M_Cur指针指示当前位置A,每次计算operator++,都用当前位置的key调用hash函数计算下一个位置B,如果key传入hash_map以后,又在外部将其内容破坏,导致hash函数计算后的B位置在A位置之前,那么从B到达A以后,又会跳回B,形成B-A区间的死循环。
#include#include #include using namespace std; int main() { __gnu_cxx::hash_map hashMap; char name[10] = "zhu"; hashMap.insert(pair (name, 1)); strncpy(name, "wang", 10); //在外部改变了已经传入hash_map中的key,导致死循环 for (__gnu_cxx::hash_map ::iterator it = hashMap.begin(); it != hashMap.end(); ++it) { cout << it->first << " " << it->second << endl; } return 0; }
分享名称:STL容器之map与hash_map
当前链接:http://pwwzsj.com/article/pgsijj.html