当前位置:网站首页>二叉排序树与 set、map
二叉排序树与 set、map
2022-08-02 14:10:00 【WANGHAOXIN364】
前置知识:二叉树的概念及性质
为了保证学习效果,请保证已经掌握前置知识之后,再来学习本章节!
学习目标
- 理解二叉排序树的概念
- 理解二叉排序树的查找、插入、删除、构建和简单平衡的过程
- 掌握 STL 的容器
map
、set
的使用方法及其用途
二叉排序树的概念
二叉排序树(Binary Sort Tree),又称二叉查找树(Binary Search Tree)、二叉搜索树,是指一棵空树,或者是具有下列性质的二叉树:
- 若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值。
- 若它的右子树不空,则右子树上所有结点的值均大于它的根结点的值。
- 它的左、右子树也分别为二叉排序树。
- 没有键值相同的结点。
转存失败重新上传取消
二叉搜索树作为一种经典的数据结构,它既有链表的快速插入与删除操作的特点,又有数组快速查找的优势。二叉排序树是基础性数据结构,用于构建更为抽象的期望数据结构,比如 set(集合)、multiset、map(关联数组)、multimap等。
二叉排序树有一个很重要的性质: 中序遍历二叉排序树可以得到一个关键字的递增序列。这也是为什么它叫二叉排序树的原因。
二叉排序树的操作
二叉排序树的查找、插入、删除的复杂度等于树高,期望复杂度均为 O(\log_2 n)O(log2n),当数列有序时,二叉排序树退化成线性表,此时最坏,复杂度为 O(n)O(n)。
虽然二叉排序树的最坏效率是 O(n)O(n),但它支持动态查询,且有很多改进版的二叉排序树可以使树高为 O(\log_2 n)O(log2n),如 Treap、Splay、SBT(Size Balanced Tree)、AVL树(平衡树)、红黑树等。这些将在后面学习。
查找
在二叉排序树 b 中查找元素 x 的算法:
(1)若 b 是空树,则查找失败;否则执行(2)。
(2)若 x 等于 b 的根结点的数据域之值,则查找成功;否则执行(3)。
(3)若 x 小于 b 的根结点的数据域之值,则搜索左子树;否则执行(4)。
(4)查找右子树。
插入
向二叉排序树 b 中插入一个结点 s 的算法:
(1)若 b 是空树,则将 s 所指结点作为根结点插入;否则执行(2)。
(2)若 s->data 等于 b 的根结点的数据域之值,则返回;否则执行(3)
(3)若 s->data 小于 b 的根结点的数据域之值,则把 s 插入到左子树中;否则执行(4)。
(4)把s所指结点插入到右子树中。(新插入结点总是叶子结点)
删除
在二叉查找树删去一个结点 *p,分三种情况讨论:
(1)若 *p 结点为叶子结点,即 PL(左子树)和 PR(右子树)均为空树,由于删去叶子结点不破坏整棵树的结构,则只需修改其双亲结点的指针即可。
(2)若 *p 结点只有左子树 PL 或右子树 PR,此时只要令 PL 或 PR 直接成为其双亲结点 *f 的左子树(当 *p 是左子树)或右子树(当 *p 是右子树)即可,做此修改也不破坏二叉查找树的特性。
(3)若 *p 结点的左子树和右子树均不空,在删去 *p 之后,为保持其他元素之间的相对位置不变,可按中序遍历保持有序进行调整,可以令 *p 的直接前驱(in-order successor)替代 *p,然后再从二叉查找树中删去它的直接前驱。直接前驱就是指:从 *p 的左儿子开始,如果有右儿子,则不断向右继续查找,否则就找到了直接前驱。由于它的直接前驱最多只有一个儿子,因此可以按照方法 2 删除,例如下图所示。(备注:同理,也可以令 *p 的直接后继承去替代 *p,方法是类似的)
转存失败重新上传取消
代码实现将在今后学习,现在只需理解概念和原理。
STL 关联容器
在关联容器中,对象的位置取决于和它关联的键的值。键可以是基本类型也可以是类类型。关联容器是与非关联容器(顺序容器)相对应的,顺序容器中元素的位置不依赖于元素的值,而是和该元素加入容器时的位置有关。关联容器的类型有下面八种:
// 按关键字有序保存元素,底层用二叉排序树及其优化后的红黑树实现
map 关联数组;保存关键字-值对
set 关键字即值,只保存关键字的容器
multimap 关键字可以重复出现的map
multiset 关键字可以重复出现的set
// 无序关联容器
unordered_map 用哈希函数组织的map,无序
unordered_set 用哈希函数组织的set,无序
unordered_multimap 哈希组织的map;关键字可以重复
unordered_multiset 哈希组织的set,关键字可以重复
Copy
集合—set
set 可以方便快速地实现排序和去重操作
set 的含义是集合,它是一个 有序 的容器,里面的元素都是排序好的,支持插入、删除、查找等操作,就像一个集合一样。所有的操作的都是严格在 O(\log n)O(logn) 时间之内完成,效率非常高。 set 和 multiset 的区别是:set 插入的元素不能相同,但是 multiset 可以相同。
操作
// 1- 定义
#include <set>
set<int> s; // 元素必须可比较大小,元素类型必须要支持 < 运算,结构体需要重载 <
// 2- 插入
s.insert(key); // 插入
// 3- 删除
s.erase(key); // 删除值为 key 的元素
s.erase(iter); // 删除迭代器 iter 指向的元素,例如 s.erase(s.begin());
s.erase(iter1, iter2); // 删除区间 [iter1, iter2) 的所有元素,例如 s.erase(s.begin(), s.end());
s.clear(); // 清空集合
// 4- 求大小
int siz = s.size(); // 求集合大小
bool flag = s.empty(); // 集合判空
// 5-查询
if(s.find(key) != s.end()) // find 函数返回一个指向被查找到元素的迭代器
cout << "exist" << endl;
if(s.count(key) == 1) // count 返回某个值元素的个数
cout << "exist" << endl;
set<int>::iterator iter = s.lower_bound(key); // 求 key 的下界,返回指向大于等于某值的第一个元素的迭代器
set<int>::iterator iter = s.upper_bound(key); // 求 key 的上界,返回大于某个值元素的迭代器
// auto 类型推断关键字 在NOI系列比赛中无法使用!
auto iter = s.lower_bound(key); // 求 key 的下界,返回指向大于等于某值的第一个元素的迭代器
auto iter = s.upper_bound(key); // 求 key 的上界,返回大于某个值元素的迭代器
// 6-遍历
set<int>::iterator iter; // 正向遍历
for(iter=s.begin(); iter!=s.end(); iter++)
{
cout<<*iter<<endl;
}
set<int>::reverse_iterator riter; // 反向遍历
for(riter=s.rbegin(); riter!=s.rend(); riter++)
{
cout<<*riter<<endl;
}
// 7- 求最值
set<int>::iterator it = s.begin(); // 最小值
cout << *it << endl;
set<int>::iterator it = s.end(); // 最大值
cout << *(--it) << endl;
/*
注意:
1. set 和优先队列一样,其中的元素必须支持 < 运算符
2. set 的迭代器支持 ++、--、==、!=、*iter 等操作
3. set 的迭代器不支持 +、-、 +=、-= 等算术操作符,也不支持 >、<、>=、<= 等比较操作符
*/
// ..... 还有很多,请自行查阅相关资料
Copy
应用
实现 01 标记:元素类型任意(string)、大小不受限
01 桶标记:元素只能是整型,并且元素大小受限
可重集合—multiset
multiset<>
使用方法和 set<>
相同,区别是键值可重复。
关联数组—map
map 是一个 关键字—值 对的集合,适用于处理一对一的具有映射关系的数据
map<key,value>
提供一对一的数据处理能力,由于这个特性,它完成有可能在我们处理一对一数据的时候,在编程上提供快速通道。map 中的第一个值称为关键字(key),每个关键字只能在 map 中出现一次,第二个称为该关键字的值(value),可以重复。
map 内部自建一颗红黑树(一 种非严格意义上的平衡二叉树),这颗树具有对数据自动排序的功能,所以在 map 内部所有的数据都是有序的。
映射
// 定义,以 string, int 对为例
#include <map>
map<string, int> mp; // 底层是红黑树,元素可比较大小,key 的结构体要重载 < 运算
// 2- 插入
mp.insert(make_pair("lcj", 18)); // 插入一个键值对,若原先存在该 key,则无法插入和覆盖
mp.insert(pair<string,int>("lcj", 18)); // 插入一个键值对,若原先存在该 key,则无法插入和覆盖
mp["lcj"] = 18; // 甚至可以类似数组下标去访问 key 对应的 value,若原先不存在该 key,则创建,若原先存在,则覆盖以前该关键字对应的值
mp.emplace("lcj", 18); // 插入效果跟 insert 效果一样,若原先存在该 key,则无法插入和覆盖
// 3- 删除
mp.erase(key); // 删除值为 key 的元素
mp.erase(iter); // 删除迭代器 iter 指向的元素,例如 mp.erase(mp.begin());
mp.erase(iter1, iter2); // 删除区间 [iter1, iter2) 的所有元素,例如 mp.erase(mp.begin(), mp.end());
mp.clear(); // 清空集合
// 3- 求大小
int siz = mp.size(); // 求集合大小
bool flag = mp.empty(); // 集合判空
// 4-查询
if(mp.find(key) != mp.end()) // find 函数返回一个指向被查找到元素的迭代器
cout << mp[key] << endl;
if(mp.count(key)) // count 返回某个值元素的个数
cout << mp[key] << endl;
auto iter = mp.lower_bound(key); // 求 key 的下界,返回指向大于等于某值的第一个元素的迭代器
auto iter = mp.upper_bound(key); // 求 key 的上界,返回大于某个值元素的迭代器
// 5-遍历
map<string, int>::iterator iter; // 正向遍历
for(iter=mp.begin(); iter!=mp.end(); iter++)
{
cout << iter->first << " " << iter->second << endl;
// 或者
cout << (*iter).first << " " << (*iter).second << endl;
}
map<int>::reverse_iterator riter; // 反向遍历
for(riter=mp.rbegin(); riter!=mp.rend(); riter++)
{
// 遍历的同时修改
iter->second += 10;
cout << iter->first << " " << iter->second << endl;
}
for (auto x : mp){ // C++ 11 auto 遍历,NOI Linux 编译器老旧不支持!
cout << x.first << " " << x.second << endl;
}
for (auto& x : mp){ // C++ 11 auto 遍历,NOI Linux 编译器老旧不支持!
x.second += 10; // 遍历并修改
cout << x.first << " " << x.second << endl;
}
// 6- 求最值
map<string, int>::iterator it = mp.begin(); // 最小值
cout << *it << endl;
map<string, int>::iterator it = mp.end(); // 最大值
cout << *(--it) << endl;
/*
1. map 和 set 一样,其中的元素必须支持 < 运算符
2. 在插入时,使用 insert 和 用数组方式去插入,在原先存在要插入的键值时是有区别的,insert不会插入,用数组方式插入则会直接覆盖原先数据
3. map 的迭代器支持 ++、--、==、!=、(*iter).first、 (*iter).second、iter->first、 iter->second 等操作
4. map 的迭代器不支持 +、-、 +=、-= 等算术操作符,也不支持 >、<、>=、<= 等比较操作符
*/
Copy
应用
所有之前学过的数组标记类题目都可以用 map 去实现!如果想练习更多 map 的使用,可以到数组标记类问题中去找。
实现计数标记:元素类型任意(string)、大小不受限
桶计数标记:元素只能是整型,并且元素大小受限
哈希(映射)
字符串统计类问题
常用 map 类型:map<string, int> mp;
、map<string, bool> mp;
、map<string, string> mp;
可重映射
multimap; 键值可重复,用法和 map 基本相同。需要注意的是:
multimap 不支持下标运算符,因为键并不能确定一个唯一元素。
和 map 相似,multimap 也不能使用 at() 函数。
练习题
边栏推荐
- Cmd Markdown 公式指导手册
- DP1332E内置c8051的mcu内核NFC刷卡芯片国产兼容NXP
- Actual combat Meituan Nuxt +Vue family bucket, server-side rendering, mailbox verification, passport authentication service, map API reference, mongodb, redis and other technical points
- Win11怎么在右键菜单添加一键关机选项
- Mysql连接错误解决
- STM32LL库——USART中断接收不定长信息
- MATLAB绘图命令fimplicit绘制隐函数图形入门详解
- win10任务栏不合并图标如何设置
- Please make sure you have the correct access rights and the repository exists.问题解决
- Introduction to MATLAB drawing functions ezplot explanation
猜你喜欢
How to simulate 1/3 probability with coins, and arbitrary probability?
STM32LL库使用——SPI通信
推开机电的大门《电路》(一):电压,电流,参考方向
What should I do if the Win10 system sets the application identity to automatically prompt for access denied?
Redis的线程模型
Codeforces Round #605 (Div. 3)
win10 system update error code 0x80244022 how to do
The SSE instructions into ARM NEON
What should I do if I install a solid-state drive in Win10 and still have obvious lags?
如何用硬币模拟1/3的概率,以及任意概率?
随机推荐
奇技淫巧-位运算
CMAKE
mysql的索引结构为什么选用B+树?
推开机电的大门《电路》(一):电压,电流,参考方向
二叉树遍历之后序遍历(非递归、递归)入门详解
总结计算机网络超全面试题
Publish module to NPM should be how to operate?Solutions to problems and mistake
Mysql之MVCC
DP1332E刷卡芯片支持NFC内置mcu智能楼宇/终端poss机/智能门锁
质数相关问题-小记
背包问题-动态规划-理论篇
How to solve Win11 without local users and groups
Redis常见面试题
win10系统更新错误代码0x80244022怎么办
1.开发社区首页,注册
KiCad常用快捷键
The SSE instructions into ARM NEON
Flink + sklearn - use JPMML implement flink deployment on machine learning model
Letter combination of LeetCode2 phone number
实战美团Nuxt +Vue全家桶,服务端渲染,邮箱验证,passport鉴权服务,地图API引用,mongodb,redis等技术点