当前位置:网站首页>二叉排序树与 set、map

二叉排序树与 set、map

2022-08-02 14:10:00 WANGHAOXIN364

前置知识:二叉树的概念及性质

为了保证学习效果,请保证已经掌握前置知识之后,再来学习本章节!

学习目标

  • 理解二叉排序树的概念
  • 理解二叉排序树的查找、插入、删除、构建和简单平衡的过程
  • 掌握 STL 的容器 mapset 的使用方法及其用途

二叉排序树的概念

二叉排序树(Binary Sort Tree),又称二叉查找树(Binary Search Tree)、二叉搜索树,是指一棵空树,或者是具有下列性质的二叉树:

  1. 若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值。
  2. 若它的右子树不空,则右子树上所有结点的值均大于它的根结点的值。
  3. 它的左、右子树也分别为二叉排序树。
  4. 一般没有键值相同的结点,如下左图。(也存在键值可的二叉排序树,如下右图)

正在上传…重新上传取消

二叉搜索树作为一种经典的数据结构,它既有链表的快速插入与删除操作的特点,又有数组快速查找的优势。二叉排序树是基础性数据结构,用于构建更为抽象的期望数据结构,比如 set(集合)、multiset(可重复键值集合)、map(关联数组)、multimap(可重复键值关联数组)等。

二叉排序树有一个很重要的性质: 中序遍历二叉排序树可以得到一个关键字的递增序列。这也是为什么它叫二叉排序树的原因。

二叉排序树的操作

二叉排序树的查找、插入、删除的复杂度等于树高,期望复杂度均为 O(\log_2 n)O(log2​n),当数列有序时,二叉排序树退化成线性表,此时最坏,复杂度为 O(n)O(n)。

查找

在二叉排序树 b 中查找元素 x 的算法:

(1)若 b 是空树,则查找失败;否则执行(2)。

(2)若 x 等于 b 的根结点的数据域之值,则查找成功;否则执行(3)。

(3)若 x 小于 b 的根结点的数据域之值,则搜索左子树;否则执行(4)。

(4)查找右子树。

插入

向键值不可重复二叉排序树 b 中插入一个结点 s 的算法:

(1)若 b 是空树,则将 s 所指结点作为根结点插入;否则执行(2)。

(2)若 s->data 等于 b 的根结点的数据域之值,则不插入,直接返回;否则执行(3)

(3)若 s->data 小于 b 的根结点的数据域之值,则把 s 插入到左子树中;否则执行(4)。

(4)把s所指结点插入到右子树中。(新插入结点总是叶子结点)

键值可重复的二叉树(STL 中实现为 multiset),算法略。

删除

在二叉查找树删去一个结点 *p,分三种情况讨论:

(1)若 *p 结点为叶子结点,即 PL(左子树)和 PR(右子树)均为空树,由于删去叶子结点不破坏整棵树的结构,则只需修改其双亲结点的指针为空即可。

(2)若 *p 结点只有左子树 PL 或右子树 PR,此时只要令 PL 或 PR 直接成为其双亲结点 *f 的左子树(当 *p 是左子树)或右子树(当 *p 是右子树)即可,做此修改也不破坏二叉查找树的特性。

(3)若 *p 结点的左子树和右子树均不空,在删去 *p 之后,为保持其他元素之间的相对位置不变,可按中序遍历保持有序进行调整,可以令 *p 的直接前驱(in-order successor)替代 *p,然后再从二叉查找树中删去它的直接前驱。直接前驱就是指:从 *p 的左儿子开始,如果有右儿子,则不断向右继续查找,否则就找到了直接前驱。由于它的直接前驱最多只有一个儿子,因此可以按照方法 2 删除,例如下图所示。(备注:同理,也可以令 *p 的直接后继承去替代 *p,方法是类似的)

代码实现将在今后学习,现在只需理解概念和原理。

虽然二叉排序树的最坏效率是 O(n)O(n),但它支持动态查询,且有很多改进版的二叉排序树可以使树的高度稳定为 O(\log_2 n)O(log2​n),即操作时间复杂度为 O(\log_2 n)O(log2​n) 。如 Treap、Splay、SBT(Size Balanced Tree)、AVL树(平衡树)、红黑树等。这些将在后面学习,而下面将学习的 STL 关联容器 set 和 map 等都是基于这些改进版二叉排序树实现的数据结构,所以它们的时间复杂度都是 O(\log n)O(logn)。

STL 关联容器

STL 中有基于二叉排序树实现的一些数据结构—— set 和 map

在关联容器中,对象的位置取决于和它关联的键的值。键可以是基本类型也可以是类类型。关联容器是与非关联容器(顺序容器)相对应的,顺序容器中元素的位置不依赖于元素的值,而是和该元素加入容器时的位置有关。关联容器的类型有下面八种:

// 按关键字有序保存元素,底层用二叉排序树及其优化后的红黑树实现
map                      关联数组;保存关键字-值对
set                      关键字即值,只保存关键字的容器
multimap                 关键字可以重复出现的map
multiset                 关键字可以重复出现的set
 
// 无序关联容器
unordered_map            用哈希函数组织的map,无序
unordered_set            用哈希函数组织的set,无序
unordered_multimap       哈希组织的map;关键字可以重复
unordered_multiset       哈希组织的set,关键字可以重复

Copy

集合—set

set 可以方便快速地实现排序和去重操作

set 的含义是集合,它是一个 有序 的容器,里面的元素都是排序好的,支持插入、删除、查找等操作,就像一个集合一样。所有的操作的都是严格在 O(\log n)O(logn) 时间之内完成,效率非常高。 set 和 multiset 的区别是:set 插入的元素不能相同,但是 multiset 可以相同。

操作

// 1- 定义
#include <set>
set<int> s;     // 元素必须可比较大小,元素类型必须要支持 < 运算,结构体需要重载 <

// 2- 插入
s.insert(key);    // 插入

// 3- 删除
s.erase(key);     // 删除值为 key 的元素
s.erase(iter);    // 删除迭代器 iter 指向的元素,例如 s.erase(s.begin());
s.erase(iter1, iter2); // 删除区间 [iter1, iter2) 的所有元素,例如 s.erase(s.begin(), s.end());
s.clear();        // 清空集合

// 4- 求大小
int siz = s.size();         // 求集合大小
bool flag = s.empty();      // 集合判空

// 5-查询
if(s.find(key) != s.end())           // find 函数返回一个指向被查找到元素的迭代器
    cout << "exist" << endl;
if(s.count(key) == 1)               // count 返回某个值元素的个数
    cout << "exist" << endl;


set<int>::iterator iter = s.lower_bound(key);   // 求 key 的下界,返回指向大于等于某值的第一个元素的迭代器
set<int>::iterator iter = s.upper_bound(key);   // 求 key 的上界,返回大于某个值元素的迭代器

// auto 类型推断关键字 在NOI 系列比赛中也可以使用了
auto iter = s.lower_bound(key);   // 求 key 的下界,返回指向大于等于某值的第一个元素的迭代器
auto iter = s.upper_bound(key);   // 求 key 的上界,返回大于某个值元素的迭代器

// 6-遍历
set<int>::iterator iter;             // 正向遍历
for(iter=s.begin(); iter!=s.end(); iter++)
{
    cout<<*iter<<endl;
}
set<int>::reverse_iterator riter;    // 反向遍历,不重要
for(riter=s.rbegin(); riter!=s.rend(); riter++)
{
    cout<<*riter<<endl;
}

// 7- 求最值
set<int>::iterator it = s.begin();    // 最小值
cout << *it << endl;
set<int>::iterator it = s.end();      // 最大值
cout << *(--it) << endl;

/*
注意:
1. set 和优先队列一样,其中的元素必须支持 < 运算符
2. set 的迭代器支持 ++、--、==、!=、*iter 等操作
3. set 的迭代器不支持 +、-、 +=、-= 等算术操作符,也不支持 >、<、>=、<= 等比较操作符
*/

// ..... 还有很多,请自行查阅相关资料 

Copy

应用

实现 01 标记:元素类型任意(string)、大小不受限

01 桶标记:元素只能是整型,并且元素大小受限

可重集合—multiset

multiset<> 使用方法和 set<> 相同,区别是键值可重复。

关联数组—map

map 是一个 关键字—值 对的集合,适用于处理一对一的具有映射关系的数据

map<key,value>提供一对一的数据处理能力,由于这个特性,它完成有可能在我们处理一对一数据的时候,在编程上提供快速通道。map 中的第一个值称为关键字(key),每个关键字只能在 map 中出现一次,第二个称为该关键字的值(value),可以重复。

map 内部自建一颗红黑树(一 种非严格意义上的平衡二叉树),这颗树具有对数据自动排序的功能,所以在 map 内部所有的数据都是有序的。

映射

// 定义,以 string, int 对为例
#include <map>
map<string, int> mp;     // 底层是红黑树,元素可比较大小,key 的结构体要重载 < 运算

// 2- 插入
mp.insert(make_pair("lcj", 18));        // 插入一个键值对,若原先存在该 key,则无法插入和覆盖
mp.insert(pair<string,int>("lcj", 18)); // 插入一个键值对,若原先存在该 key,则无法插入和覆盖
mp["lcj"] = 18;                         // 甚至可以类似数组下标去访问 key 对应的 value,若原先存在该 key,则创建,若原先存在,则覆盖以前该关键字对应的值
mp.emplace("lcj", 18);                  // 插入效果跟 insert 效果完全一样

// 3- 删除
mp.erase(key);     // 删除值为 key 的元素
mp.erase(iter);    // 删除迭代器 iter 指向的元素,例如 mp.erase(mp.begin());
mp.erase(iter1, iter2); // 删除区间 [iter1, iter2) 的所有元素,例如 mp.erase(mp.begin(), mp.end());
mp.clear();        // 清空集合

// 3- 求大小
int siz = mp.size();         // 求集合大小
bool flag = mp.empty();      // 集合判空

// 4-查询
if(mp.find(key) != mp.end())           // find 函数返回一个指向被查找到元素的迭代器
    cout << mp[key] << endl;
if(mp.count(key))                // count 返回某个值元素的个数
    cout << mp[key] << endl;
auto iter = mp.lower_bound(key);   // 求 key 的下界,返回指向大于等于某值的第一个元素的迭代器
auto iter = mp.upper_bound(key);   // 求 key 的上界,返回大于某个值元素的迭代器

// 5-遍历
map<string, int>::iterator iter;             // 正向遍历
for(iter=mp.begin(); iter!=mp.end(); iter++)
{
    cout << iter->first << " " << iter->second << endl;
    // 或者
    cout << (*iter).first << " " << (*iter).second << endl;
}
map<int>::reverse_iterator riter;    // 反向遍历
for(riter=mp.rbegin(); riter!=mp.rend(); riter++)
{
    // 遍历的同时修改
    iter->second += 10;
    cout << iter->first << " " << iter->second << endl;
}
for (auto x : mp){               // C++ 11 auto 遍历,NOI Linux 编译器老旧不支持!
    cout << x.first << " " << x.second << endl;
}
for (auto& x : mp){               // C++ 11 auto 遍历,NOI Linux 编译器老旧不支持!
    x.second += 10;   // 遍历并修改
    cout << x.first << " " << x.second << endl;
}

// 6- 求最值
map<string, int>::iterator it = mp.begin();    // 最小值
cout << *it << endl;
map<string, int>::iterator it = mp.end();      // 最大值
cout << *(--it) << endl;

/*
1. map 和 set 一样,其中的元素必须支持 < 运算符
2. 在插入时,使用 insert 和 用数组方式去插入,在原先存在要插入的键值时是有区别的,insert不会插入,用数组方式插入则会直接覆盖原先数据
3. map 的迭代器支持 ++、--、==、!=、(*iter).first、 (*iter).second、iter->first、 iter->second 等操作
4. map 的迭代器不支持 +、-、 +=、-= 等算术操作符,也不支持 >、<、>=、<= 等比较操作符
*/

Copy

应用

所有之前学过的数组标记类题目都可以用 map 去实现!如果想练习更多 map 的使用,可以到数组标记类问题中去找。

实现计数标记:元素类型任意(string)、大小不受限

桶计数标记:元素只能是整型,并且元素大小受限

哈希(映射)

字符串统计类问题

常用 map 类型:map<string, int> mp;map<string, bool> mp;map<string, string> mp;

可重映射

multimap; 键值可重复,用法和 map 基本相同。需要注意的是:multimap 不支持下标运算符,因为键并不能确定一个唯一元素。

练习题

附 STL 总结 & 二元组

STL 三大模块:

  1. 容器: vector, queue, stack, set, map, ...
  2. 算法: sort(), reverse(), lowerbound(), upperbound() binarysearch(), unique(), *maxelement(), next_permutation()
  3. 迭代器:用来支持 容器和算法进行操作

    容器类型<数据类型>::iterator 变量名;

    两个常用的迭代器:
    .begin()
    .end()

  4. 利用迭代器求有序容器最值:

cout << *(s.begin()) << endl;
cout << *(s.end()-1) << endl;

Copy

  1. 利用迭代器 + sort() 对容器排序:
sort(a.begin(), a.end()) 

Copy

pair : 二元组

pair<int,int> pos;
pos.first = 1;
pos.second = 1; 
a = make_pair(1,1);
a = pair<int,int>(1,1);

Copy

 

原网站

版权声明
本文为[WANGHAOXIN364]所创,转载请带上原文链接,感谢
https://blog.csdn.net/WANGHAOXIN364/article/details/125020397