当前位置:网站首页>Partition table (1)
Partition table (1)
2022-08-03 09:03:00 【51CTO】
一、概念
1.为什么要分表和分区?
日常开发中我们经常会遇到大表的情况,所谓的大表是指存储了百万级乃至千万级条记录的表.这样的表过于庞大,导致数据库在查询和插入的时候耗时太长,性能低下,如果涉及联合查询的情况,性能会更加糟糕.分表和表分区的目的就是减少数据库的负担,提高数据库的效率,通常点来讲就是提高表的增删改查效率.
2.什么是分表?
分表是将一个大表按照一定的规则分解成多张具有独立存储空间的实体表,我们可以称为子表,每个表都对应三个文件,MYD数据文件,.MYI索引文件,.frm表结构文件.这些子表可以分布在同一块磁盘上,也可以在不同的机器上.app读写的时候根据事先定义好的规则得到对应的子表名,然后去操作它.
3.什么是分区?
分区和分表相似,都是按照规则分解表.不同在于分表将大表分解为若干个独立的实体表,而分区是将数据分段划分在多个位置存放,可以是同一块磁盘也可以在不同的机器.分区后,表面上还是一张表,但数据散列到多个位置了.app读写的时候操作的还是大表名字,db自动去组织分区的数据.
4.mysql分表和分区有什么联系呢?
(1)都能提高mysql的性高,在高并发状态下都有一个良好的表现.
(2)分表和分区不矛盾,可以相互配合的,对于那些大访问量,并且表数据比较多的表,我们可以采取分表和分区结合的方式(如果merge这种分表方式,不能和分区配合的话,可以用其他的分表试),访问量不大,但是表数据很多的表,我们可以采取分区的方式等.
(3)分表技术是比较麻烦的,需要手动去创建子表,app服务端读写时候需要计算子表名.采用merge好一些,但也要创建子表和配置子表间的union关系.
(4)表分区相对于分表,操作方便,不需要创建子表.
二、分区
1.分区的类型:
(1)Range:把连续区间按范围划分
例:
(2)List:Divide discrete values into sets,Divide by collection,Suitable for tables with fixed value columns
例:
(3)Hash:随机分配,分区数固定
例:
(4)Key:类似Hash,The difference is only support1列或多列,且mysql提供自身的Hash函数
例:
2.分区管理
(1)新增分区
(2)删除分区
(3)分区的合并
下面的SQL,将p201701 - p201709 合并为3个分区p2017Q1 - p2017Q3
3.Partitions should be noted:
(1)when partitioning,Either do not define the primary key,Either add the partition field to the primary key.
(2)分区字段不能为NULL,要不然怎么确定分区范围呢,所以尽量NOT NULL
三、分表
1.垂直分表
Split the original table with many columns into multiple tables,原则是:
(1)把常用、Fields that are not commonly used are separated
(2)Store large fields independently in a table
2.水平分表
In order to solve the problem of too much data in a single table,The structure of each horizontally split table is exactly the same.
例:
(1)Structured by time
如果业务系统对时效性较高,比如新闻发布系统的文章表,可以把数据库设计成时间结构,按时间分有几种结构:
(a)平板式
表类似:
用年来分还是用月可自定,但用日期的话表就太多了,也没这必要.一般建议是按月分就可以.
这种分法,其难处在于,假设我要列20条数据,结果这三张表里都有2条,那么业务上很有可能要求读三次表.如果时间长了,有几十张表,而每张表是0条,那不就是要读完整个系统的表才行么?另外这个结构,要作分页是比较难实现的.
主键:在这个系统中,主键是13位带毫秒的时间戳,不要用自动编号,否则难以通过主键定位到表,也可以在查询时带上时间,但比较烦琐.
(b)归档式
表类似:
为了解决平板式的缺点,可以采用时间归档式设计,可以看到这个系统只有两张表.一张是旧文章表,一张是新文章表,新文章表放2个月的信息,每天定期把2
个月中的最早一天的文章归入旧表中.这样一方面可以解决性能问题,因为一般新闻发布系统读取的都是新的内容,旧的内容读取少;The second can be euphemistically solve functional problems
题,比如平板式所说的问题,在归档式中最多也只需要读2张表就完成了.
归档式的缺点在于旧表容量还是相对比较大,如果业务允许,可对旧表中的超旧内容进行再归档或直接清理掉.
(2)By block structure
如果按照文章的所属版块进行拆表,比如新闻、体育版块拆表,一方面可以使每个表数据量分离,另一方面是各版块之间相互影响可降到最低.假如新闻版块的数据表损坏或需要维护,并不会影响到体育版块的正常工作,从而降低了风险.版块结构同时常用于bbs这样的系统.
板块结构也有几种分法:
(a)对应式
对于版块数量不多,而且较为固定的形式,就直接对应就好.比如新闻版块,可以分出新闻的目录表,新闻的文章表等.
可看到每一个版块都对应着一组相同的表结构,好处就是一目了然.在功能上,因为版块之间还是有一些隔阂,所以需要联合查询的需求不多,开发上比时间结构的方式要轻松.
主键:依旧要考虑的,在这个系统中,主键是版块+时间戳,单纯的时间戳或自动编号也能用,查询时要记得带上版块用于定位表.
(b)冷热式
对应式的缺点是,如果版块数量很大而且不确定,那要分出的表数量就太多了.举个例子:百度贴吧,如果按一个词条一个表设计,那得有多少张表呢?
用这样的方式吧.
这个表汽车、火箭表是属于热门表,定义为新建的版块放在unite表里面,待到其超过一万张主贴的时候才开对应表结构.因为在贴吧这种系统中,Unpopular section
Definitely a lot more than the popular section,这些Unpopular section通常只有几张帖子,为它们开表也太浪费了;同时热门版块数量和访问量等,又比Unpopular section多得多,非常有特点.
unite表还可以扩展成哈希表,利用词条的md5编码,可以分成n张表,我算了一下,md5前一位可分36张表,两位即是1296张表,足够了.
(3)By hash structure
哈希结构通常用于博客之类的基于用户的场合,在博客这样的系统里有几个特点,1是用户数量非常多,2是每个用户发的文章数量都较少,3It is the user who posts the article indefinitely
期,4是每个用户发得不多,但总量仍非常之大.基于这些特点,用以上所说的任何一种分表方式都不合适,一没有固定的时效不宜用时间拆,二用户很多,而且还
Happens to be cold,所以也不宜用版块(用户)拆.
哈希结构在上面有所提及,既然按每个用户不好直接拆,那就把一群用户归进一个表好了.
如上所说,md5取前两位哈希可以达到1296张表,如果觉得不够,那就再加一位,总数可达46656张表,还不够?
表的数量太多,要创建这些表也是挺麻烦的,可以考虑在程序里往数据库insert之前,多执行一句判断表存在与否并创建表的语句,很实用,消耗也并不很大.
主键:依旧要考虑的,在这个系统中,主键是用户ID+时间戳,单纯的时间戳或自动编号也能用,但查询时要记得带上用户名用于定位表.
################
#####################
边栏推荐
猜你喜欢
PowerShell:执行 Install-Module 时,不能从 URI 下载
What are pseudo-classes and pseudo-elements?The difference between pseudo-classes and pseudo-elements
【LeetCode】112.路径总和
多媒体数据处理实验3:图像特征提取与检索
分区分表(一)
pytorch one-hot 小技巧
机器学习(公式推导与代码实现)--sklearn机器学习库
pytorch one-hot tips
响应式布局经典范例——巨幅背景大标题
二进制日志过期时间设置expire_logs_days
随机推荐
数仓4.0(一)
进程信息
013-二叉树
Alibaba Cloud SMS Sending
【LeetCode】101. Symmetric Binary Tree
数仓4.0(二)------ 业务数据采集平台
【论文笔记】一种基于启发式奖赏函数的分层强化学习方法
Redis分布式锁
【LeetCode】zj面试-把字符串转换成整数
FusionAccess软件架构、FusionAccess必须配置的四个组件、桌面发放流程、虚拟机组类型、桌面组类型
Exception: Dataset not found. Solution
HCIP练习(OSPF)
多媒体数据处理实验3:图像特征提取与检索
uni-app 顶部选项卡吸附效果 demo(整理)
uniapp swiper 卡片轮播 修改指示点样式效果demo(整理)
110道 MySQL面试题及答案 (持续更新)
Guava-字符串工具
LINGO 18.0 software installation package download and installation tutorial
固件工程师到底是干什么?
RViz报错: Error subscribing: Unable to load plugin for transport ‘compressed‘解决方法