相信很多小伙伴在面试中都被问过「为什么要用缓存?」,大部分人都是回答:「减少数据库的磁盘IO
压力」。
但是MySQL
真的有如此不堪吗?
每次增删改查都要去走磁盘IO
吗?
今天就聊聊InnoDB
对Buffer Pool
的奇思妙想。
先梳理出问题,再思考如何解决问题。
假设我们就是InnoDB
,我们要如何去解决磁盘IO
问题?
这个简单,做缓存就好了,所以MySQL
需要申请一块内存空间,这块内存空间称为Buffer Pool
。
Buffer Pool
是申请下来了,但是Buffer Pool
里面放什么,要怎么规划?
MySQL
数据是以页为单位,每页默认16KB
,称为数据页,在Buffer Pool
里面会划分出若干个缓存页与数据页对应。
感觉还少了点什么,我们如何知道缓存页对应那个数据页呢?
所有还需要缓存页的元数据信息,可以称为描述数据,它与缓存页一一对应,包含一些所属表空间、数据页的编号、Buffer Pool
中的地址等等。
后续对数据的增删改查都是在Buffer Pool
里操作
可能有小伙伴担心,MySQL
宕机了,数据不就全丢了吗?
这个不用担心,因为InnoDB
提供了WAL
技术(Write-Ahead Logging),通过redo log
让MySQL
拥有了崩溃恢复能力。
再配合空闲时,会有异步线程做缓存页刷盘,保证数据的持久性与完整性。
如果不能理解redo log
是如何恢复数据的,可以看看阿星前面两篇文章
另外,直接更新数据的缓存页称为脏页,缓存页刷盘后称为干净页
MySQL
数据库启动时,按照设置的Buffer Pool
大小,去找操作系统申请一块内存区域,作为Buffer Pool
(假设申请了512MB)。
申请完毕后,会按照默认缓存页的16KB
以及对应的800Byte
的描述数据,在Buffer Pool
中划分出来一个一个的缓存页和它们对应的描述数据。
MySQL
运行起来后,会不停的执行增删改查,需要从磁盘读取一个一个的数据页放入Buffer Pool
对应的缓存页里,把数据缓存起来,以后就可以在内存里执行增删改查。
但是这个过程必然涉及一个问题,哪些缓存页是空闲的?
为了解决这个问题,我们使用链表结构,把空闲缓存页的描述数据放入链表中,这个链表称为free
链表。
针对free
链表我们要做如下设计
free
基础节点free
节点指针最终呈现出来的,是由空闲缓存页的描述数据组成的free
链表。
有了free
链表之后,我们只需要从free
链表获取一个描述数据,就可以获取到对应的缓存页。
往描述数据与缓存页写入数据后,就将该描述数据移出free
链表。
数据页是缓存进去了,但是又一个问题来了。
下次查询数据时,如何在Buffer Pool
里快速定位到对应的缓存页呢?
难道需要一个非空闲的描述数据链表,再通过表空间号+数据页编号遍历查找吗?
这样做也可以实现,但是效率不太高,时间复杂度是O(N)
。
所以我们可以换一个结构,使用哈希表来缓存它们间的映射关系,时间复杂度是O(1)
。
表空间号+数据页号,作为一个key
,然后缓存页的地址作为value
。
每次加载数据页到空闲缓存页时,就写入一条映射关系到缓存页哈希表中。
后续的查询,就可以通过缓存页哈希表路由定位了。
还记得之前有说过「空闲时会有异步线程做缓存页刷盘,保证数据的持久性与完整性」吗?
新问题来了,难道每次把Buffer Pool
里所有的缓存页都刷入磁盘吗?
当然不能这样做,磁盘IO
开销太大了,应该把脏页刷入磁盘才对(更新过的缓存页)。
可是我们怎么知道,那些缓存页是脏页?
很简单,参照free
链表,弄个flush
链表出来就好了,只要缓存页被更新,就将它的描述数据加入flush
链表。
针对flush
链表我们要做如下设计
flush
基础节点flush
节点指针
最终呈现出来的,是由更新过数据的缓存页描述数据组成的flush
链表。
后续异步线程都从flush
链表刷缓存页,当Buffer Pool
内存不足时,也会优先刷flush
链表里的缓存页。
目前看来Buffer Pool
的功能已经比较完善了。
但是仔细思考下,发现还有一个问题没处理。
MySQL
数据库随着系统的运行会不停的把磁盘上的数据页加载到空闲的缓存页里去,因此free
链表中的空闲缓存页会越来越少,直到没有,最后磁盘的数据页无法加载。
为了解决这个问题,我们需要淘汰缓存页,腾出空闲缓存页。
可是我们要优先淘汰那些缓存页?总不能一股脑直接全部淘汰吧?
这里就要借鉴LRU
算法思想,把最少使用的缓存页淘汰(命中率低),提供LRU
链表出来。
针对LRU
链表我们要做如下设计
LRU
基础节点LRU
节点指针实现思路也很简单,只要是查询或修改过缓存页,就把该缓存页的描述数据放入链表头部,也就说近期访问的数据一定在链表头部。
当free
链表为空的时候,直接淘汰LRU
链表尾部缓存页即可。
麻雀虽小五脏俱全,基本Buffer Pool
里与缓存页相关的组件齐全了。
但是缓存页淘汰这里还有点问题,如果仅仅只是使用LRU
链表的机制,有两个场景会让热点数据被淘汰。
预读机制是指MySQL
加载数据页时,可能会把它相邻的数据页一并加载进来(局部性原理)。
这样会带来一个问题,预读进来的数据页,其实我们没有访问,但是它却排在前面。
正常来说,淘汰缓存页时,应该把这个预读的淘汰,结果却把尾部的淘汰了,这是不合理的。
我们接着来看第二个场景全表扫描,如果表数据量大,大量的数据页会把空闲缓存页用完。
最终LRU
链表前面都是全表扫描的数据,之前频繁访问的热点数据全部到队尾了,淘汰缓存页时就把热点数据页给淘汰了。
为了解决上述的问题。
我们需要给LRU
链表做冷热数据分离设计,把LRU
链表按一定比例,分为冷热区域,热区域称为young
区域,冷区域称为old
区域。
以7:3为例,young区域70%,old`区域30%
如上图所示,数据页第一次加载进缓存页的时候,是先放入冷数据区域的头部,如果1秒后再次访问缓存页,则会移动到热区域的头部。
这样就保证了预读机制与全表扫描加载的数据都在链表队尾。
young
区域其实还可以做一个小优化,为了防止young
区域节点频繁移动到表头。
young
区域前面1/4
被访问不会移动到链表头部,只有后面的3/4
被访问了才会。
记住是按照某个比例将
LRU
链表分成两部分,不是某些节点固定是young
区域的,某些节点固定是old
区域的,随着程序的运行,某个节点所属的区域也可能发生变化。
其实MySQL
就是这样实现Buffer Pool
缓存页的,只不过它里面的链表全是双向链表,阿星这里偷个懒,但是不影响理解思路。
读到这里,我相信大家对Buffer Pool
缓存页有了深刻的认知,也知道从一个增删改查开始,如何缓存数据、定位缓存、缓存刷盘、缓存淘汰。
这里留问题给大家思考,Free、Flush、LRU
这三个链表之间的联系,随着MySQL
一直在运行,它们会产生怎样的联动。
本文由哈喽比特于3年以前收录,如有侵权请联系我们。
文章来源:https://mp.weixin.qq.com/s/hSui3byU68ubgS7bgwp5RQ
京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。
日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。
据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。
今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。
日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。
近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。
据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。
9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...
9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。
据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。
特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。
据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。
近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。
据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。
9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。
《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。
近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。
社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”
2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。
罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。