在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MySQL單表數據最大不要超過多少行

jf_ro2CN3Fa ? 來源:芋道源碼 ? 2023-06-02 15:30 ? 次閱讀

1、背景

2、實驗

3、單表數量限制

4、表空間

5、頁的數據結構

6、索引的數據結構

7、單表建議值

8、總結

9、參考

1、背景

作為在后端圈開車的多年老司機,是不是經常聽到過,“mysql 單表最好不要超過 2000w”,“單表超過 2000w 就要考慮數據遷移了”,“你這個表數據都馬上要到 2000w 了,難怪查詢速度慢”

這些名言民語就和 “群里只討論技術,不開車,開車速度不要超過 120 碼,否則自動踢群”,只聽過,沒試過,哈哈。

下面我們就把車速踩到底,干到 180 碼試試…….

基于 Spring Boot + MyBatis Plus + Vue & Element 實現的后臺管理系統 + 用戶小程序,支持 RBAC 動態權限、多租戶、數據權限、工作流、三方登錄、支付、短信、商城等功能

項目地址:https://github.com/YunaiV/ruoyi-vue-pro

視頻教程:https://doc.iocoder.cn/video/

2、實驗

實驗一把看看…建一張表

CREATETABLEperson(
idintNOTNULLAUTO_INCREMENTPRIMARYKEYcomment'主鍵',
person_idtinyintnotnullcomment'用戶id',
person_nameVARCHAR(200)comment'用戶名稱',
gmt_createdatetimecomment'創建時間',
gmt_modifieddatetimecomment'修改時間'
)comment'人員信息表';

插入一條數據

insertintopersonvalues(1,1,'user_1',NOW(),now());

利用 mysql 偽列 rownum 設置偽列起始點為 1

select(@i:=@i+1)asrownum,person_namefromperson,(select@i:=100)asinit;
set@i=1;

運行下面的 sql,連續執行 20 次,就是 2 的 20 次方約等于 100w 的數據;執行 23 次就是 2 的 23 次方約等于 800w , 如此下去即可實現千萬測試數據的插入,如果不想翻倍翻倍的增加數據,而是想少量,少量的增加,有個技巧,就是在 SQL 的后面增加 where 條件,如 id > 某一個值去控制增加的數據量即可。

insertintoperson(id,person_id,person_name,gmt_create,gmt_modified)
select@i:=@i+1,
left(rand()*10,10)asperson_id,
concat('user_',@i%2048),
date_add(gmt_create,interval+@i*cast(rand()*100assigned)SECOND),
date_add(date_add(gmt_modified,interval+@i*cast(rand()*100assigned)SECOND),interval+cast(rand()*1000000assigned)SECOND)
fromperson;

此處需要注意的是,也許你在執行到近 800w 或者 1000w 數據的時候,會報錯:The total number of locks exceeds the lock table size,這是由于你的臨時表內存設置的不夠大,只需要擴大一下設置參數即可。

SETGLOBALtmp_table_size=512*1024*1024;(512M)
SETglobalinnodb_buffer_pool_size=1*1024*1024*1024(1G);

先來看一組測試數據,這組數據是在 mysql8.0 的版本,并且是在我本機上,由于本機還跑著 idea , 瀏覽器等各種工具,所以并不是機器配置就是用于數據庫配置,所以測試數據只限于參考。

6329ecac-fbcb-11ed-90ce-dac502259ad0.png6355e0d2-fbcb-11ed-90ce-dac502259ad0.png

看到這組數據似乎好像真的和標題對應,當數據達到 2000w 以后,查詢時長急劇上升;難道這就是鐵律嗎?

那下面我們就來看看這個建議值 2kw 是怎么來的?

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 實現的后臺管理系統 + 用戶小程序,支持 RBAC 動態權限、多租戶、數據權限、工作流、三方登錄、支付、短信、商城等功能

項目地址:https://github.com/YunaiV/yudao-cloud

視頻教程:https://doc.iocoder.cn/video/

3、單表數量限制

首先我們先想想數據庫單表行數最大多大?

CREATETABLEperson(
idint(10)NOTNULLAUTO_INCREMENTPRIMARYKEYcomment'主鍵',
person_idtinyintnotnullcomment'用戶id',
person_nameVARCHAR(200)comment'用戶名稱',
gmt_createdatetimecomment'創建時間',
gmt_modifieddatetimecomment'修改時間'
)comment'人員信息表';

看看上面的建表 sql,id 是主鍵,本身就是唯一的,也就是說主鍵的大小可以限制表的上限,如果主鍵聲明 int 大小,也就是 32 位,那么支持 2^32-1 ~~21 億;如果是 bigint,那就是 2^62-1 ?(36893488147419103232),難以想象這個的多大了,一般還沒有到這個限制之前,可能數據庫已經爆滿了!!有人統計過,如果建表的時候,自增字段選擇無符號的 bigint , 那么自增長最大值是 18446744073709551615,按照一秒新增一條記錄的速度,大約什么時候能用完?

6360c6dc-fbcb-11ed-90ce-dac502259ad0.png

4、表空間

下面我們再來看看索引的結構,對了,我們下面講內容都是基于 Innodb 引擎的,大家都知道 Innodb 的索引內部用的是 B+ 樹

636ff44a-fbcb-11ed-90ce-dac502259ad0.png

這張表數據,在硬盤上存儲也是類似如此的,它實際是放在一個叫 person.ibd (innodb data)的文件中,也叫做表空間;雖然數據表中,他們看起來是一條連著一條,但是實際上在文件中它被分成很多小份的數據頁,而且每一份都是 16K。大概就像下面這樣,當然這只是我們抽象出來的,在表空間中還有段、區、組等很多概念,但是我們需要跳出來看。

638ba6f4-fbcb-11ed-90ce-dac502259ad0.png

5、頁的數據結構

因為每個頁只有 16K 的大小,但是如果數據很多,那一頁肯定就放不下這些數據,那數據肯定就會被分到其他的頁中,所以為了把這些頁關聯起來,肯定就會有記錄前后頁地址,方便找到對應頁;同時每頁都是唯一的,那就會需要有一個唯一標志來標記頁,就是頁號;頁中會記錄數據所以會存在讀寫操作,讀寫操作會存在中斷或者其他異常導致數據不全等,那就會需要有校驗機制,所以里面還有會校驗碼,而讀操作最重要的就是效率問題,如果按照記錄一個個進行遍歷,那肯定是很費勁的,所以這里面還會為數據生成對應的頁目錄(Page Directory); 所以實際頁的內部結構像是下面這樣的。

63ac64a2-fbcb-11ed-90ce-dac502259ad0.png

從圖中可以看出,一個 InnoDB 數據頁的存儲空間大致被劃分成了 7 個部分,有的部分占用的字節數是確定的,有的部分占用的字節數是不確定的。

在頁的 7 個組成部分中,我們自己存儲的記錄會按照我們指定的行格式存儲到 User Records 部分。

但是在一開始生成頁的時候,其實并沒有 User Records 這個部分,每當我們插入一條記錄,都會從 Free Space 部分,也就是尚未使用的存儲空間中申請一個記錄大小的空間劃分到 User Records 部分,當 Free Space 部分的空間全部被 User Records 部分替代掉之后,也就意味著這個頁使用完了,如果還有新的記錄插入的話,就需要去申請新的頁了。這個過程的圖示如下。

63b95e50-fbcb-11ed-90ce-dac502259ad0.png

剛剛上面說到了數據的新增的過程。

那下面就來說說,數據的查找過程,假如我們需要查找一條記錄,我們可以把表空間中的每一頁都加載到內存中,然后對記錄挨個判斷是不是我們想要的,在數據量小的時候,沒啥問題,內存也可以撐;但是現實就是這么殘酷,不會給你這個局面;為了解決這問題,mysql 中就有了索引的概念;大家都知道索引能夠加快數據的查詢,那到底是怎么個回事呢?下面我就來看看。

6、索引的數據結構

在 mysql 中索引的數據結構和剛剛描述的頁幾乎是一模一樣的,而且大小也是 16K, 但是在索引頁中記錄的是頁 (數據頁,索引頁) 的最小主鍵 id 和頁號,以及在索引頁中增加了層級的信息,從 0 開始往上算,所以頁與頁之間就有了上下層級的概念。

63d43964-fbcb-11ed-90ce-dac502259ad0.png

看到這個圖之后,是不是有點似曾相似的感覺,是不是像一棵二叉樹啊,對,沒錯!它就是一棵樹,只不過我們在這里只是簡單畫了三個節點,2 層結構的而已,如果數據多了,可能就會擴展到 3 層的樹,這個就是我們常說的 B+ 樹,最下面那一層的 page level =0, 也就是葉子節點,其余都是非葉子節點。

63e3bd6c-fbcb-11ed-90ce-dac502259ad0.png

看上圖中,我們是單拿一個節點來看,首先它是一個非葉子節點(索引頁),在它的內容區中有 id 和 頁號地址兩部分,這個 id 是對應頁中記錄的最小記錄 id 值,頁號地址是指向對應頁的指針;而數據頁與此幾乎大同小異,區別在于數據頁記錄的是真實的行數據而不是頁地址,而且 id 的也是順序的。

7、單表建議值

下面我們就以 3 層,2 分叉(實際中是 M 分叉)的圖例來說明一下查找一個行數據的過程。

比如說我們需要查找一個 id=6 的行數據,因為在非葉子節點中存放的是頁號和該頁最小的 id,所以我們從頂層開始對比,首先看頁號 10 中的目錄,有 [id=1, 頁號 = 20],[id=5, 頁號 = 30], 說明左側節點最小 id 為 1,右側節點最小 id 是 5;6>5, 那按照二分法查找的規則,肯定就往右側節點繼續查找,找到頁號 30 的節點后,發現這個節點還有子節點(非葉子節點),那就繼續比對,同理,6>5&&6<7, 所以找到了頁號 60,找到頁號 60 之后,發現此節點為葉子節點(數據節點),于是將此頁數據加載至內存進行一一對比,結果找到了 id=6 的數據行。

從上述的過程中發現,我們為了查找 id=6 的數據,總共查詢了三個頁,如果三個頁都在磁盤中(未提前加載至內存),那么最多需要經歷三次的磁盤 IO。需要注意的是,圖中的頁號只是個示例,實際情況下并不是連續的,在磁盤中存儲也不一定是順序的。

63f6aa44-fbcb-11ed-90ce-dac502259ad0.png

至此,我們大概已經了解了表的數據是怎么個結構了,也大概知道查詢數據是個怎么的過程了,這樣我們也就能大概估算這樣的結構能存放多少數據了。

從上面的圖解我們知道 B+ 數的葉子節點才是存在數據的,而非葉子節點是用來存放索引數據的。

所以,同樣一個 16K 的頁,非葉子節點里的每條數據都指向新的頁,而新的頁有兩種可能

如果是葉子節點,那么里面就是一行行的數據

如果是非葉子節點的話,那么就會繼續指向新的頁

假設

非葉子節點內指向其他頁的數量為 x

葉子節點內能容納的數據行數為 y

B+ 數的層數為 z

如下圖中所示Total =x^(z-1) *y 也就是說總數會等于 x 的 z-1 次方 與 Y 的乘積。

64105a3e-fbcb-11ed-90ce-dac502259ad0.png

X =?

在文章的開頭已經介紹了頁的結構,索引也也不例外,都會有 File Header (38 byte)、Page Header (56 Byte)、Infimum + Supermum(26 byte)、File Trailer(8byte), 再加上頁目錄,大概 1k 左右,我們就當做它就是 1K, 那整個頁的大小是 16K, 剩下 15k 用于存數據,在索引頁中主要記錄的是主鍵與頁號,主鍵我們假設是 Bigint (8 byte), 而頁號也是固定的(4Byte), 那么索引頁中的一條數據也就是 12byte; 所以 x=15*1024/12≈1280 行。

Y=?

葉子節點和非葉子節點的結構是一樣的,同理,能放數據的空間也是 15k;但是葉子節點中存放的是真正的行數據,這個影響的因素就會多很多,比如,字段的類型,字段的數量;每行數據占用空間越大,頁中所放的行數量就會越少;這邊我們暫時按一條行數據 1k 來算,那一頁就能存下 15 條,Y≈15。

算到這邊了,是不是心里已經有譜了啊根據上述的公式,Total =x^(z-1) y,已知 x=1280,y=15假設 B+ 樹是兩層,那就是 Z =2, Total = (1280 ^1 )15 = 19200假設 B+ 樹是三層,那就是 Z =3, Total = (1280 ^2) *15 = 24576000 (約 2.45kw)

哎呀,媽呀!這不是正好就是文章開頭說的最大行數建議值 2000w 嘛!對的,一般 B+ 數的層級最多也就是 3 層,你試想一下,如果是 4 層,除了查詢的時候磁盤 IO 次數會增加,而且這個 Total 值會是多少,大概應該是 3 百多億吧,也不太合理,所以,3 層應該是比較合理的一個值。

到這里難道就完了?

不我們剛剛在說 Y 的值時候假設的是 1K ,那比如我實際當行的數據占用空間不是 1K , 而是 5K, 那么單個數據頁最多只能放下 3 條數據同樣,還是按照 Z=3 的值來計算,那 Total = (1280 ^2) *3 = 4915200 (近 500w)

所以,在保持相同的層級(相似查詢性能)的情況下,在行數據大小不同的情況下,其實這個最大建議值也是不同的,而且影響查詢性能的還有很多其他因素,比如,數據庫版本,服務器配置,sql 的編寫等等,MySQL 為了提高性能,會將表的索引裝載到內存中。在 InnoDB buffer size 足夠的情況下,其能完成全加載進內存,查詢不會有問題。但是,當單表數據庫到達某個量級的上限時,導致內存無法存儲其索引,使得之后的 SQL 查詢會產生磁盤 IO,從而導致性能下降,所以增加硬件配置(比如把內存當磁盤使),可能會帶來立竿見影的性能提升哈。

8、總結

Mysql 的表數據是以頁的形式存放的,頁在磁盤中不一定是連續的。

頁的空間是 16K, 并不是所有的空間都是用來存放數據的,會有一些固定的信息,如,頁頭,頁尾,頁碼,校驗碼等等。

在 B+ 樹中,葉子節點和非葉子節點的數據結構是一樣的,區別在于,葉子節點存放的是實際的行數據,而非葉子節點存放的是主鍵和頁號。

索引結構不會影響單表最大行數,2kw 也只是推薦值,超過了這個值可能會導致 B + 樹層級更高,影響查詢性能。
責任編輯:彭菁

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7249

    瀏覽量

    91349
  • 管理系統
    +關注

    關注

    1

    文章

    2751

    瀏覽量

    36850
  • MySQL
    +關注

    關注

    1

    文章

    849

    瀏覽量

    27663

原文標題:阿里一面:MySQL 單表數據最大不要超過多少行?為什么?

文章出處:【微信號:芋道源碼,微信公眾號:芋道源碼】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    誰說MySQL行數不要超過2000W?

    網上看了一篇文章《為什么說MySQL行數不要超過2000w》,親自實踐了一下,跟原作者有不同的結論。原文的結論是2000W左右性能會成指
    的頭像 發表于 12-15 10:02 ?1370次閱讀
    誰說<b class='flag-5'>MySQL</b><b class='flag-5'>單</b><b class='flag-5'>表</b>行數<b class='flag-5'>不要</b><b class='flag-5'>超過</b>2000W?

    TAS5717的MCLK如果是12.288MHZ,這個頻率的上下誤差最大不能超過多少呢?

    TAS5717的MCLK如果是12.288MHZ,這個頻率的上下誤差最大不能超過多少?
    發表于 11-05 08:23

    mysql中文參考手冊chm

    數據類型 10 從 MySQL 得到最大的性能 10.1 優化概述 10.2 系統/編譯時和啟動參數的調節 10.2.1 編譯和鏈接如何影響 M
    發表于 12-26 13:32

    變壓器的大小有效電流最大不超過1A,這樣的話功率不是達不到嗎?

    輸入220v交流經整壓濾波穩流后輸出為24v5A,現在比較奇怪的是。在變壓器部分降壓之后的電壓最大不超過40v,看變壓器的大小有效電流最大不超過1A,這樣的話功率不是達不到嗎???
    發表于 11-10 20:38

    MySQL root密碼忘記怎么辦?

    MySQL實例1. 跳過授權登錄mysqld_safe --skip-grant-table --user=mysql &2. 更改密碼mysq
    發表于 06-22 17:54

    MySQL分區類型及介紹

    分區是將一個數據按照一定規則水平劃分成不同的邏輯塊,并分別進行物理存儲,這個規則就叫做分區函數,可以有不同的分區規則。通過show plugins語句查看當前MySQL是否支持
    發表于 06-29 16:31

    請問TAS5717的MCLK是12.288MHZ那頻率的上下誤差最大不能超過多少?

    TAS5717的MCLK如果是12.288MHZ,這個頻率的上下誤差最大不能超過多少?
    發表于 08-06 10:49

    如何利用labview獲取MySQL數據中某一列的最大

    如題,想獲取MySQL數據中的data7那一列的最大值,下面是程序框圖一直報語法錯誤,但是該語句在mysql command line
    發表于 12-06 21:37

    mysql轉列如何操作

    mysql 轉列操作
    發表于 04-28 11:27

    mysql數據導出golang實現

    mysql數據導出為excel文件,golang實現:首先下載依賴到的三方庫:Simple install the package to your $GOPATH
    發表于 10-21 15:14

    B+樹索引如何對Mysql數據量造成影響

    我們說 Mysql 適合存儲的最大數據量,自然不是說能夠存儲的最大數據量,如果是說能夠存儲的最大
    的頭像 發表于 04-16 08:08 ?1755次閱讀
    B+樹索引如何對<b class='flag-5'>Mysql</b><b class='flag-5'>單</b><b class='flag-5'>表</b><b class='flag-5'>數據</b>量造成影響

    為什么 MySQL 不能超過 2000 萬?

    ,因為數據量超大(5000 萬條左右),需要每天定時生成 3 張,然后將數據取模分別存到這三張表里。 接下來是兩人的對話: 面試后續暫且不論,不過,互聯網江湖上的確流傳著一個說法:
    的頭像 發表于 06-29 16:48 ?935次閱讀
    為什么 <b class='flag-5'>MySQL</b> <b class='flag-5'>單</b><b class='flag-5'>表</b>不能<b class='flag-5'>超過</b> 2000 萬<b class='flag-5'>行</b>?

    MySQL數據最大不要超過多?為什么?

    想必大家也聽說過數據建議最大2kw 條數據這個說法。如果超過了,性能就會下降得比較厲害。
    的頭像 發表于 07-06 09:46 ?1518次閱讀
    <b class='flag-5'>MySQL</b><b class='flag-5'>單</b><b class='flag-5'>表</b><b class='flag-5'>數據</b><b class='flag-5'>最大不要</b><b class='flag-5'>超過多</b>少<b class='flag-5'>行</b>?為什么?

    MySQL數據量限制:為何2000萬成為瓶頸?

    很多人認為:數據超過500萬或2000萬時,引起B+tree的高度增加,延長了索引的搜索路徑,進而導致了性能下降。事實果真如此嗎?
    的頭像 發表于 02-27 10:38 ?7304次閱讀
    <b class='flag-5'>MySQL</b><b class='flag-5'>單</b><b class='flag-5'>表</b><b class='flag-5'>數據</b>量限制:為何2000萬<b class='flag-5'>行</b>成為瓶頸?

    MySQL數據庫是什么

    開發、企業應用和大數據場景。以下是其核心特性和應用場景的詳細說明: 核心特性 關系型數據庫模型 數據(Table) 形式組織,
    的頭像 發表于 05-23 09:18 ?283次閱讀
    主站蜘蛛池模板: 极品美女洗澡后露粉嫩木耳视频 | 亚洲一区欧美一区 | 特黄特色三级在线观看 | 57pao强力打造免费高清高速 | 国产午夜精品久久久久九九 | 精品国产一二三区 | 久久思re热9一区二区三区 | a级男女性高爱潮高清试 | 四虎免费永久观看 | 午夜视频免费看 | 第四色激情网 | 玖玖激情 | 色噜噜狠狠成人网 | 狠狠色综合网 | 欧美在线激情 | 伊人狼人在线 | 中文字幕佐山爱一区二区免费 | 美女扒开腿让男人桶尿口 | 性欧美处 | 国产精品一区二区综合 | 四虎影院久久 | 手机看片神马午夜 | 在线三级网址 | 天堂中文字幕 | 特级毛片永久久免费观看 | 五月婷婷俺也去开心 | 四虎国产精品视频免费看 | 色香蕉色香蕉在线视频 | 在线观看免费视频一区 | 黄h视频在线观看视频 | 午夜视频在线观看视频 | 日韩亚洲欧洲在线com91tv | 免费看特级淫片日本 | 91pao强力打造免费高清 | 中国一级特黄真人毛片免费看 | 天天操天天干天天拍 | 日本不卡在线播放 | 日本又粗又长一进一出抽搐 | 色资源窝窝全色 | 久久人人干 | 欧美一级做一a做片性视频 欧美一级做一级做片性十三 |