Alibaba 螞蟻?zhàn)匝袛?shù)據(jù)庫OceanBase登頂TPC-H榜單,核心成員撰文講述背后思考( 三 )
從時(shí)間上看,AP場(chǎng)景的幾項(xiàng)關(guān)鍵技術(shù)是隨著產(chǎn)品豐富逐步完善起來的 。2014年做了基于代價(jià)的查詢優(yōu)化器 。2016年做了分布式運(yùn)行一體化執(zhí)行 。2019年和2020年分別做了向量化執(zhí)行引擎和TP、AP的資源隔離 。事實(shí)上,這些年,OceanBase的AP能力一直在不斷增強(qiáng),只不過大家很少有機(jī)會(huì)了解 。
如果知道這些來龍去脈,大家對(duì)OceanBase沖擊TPC-H這件事兒,也許就沒那么奇怪了 。今天我們的用戶場(chǎng)景和產(chǎn)品定位也都需要產(chǎn)品具備這樣的能力,從這個(gè)角度上講,OceanBase正式進(jìn)入到HTAP產(chǎn)品時(shí)代,也是市場(chǎng)的選擇 。
從2017年開始,我每年都會(huì)投入相當(dāng)比例的時(shí)間拜訪外部客戶 。在這個(gè)過程中,深刻感受到,對(duì)于HTAP,不同客戶有不一樣的認(rèn)知 。
其中一部分用戶使用的是典型的TP、AP獨(dú)立架構(gòu) 。這類用戶以互聯(lián)網(wǎng)公司居多,受目前流行的解決方案影響 。系統(tǒng)設(shè)計(jì)之初就將TP和AP系統(tǒng)分開,通過中間鏈路同步數(shù)據(jù) 。這類用戶一般有兩個(gè)痛點(diǎn),一個(gè)是實(shí)時(shí)性要求高的分析邏輯無法在TP數(shù)據(jù)庫中原地完成,只能等數(shù)據(jù)同步到AP數(shù)據(jù)庫中再做 。另外就是系統(tǒng)難以運(yùn)維,尤其是中小型的客戶,運(yùn)維人員得熟悉兩套系統(tǒng),還要時(shí)刻關(guān)注中間數(shù)據(jù)鏈路的穩(wěn)定性,技術(shù)門檻很高 。
另外一部分用戶,一直使用的是像Oracle這樣的傳統(tǒng)的數(shù)據(jù)庫,對(duì)于TP和AP的邊界認(rèn)知比較模糊,尤其是Oracle的處理能力很強(qiáng),很多復(fù)雜查詢?nèi)拥絆racle里面也能跑 。在一次某大型客戶的業(yè)務(wù)上線過程中,壓測(cè)的最后階段,我們發(fā)現(xiàn)了非常多的復(fù)雜查詢 。當(dāng)我們?cè)儐柨蛻魹槭裁此麄兊腡P系統(tǒng)中會(huì)有如此多AP請(qǐng)求時(shí),客戶的一句話把我們問懵了——“啥叫TP、AP請(qǐng)求?”我們?cè)趦?nèi)部也有過討論,發(fā)現(xiàn)即使是團(tuán)隊(duì)內(nèi)部大家的看法也是不一樣的 。只能說有一些場(chǎng)景偏TP類型或者偏AP類型,但很難給出絕對(duì)答案 。
越來越多的客戶案例讓我意識(shí)到,過去一直堅(jiān)持的HTAP技術(shù)方向也是很多客戶需要的 。但今天在很多客戶眼中,OceanBase就是只支持TP處理的數(shù)據(jù)庫,完全沒想到我們還有很強(qiáng)的AP處理能力 。“酒香也怕巷子深”,我們覺得這個(gè)時(shí)候打榜TPC-H,既能讓產(chǎn)品的能力進(jìn)一步提高,大家也能更了解OceanBase的價(jià)值 。
三、TPC-H新世界紀(jì)錄背后的“三座大山”
如果讓2014年的我說OceanBase什么時(shí)候能夠在TPC-C、TPC-H這樣的榜單上露個(gè)臉,我還真不知道 。
做數(shù)據(jù)庫就像蓋房子,今天OceanBase這座房子已經(jīng)到了交付階段,要給客戶的體驗(yàn)是“拎包入住”,因此水、電、裝修風(fēng)格都要做好 。而2014 年就像在“打地基”的階段,你說我將來要做某某內(nèi)飾風(fēng)格,至少當(dāng)時(shí)沒有想到那么具體的事情,但是我知道分布式一定是這個(gè)房子的“地基”,我們要蓋的是一個(gè)摩天大樓,而不是一個(gè)獨(dú)門小院 。這個(gè)是打破傳統(tǒng)數(shù)據(jù)庫設(shè)計(jì)限制的前提,想通了這個(gè)事兒,后面的技術(shù)落地就比較自然了 。
文章圖片
為什么分布式數(shù)據(jù)庫是HTAP技術(shù)的未來?這個(gè)和HTAP的幾大技術(shù)挑戰(zhàn)有關(guān) 。
首先,也是最重要的事情,這個(gè)系統(tǒng)的容量一定要足夠大,擴(kuò)展性足夠強(qiáng) 。
從數(shù)據(jù)容量上看,因?yàn)锳P本身的分析要有價(jià)值,就需要聚集相當(dāng)量的數(shù)據(jù)才有價(jià)值,這是以前的單機(jī)數(shù)據(jù)庫做不到的 。一臺(tái)機(jī)器的容量,或者是幾臺(tái)機(jī)器的容量永遠(yuǎn)是受限的 。十年前,世界上最大的Oracle RAC實(shí)際系統(tǒng)只有20來個(gè)節(jié)點(diǎn) 。當(dāng)時(shí)我在Oracle經(jīng)歷的一個(gè)重要項(xiàng)目是,將RAC的集群規(guī)模擴(kuò)展到128臺(tái) 。而今天像OceanBase這樣一個(gè)分布式數(shù)據(jù)庫,做到幾百臺(tái)機(jī)器的集群規(guī)模是非常輕松的,這種規(guī)模上的區(qū)別帶來技術(shù)上的想象空間是完全不同的 。
而且在這次測(cè)試面向AP的場(chǎng)景中,又引入了一個(gè)OceanBase家族的新成員叫OceanBase File System(簡(jiǎn)稱OFS) 。這是一個(gè)分布式的共享存儲(chǔ)系統(tǒng),基于OFS的方案在存儲(chǔ)容量上幾乎是可以無限擴(kuò)展,永遠(yuǎn)不用擔(dān)心數(shù)據(jù)沒地方存 。這就解決了整個(gè)系統(tǒng)容量的擴(kuò)展的問題 。
另外,既然要將TP和AP放到同一個(gè)集群中處理,那么集群的處理能力也要有非常強(qiáng)的可擴(kuò)展性 。這里如果再講多一些,處理能力的擴(kuò)展性還能分為“水平”擴(kuò)展和“垂直”擴(kuò)展兩個(gè)維度 。
大家看過我們TPC-C的測(cè)試結(jié)果可能還有印象 。當(dāng)時(shí),是用了1554臺(tái)機(jī)器,把整個(gè)TP系統(tǒng)跑這么高的分?jǐn)?shù) 。這個(gè)體現(xiàn)的是OceanBase的水平擴(kuò)展能力 。
什么叫垂直擴(kuò)展性呢?就是在一臺(tái)機(jī)器內(nèi)部通過硬件擴(kuò)展(更多CPU核數(shù)、更大內(nèi)存)而提升性能 。為什么這個(gè)在HTAP下仍然有挑戰(zhàn)?因?yàn)樵赥PC-C的擴(kuò)展里面,更強(qiáng)調(diào)的是水平擴(kuò)展,換句話說,數(shù)據(jù)庫集群規(guī)模越大,性能分?jǐn)?shù)就越高 。但在AP場(chǎng)景下,用戶同時(shí)也會(huì)關(guān)心能不能實(shí)現(xiàn)垂直擴(kuò)展,比如說能不能讓一個(gè)系統(tǒng)的幾千個(gè)CPU核,幾十臺(tái)機(jī)器同時(shí)為一個(gè)查詢服務(wù) 。萬事萬物,只要涉及到“協(xié)同“,就有成本 。把協(xié)同的成本降低到最低,考驗(yàn)的是系統(tǒng)整體的設(shè)計(jì) 。
推薦閱讀
- 電子商務(wù) 重慶螞蟻消費(fèi)金融獲批開業(yè) 合作貸款不能用“花唄”“借唄”名稱
- 硬件 美光發(fā)布首批PCIe 4.0固態(tài)硬盤:采用自研主控+176層3D TLC閃存
- Alibaba 螞蟻?zhàn)匝袛?shù)據(jù)庫OceanBase升級(jí)3.0版本 開源300萬行核心代碼
- Alibaba 2021年阿里云6·18大促攻略 云服務(wù)器秒殺價(jià)59.90/年起
- Alibaba 阿里云開啟6·18年中大促 全線產(chǎn)品減至歷史新低
- Apple 開發(fā)者發(fā)現(xiàn)蘋果自研M1芯片存在安全性漏洞 不改設(shè)計(jì)無法修復(fù)
- 偽裝者 “酷蓋”人設(shè)保不住了?王一博見蜘蛛螞蟻一秒認(rèn)慫
- Alibaba 2021 阿里云峰會(huì)新品匯總:包括第七代 ECS 云服務(wù)器
- Alibaba 阿里云宣布全面兼容X86、ARM、RISC-V等多種芯片架構(gòu)
- SONY 索尼第三代降噪豆WF-1000XM4細(xì)節(jié)公布:內(nèi)置索尼V1自研芯片 支持LDAC
