AWS工程師干了5年才發(fā)現(xiàn):那些號稱"強(qiáng)一致"或"高可用"的系統(tǒng),骨子里都在玩灰色地帶。
「AP系統(tǒng)」的真相:臟數(shù)據(jù)比宕機(jī)劃算
![]()
電商大促時購物車顯示"庫存緊張"而非精確數(shù)字,不是技術(shù)做不到,是業(yè)務(wù)選了可用性(Availability,系統(tǒng)持續(xù)響應(yīng)能力)。用戶能下單比數(shù)字準(zhǔn)更重要。
但這不意味著放棄一切。AP系統(tǒng)仍要處理沖突——比如兩人同時搶最后一件庫存,事后對賬時總得有人輸。工程師的活兒是設(shè)計"可接受的混亂",而非放任自流。
CP系統(tǒng)的隱藏成本:一致性是奢侈品
銀行轉(zhuǎn)賬必須強(qiáng)一致(Consistency,所有節(jié)點(diǎn)數(shù)據(jù)同步),代價是分區(qū)容錯時直接拒絕服務(wù)。2017年某支付平臺因網(wǎng)絡(luò)抖動導(dǎo)致全國交易中斷2小時,就是CP的學(xué)費(fèi)。
AWS工程師的觀察很扎心:「我們很少在純CP或純AP上部署生產(chǎn)系統(tǒng)。」真實(shí)架構(gòu)是滑動標(biāo)尺——支付核心走CP,商品搜索走AP,中間地帶靠業(yè)務(wù)規(guī)則填縫。
工程師的終極妥協(xié):PACELC定理比CAP更誠實(shí)
CAP定理(一致性/可用性/分區(qū)容錯三選二)被過度簡化了。實(shí)際決策還要加延遲(Latency)和成本(Cost)。
同一套分布式數(shù)據(jù)庫,同城雙活可能選CP,跨洲部署被迫選AP——不是技術(shù)哲學(xué)變了,是光纖速度追不上業(yè)務(wù)野心。
那位AWS工程師寫博客治"冒名頂替綜合征",反而暴露了行業(yè)真相:分布式系統(tǒng)沒有正確答案,只有算清賬的工程師。全球云廠商的故障報告顯示,2023年因"錯誤選擇一致性級別"導(dǎo)致的事故占比31%,比純技術(shù)故障更高——人比機(jī)器更容易選錯邊。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.