不知道差友們還記不記得,去年的 7 月 13 日,B 站發(fā)生了一件大事。它毫無征兆的崩了。。。( 如果忘了的小伙伴,可以看這篇文章)
至于為啥崩了,當時大家誰也心里沒個底。不過吹起水來可是一套一套的,什么停電啊,起火啊,程序員 rm -rf /* 跑路啊。。。說的是個天馬行空。
后來呢,隨著 B 站在凌晨兩點一頓修仙,把服務(wù)器問題給慢慢解決,這件事情也算是告一段落了。
【資料圖】
本以為這次 B 站崩了會和微博上無數(shù)崩了的網(wǎng)站一樣,成為我們沖浪生活中的一個笑談,僅留下一個大會員給我們“ 緬懷 ”。
沒想到在今年的 7 月 13 日,B 站特意發(fā)了一篇文章,刨開心窩子來給我們講了一講,那個晚上,到底發(fā)生了什么。
咱也看了一下這篇文章,好家伙,讓整個 B 站崩潰的原因,竟然只是一行代碼沒寫好???借著這篇文章,世超準備帶大家從B 站的角度來回顧一下這件事情。放心,不會有生澀難懂的名詞,不會有犀利糊涂的黑話,保證小白也能看明白。 案情回溯:意外,發(fā)生在 2021 年 7 月 13 日的 22 時 52 分。
負責搞定站點可靠性的工程師(SRE)和B站的客服都收到了大量網(wǎng)站打不開的報警。
而負責處理這些事故的同事已經(jīng)下班了,當即準備在家里通過 VPN 來登錄公司內(nèi)網(wǎng)處理這些問題。
結(jié)果發(fā)現(xiàn)VPN也崩了。。。壓根進不去系統(tǒng)。最后,還是在公司的整了個 “ 綠色通道 ” 才成功進去。你說這綠色通道不會是向日葵吧(一種遠程桌面軟件)
▼
而在綠色通道成功打通,負責各種業(yè)務(wù)的團隊就位之后,B 站也開始對問題進行分析定位。出問題的模塊也很明顯,在線業(yè)務(wù)主機房的7層 SLB(負載均衡服務(wù)器,用來處理多用戶,多業(yè)務(wù)的情況)的 CPU 跑滿了 100%。
簡單來說,就是 CPU 被不知道哪里來的刺客給占用光了算力,沒法處理業(yè)務(wù)了。
系統(tǒng)未響應(yīng).exe▼
B 站最開始的嘗試方法呢,和咱們平時手機電腦卡機后做的操作一樣。
重啟就完事了,要相信重啟能解決 90% 的問題!
但很可惜,B 站這次是那個 10.5%。
說業(yè)務(wù)恢復(fù)了嘛,也沒有,主機房重啟后還是出現(xiàn)了CPU 跑滿 100%的問題。不過別的機房好起來了,雖然會卡,但是沒出現(xiàn) CPU 跑滿的問題。
有一部分做了多活的業(yè)務(wù)(多站點同時提供服務(wù))開始慢慢恢復(fù)。所以。。。重啟不能完全解決問題,但是這個問題既然過去沒出現(xiàn)過。
那會不會是新加入的代碼問題呢?隨著時間在一分一秒的過去,借助分析工具的幫助,問題被定位到了最近新上線的 Lua(一種編程語言,類似 Python,Java 這些)函數(shù)上。
隨后,B 站開始進行了一波波緊張的回滾操作。
這一通工作弄下來,雖然好像找到幾個疑似出問題的部位,但服務(wù)器還是該掛掛,距離 “ 康復(fù) ” 還有那么一些距離。
沒辦法,總得讓業(yè)務(wù)先跑起來吧。于是團隊開始兵分兩路。一隊繼續(xù)堅持排查問題,尋找原因,另一隊則是開始重建一個新的 SLB 服務(wù)。
在緊張刺激的一小時后,新的 SLB 配置成功,原本導(dǎo)向主站的流量也慢慢的開始遷移過去。
好在這次行了。
凌晨兩點,在崩潰了三小時之后,B 站的業(yè)務(wù)總算得到了恢復(fù)。罪魁禍首:上面這些,就是那個晚上 B 站發(fā)生的故事,雖然解決了表面問題,讓業(yè)務(wù)恢復(fù)了。
可是最根本的原因是啥呢?如果不找到根因,那遲早會二度暴雷。
負責排查問題的同學(xué)也沒讓人失望,在時間壓力大大放緩之后,找出了真相。沒有外星人,沒有起火,沒有斷電,和網(wǎng)友們想象的大相徑庭。B 站這次崩的根因,僅僅是因為一個求最大公約數(shù)的函數(shù)沒寫好。。。
咱先盤一下這個 “ 萬惡之源 ” 哈。
這是一個典型的 “自己調(diào)用自己 ” 的遞歸函數(shù)。a b兩數(shù)字輾轉(zhuǎn)求余,直到b 等于 0的時候函數(shù)終止。不然這個函數(shù)就會自己調(diào)用自己,重新再跑一遍。
看上去好像是一點點問題都沒有,既明確了遞歸的終止條件(b = 0),也沒有太多復(fù)雜的邏輯處理。但是既然事情能發(fā)展到這地步。。。那就說明是出大問題了。對編程有些了解的差友可能發(fā)現(xiàn)了不對:
你傳進去的 0,是個什么 0?沒錯,在編程語言里,數(shù)字 0 和字符串 ‘ 0 ’并不算是一個東西。為了防止呆呆的計算機語言把事情給搞混,像 C 語言,Java 這些靜態(tài)語言都會要求我們在創(chuàng)建新變量的時候聲明這個變量的類型。
搞清楚它到底是整數(shù),還是小數(shù),或者是一個字符。然而 Lua 是個非常智慧的語言,它沒有這個要求。麻煩的臟活累活讓它自動來做就好了,Lua 會根據(jù)程序的需求自動分配變量類型。
C語言示例:# 定義一個整型數(shù)據(jù)a,為它賦值1# 定義一個字符串數(shù)據(jù)b,為它賦值‘1’int a = 0;char a = "0";Lua示例:--定義 a 為數(shù)字0,b為字符串‘0’a = 0b = "0"
所以,我們給參數(shù) b 傳進去的數(shù)值,是數(shù)字 0呢,還是字符 ‘ 0 ’?一旦前面數(shù)據(jù)驗證沒把好關(guān),在執(zhí)行某個功能的時候,把字符 ‘ 0 ’給傳到了這個函數(shù)里。
地雷就被引爆了。字符串‘0’不會等于數(shù)字 0,函數(shù)的終止條件判斷不通過。
所以程序進入遞歸模式,再次調(diào)用自己。在后續(xù)進行求余預(yù)算的時候,Lua 的 “ 智慧 ” 又突然起到了作用。Lua 一拍腦袋,咋會有人把字符 ‘ 0 ’ 拿來做計算啊,肯定是想把這個參數(shù)當數(shù)字用。
于是發(fā)生了強制類型轉(zhuǎn)換。
所以咱們小學(xué)數(shù)學(xué)都會學(xué)到的。。。把 0 當除數(shù)的事情就發(fā)生了。這要是古老的大哥 C 語言來干這活,可能直接就給一個 Floating point exception 報錯了。但是 Lua 不一樣,作為一個新時代的 “ 智慧 ” 的語言,它會優(yōu)雅的返回一個 nan(Not A Numbewr)。
程序,繼續(xù)運行。更要命的是,nan 也不會等于0。。。程序的終止條件無法實現(xiàn)。這樣跑幾個循環(huán)之后,原本用來計算 a 和 b 的最大公約數(shù)的函數(shù) _gcd(a,b) 就變成了一個停不下來的函數(shù) _gcd(nan,nan)。
在停不下來的路上根本停不下來,直接把 CPU 資源給吃滿了。
太聰明也不是一件好事啊。。。
就這樣,被占滿的 CPU 一口氣把別的業(yè)務(wù)也帶崩了。還得前面提到的在家的 B 站程序員沒法在家通過 VPN 來搶救網(wǎng)絡(luò)么?沒錯,他們登錄內(nèi)網(wǎng)的時候,其中有部分服務(wù)也需要通過內(nèi)網(wǎng)來處理。。。
屬于是把鑰匙斷鎖眼里,也是崩的理所當然了。崩完之后:最后,如果差友們對相關(guān)技術(shù)細節(jié)更感興趣的話,世超建議你看看 B 站發(fā)布的這篇2021.07.13 我們是這樣崩的除了對事故的起承轉(zhuǎn)合,還對未來技術(shù)的更進與反思都做了更加專業(yè),全面的總結(jié)。
講道理,這樣的機會其實挺難得的。每年崩了的應(yīng)用何其多,但是愿意發(fā)出來給同行學(xué)習(xí),給普羅大眾看個樂子的寥寥無幾。
向上滑動▼
B 站這次愿意分享,直面自己的 “ 傷疤 ” 。也讓我們看到了互聯(lián)網(wǎng)運維上最真實的一面。這些經(jīng)驗,可不會寫在任何教科書上。哦對,這篇文章發(fā)出來的晚上,B 站其實又偷偷小崩了一次。。。
不知道是不是團隊好好總結(jié)了去年經(jīng)驗的緣故。這回還沒等大部分人反應(yīng)過來。。。B 站已經(jīng)把問題給解決了。
關(guān)鍵詞: B站自曝去年服務(wù)器大崩潰原因 就因為這
網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 www.ffpps.com All Rights Reserved.
中國網(wǎng)絡(luò)消費網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com
2023国产麻豆剧传媒鱿鱼游戏| 久久久久亚洲AV成人片一区| 装睡被陌生人摸出水好爽| 4399日本在线观看完整| 精品国产不卡一区二区三区| s货c货大声点| 亚洲男女一区二区三区| 麻豆国产精品va在线观看不卡| 人妻日本无中文字幕无码| 欧洲freexxxx性| 少妇高h肉辣全集目录| 欧美日韩国产| 免费看成人aa片无码视频吃奶| 一边摸一边抽搐一进一出| 久久精品国产精品亚洲毛片| 亚洲国产精品无码中文字| 公么大龟弄得我好舒服秀婷视频| 内射人妻无码色av天堂| 亲亲抱抱蹭蹭的刺激原声哔哩哔哩| 少妇挑战3个黑人叫声凄惨| 无码刺激性a片短视频| 大香区煮伊区2020小辣椒| 永不迷路-黑料正能量在线| 少妇我被躁爽到高潮a片| 国产spa盗摄xo在线观看| gogogo日本免费观看视频| 偷窥 性别 瘾 xxxxx| 老板含着她的花蒂啃咬高潮的视频| 久久精品国产一区二区三| 国产69精品久久久久9999不卡| 国产精品国产三级国产普通话| 在电影院里拨开内裤挺进| 无码精品人妻一区二区三区人妻斩| 免费高清视频免费观看| 久久精品免视看国产成人不卡| 国产又黄又大又粗视频| 大地资源电影中文在线观看| 亚洲成av人片乱码色午夜| 久久天堂AV综合合色蜜桃网 | 欧美一进一出抽搐大尺度视频| 成熟闷骚女邻居引诱2|