微軟藍屏搞癱全球,都怪歐盟?

“藍屏事件”事件,微軟終於給出了說法。

7月22日,微軟發言人在接受媒體採訪時表示,歐盟的限制措施導致其無法鎖定Windows系統,是引發本次全球性藍屏事件的原因之一。

微軟所說的歐盟限制性措施指的是,2009年微軟與歐盟達成協議,根據協議要求,微軟承諾給予所有安全軟件與微軟自身軟件相同的Windows內核訪問權限,使得像CrowdStrike這樣的第三方安全軟件開發商的安全產品,可通過Windows客戶端和服務器系統中的API,訪問並執行極其複雜的操作。

微軟認爲這一政策的代價是系統安全性降低,藍屏死機事件正是這一政策後果的體現。微軟發言人抱怨稱,“儘管公司希望能夠進一步鎖定操作系統以提高安全性,但歐盟的要求使得這一目標難以實現。”

5天前的“藍屏事件”確實影響巨大。7月18日,微軟Window系統在全球範圍陸續出現嚴重宕機,電腦無預警地陷入藍屏狀態。

辦公室裡,全球各地的白領打工人齊刷刷和藍屏顯示器合影留戀,自嘲微軟讓大家享受了週五放假。雖然社交平臺上充滿着調侃段子,但是藍屏事件不能真的當作是嘻嘻哈哈的玩笑。操作系統在當下幾乎可以看作是社會公用基礎設施,宕機事故引發了一連串運營“災難”。

除了辦公室,多家機場、火車站、辦公大樓外的顯示屏也都一片“藍”,美國、德國、澳大利亞等多地機場幾乎癱瘓,從值機櫃臺到登機口的航顯屏,全是一片“藍色”。期間,光是美國就有超過2000架次航班停飛,超過5300架次航班延誤。

除了運輸行業,公共服務也受到了嚴重影響。電視臺無法正常開展直播,醫院掛號和病歷系統無法使用,急救熱線信息難以同步,無法接診患者。

據微軟統計,全球約有850萬臺設備在期間受到影響。

面對這場自2017年以來全球最大規模的宕機事件,人們先是指責微軟,而後安全軟件開發商CrowdStrike被認爲是罪魁禍首,現在微軟說,得怪歐盟。

01

2017年,勒索病毒WannaCry利用微軟視窗系統漏洞襲擊全球互聯網。一旦中招電腦上的各類資料都無法正常打開,病毒製造者勒索價值約300美元的比特幣。

相比較WannaCry攻擊者身份的撲朔迷離,此次宕機事故緣由倒沒有那麼複雜,並非一起有針對性的安全事件或者網絡攻擊。

根據報道,在線安全解決方案服務商CrowdStrike公司的Falcon平臺版本更新出現問題,是造成此次混亂的直接原因。據稱,當日Falcon軟件代碼更新與Windows系統的交互方式有衝突引發了代碼錯誤,而這一問題在版本上線前的測試中沒有被關注到。

藍屏事件後,CrowdStrike股價暴跌11%,市值一夜蒸發近百億美元,創下了2022年以來最差單日表現。

據市場研究機構IDC統計,在價值86億美元的端點檢測和響應(EDR)軟件市場中,成立於2011年的CrowdStrike佔據了18%的市場份額,僅次於微軟。

CrowdStrike是一家以AI驅動安全解決方案的公司。該公司旗下的Falcon平臺利用人工智能和機器學習技術來檢測、預防和響應網絡威脅。軟件需要更深層次地訪問計算機的操作系統來掃描威脅,而這種訪問權限使其有能力破壞它們試圖保護的系統。

Falcon是一款to B端服務軟件,每臺機器的安裝成本超過50美元。中小型公司,或者說電腦被攻擊掀起不了嚴重後果的公司出於成本考慮並不會配備,只有對網絡安全有較高要求的企業纔會配備。截止2024年,CrowdStrike的客戶遍及超過170個國家,總量超29000個,其中五百多家位列財富1000強。

這也意味着,安裝了該軟件的計算機是最需要保護的計算機,如果它們癱瘓,關鍵服務也會隨之癱瘓。

在業內人士看來,此次事故說不上多麼複雜的技術問題,更像是海恩法則得到了應驗——每一起重大事故看似偶然,實則是各種不安全因素累積的結果。

美國網絡安全和基礎設施安全局局長珍·伊斯特利評論稱,這是一起嚴重影響全球關鍵基礎設施運行的重大事件,雖然這不是惡意的,但是“一個嚴重的錯誤”。

當前,全球的互聯網關鍵基礎設施高度數字化、高度相互依存、高度互聯,而軟件生態系統的保護並不到位,導致了系統呈現高度脆弱的特質,單一的bug就可以引起連帶反應。

某種程度上,各家公司在構建網絡空間的過程中,對速度的迫切要求使許多從業者安全運行意識在執行層面並不到位。

簡單來說,CrowdStrike選在週五更新就是一個並不明智的決定。萬一出現問題,就需要雙休日加班維護,對於講究WLB的美國人,雙休日效率遠不如工作日,甚至可能都聯繫不上。

“藍屏事件”發生後,根據媒體報道,至少有75家客戶有計劃因宕機事故帶來的連鎖問題向CrowdStrike提出索賠。

02

爲了解決問題,微軟積極採取了包括流量重定向、修復策略驗證及緩解措施的實施儘快恢復運作,在當天就解決了技術層面的問題,並一再強受影響的設備不到所有使用Windows系統設備的1%,試圖弱化事故的嚴重性。

事件發生後,微軟表現得很委屈,提示此次事故不是微軟直接造成的,並且現在又將原因推給與歐盟在15年達成的協議,它還暗示到,蘋果和谷歌並未受到類似限制。蘋果在 2020 年就停止向開發者提供內核級訪問權限,雖然給開發者帶來不便,但也提升了系統穩定性。

蘋果、谷歌各自的操作系統市場佔有率非常低,根據知名機構StatCounter的數據,截止至2023年12月底,全球桌面操作系統中,微軟的windows所佔的份額爲72.72%,是名副其實的互聯網基礎設施提供方。

份額越大,責任也就越大,雖然事情是CrowdStrike直接造成的,訪問權限是歐盟要求的,但對系統上運轉的程序缺乏必要的管控措施或者說備用方案,顯然也是微軟失職的。

類比一下,微軟的操作系統是通向用戶的高速公路,軟件供應商是路上行駛的各類汽車。一旦出現事故,大家不可能拋開道路只說汽車的問題。汽車在道路上如何駕駛,道路管理方也該拿出規範方案。即使某一個車輛出現問題,也不會導致整個道路網癱瘓。

2023年11月,微軟在內部發布“未來安全倡議”(Secure Future Initiative),強調要在基於AI的安全防禦、強化基礎軟件工程,更穩妥的國際規範三方面發力。彼時,微軟強調要利用AI的速度來擊敗網絡攻擊。

並且,正因爲歐盟的規定給足了第三方安全軟件開發商權限,所以微軟更需要做足準備,要求第三方安全軟件開放商嚴格執行軟件更新協議,留出冗餘度,提升IT人員應急處置能力。

顯然,作爲整個網絡的基礎服務提供商,微軟制度性建設還有極大的提升空間。

所以,這就不難理解爲什麼外界沒有放過抨擊微軟的機會,尤其是對微軟一直不滿的全球網紅馬斯克率先發難。

據報道,宕機期間特斯拉在美國的超級工廠出現了設備報錯,部分工人看到系統停轉選擇提前下班。當時馬斯克在個人賬號直接和微軟CEO納德拉喊話,抱怨微軟的故障給全球汽車供應鏈帶來了影響。此外,馬斯克還頗爲得意地炫耀道自己旗下的X平臺沒有受到影響。

但馬斯克可能笑得太早,未來特斯拉的系統也被迫開放時,也要做好充分的準備,否則“藍屏事件”也未必就一定不會發生在特斯拉身上。

03

近幾年,科技行業一路狂奔向前看,缺乏回頭夯實基礎服務和制度性建設的耐心。如現在所有的科技公司都在強調AI能力,反覆宣傳要把AI技術“融入生活的每一個環節”“無縫集成到每個應用”,一副要將觸手伸到社會每一個角落的意圖。

舊的不如新的,新的纔有估值,而基礎服務、基礎設施似乎是“老古董”,不值得再大力投入。快速的迭代也意味着快速淘汰,近幾年,不但許多新推出的智能產品都在短暫地追捧後,最後後不了了之,並且許多基礎服務也日漸缺少維護。“藍屏事件”就顯示出這種“喜新厭舊”的後果。

但另一方面,這次事件也顯示出高度互聯的網絡過於依賴單一基礎技術服務提供方的風險。

目前來說,大型企業都應當配備備用通信鏈路,確保有效應對和快速恢復的能力,最大限度減少對關鍵服務的干擾。如何在系統失靈的情況下守住安全底線,能否在沒有輔助工具的情況下保證核心業務的運營,是所有企業管理者都該思考的問題。

網絡安全也早已不是商業層面的問題。

“當世界上大部分地區都在與‘微軟藍屏’作鬥爭,中國基本上毫髮未損。”這是媒體發出的感嘆。

對於國內用戶,微軟藍屏事件更像是大洋彼岸的新聞,沒有切身實感,從社交媒體上看,只有極少數外企受到了影響。

但其實windows系統在中國市場的佔有率也非常高,只是很多運行的windows系統是盜版的,並未升級,並且,CrowdStrike在國內沒有銷售。所以國內運行windows系統的電腦躲過了一劫。

事件發生後,國內各大官媒紛紛發表評論強調網絡基礎設施的重要性,進一步表明國內在信息化時代必須走自主可控的發展道路。

360創始人、新晉網紅周鴻禕更是在個人賬號發佈視頻表示,電腦網絡安全必須要掌握在自己手裡,殺毒軟件一定要是國產品牌。“假設將來有一天在大國博弈的時候,某家公司假裝升級出錯,然後導致系統出現藍屏,那就不是電腦死機不上班的問題。”

這種顧慮在強調自主可控的大背景下,是得到很多人認同的。

如果說歐盟迫使微軟向第三方安全軟件開發商開放API,使其能訪問並執行極其複雜操作,是反壟斷措施,對微軟彰顯管轄權和控制力,那麼這次事件後,各國也會重新思考在網絡基礎設施的保障、管理能力。

從務實的角度來說,全球科技行業的規則制定權仍在歐美手中,國內和美國在硬實力上確實還有差距,各家企業在調動資源上也不如硅谷龍頭。但是,走自主發展目標不是要拼盡全力成爲行業第一名,而是給國內用戶更多的選擇權,不至於在關鍵時刻受制於人。

一家公司的一個小錯誤掀起全球範圍的停擺,是讓各國深感憂慮的,本次藍屏事件也絕對不會是最後一次全球性宕機,網絡安全需要時刻保持警醒。