微服務拆分之道
背景
微服務在最近幾年大行其道,很多公司的研發人員都在考慮微服務架構,同時,隨着 Docker 容器技術和自動化運維等相關技術發展,微服務變得更容易管理,這給了微服務架構良好的發展機會。
在做微服務的路上,拆分服務是個很熱的話題。我們應該按照什麼原則將現有的業務進行拆分?是否拆分得越細就越好?接下來一起談談服務拆分的策略和堅持的原則。
拆分目的是什麼?
在介紹如何拆分之前,我們需要了解下拆分的目的是什麼,這樣纔不會在後續的拆分過程中忘了最初的目的。
拆分的本質是爲了將複雜的問題簡單化,那麼我們在單體架構階段遇到了哪些複雜性問題呢?首先來回想下當初爲什麼選用了單體架構,在電商項目剛啓動的時候,我們只希望能儘快地將項目搭建起來,方便將產品更早的投放市場進行快速驗證。在開發初期,這種架構確實給開發和運維帶來了很大的便捷,主要體現在:
-
開發簡單直接,代碼和項目集中式管理。
-
排查問題時只需要排查這個應用就可以了,更有針對性。
-
只需要維護一個工程,節省維護系統運行的人力成本。
但是隨着功能越來越多,開發團隊的規模越來越大,單體架構的缺陷慢慢體現出來,主要有以下幾個方面:
在技術層面,數據庫的連接數成爲應用服務器擴容的瓶頸,因爲連接 MySQL 的客戶端數量是有限制的。
**除此之外,單體架構增加了研發的成本抑制了研發效率的提升。**比如公司的垂直電商系統團隊會被按業務線拆分爲不同的組。當如此多的小團隊共同維護一套代碼和一個系統時,在配合的過程中就會出現問題。不同的團隊之間溝通少,假如一個團隊需要一個發送短信的功能,那麼有的研發同學會認爲最快的方式不是詢問其他團隊是否有現成的,而是自己寫一套,但是這種想法是不合適的,會造成功能服務的重複開發。由於代碼部署在一起,每個人都向同一個代碼庫提交代碼,代碼衝突無法避免;同時功能之間耦合嚴重,可能你只是更改了很小的邏輯卻導致其它功能不可用,從而在測試時需要對整體功能迴歸,延長了交付時間。模塊之間互相依賴,一個小團隊中的成員犯了一個錯誤,就可能會影響到其它團隊維護的服務,對於整體系統穩定性影響很大。
**最後,單體架構對於系統的運維也會有很大的影響。**想象一下,在項目初期你的代碼可能只有幾千行,構建一次只需要一分鐘,那麼你可以很敏捷靈活地頻繁上線變更修復問題。但是當你的系統擴充到幾十萬行甚至上百萬行代碼的時候,一次構建的過程包括編譯、單元測試、打包和上傳到正式環境,花費的時間可能達到十幾分鍾,並且任何小的修改,都需要構建整個項目,上線變更的過程非常不靈活。
而這些問題都可以通過微服務化拆分來解決。
爲了方便你更好的理解這塊,在此附上一份表格(內容來源:《持續演進的 Cloud Native:雲原生架構下微服務最佳》一書),可以更直觀地幫助你認識拆分的目的。
拆分時機應該如何決策?
產品初期,應該以單體架構優先。因爲面對一個新的領域,對業務的理解很難在開始階段就比較清晰,往往是經過一段時間之後,才能逐步穩定,如果拆分過早,導致邊界拆分不合理或者拆的過細,反而會影響生產力。很多時候,從一個已有的單體架構中逐步劃分服務,要比一開始就構建微服務簡單得多。同時公司的產品並沒有被市場驗證過,有可能會失敗,所以這個投入的風險也會比較高。
另外,在資源受限的情況下,採用微服務架構很多優勢無法體現,性能上的劣勢反而會比較明顯。如下圖所示。當業務複雜度達到一定程度後,微服務架構消耗的成本纔會體現優勢,並不是所有的場景都適合採用微服務架構,服務的劃分應逐步進行,持續演進。產品初期,業務複雜度不高的時候,應該儘量採用單體架構。
隨着公司的商業模式逐漸得到驗證,且產品獲得了市場的認可,爲了能加快產品的迭代效率快速佔領市場,公司開始引進更多的開發同學,這時系統的複雜度會變得越來越高,就出現單體應用和團隊規模之間出現矛盾,研發效率不升反降。上圖中的交叉點表明,業務已經達到了一定的複雜度,單體應用已經無法滿足業務增長的需求,研發效率開始下降,而這時就是需要考慮進行服務拆分的時機點。這個點需要架構師去權衡。筆者所在的公司,是當團隊規模達到百人的時候,才考慮進行服務化。
當我們清楚了什麼時候進行拆分,就可以直接落地了嗎?不是的,微服務拆分的落地還要提前準備好配套的基礎設施,如服務描述、註冊中心、服務框架、服務監控、服務追蹤、服務治理等幾大基本組件,以上每個組件缺一不可,每個組件展開又包括很多技術門檻,比如,容器技術、持續部署、DevOps 等相關概念,以及人才的儲備和觀念的變化。微服務不僅僅是技術的升級,更是開發方式、組織架構、開發觀念的轉變。
至此,何時進行微服務的拆分,整體總結如下:
-
業務規模:業務模式得到市場的驗證,需要進一步加快腳步快速佔領市場,這時業務的規模變得越來越大,按產品生命週期來劃分(導入期、成長期、成熟期、衰退期)這時一般在成長期階段。如果是導入期,儘量採用單體架構。
-
團隊規模:一般是團隊達到百人的時候。
-
技術儲備:領域驅動設計、註冊中心、配置中心、日誌系統、持續交付、監控系統、分佈式定時任務、CAP 理論、分佈式調用鏈、API 網關等等。
-
人才儲備:精通微服務落地經驗的架構師及相應開發同學。
-
研發效率:研發效率大幅下降,具體問題參加上面拆分目的裏提到的。
拆分時應該堅守哪些指導原則?
**1. 單一服務內部功能高內聚低耦合
**
也就是說每個服務只完成自己職責內的任務,對於不是自己職責的功能交給其它服務來完成。
2. 閉包原則(CCP)
微服務的閉包原則就是當我們需要改變一個微服務的時候,所有依賴都在這個微服務的組件內,不需要修改其他微服務。
3. 服務自治、接口隔離原則
儘量消除對其他服務的強依賴,這樣可以降低溝通成本,提升服務穩定性。服務通過標準的接口隔離,隱藏內部實現細節。這使得服務可以獨立開發、測試、部署、運行,以服務爲單位持續交付。
4. 持續演進原則
在服務拆分的初期,你其實很難確定服務究竟要拆成什麼樣。從微服務這幾個字來看,服務的粒度貌似應該足夠小,但是服務多了也會帶來問題,服務數量快速增長會帶來架構複雜度急劇升高,開發、測試、運維等環節很難快速適應,會導致故障率大幅增加,可用性降低,非必要情況,應逐步劃分,持續演進,避免服務數量的爆炸性增長,這等同於灰度發佈的效果,先拿出幾個不太重要的功能拆分出一個服務做試驗,如果出現故障,則可以減少故障的影響範圍。
5. 拆分的過程儘量避免影響產品的日常功能迭代
也就是說要一邊做產品功能迭代,一邊完成服務化拆分。比如優先剝離比較獨立的邊界服務(如短信服務等),從非核心的服務出發減少拆分對現有業務的影響,也給團隊一個練習、試錯的機會。同時當兩個服務存在依賴關係時優先拆分被依賴的服務。
6. 服務接口的定義要具備可擴展性
服務拆分之後,由於服務是以獨立進程的方式部署,所以服務之間通信就不再是進程內部的方法調用而是跨進程的網絡通信了。在這種通信模型下服務接口的定義要具備可擴展性,否則在服務變更時會造成意想不到的錯誤。比如微服務的接口因爲升級把之前的三個參數改成了四個,上線後導致調用方大量報錯,推薦做法服務接口的參數類型最好是封裝類,這樣如果增加參數就不必變更接口的簽名,而只需要在類中添加字段就可以了
7. 避免環形依賴與雙向依賴
儘量不要有服務之間的環形依賴或雙向依賴,原因是存在這種情況說明我們的功能邊界沒有化分清楚或者有通用的功能沒有下沉下來。
8. 階段性合併
隨着你對業務領域理解的逐漸深入或者業務本身邏輯發生了比較大的變化,亦或者之前的拆分沒有考慮的很清楚,導致拆分後的服務邊界變得越來越混亂,這時就要重新梳理領域邊界,不斷糾正拆分的合理性。
拆分的粒度是不是越細越好?
目前很多傳統的單體應用再向微服務架構進行升級改造,如果拆分粒度太細會增加運維複雜度,粒度過大又起不到效果,那麼改造過程中如何平衡拆分粒度呢?
弓箭原理
平衡拆分粒度可以從兩方面進行權衡,一是業務發展的複雜度,二是團隊規模的人數。如上圖,它就像弓箭一樣,只有當業務複雜度和團隊人數足夠大的時候,射出的服務拆分粒度這把劍纔會飛的更遠,發揮出最大的威力。
比如說電商的商品服務,當我們把商品從大的單體裏拆分出來的時候,就商品服務本身來講,邏輯並沒有足夠複雜到 2~3 個人沒法維護的地步,這時我們沒有必要繼續將商品服務拆的更細,但是隨着業務的發展,商品的業務邏輯變的越來越複雜,可能同時服務公司的多個平臺,此時你會發現商品服務本身面臨的問題跟單體架構階段面臨的問題基本一樣,這個階段就需要我們將商品拆成更細粒度的服務,比如,庫存服務、價格服務、類目服務、商品基礎信息服務等等。
雖然業務複雜度已經滿足了,如果公司此時沒有足夠的人力(招聘不及時或員工異動比較多),服務最好也不要拆分,拆分會因爲人力的不足導致更多的問題,如研發效率大幅下降(一個開發負責與其不匹配數量的服務)。這裏引申另外一個問題,一個微服務究竟需要幾個開發維護是比較理性的?我引用下李雲華老師在 " 從零開始學架構 “ 中的一段經典論述,可以解決此問題。
三個火槍手原則
爲什麼說是三個人分配一個服務是比較理性的?而不是 4 個,也不是 2 個呢?
首先,從系統規模來講,3 個人負責開發一個系統,系統的複雜度剛好達到每個人都能全面理解整個系統,又能夠進行分工的粒度;如果是 2 個人開發一個系統,系統的複雜度不夠,開發人員可能覺得無法體現自己的技術實力;如果是 4 個甚至更多人開發一個系統,系統複雜度又會無法讓開發人員對系統的細節都瞭解很深。
其次,從團隊管理來說,3 個人可以形成一個穩定的備份,即使 1 個人休假或者調配到其他系統,剩餘 2 個人還可以支撐;如果是 2 個人,抽調 1 個後剩餘的 1 個人壓力很大;如果是 1 個人,這就是單點了,團隊沒有備份,某些情況下是很危險的,假如這個人休假了,系統出問題了怎麼辦?
最後,從技術提升的角度來講,3 個人的技術小組既能夠形成有效的討論,又能夠快速達成一致意見;如果是 2 個人,可能會出現互相堅持自己的意見,或者 2 個人經驗都不足導致設計缺陷;如果是 1 個人,由於沒有人跟他進行技術討論,很可能陷入思維盲區導致重大問題;如果是 4 個人或者更多,可能有的參與的人員並沒有認真參與,只是完成任務而已。
“三個火槍手” 的原則主要應用於微服務設計和開發階段,如果微服務經過一段時間發展後已經比較穩定,處於維護期了,無須太多的開發,那麼平均 1 個人維護 1 個微服務甚至幾個微服務都可以。當然考慮到人員備份問題,每個微服務最好都安排 2 個人維護,每個人都可以維護多個微服務。
綜上所訴,拆分粒度不是越細越好,粒度需要符合弓箭原理及三個火槍手原則。
拆分策略有哪些?
拆分策略可以按功能和非功能維度進行考慮,功能維度主要是劃分清楚業務的邊界,非功能維度主要考慮六點包括擴展性、複用性、高性能、高可用、安全性、異構性。接下來詳細介紹下。
功能維度
功能維度主要是劃分清楚業務邊界,採用的主要設計方法可以利用 DDD(關於 DDD 的理論知識可以參考網上其它資料),DDD 的戰略設計會建立領域模型,可以通過領域模型指導微服務的拆分,主要分四步進行:
-
第一步,找出領域實體和值對象等領域對象。
-
第二步,找出聚合根,根據實體、值對象與聚合根的依賴關係,建立聚合。
-
第三步,根據業務及語義邊界等因素,定義限界上下文。
-
第四步,每一個限界上下文可以拆分爲一個對應的微服務,但也要考慮一些非功能因素。
以電商的場景爲例,交易鏈路劃分的限界上下文如下圖左半部分,根據一個限界上下文可以設計一個微服務,拆解出來的微服務如下圖右側部分。
非功能維度
當我們按照功能維度進行拆分後,並不是就萬事大吉了,大部分場景下,我們還需要加入其它維度進一步拆分,才能最終解決單體架構帶來的問題。
-
**擴展性:**區分系統中變與不變的部分,不變的部分一般是成熟的、通用的服務功能,變的部分一般是改動比較多、滿足業務迭代擴展性需要的功能,我們可以將不變的部分拆分出來,作爲共用的服務,將變的部分獨立出來滿足個性化擴展需要。同時根據二八原則,系統中經常變動的部分大約只佔 20%,而剩下的 80% 基本不變或極少變化,這樣的拆分也解決了發佈頻率過多而影響成熟服務穩定性的問題。
-
**複用性:**不同的業務裏或服務裏經常會出現重複的功能,比如每個服務都有鑑權、限流、安全及日誌監控等功能,可以將這些通過的功能拆分出來形成獨立的服務,也就是微服務裏面的 API 網關。在如,對於滴滴業務,有快車和順風車業務,其中都涉及到了訂單支付的功能,那麼就可以將訂單支付獨立出來,作爲通用服務服務好上層業務。如下圖:
- **高性能:**將性能要求高或者性能壓力大的模塊拆分出來,避免性能壓力大的服務影響其它服務。常見的拆分方式和具體的性能瓶頸有關,例如電商的搶購,性能壓力最大的是入口的排隊功能,可以將排隊功能獨立爲一個服務。同時,我們也可以基於讀寫分離來拆分,比如電商的商品信息,在 App 端主要是商詳有大量的讀取操作,但是寫入端商家中心訪問量確很少。因此可以對流量較大或較爲核心的服務做讀寫分離,拆分爲兩個服務發佈,一個負責讀,另外一個負責寫。還有數據一致性是另一個基於性能維度拆分需要考慮的點,對於強一致的數據,屬於強耦合,儘量放在同一個服務中(但是有時會因爲各種原因需要進行拆分,那就需要有響應的機制進行保證),弱一致性通常可以拆分爲不同的服務。
-
**高可用:**將可靠性要求高的核心服務和可靠性要求低的非核心服務拆分開來,然後重點保證核心服務的高可用。具體拆分的時候,核心服務可以是一個也可以是多個,只要最終的服務數量滿足 “三個火槍手” 的原則就可以。比如針對商家服務,可以拆分一個核心服務一個非核心服務,核心服務供交易服務訪問,非核心提供給商家中心訪問。
-
**安全性:**不同的服務可能對信息安全有不同的要求,因此把需要高度安全的服務拆分出來,進行區別部署,比如設置特定的 DMZ 區域對服務進行分區部署,可以更有針對性地滿足信息安全的要求,也可以降低對防火牆等安全設備吞吐量、併發性等方面的要求,降低成本,提高效率。
-
**異構性:**對於對開發語言種類有要求的業務場景,可以用不同的語言將其功能獨立出來實現一個獨立服務。
以上幾種拆分方式不是多選一,而是可以根據實際情況自由排列組合。同時拆分不僅僅是架構上的調整,也意味着要在組織結構上做出相應的適應性優化,以確保拆分後的服務由相對獨立的團隊負責維護。
服務都拆了爲什麼還要合併?
古希臘哲學家赫拉克利特曾經說過:“人不能兩次踏進同一條河流。” 隨着時間的流逝,任何事物的狀態都會發生變化。線上系統同樣如此,即使一個系統在不同時刻的狀況也絕不會一模一樣。現在拆分出來的服務粒度也許合適,但誰能保證這個粒度能夠一直正確呢。
服務都拆了爲什麼還要合,就是要不斷適應新的業務發展階段,筆者這裏做個類比看大家是否清晰,拆相當於我們開發代碼,合相當於重構代碼,爲什麼要重構呢,相信你肯定知道。微服務的合也是一樣的道理,隨着我們對應用程序領域的瞭解越來越深,它們可能會隨着時間的推移而變化。例如,你可能會發現由於過多的進程間通信而導致特定的分解效率低下,導致你必須把一些服務組合在一起。
同時因爲人員和服務數量的不匹配,導致的維護成本增加,也是導致服務合併的一個重要原因。例如,今年疫情的影響導致很多企業開始大量裁員,人員流失但是服務的數量確沒有變,造成服務數量和人員的不平衡,一個開發同學同時要維護至少 5 個服務的開發,效率大幅下降。
那麼如果微服務數量過多和資源不匹配,則可以考慮合併多個微服務到服務包,部署到一臺服務器,這樣可以節省服務運行時的基礎資源消耗也降低了維護成本。需要注意的是,雖然服務包是運行在一個進程中,但是服務包內的服務依然要滿足微服務定義,以便在未來某一天要重新拆開的時候可以很快就分離。服務合併到服務包示意圖如下:
拆分過程中要注意的風險
不打無準備之仗
開發團隊是否具備足夠的經驗,能否駕馭微服務的技術棧,可能是第一個需要考慮的點。這裏並不是要求團隊必須具備完善的經驗才能啓動服務拆分,如果團隊中有這方面的專家固然是最好的。如果沒有,那可能就需要事先進行充分的技術論證和預演,至少不打無準備之仗。避免哪個簡單就先拆哪個,哪個新業務要上了,先起一個服務再說。否則可能在一些分佈式常見的問題上會踩坑,比如服務器資源不夠、運維困難、服務之間調用混亂、調用重試、超時機制、分佈式事務等等。
** 不斷糾正**
我們需要承認我們的認知是有限的,只能基於目前的業務狀態和有限的對未來的預測來制定出一個相對合適的拆分方案,而不是所謂的最優方案,任何方案都只能保證在當下提供了相對合適的粒度和劃分原則,要時刻做好在未來的末一個時刻會變得不和時宜、需要再次調整的準備。因此隨着業務的演進,需要我們重新審視服務的劃分是否合理,如服務拆的太細,導致人員效率反而下降,故障的概率也大大增加,則需要重新劃分好領域邊界。
要做行動派,而不是理論派
在具體怎麼拆分上,也不要太糾結於是否合適,不動手怎麼知道合不合適呢?如果拆了之後發現真的不合適,在重新調整就好了。你可能會說,重新調整成本比較高。但實際上這個問題的本質是有沒有針對服務化架構搭建起一套完成的能力體系,比如服務治理平臺、數據遷移工具、數據雙寫等等,如果有的話,重新調整的成本是不會太高的。
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/mojOSgEUaHWGU3H3j7WjlQ