【小(xiǎo)編推薦】藍(lán)雲湯濤:從(cóng)雲運維角度ε'&∑解讀(dú)全網負載均衡

2015-08-13  ←∑ε£ |   發布者:梁國(♣§​guó)芳   |&£Ω∑nbsp;  查看(kàn):3320次

IT新聞
 運維在“雲江湖(hú)”的(d₹‌$αe)地(dì)位毋庸置疑。可(kě)以說(shuō),沒有(yǒu£"↔↑)雲運維就(jiù)沒有(yǒu)雲計(jì)算( >✘♠suàn)。這(zhè)其中,不(bù)僅是(shì)傳統數(shù)據→$中心的(de)運維管理(lǐ),還(hái)≤↕₹☆有(yǒu)新技(jì)術(shù)如(rú)Co₽§σδntainer運維、Hadoop運維、Sparγ∏k運維、安全運維等。在世紀互聯藍(lán)雲事(s®≥​∏hì)業(yè)部技(jì)術(shù)運維總經理♥​₽(lǐ)湯濤看(kàn)來(lái):“↑λ♣↓中國(guó)本土(tǔ)市(shì)場(→ε↑chǎng),混合雲和(hé)公有(yǒu)雲在IT∑≈↑≤預算(suàn)上(shàng)的(de)比例是(shì)10:1,即10元投入在混合雲,1元在公有(yǒu)雲。而↑♥快(kuài)速發展的(de)混合雲市(shì"≤)場(chǎng),使得(de)傳統運維也(yě)在迅速向β™雲運維轉型。其中,有(yǒu)挑戰,更有(yǒu)機(jī)✘ε£Ω遇。”

雲運維要(yào)更集中、專業(yè)和(™π↔∞hé)精準

在混合雲的(de)場(chǎng)景中,現(xiàn)有(yǒu)應用(yòn♠ε↕₽g)遷入雲是(shì)比較多(duō)的(de)一(yī<↓♦)類。企業(yè)希望新系統能(néng)夠更加“高(gāo∏<"™)可(kě)用(yòng)”。湯濤就(jiù)Cluste  ↑→r集群和(hé)混合雲方案做(zuò)了(le)一(yī)個(gè)對(d♣×uì)比。為(wèi)了(le)保證高(gāo)可(kě)用(yòng¶≤),傳統方案多(duō)是(shì)2台或者4台服務器(qì)做(zuò)Clφ®‌uster集群,一(yī)台宕機(jī)另一(yī)台還(há€‌↕♦i)可(kě)以正常運行(xíng)。但(dàn)此方案局限性也(yě)很(λ∞hěn)明(míng)顯:

 

 

湯濤分(fēn)析道(dào):“如"≈ (rú)果同樣場(chǎng)景采用(yòng)混合雲方案,♥™γ傳統IT架構需要(yào)250台服務器(qì),雲γ™←架構也(yě)許隻需要(yào)100台服務器(qì)或者更少₽©☆≠(shǎo)就(jiù)夠了(le)。在硬件(jiàn)和(hé)₩☆≤"電(diàn)力支出等方面都(dōu)有π××¥(yǒu)很(hěn)大(dà)的(de)節省,應用(yòng)層以下(xi♠Ωà)的(de)運維也(yě)全面由雲服務提供商所承擔,節省人(rén)力、>♣​物(wù)力和(hé)财力。”

世紀互聯藍(lán)雲事(shì)業(yè)部技(jì)‌σ± 術(shù)運維總經理(lǐ) 湯濤

事(shì)實上(shàng),關于運維工(gōng)作(zuò)範疇"©×∑的(de)變化(huà),已經被很(hěn)多(duō)雲上(shàng)初∑α≈創團隊所驗證:混合雲架構下(xià),傳統運維負責應用€‌(yòng)層,雲運維負責數(shù)據中心的(de)風(fēng)火(hπ☆uǒ)水(shuǐ)電(diàn)以及雲操作(zuò)系統等。湯濤♣σ"♣表示:“以前在系統出現(xiàn)問‌∞↑↕(wèn)題時(shí),技(jì)術(shù)部門(mén)會≤>γ₩(huì)對(duì)服務器(qì)、桌面、應用↑< (yòng)系統等進行(xíng)排查,但(dàn)≥∑ ₽混合雲後,傳統IT架構變成基于雲架構,應用( <≤≥yòng)更多(duō)在雲端。而雲計(jì)算(suàn)的(d✔♦§ e)本質就(jiù)是(shì)資源共享,每一(yī)個(gè)®♠<操作(zuò)所影(yǐng)響的(de)都(dōu)是(shì)平台上(≥‌∑shàng)若幹企業(yè)用(yòng)戶的(de)應用€‍↑≤(yòng)。所以雲運維工(gōng)程師(shī)需要(yào≤₩♥≤)從(cóng)針對(duì)單機(jī)、單₽↔®系統向多(duō)服務器(qì)、多(duō)系統、 ✔₩®多(duō)平台的(de)管理(lǐ),更集中、₽©更專業(yè)化(huà)的(de)方向轉變,需要(y↔>α™ào)更加小(xiǎo)心和(hé)謹慎,更具精準度的(de)₹α 處理(lǐ)。比如(rú)服務器(qì)打補丁,原來(lái)是(shì)下¶☆(xià)載後,工(gōng)程師(shī)直接安裝,但(​®×≥dàn)現(xiàn)在需要(yào)全方位測試和(hé)部ε α署。雲平台的(de)運維每一(yī)個(g©γ©‍è)操作(zuò)都(dōu)要(yào)遵守嚴​©Ω格的(de)規定(運維SOP編制(zhì)指南(nán₩→))。這(zhè)對(duì)運維工(gōn♣✔g)程師(shī)的(de)學曆、技(jì)術(shù)'♠☆£水(shuǐ)平、專業(yè)能(néng)力等都(dōu)有(yǒu)更的(♣∑✔≈de)高(gāo)要(yào)求。在藍(lán)雲運維團隊中,多(duō)♦"Ω₹數(shù)工(gōng)程師(shī)都(dōu)需要(yào♣↕γ)半年(nián)或者更長(cháng)時(shí)間(jiān)的(de→₹♦β)專業(yè)性訓練後,才能(néng)正式進入雲運維工(gōng)作(÷₩✘zuò)。”

而随著(zhe)混合雲應用(yòng)的δ•£™(de)逐步深入,湯濤對(duì)CSDN雲計(jì)✔₩算(suàn)表示:“現(xiàn)在很(hěn)≈‍€δ多(duō)新業(yè)務上(shàng)線速度很(hěn)快(ku£☆δài),很(hěn)多(duō)企業(yè)都(dōu)和(hé)藍(lán®$)雲運維團隊溝通(tōng),希望能(néng)夠實現(xiàn)運維的(de•™§₩)外(wài)包服務。同樣我們也(yě)看('♥©®kàn)到(dào),ITSM(IT服務管理(l≠∑ǐ))也(yě)開(kāi)始走向雲化(huà)服務。&≈ ↑✔rdquo;

從(cóng)運維角度看(kàn)全網負載均衡

從(cóng)運維的(de)角度來(lái'>♥&)看(kàn),自(zì)動縮放(fàng↓✔₹§)、彈性擴容、負載均衡(SLB技(jì)術(shγ♦ù))都(dōu)是(shì)很(hěn)重要(yào)的±$ ↓(de)技(jì)術(shù)。尤其是(shì)已獲得(de✔¥)了(le)可(kě)信雲計(jì)算(suàn)認↕Ω證的(de)WindowsAzure的(de)全網負載均衡(Tra‍πffic Manager)。簡單€'<來(lái)說(shuō),就(jiù)是$÷€✘(shì)在擁有(yǒu)不(bù)同的(de)數(‌™≈shù)據中心、多(duō)個(gè)操作(zuò)單元的(de)基礎×₹§上(shàng),根據狀态的(de)有(yǒu)無、服務♣¶器(qì)負載、網絡帶寬和(hé)速度等因素,将流量變化(huà&®π )智能(néng)地(dì)導向到(dào)不(b₩"‌↔ù)同的(de)服務器(qì)集群上(shàng)。如¥±☆ (rú)同一(yī)個(gè)智能(néng)∞♥的(de)交通(tōng)調度中心,這(•'&↓zhè)個(gè)智能(néng)全網負載系統通(tōng)過循環負載均衡↑ ₹、性能(néng)負載均衡、故障轉移負載均衡等功能(néng),幫助企業(y₹✔ è)自(zì)動監測并自(zì)動定向交通(tōng)流量,為(w→÷èi)企業(yè)選擇一(yī)條最快(kuài)最高(gāo)效的(de)交φσ通(tōng)線路(lù)到(dào)達目的(de)地©♣  (dì)。但(dàn)雲服務往往都(dō←↓↓'u)是(shì)跨地(dì)域的(de),所以要(yào)真正實現(xiàn ↑♥γ)全網負載均衡并不(bù)容易。“從(cón‌≠g)研發走向穩定至少(shǎo)需要(yào)2-3年(niá∞β≥>n),這(zhè)也(yě)是(shì)為(wèi)何目前僅有(&λyǒu)由世紀互聯運營的(de)Window↕‌∞s Azure能(néng)夠通(tōng)過該項認證的(de)原₩ ↓因。”

在湯濤看(kàn)來(lái),全網負載均衡的(de)技(jì)術(π‍☆♠shù)點包括故障轉移、輪詢、按性能(néng)分(fēn)配等,這(zhè) σλ些(xiē)對(duì)用(yòng)戶而言都(dōu)很(™™₩≠hěn)重要(yào)。事(shì)實上(shàng),雷擊、斷網、®≤↑✔DDos攻擊等宕機(jī),包含私有(yǒu)雲、混合雲、公有(yǒu)雲都(>✘'dōu)會(huì)遇到(dào),通(&σtōng)過全網負載均衡可(kě)以不(bù)僅可(kě)以指向Aσ zure雲服務,還(hái)可(kě)以指向用(yòng)戶的(de)←©→私有(yǒu)雲或者混合雲,即使是(shì)其他(tā)的(d♣€σλe)雲服務提供商的(de)雲服務也(yě)是(∞♣αshì)可(kě)以的(de)。比如(rú)同樣一λ®Ω(yī)個(gè)用(yòng)戶端域名可(kě)以指向分(fēn)布在✘"★÷10個(gè)不(bù)同雲上(shàng)的(de)10個(gè)站(zh♣✔γ$àn)點,任何一(yī)個(gè)雲節點故障發生(shēng)時(shí)>©✔,用(yòng)戶都(dōu)可(kě)以指向其他(tā)Ω☆↑δ9個(gè)。所以隻要(yào)10個(gè)雲節↓≠¥$點中的(de)1個(gè)不(bù)宕,服務就(jiù)能(n₹βéng)有(yǒu)效提供。

 

 

湯濤詳細解釋:從(cóng)底層技(jì)術(shù)來(lái)看∏≈β(kàn),用(yòng)戶的(de)架構設計(jìΩλλ)時(shí),傳統IT架構和(hé)雲‍π Ω架構不(bù)同,前者更多(duō)在Iaa±α¶S層,後者會(huì)用(yòng)到(d÷÷βào)雲的(de)虛拟機(jī),而在真正能(néng)體(tǐ)現(↕×xiàn)雲價值的(de)軟件(jiàn)層↓♠涉及較少(shǎo)。這(zhè)也(yě)是‍<•←(shì)曾經業(yè)內(nèi)有(yǒu) ' 人(rén)将虛拟化(huà)和(hé)雲計(§×≈™jì)算(suàn)試圖劃等号的(de)原因。然而僅有(λ yǒu)虛拟化(huà)是(shì)不(bù)夠的(de),更多(®>&≤duō)是(shì)基于PaaS層的(de)雲化(h€↓uà)服務,更多(duō)特征或者功能(néng)的(de)服務。比€→如(rú)跨中心的(de)高(gāo)可(kě)用(yòn®₩σg),HA(High Availability)Ω× ,從(cóng)架構上(shàng)使應用(yòn↓↑ €g)無狀态化(huà),是(shì)PaaS層的(de)技(jì)術✔α(shù)。舉個(gè)例子(zǐ),10台虛拟機(jī)跑¶♥¶©一(yī)個(gè)應用(yòng),這(zhè)10台虛拟機(jī)中都★₽≈(dōu)存有(yǒu)與用(yòng)≤♣☆戶相(xiàng)關的(de)所有(yǒ€‍u)狀态,保存在共享緩存中或者數(shù)據庫中,然後通(tōn₩✘δ g)過數(shù)據中心同步實現(xiàn)變化(huà)的(de)統一(♣&★↑yī)性。當這(zhè)10台中任何1-2台宕掉'→₽時(shí)不(bù)會(huì)影(yǐnγ→g)響業(yè)務正常運轉,也(yě)不(bù)<γ  會(huì)影(yǐng)響暫存數(shù)‍‌γε據或者已存儲數(shù)據。

Azure在國(guó)內(nèi)的(d≠‍ ♣e)北(běi)京和(hé)上(shàng)海(₽✘hǎi)的(de)數(shù)據中心中,數(shù)據是(sπ♣×¥hì)自(zì)動同步的(de),所以簡單地(dì)說(sε←↔₹huō)隻需将無狀态應用(yòng)直接放(fàng)到(dào)兩個(§≈&gè)數(shù)據中心,再架一(yī)個(gè)全網負載指向即可(↕αkě)。當一(yī)個(gè)出現(xiàn)↓∑€™問(wèn)題,自(zì)動轉到(dào)另‍≠₽σ一(yī)個(gè)上(shàng)。當架✘× 構重新設計(jì)時(shí),全網負載可(kě)以指向用(yònλ₽g)戶私有(yǒu)雲數(shù)據中心,或者第三方數(shù)據中心(其他(★↕tā)公有(yǒu)雲數(shù)據中心),所采用(yòng)的(de)就™β(jiù)是(shì)Azure Traffic Manageγ•r技(jì)術(shù)。相(xiàng)當于在Azure和(hé)其® ¥他(tā)數(shù)據中心通(tōng)過VPN架設起來(lái),在不(bù)停機(jī)的(de)情況下(xià)執行(x​∑íng)升級和(hé)服務維護,實現(xiàn)高(gāo)速通(tō​>ε<ng)路(lù)。無論是(shì)其他(tā)辦公室還(hái)是(‌ ↕δshì)數(shù)據中心,都(dōu)可(kě)以享受全網負載的(de)<<•優勢。

談到(dào)具有(yǒu)财務保障的(de)高(gāo)達99.9%的(de©✘)月(yuè)度SLA服務等級協議(yì)保證$Ω∑®,湯濤還(hái)分(fēn)享了(le)一(yī)些(×"↓xiē)技(jì)術(shù)細節:由于Az​✔ure提供6份備份,容災方面的(de)考慮,首先是(shì)數(s≈÷hù)據層面,其次是(shì)應用(yòng)層面,出現(xiàn)問(©‌₩≤wèn)題不(bù)僅是(shì)保護數(shù)據,還(hái)€π有(yǒu)讓用(yòng)戶可(kě)以随時<÷(shí)訪問(wèn)到(dào)關鍵應用(yòng)。比如(rú)有(£γ☆yǒu)些(xiē)關鍵應用(yòng)可(kě)能(né÷Ωεng)一(yī)分(fēn)鐘(zhōng)都(dōu)不(bùδ$)能(néng)宕機(jī)。這(zhè)時(shí)就(jiù)不(≈¶bù)僅需要(yào)應用(yòng)級容災,還(hái)​&©←需要(yào)異地(dì)災備,跨城(chéng)(1000公裡(lǐ)以上✘★(shàng))異地(dì)災備。而Azur‍★↑e的(de)北(běi)京和(hé)上(shàng)海(hǎ≈♣ i)的(de)數(shù)據中心是(sh£<$↔ì)通(tōng)過高(gāo)速“雙£×•‌”光(guāng)纖連接的(de),兩條通(tōng)路(lù)是  ✔∞(shì)相(xiàng)對(duì)獨立的(de),可(kě)以避免如(rú)地(dì)震、“挖掘機∑↕£(jī)”這(zhè)類問(wèn)γ÷©題。如(rú)果用(yòng)Azure的↓∞(de)PaaS,隻要(yào)将虛拟機(jī)放(fàng)入可(kě)用★★♦(yòng)級中,就(jiù)已自(zì)動實現(xiàn)跨區(qū→∑≤÷)管理(lǐ),比如(rú)說(shuō)同一(yī)數(shù)據中心不(‍ ₩bù)同機(jī)架,或者不(bù)同數(shù)據中心之"β§間(jiān),任何一(yī)個(gè)機(jī)器(qì)宕掉,•♦π系統都(dōu)能(néng)自(zì)動識别,并且自(zì)動啓動一(φ↔‍‌yī)個(gè)新的(de)實例起來(lái)。再加上(sh'​¥‌àng)自(zì)動縮放(fàng)、實時(shí)監測,就(jiù)能(φ•<>néng)自(zì)動适應,并提供高(gāo)度✘ ≥穩定、可(kě)用(yòng)的(de)解β©♠決方案,效果很(hěn)好(hǎo)。

舉個(gè)例子(zǐ),用(yòng)戶配置是(β★ ♣shì)4台虛拟機(jī),其中2台出現(xiàn)問(wèn)題,不(bù)✘ ¶₽需人(rén)工(gōng)幹預,系統自(zì)動會(huì)♠>從(cóng)不(bù)同機(jī)架上(s‌✘♣hàng)調配2台新虛拟機(jī)實例,這(zhè)樣在上(sh♠∑☆àng)海(hǎi)和(hé)北(běi)京的(de)數(shùδ<∑)據中心,這(zhè)樣就(jiù)一(yī)直£π$保持4個(gè)虛拟機(jī)在響應用(yòng)戶需求。這(z↕πΩhè)是(shì)Azure PaaS實例層π'面一(yī)個(gè)很(hěn)重要(&∏yào)的(de)技(jì)術(shù) π",國(guó)內(nèi)其他(tā)雲服務企業(yè)≥ε¥在藍(lán)雲的(de)帶領下(xià),也(y∏<✔ě)在逐步提供這(zhè)樣的(de)服務。

不(bù)止如(rú)此,為(wèi)了(le)提升運維服務水(shuǐ)平 ₩↑±,除了(le)高(gāo)效響應和(hé)分(fēn)級處理(lǐ)≠<∑≠制(zhì)度外(wài),運維團隊還(hái)從(cóng)不∑→←σ(bù)同指标中選擇最優組合指标來(lái)判斷問(wèn)題的(d€₽≥e)出現(xiàn)、狀況、處理(lǐ)方案,湯濤表示:“不(bù)僅有(yǒu)傳感器(φ"₽×qì),還(hái)需要(yào)有(yǒu)監控​™§傳感器(qì)的(de)體(tǐ)系,通(tō→♣ng)過這(zhè)樣的(de)二級防護體(tǐ)系來(lái)保障運維穩定、安全和(hé)高(gāo)效。在一(yī)$<✔些(xiē)實際場(chǎng)景中,在用(y★ε↔δòng)戶的(de)請(qǐng)求下(xià)藍(lán)雲還(h᥀i)會(huì)幫助用(yòng)戶分(fēn)析是(shì‌ )解決方案的(de)問(wèn)題還(hái)是(shì)平台的(de)B↕₹>ug,甚至可(kě)以從(cóng)代碼角度進行(xíng)排查。&r ≠dquo;

随著(zhe)雲計(jì)算(suàn)的(de)深入♦✔§,傳統IT運維過度到(dào)雲運維,已是(shì)趨勢。而無論是(s®≈"&hì)自(zì)動化(huà)還(hái)是(shì)規模化(huà),‍δα≈運維都(dōu)是(shì)朝高(gāo)π→φλ精尖方向發展,如(rú)果運維工(gōng)程師(sh♦"ī)能(néng)主動學習(xí),更寬​↓廣的(de)雲運維之路(lù)就(jiù)在前方。