運(yùn)維工作十多年,無數(shù)個(gè)瞬間、我覺得自己還是個(gè)小白…

?曾幾何時(shí),當(dāng)我還是一名初出茅廬的計(jì)算機(jī)專業(yè)應(yīng)屆生的時(shí)候,在招聘網(wǎng)站上瀏覽了很多招聘貼,眼花繚亂的技術(shù)崗位讓我摸不著頭腦:研發(fā)工程師、運(yùn)維工程師、測試工程師…?

大學(xué)期間專業(yè)課馬馬虎虎,更談不上有什么技術(shù)視野,對(duì)于具體從事那個(gè)技術(shù)方向并沒有什么明確的想法。

直到一位學(xué)長對(duì)我說:“做運(yùn)維吧,做運(yùn)維不用天天寫代碼,會(huì)玩 Liunx 就行!比做開發(fā)輕松多了!”

????????我選擇了相信……

入行十多年,吃過很多苦,背了很多鍋,弄死過服務(wù)器,經(jīng)歷過部門裁員,如果有人現(xiàn)在跟我說做運(yùn)維比開發(fā)簡單,那我會(huì)毫不猶豫的把他拉黑…????????

基礎(chǔ)的運(yùn)維工作很簡單,但運(yùn)維工作最大的特點(diǎn)就是復(fù)雜

在我看來,運(yùn)維工作可能是最復(fù)雜的技術(shù)工種之一,需要處理大量的技術(shù)細(xì)節(jié)、不同平臺(tái)的集成和配置,以及解決各種復(fù)雜的問題和故障。因此需要運(yùn)維人員擁有廣泛的技能和知識(shí),以應(yīng)對(duì)不斷變化的技術(shù)和業(yè)務(wù)需求:

運(yùn)維常常要面對(duì)的復(fù)雜平臺(tái)運(yùn)維工作。原因是企業(yè)通常需要管理和監(jiān)控的不是單一的平臺(tái)和系統(tǒng),而是復(fù)雜的多,這些系統(tǒng)可能來自不同的供應(yīng)商,使用不同的協(xié)議和技術(shù),包括服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)、應(yīng)用程序等。

繁瑣的配置管理也是運(yùn)維工作的難點(diǎn)之一。配置管理涉及到大量的任務(wù),例如系統(tǒng)安裝、配置更新、軟件安裝和更新等。這些任務(wù)需要在整個(gè)系統(tǒng)中協(xié)調(diào)和執(zhí)行。

大規(guī)模集群的管理工作同樣不簡單。大型企業(yè)需要管理數(shù)千臺(tái)服務(wù)器,這需要強(qiáng)大的工具和自動(dòng)化技術(shù)。運(yùn)維人員需要使用自動(dòng)化工具來管理配置、更新、監(jiān)視和報(bào)告。

運(yùn)維安全問題同樣不能忽視。運(yùn)維人員需要保護(hù)公司的資產(chǎn)和數(shù)據(jù),并保證系統(tǒng)的安全性。這可能包括防火墻、入侵檢測系統(tǒng)、安全補(bǔ)丁管理等。

運(yùn)維還需要有豐富的故障處理經(jīng)驗(yàn)。故障是運(yùn)維工作中的常見問題,當(dāng)系統(tǒng)出現(xiàn)問題時(shí),運(yùn)維人員需要快速定位故障,并采取措施恢復(fù)服務(wù)。

持續(xù)學(xué)習(xí)是對(duì)運(yùn)維人最基本的要求。運(yùn)維工具和技術(shù)的快速演進(jìn)十分夸張,IT技術(shù)在不斷發(fā)展,新技術(shù)和工具不斷涌現(xiàn),運(yùn)維人員需要不斷學(xué)習(xí)和更新知識(shí),以跟上技術(shù)的快速演進(jìn)。

運(yùn)維是高危職業(yè),沒弄死過服務(wù)器的運(yùn)維人生是不完美的?

如果說高危職業(yè),運(yùn)維肯定可以算一個(gè),即使在不少大公司,也經(jīng)常發(fā)生運(yùn)維人為操作引起的宕機(jī)事故:

太平洋石油公司網(wǎng)絡(luò)攻擊(2021年):2021年5月,美國太平洋石油公司遭到一次勒索軟件攻擊,導(dǎo)致該公司的網(wǎng)絡(luò)和服務(wù)器出現(xiàn)故障和停機(jī)。據(jù)報(bào)道,該事件是由于一名員工在誤操作時(shí)打開了一個(gè)惡意鏈接導(dǎo)致的。

gitlab故障(2017年):2017年1月,代碼托管服務(wù)提供商GitLab發(fā)生了一次嚴(yán)重的數(shù)據(jù)丟失事件,導(dǎo)致許多客戶的數(shù)據(jù)被永久刪除。據(jù)GitLab后來的官方聲明,這是由于一名員工在誤操作時(shí)刪除了一個(gè)生產(chǎn)數(shù)據(jù)庫的文件導(dǎo)致的。

沃爾瑪服務(wù)器宕機(jī)(2019年):2019年11月,美國零售巨頭沃爾瑪?shù)姆?wù)器在一個(gè)小時(shí)內(nèi)多次宕機(jī),導(dǎo)致該公司的網(wǎng)站、應(yīng)用程序和支付系統(tǒng)無法正常工作。據(jù)報(bào)道,該事件是由于一名員工在進(jìn)行例行的服務(wù)器維護(hù)時(shí)出現(xiàn)錯(cuò)誤導(dǎo)致的。

微軟azure云服務(wù)中斷(2020年):2020年9月,微軟的Azure云服務(wù)出現(xiàn)了一次全球性的中斷,導(dǎo)致許多客戶的應(yīng)用程序和服務(wù)無法正常工作。后來證實(shí),該事件是由于一個(gè)網(wǎng)絡(luò)配置錯(cuò)誤導(dǎo)致的。

運(yùn)維也可能面對(duì)各種不可抗力,甚至是自然災(zāi)害

菲律賓臺(tái)風(fēng)(2013年):2013年11月,菲律賓遭遇了一場強(qiáng)烈的臺(tái)風(fēng),這是自1947年以來菲律賓遭遇的最強(qiáng)臺(tái)風(fēng)。這場臺(tái)風(fēng)造成了超過6,000人的死亡和失蹤,并且對(duì)該國的基礎(chǔ)設(shè)施造成了嚴(yán)重破壞。該災(zāi)難還導(dǎo)致許多國際企業(yè)在菲律賓的數(shù)據(jù)中心和服務(wù)器停機(jī)。

美國颶風(fēng)(2012年):2012年10月,美國東海岸遭遇了一場強(qiáng)烈的颶風(fēng),該災(zāi)難造成了大規(guī)模的停電、通信中斷和水災(zāi)。該災(zāi)難還導(dǎo)致了一些知名公司和服務(wù)提供商的數(shù)據(jù)中心和服務(wù)器停機(jī),包括亞馬遜、谷歌和Netflix。

職業(yè)發(fā)展方向不明確,運(yùn)維工作常常陷入職場迷茫…?????

硬技能落后可能是運(yùn)維人面對(duì)的最大難題。隨著技術(shù)的不斷進(jìn)步,運(yùn)維工作需要不斷學(xué)習(xí)新的技能和工具,以適應(yīng)不斷變化的市場需求。然而,對(duì)于一些從事運(yùn)維工作多年的人來說,他們可能會(huì)發(fā)現(xiàn)自己的技能已經(jīng)落后于市場需求,這會(huì)讓他們感到迷茫和不知所措。

大環(huán)境不好真不是運(yùn)維造成的。與其他技術(shù)領(lǐng)域相比,運(yùn)維領(lǐng)域的職業(yè)發(fā)展路徑相對(duì)較模糊。在一些組織中,運(yùn)維工程師往往只被視為“后勤部門”,缺乏與其他技術(shù)團(tuán)隊(duì)平等的地位和待遇,例如無法得到應(yīng)有的認(rèn)可和獎(jiǎng)勵(lì)。這更加重了運(yùn)維的負(fù)面情緒,從而一定程度導(dǎo)致運(yùn)維工程師對(duì)職業(yè)發(fā)展前景不夠明確。

只顧低頭走路,無暇抬頭看天。運(yùn)維工作的本質(zhì)是確保系統(tǒng)的穩(wěn)定性和可靠性,因此運(yùn)維工程師必須時(shí)刻保持高度的警惕和專注。這可能會(huì)導(dǎo)致他們的工作壓力非常大,特別是在面對(duì)系統(tǒng)故障或緊急事件時(shí)。疲于應(yīng)付生活中的茍且,無暇思考職業(yè)發(fā)展的遠(yuǎn)方。

因此我們常常在思考,運(yùn)維生涯如何更好的發(fā)展???

布賴恩·費(fèi)瑟斯通豪所著《遠(yuǎn)見》一書中描述了職業(yè)生涯的普遍發(fā)展規(guī)律,其中提到的原則或許能給我們答案:

運(yùn)維工作十多年,無數(shù)個(gè)瞬間、我覺得自己還是個(gè)小白…

具備未來45年的思維,如果以較長的時(shí)間跨度為規(guī)劃,例如45年,你就不會(huì)在乎眼下一城一池的得失。而且在有明確職業(yè)規(guī)劃的前提下,更容易克服困難,堅(jiān)持下去。

而我們要做的是明確運(yùn)維技術(shù)發(fā)展的路徑,從而在一個(gè)細(xì)分技術(shù)領(lǐng)域做到極致

devops 轉(zhuǎn)型:不知何時(shí),技術(shù)圈開始流行一種所謂的“DevOps已死”的論調(diào)。然而 DevOps 絕不是簡單的讓開發(fā)去做運(yùn)維,讓運(yùn)維無路可走。

運(yùn)維工作已經(jīng)很難了,別在給我們制造恐慌了。

真正 DevOps 的必要組成部分應(yīng)是一個(gè)內(nèi)部 DevOps 平臺(tái)和維護(hù)內(nèi)部平臺(tái)的專門團(tuán)隊(duì),而不是一需要程序員自己去搞定的零散開源工具,或者說讓開發(fā)去干運(yùn)維的活。真正的 DevOps 團(tuán)隊(duì)?wèi)?yīng)該讓開發(fā)和運(yùn)維緊密團(tuán)結(jié)在一起,共但共責(zé),協(xié)同提升IT效能,從而為業(yè)務(wù)賦能。

運(yùn)維向 DevOps 的轉(zhuǎn)型需要運(yùn)維人員掌握一些關(guān)鍵的工具和技術(shù),如持續(xù)集成、持續(xù)交付、自動(dòng)化測試、容器化等,同時(shí) DevOps 團(tuán)隊(duì)?wèi)?yīng)引入敏捷開發(fā)、迭代開發(fā)和持續(xù)交付等方法。在一個(gè)建立完備 DevOps 文化的企業(yè),運(yùn)維轉(zhuǎn)型 DevOps 工作是一個(gè)非常好的發(fā)展路徑。

向 AIOps 轉(zhuǎn)型:同樣 AIOps 也是運(yùn)維一直比較好的職業(yè)發(fā)展路徑。AIOps 可以幫助 IT 運(yùn)維人員自動(dòng)化一些常規(guī)的、繁瑣的、低價(jià)值的操作,如日志分析、故障排除等,從而釋放更多的時(shí)間和精力來解決更加復(fù)雜的問題。

同時(shí)運(yùn)維工作涉及到很多方面,包括基礎(chǔ)設(shè)施管理、應(yīng)用程序部署、監(jiān)控、故障排除等等,這些任務(wù)需要人類運(yùn)維人員的專業(yè)知識(shí)和經(jīng)驗(yàn)。

AIOps 技術(shù)可以提高 IT 運(yùn)維效率和準(zhǔn)確性,但是它并不會(huì)完全取代人類運(yùn)維人員的工作。相反,它們可以共同工作,提高整個(gè) IT 運(yùn)維團(tuán)隊(duì)的效率和生產(chǎn)力。

向SRE轉(zhuǎn)型:不斷學(xué)習(xí)軟件開發(fā)技能,掌握DevOps中的自動(dòng)化工具、測試、部署和監(jiān)控等實(shí)踐。學(xué)習(xí)云計(jì)算和容器技術(shù),SRE需要了解云計(jì)算平臺(tái)和容器技術(shù),掌握基本的云服務(wù)和容器管理工具,如AWS、dockerkubernetes等。掌握數(shù)據(jù)分析技能同時(shí)在組織內(nèi)建立SRE文化,如可靠性、自動(dòng)化和實(shí)驗(yàn)文化等核心概念。?

? 版權(quán)聲明
THE END
喜歡就支持一下吧
點(diǎn)贊8 分享