從手工賬簿到財(cái)務(wù)軟件,從柜臺(tái)長龍到電子銀行,從紙質(zhì)流程到移動(dòng)辦公,IT讓業(yè)務(wù)越來越自動(dòng)化,越來越高效;但I(xiàn)T自身為什么不能更自動(dòng)化些?
什么時(shí)候網(wǎng)絡(luò)管理員能擺脫四處救火的消防員形象?什么時(shí)候數(shù)據(jù)庫管理員能夠從容應(yīng)對(duì)海量數(shù)據(jù)的監(jiān)控、管理?什么時(shí)候系統(tǒng)管理員能夠吃著火鍋、唱著歌,就能確保系統(tǒng)正常運(yùn)行呢?
自動(dòng)化 必須的
2010年5月份,第三方研究公司Coleman Parkes Research的調(diào)查研究結(jié)果顯示,企業(yè)的IT支出呈現(xiàn)出 70/30 規(guī)則,即與新的IT計(jì)劃相比,企業(yè)70%的錢都花了現(xiàn)有系統(tǒng)的運(yùn)維上。而IT運(yùn)維人員70%的精力和時(shí)間都花在了日常巡檢、系統(tǒng)發(fā)布、配置等基礎(chǔ)運(yùn)維工作上。
的確是如此。在4月9日舉行的“自動(dòng)化:IT的未來——惠普軟件IT自動(dòng)化用戶研討會(huì)”上,一位不愿透露姓名的某國有大型銀行技術(shù)經(jīng)理以其數(shù)據(jù)中心為例向記者介紹,復(fù)雜的架構(gòu)、繁雜的工作、嚴(yán)格的流程、紛繁的系統(tǒng)、眾多的管理團(tuán)隊(duì)和離散的操作,讓系統(tǒng)運(yùn)維工作占用了大量的資金和人力成本,但實(shí)際效果卻不怎么樣。
因?yàn)榧袕?fù)雜的服務(wù)器、網(wǎng)絡(luò)和存儲(chǔ)部署與多點(diǎn)分布的業(yè)務(wù)應(yīng)用之間存在大量的相互依賴的關(guān)系,在復(fù)雜的架構(gòu)下,“要手工做持續(xù)的大量變更非常容易出錯(cuò),且前后不一致;而在運(yùn)維組、調(diào)度組、安全組等不同的團(tuán)隊(duì)及系統(tǒng)之間的調(diào)度和協(xié)作也因缺乏標(biāo)準(zhǔn)化控制而凌亂;在各自獨(dú)立的系統(tǒng)視圖下對(duì)網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)等基礎(chǔ)設(shè)施豎井式的分離管理也讓運(yùn)維工作不能體現(xiàn)出整體效應(yīng)。”這位技術(shù)經(jīng)理感慨地說。
一方面,企業(yè)既需要用自動(dòng)化工具替代手工操作,把IT人員從繁瑣的日常運(yùn)維工作中解放出來,使其不再做重復(fù)勞動(dòng),可以有更多的時(shí)間去做更具創(chuàng)新、更有價(jià)值的事情;另一方面自動(dòng)化也能解決一旦系統(tǒng)出現(xiàn)問題后,各個(gè)崗位互相扯皮、責(zé)任不清的問題。
“無論是從人工成本還是系統(tǒng)效率還是支撐業(yè)務(wù)創(chuàng)新的角度看,IT自動(dòng)化都是必然的趨勢(shì)。”中國工商銀行數(shù)據(jù)中心安全部副總經(jīng)理敦宏程肯定地對(duì)記者說。
光大銀行運(yùn)行管理處項(xiàng)目經(jīng)理張憲鐸也對(duì)記者說,“各銀行具體環(huán)境不太一樣,得根據(jù)銀行自己實(shí)際情況綜合考慮,在風(fēng)險(xiǎn)可控的前提原則下,自動(dòng)化應(yīng)該是個(gè)大方向。
業(yè)務(wù)導(dǎo)向的運(yùn)維
“現(xiàn)在很多監(jiān)控、管理工作是孤立的,網(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫、業(yè)務(wù)之間不相互關(guān)聯(lián)。一旦業(yè)務(wù)出現(xiàn)問題,沒有一個(gè)統(tǒng)一、簡單、可控的監(jiān)控與管理,不能自動(dòng)化,無法高效地解決問題。” 惠普全球運(yùn)維管理資深專家Jonathan研討會(huì)上以美國大型醫(yī)療藥品供應(yīng)商麥克森(McKesson)的數(shù)據(jù)中心自動(dòng)化運(yùn)維為例,介紹了當(dāng)前IT運(yùn)維的現(xiàn)狀和難點(diǎn)和自動(dòng)化IT的價(jià)值。
當(dāng)然,IT自動(dòng)化的價(jià)值不只是在于保障系統(tǒng)本身的正常運(yùn)行,降低運(yùn)行成本,提高運(yùn)行效率,更重要的是要高效、靈活地實(shí)現(xiàn)IT對(duì)業(yè)務(wù)的支撐,應(yīng)對(duì)加速變化的業(yè)務(wù)流程,與業(yè)務(wù)融為一體,不斷創(chuàng)新。
惠普軟件技術(shù)總監(jiān)于志偉用醫(yī)院急診的例子介紹了瞬捷企業(yè)對(duì)IT自動(dòng)化需求的必要性。“一名昏迷的病人被送進(jìn)急診室搶救,掃描一下,這名病人的病史、過敏史等所有信息就都展現(xiàn)在了醫(yī)生面前,醫(yī)生就可以對(duì)癥采取急救措施了。在醫(yī)院,時(shí)間就是生命。試想如果沒有自動(dòng)化的IT手段收集、快速查詢、傳輸這些信息,搶救情況會(huì)多么糟糕,而單靠人工是不可能做到的。”
另外,他也說,現(xiàn)在企業(yè)對(duì)CIO的期望,不再只是保證系統(tǒng)的可靠性和可用率,而是得面向業(yè)務(wù),更加敏捷、高效地去適應(yīng)業(yè)務(wù)流程,通過IT獲取更多的業(yè)務(wù)機(jī)會(huì)、增長利潤、體現(xiàn)競爭優(yōu)勢(shì)。而通常情況下,要實(shí)現(xiàn)這些CIO不得不還得面臨的一個(gè)“殘忍”現(xiàn)實(shí)是并沒有增加新的IT預(yù)算。還是原來那些錢,但卻要做更多事,那么CIO就必須簡化IT,通過IT自動(dòng)化實(shí)現(xiàn)創(chuàng)新的目標(biāo)。
在于志偉看來,IT自動(dòng)化分為三個(gè)階段:第一個(gè)階段是單個(gè)任務(wù)自動(dòng)化,用自動(dòng)化工具取代日常手工作業(yè),比如服務(wù)器自動(dòng)巡檢、自動(dòng)化測試應(yīng)用上線等,這樣可以解放IT人力等資源投入到其他創(chuàng)新項(xiàng)目,這個(gè)階段是目前大多企業(yè)都可以做到的;第二階段是自動(dòng)化IT流程,依據(jù)ITIL等標(biāo)準(zhǔn)化的最佳實(shí)踐,實(shí)現(xiàn)配置、變更、事件等管理的自動(dòng)化,將過去要用2-3個(gè)小時(shí)做的事情現(xiàn)在用幾秒鐘完成,這階段是IT應(yīng)用相對(duì)成熟的金融、電信等行業(yè)用戶正在做的;而第三個(gè)階段就是要實(shí)現(xiàn)服務(wù)自動(dòng)化,比如上線一個(gè)ERP系統(tǒng)、CRM系統(tǒng),過去可能需要5個(gè)月,而通過自動(dòng)化,通過云服務(wù)就可以2個(gè)小時(shí)完成。于志偉說,怒目前很多企業(yè)都是已經(jīng)實(shí)現(xiàn)了服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ)等基礎(chǔ)設(shè)施的自動(dòng)化,而面向業(yè)務(wù)的流程和服務(wù)自動(dòng)化則是大勢(shì)所趨。
Jonathan則針對(duì)目前IT運(yùn)維的現(xiàn)狀,提出企業(yè)先要整合網(wǎng)絡(luò)、存儲(chǔ)、服務(wù)器等各自的監(jiān)控管理平臺(tái)成一個(gè)平臺(tái),然后從業(yè)務(wù)出發(fā),看業(yè)務(wù)需要落實(shí)什么,再將業(yè)務(wù)與IT緊密關(guān)聯(lián),并通過恰當(dāng)?shù)闹С煮w系實(shí)現(xiàn)整個(gè)運(yùn)維過程的自動(dòng)化。
在會(huì)上,惠普軟件自動(dòng)化專家陳禾也向與會(huì)嘉賓介紹了惠普針對(duì)數(shù)據(jù)庫和中間件自動(dòng)化的DMA解決方案。他認(rèn)為,針對(duì)數(shù)據(jù)庫和中間件自動(dòng)化的DMA是基礎(chǔ)架構(gòu)到應(yīng)用之間的一個(gè)連接紐帶,是一個(gè)非常重要的連接點(diǎn)。
關(guān)鍵是基礎(chǔ)腳本庫和流程庫
已經(jīng)有兩年數(shù)據(jù)中心自動(dòng)化建設(shè)經(jīng)驗(yàn)的某大型銀行數(shù)據(jù)中心負(fù)責(zé)人向記者介紹了他們的經(jīng)驗(yàn)。
“我們當(dāng)時(shí)做自動(dòng)化建設(shè)的起因是運(yùn)維工作面臨著三大困難:一是隨著數(shù)據(jù)中心的業(yè)務(wù)發(fā)展,運(yùn)維的規(guī)模不斷膨脹,管理體系不斷增加,但人手卻沒有增加,有限的人手怎樣面對(duì)復(fù)雜的運(yùn)維環(huán)境是當(dāng)時(shí)最突出的矛盾。第二個(gè)困難就是在配置管理部分,因?yàn)閺南到y(tǒng)安裝到后期運(yùn)維的整個(gè)運(yùn)維生命周期內(nèi),配置管理信息非常多。作為普通的系統(tǒng)管理員,面對(duì)海量的配置要求,如何能一次性地、準(zhǔn)確地獎(jiǎng)信息輸入電腦非常關(guān)鍵。第三就是在數(shù)據(jù)中心的日常項(xiàng)目管理方面,相關(guān)軟件的部署和運(yùn)維不能100%覆蓋整個(gè)系統(tǒng),總會(huì)有5%部分的系統(tǒng)是沒有覆蓋到的。這是因?yàn)榻裉斓臄?shù)據(jù)中心已經(jīng)涵蓋包括軟件、傳輸、ITM監(jiān)控等非常多的產(chǎn)品,普通的系統(tǒng)管理員很難全部掌握全部產(chǎn)品的運(yùn)維知識(shí)和技能。”這位負(fù)責(zé)人說。
如何解決這些困難呢?自動(dòng)化是非常好的方法。從2009年開始,該行開始了自動(dòng)化建設(shè)一期的建設(shè)。立項(xiàng)之初,項(xiàng)目就設(shè)立了三大目標(biāo),第一是做什么,就是要建立跨平臺(tái)、面向服務(wù)的自動(dòng)化運(yùn)維管理體系。第二是怎么做,核心環(huán)節(jié)是什么,就是要發(fā)展不完善的基礎(chǔ)腳本庫和基礎(chǔ)流程庫,這兩樣是其整個(gè)自動(dòng)化運(yùn)維的核心關(guān)鍵。“只有把腳本庫和流程庫很規(guī)范地建設(shè)好后,才能在復(fù)雜的環(huán)境中推進(jìn)自動(dòng)化運(yùn)維,否則雖然自動(dòng)化在某些情況下能提高工作效率,還是會(huì)帶來負(fù)面的風(fēng)險(xiǎn)。” 他說。
第三就是組織架構(gòu),數(shù)據(jù)中心怎樣協(xié)調(diào)系統(tǒng)部、應(yīng)用部、運(yùn)維部、調(diào)度部、安全部等各個(gè)技術(shù)水平不一的部門共同實(shí)施自動(dòng)化,必須得有方法、有制度。“我們不斷將自動(dòng)化的知識(shí)、理念、平臺(tái)的使用方法等做知識(shí)轉(zhuǎn)移,讓像系統(tǒng)部、應(yīng)用部等技術(shù)能力較強(qiáng)的部門接受自動(dòng)化工具,同時(shí)也協(xié)調(diào)一些流程管理部門,像安全部、調(diào)度部等,讓他們的日常工作也越來越自動(dòng)化。”
經(jīng)過兩年的努力,該負(fù)責(zé)人介紹,該行已經(jīng)實(shí)現(xiàn)了系統(tǒng)運(yùn)維的自動(dòng)化,包括配置信息的收集、系統(tǒng)日常健康檢查等,把日常重復(fù)、簡單、可控的工作,納入自動(dòng)化范疇;其次就是實(shí)現(xiàn)了一些操作的自動(dòng)化,比如數(shù)據(jù)中心網(wǎng)上批量處理的自動(dòng)化;還有災(zāi)備切換的自動(dòng)化。
他以系統(tǒng)健康檢查自動(dòng)化為例,向記者介紹他們的具體做法就是將健康檢查的標(biāo)準(zhǔn)、規(guī)范的前提形成一些腳本,通過自動(dòng)化運(yùn)維平臺(tái)定時(shí)地調(diào)用這些腳本,生成的報(bào)表可以快速地反饋到運(yùn)維人員的信箱。“當(dāng)時(shí)我們就是每天晚上大概三四點(diǎn)鐘的時(shí)候,定時(shí)執(zhí)行這個(gè)自動(dòng)化任務(wù)。每天早上九點(diǎn)鐘,系統(tǒng)管理員上班打開電腦就可以從他的郵箱里面看到昨天晚上整個(gè)系統(tǒng)的運(yùn)維情況。他就不用再花時(shí)間到不同的平臺(tái)上去檢查這些參數(shù),只要對(duì)這些報(bào)表進(jìn)行瀏覽,再對(duì)他覺得有疑點(diǎn)的地方做正式的檢查和排查。通過這種方式,在節(jié)省時(shí)間和人力成本的同時(shí),確保了系統(tǒng)的可用性,降低了發(fā)生問題的風(fēng)險(xiǎn)。”
自動(dòng)化的前提是風(fēng)險(xiǎn)可控
自動(dòng)化雖是大勢(shì)所趨,但記者采訪發(fā)現(xiàn),用戶對(duì)于自動(dòng)化還是非常謹(jǐn)慎的。敦宏程認(rèn)為其實(shí)銀行有些流程環(huán)節(jié)是必須要有人介入的,不能什么事都自動(dòng)化。敦宏程認(rèn)為,要推進(jìn)自動(dòng)化,供應(yīng)商產(chǎn)品的成熟度也是他們要考慮琢磨的重中之重。因?yàn)樵?jīng)他們?cè)庥鰧擂蔚淖詣?dòng)化事件,有個(gè)項(xiàng)目中,他們需要部署幾百臺(tái)某其他品牌服務(wù)器,預(yù)備采取自動(dòng)化部署方案,預(yù)留的部署時(shí)間就很短,結(jié)果在在第二天要投產(chǎn)之前發(fā)現(xiàn)自動(dòng)化部署有問題,他們不得不把所有人集中在機(jī)房,一人幾臺(tái)機(jī)器趴在地板上連夜手工裝機(jī)器。“可控性是我們考慮的第一要素。”
北京京東方光電科技有限公司自動(dòng)化部部長邢明海也表示,出于安全的考慮,需要從效率和控制兩方面均衡考慮配比自動(dòng)化和手工兩種方式。
張憲鐸認(rèn)為自動(dòng)化和手工會(huì)有慢慢轉(zhuǎn)化的過程,就像復(fù)雜和簡單之間也是在慢慢轉(zhuǎn)化一樣。他說,目前對(duì)光大銀行來說,可以自動(dòng)化的還是那些常規(guī)性、重復(fù)性的簡單操作,他們現(xiàn)在主要做的還是把相當(dāng)于眼睛和耳朵的監(jiān)控工作做到位,通過對(duì)基礎(chǔ)設(shè)施和業(yè)務(wù)的監(jiān)控,及時(shí)發(fā)現(xiàn)問題,保障系統(tǒng)和業(yè)務(wù)的可用性和連續(xù)性。推進(jìn)自動(dòng)化的最終原則就是風(fēng)險(xiǎn)可控,風(fēng)險(xiǎn)可控的前提下把繁瑣操作自動(dòng)化提高效率是好事,但如果風(fēng)險(xiǎn)不一定可控,就不能冒冒失失地推進(jìn)自動(dòng)化。
飯要一口一口吃,路要一步一步走。企業(yè)的IT自動(dòng)化之旅,得按部就班、循序漸進(jìn)。
案例鏈接:
麥克森的自動(dòng)化故事
麥克森是美國的一家大型醫(yī)療藥品供應(yīng)商,在全球500強(qiáng)排名34,在財(cái)富500強(qiáng)的美國公司中排名第14,年?duì)I業(yè)額1060億美元,是美國醫(yī)療藥品批發(fā)領(lǐng)域的頭一把交椅,有超過4萬家的藥店,同時(shí)它還是醫(yī)療流程系統(tǒng)提供商,像醫(yī)療記錄、藥方的合規(guī)審計(jì)等領(lǐng)域的軟件都是由麥克森提供的。
麥克森的問題有兩個(gè),一是它基礎(chǔ)設(shè)施和業(yè)務(wù)應(yīng)用的監(jiān)控相互獨(dú)立,一旦業(yè)務(wù)出現(xiàn)問題,無法定位問題源于何處;二是其系統(tǒng)的應(yīng)用可靠性和性能非常重要,因?yàn)橄到y(tǒng)宕機(jī)一小時(shí),麥克森就損失上百萬美元,而在線銷售藥品的部分,頁面反饋時(shí)間超過8秒,消費(fèi)者就會(huì)離它而去。
麥克森現(xiàn)在采用了一套IT基礎(chǔ)設(shè)施監(jiān)控軟件,但是系統(tǒng)沒有集成,應(yīng)用組件、存儲(chǔ)、網(wǎng)絡(luò)和監(jiān)控軟件之間完全孤立,流程全是通過手工來做,大量的事件無法處理。于是麥克森開始系統(tǒng)改造,業(yè)務(wù)部門和IT部門共同提出了項(xiàng)目需求:提升服務(wù)管理水平,縮短平均修復(fù)時(shí)間(MTTR),降低成本并提升流程一致性,提升業(yè)務(wù)服務(wù)可視性,集成監(jiān)控并實(shí)現(xiàn)自動(dòng)化。
經(jīng)過比對(duì)篩選,麥克森最終選擇了惠普。項(xiàng)目目標(biāo)就是要實(shí)現(xiàn)所有基礎(chǔ)設(shè)施監(jiān)控與事件關(guān)聯(lián),實(shí)現(xiàn)事件的處理和故障恢復(fù)的自動(dòng)化。項(xiàng)目分為兩期:第一期是采用惠普的一些監(jiān)控工具和自動(dòng)化的工具實(shí)行監(jiān)控的自動(dòng)化和故障采集的自動(dòng)化;第二期是實(shí)現(xiàn)故障解決的自動(dòng)化。
項(xiàng)目共需要管理麥克森的3000臺(tái)服務(wù)器。第一期項(xiàng)目中,他們著重對(duì)事件進(jìn)行關(guān)注,用自動(dòng)化的方式定位事件的根源;然后注意在流程處理過程中保持測試的準(zhǔn)確性,保持處理策略的一致性,用很多即插即用的插件實(shí)現(xiàn)監(jiān)控的標(biāo)準(zhǔn)化管理。
項(xiàng)目一期實(shí)現(xiàn)了自動(dòng)化的從事件發(fā)生到處理到結(jié)束的閉環(huán)事件處理流程。項(xiàng)目4億美元的投入不到半年就收回成本了。通過自動(dòng)化,麥克森節(jié)省了大量的工作時(shí)間,SLA水平也得到了顯著提升。
而麥克森自動(dòng)化的經(jīng)驗(yàn)就是先把自動(dòng)化門戶建起來,用一些自動(dòng)化工具去解決流程,但是這并不意味著直接用自動(dòng)化,而是先手工運(yùn)行一段時(shí)間,流程穩(wěn)定的時(shí)候再讓它自動(dòng)去實(shí)現(xiàn)。如此下來,所有事件都能很好地解決。接下來麥克森還會(huì)利用惠普的新平臺(tái)做業(yè)務(wù)與基礎(chǔ)設(shè)施關(guān)聯(lián)的實(shí)時(shí)互動(dòng)模型等。
(責(zé)任編輯:王少青)