四人麻将|上海四人麻将单机版
首頁 > 基礎設施 > 正文

基礎設施監控:挑戰和最佳實踐

2019-07-15 11:32:25  來源:

摘要:基礎設施監控是一種軟件工具的部署,用于自動診斷整個技術堆棧中的性能和可用性問題。
關鍵詞: 基礎設施
  基礎設施監控是一種軟件工具的部署,用于自動診斷整個技術堆棧中的性能和可用性問題。
 
  基礎設施監控包括一系列的用途和問題,從網絡優化到診斷再到入侵檢測。基礎設施監控可以告訴工作人員,路由器是否關閉,服務器是否以不尋常的利用率運行,并且在適當的安全性下,它還可以發現正在竊取企業數據的入侵者。
 
  基礎設施監控支持基礎設施管理,但兩者不同。基礎設施管理是企業根據監控工具的發現采取的補救措施。基礎設施監控可以不斷檢查IT平臺的各種元素,從內部數據中心到私有云再到公共云。
 
  隨著網絡越來越復雜,由于設備種類越來越多,以及混合云的出現,網絡完整性的重要性隨之增長。即使在中小企業內部的基本網絡上,也應該對基礎設施進行監控,但是對于大型企業的復雜系統,它是運營的重要組成部分。
 
  了解基礎設施監控
 
  在日常運營方面,基礎設施監控是軟件工具的部署,用于自動診斷整個技術堆棧中的性能和可用性問題,以在問題變得嚴重之前捕獲問題。
 
  “整個堆棧”是指硬件、操作系統、虛擬化環境、網絡、存儲、計算和應用程序。由于大多數大型基礎設施跨越多個位置,同時包含公共云和私有云,這就給IT部門帶來了更大的挑戰,因此,自動化將成為關鍵。
 
  由于具有復雜性,實現自動化至關重要,原因如下:
 
  自動化可以比人類更快地做出響應。
  它可以比等待人工干預更快地處理問題。
  假設企業已正確編程響應,自動化可以減少錯誤。
  與人類不同,它可以全天候運行,不需要睡眠。
 
  通過自動化技術,企業可以設置閾值,例如服務器利用率或網絡帶寬,以及當網絡高于或低于設定閾值時的程序響應。如果服務器凍結或停止,它也可以自動重啟。
 
  基礎設施監控包括在出現問題時添加和刪除要監控的設備、性能、運行狀況監控、網絡和數據移動監控、報告/日志以及警報系統。這些通常是實時的,因為對網絡瓶頸的警報在被發現6小時后是毫無意義的。
 
  基礎設施監控通常通過儀表板完成,儀表板通過視覺布局(如儀表)在一個位置顯示企業的所有信息。它們在屏幕上呈現實時更新,并可以在一段時間內生成報告。
 
  為什么需要基礎設施監控
 
  基礎設施監控為管理者提供了實時了解基礎設施狀態所需的數據,以及衡量組織目標進度的能力。通過不斷收集和審查有關基礎設施的數據,監控允許測量當前狀態以及網絡的進展情況。
 
  例如,如果管理層已經制定了實現一定級別網絡響應的目標,那么監控工具可以顯示網絡在響應性方面的位置。它可以識別延遲的峰值,也許也可以找出原因。
 
  確保網絡以最高效率運行需要企業了解構成IT基礎設施的設備,同時還要關注這些設備的健康狀況和性能。對企業的IT系統進行主動分析,意味著有更好的機會在導致嚴重中斷之前捕獲即將發生的故障。
 
  有很多例子表明,如果沒有適當的基礎設施管理會出現什么問題。“僵尸服務器”就是這樣一個例子,物理服務器處于空閑狀態,沒有人使用它。由Anthesis Group和斯坦福大學研究人員于2017年進行的一項研究發現,大型數據中心中多達30%的服務器是僵尸服務器,一直開啟卻沒有做任何工作。這是適當監控的失敗,因為基礎設施監控器會記錄這些服務器沒有產生任何流量或根本不使用任何周期。
 
  另一個例子是惡意軟件滲透。多年來,有關于惡意軟件進入企業網絡并使用企業網絡交付惡意有效負載、觸發垃圾郵件、發起分布式拒絕服務(DDOS)攻擊、嗅探網絡流量以獲取有用信息的故事和研究。同樣,這也是監控有幫助的地方,因為它會注意到一個未知的應用程序發送數千封電子郵件或與俄羅斯的服務器通信。
 
  基礎設施監控最佳實踐
 
  以下是充分利用基礎設施監控工具的幾個技巧:
 
  確定優先順序——提前確定哪些是最重要的通知按降序排列,這可能會花費比處理電子郵件稍多一些的時間。
 
  創建警報解決流程——應為每種警報類型提供最佳和最快的解決流程。同樣,這也是企業優先考慮的問題,因為需要通知首席執行官讓工作人員來處理。
 
  購買而不是建造——建設或購買是一個歷史悠久的IT爭論。企業是自己建設還是鎖定供應商?在這種情況下,由于IT系統日益復雜,企業最好購買監控工具。好消息是有很多可供選擇。
 
  測試企業的監控和警報系統——因為企業不應該在實際的緊急情況下首次看到其警報系統運行,因為它可能需要對系統進行一些調整。試運行有助于確保企業可以根據需要調整系統。
 
  設置詳細全面的警報——當汽車中出現“檢查引擎”指示燈,但不知道問題是什么時,這很令人沮喪。這里也同樣適用。良好的警報需要全面、詳細和可操作。
 
  從多個位置進行監控——如果企業有多個數據中心,則從每個位置監控所有數據中心。如果有三個,則從A監視B和C,從B監視A和C,依此類推。冗余將保護企業業務正常運營。
 
  獲得幫助——監控工具供應商有支持人員和顧問為企業提供幫助。
 
  混合使用監控工具——既有內部部署工具,也有基于云計算的工具。同時使用它們,特別是如果企業擁有混合云環境的話。
 
  沒有警報并不總是一個好兆頭——這可能意味著系統失敗。這是不可避免的。它們會阻塞帶寬或遭受入侵。有時錯過了一些東西。不要以為幾周內沒有警報意味著沒有任何問題。問題可能出在顯示器本身。
 
  定期審核指標——設定性能指標并非一勞永逸。企業可能設置的CPU閾值太高或網絡帶寬警報范圍過小。應定期審查指標。
 
  基礎設施監控工具
 
  現在有兩種類型的監視工具:有內部部署的監視軟件工具,以及從網絡外部運行的SaaS服務器監視工具。企業的決定應該基于其業務需求,但此時,只剩下很少的本地工具。幾乎所有工具都已遷移到云端。
 
  CloudRadar:這會將企業所有服務器、主機和服務置于統一的應用程序中,當出現問題(例如中斷、、容量、性能問題)時,軟件會通過電子郵件、短信、Slack、WhatsApp、電報、Pushover、Webhook通知用戶。
 
  CA Technologies:CA公司為本地和云提供各種企業級、全棧監控和管理解決方案,包括DX應用程序性能管理、DX應用程序體驗分析、DX基礎設施管理器以及網絡運營和分析等。
 
  VMware vRealize Hyperic:從70多種應用程序技術中收集多達50,000個指標的性能數據,以監控硬件、操作系統、應用程序、中間件堆棧中的任何組件。
 
  New Relic:APM和基礎設施的兩個應用程序,在結合覆蓋系統和應用程序性能時,無論是在內部部署數據中心還是在云平臺中。
 
  BMC數字企業管理:數字體驗監控(DEM)是一套六種全棧監控解決方案,包括IT運營、監控未經授權的IT活動、大型機維護、應用監控和未經授權的應用。
 
  Dynatrace:該公司致力于為績效管理、運營人工智能、云計算基礎設施監控,以及數字體驗管理創建監控工具。
 
  Opsview:其旗艦產品Monitor產品提供了對所有IT資產和系統以及基于云計算服務的單一視圖。
 
  SolarWinds:其旗艦服務器和應用程序監視器(SAM)工具可讓企業監控應用程序和服務器基礎設施(包括內部部署和云端)的運行狀況、可用性、性能。SAM支持1200多種應用程序和系統模板,或者可以輕松地將監控擴展到任何自定義或自行開發的應用程序。

第二十九屆CIO班招生
法國布雷斯特商學院MBA班招生
法國布雷斯特商學院碩士班招生
法國布雷斯特商學院DBA班招生
責編:pingxiaoli
四人麻将 36棋牌新神兽 广西十一选五开奖预测 北京赛车pk10缩水 吉林吉祥棋牌官方下载 河南快赢481怎么看 创业板股票涨跌幅限制 五分彩是私彩网站自己开的吗 青海11选5开奖结果查询 澳洲幸运5是国家开奖吗 双色球2016杀红公式