酷播亮新聞
最棒的知識補給站

OpsRamp推出AIOps推理引擎

文章摘要: 新版本的主要特性是在報警和事件關聯中使用了人工智慧IT運維(AIOps為實現架構和應用監控、事件管理和報警管理

基於SaaS的IT運管平臺提供商 OpsRamp 宣佈 OpsRamp 5.0 釋出。新版本的主要特性是在報警和事件關聯中使用了人工智慧IT運維(AIOps,Artificial Intelligence for IT Operations)推理引擎。此外,新版本還新增了一種實現多雲可見性的儀表盤。

OpsRamp 5.0提供了三類元件,分別用於管理混合IT環境、多雲費用支出情況和雲開銷趨勢。全域性資產元件顯示了IT資產在各個資料中心及雲環境中的地理分佈情況;雲費用支出檢視元件展示了公有云的最新消費情況,並可按雲賬戶、客戶屬性等給出標準劃分;雲開銷趨勢元件展示了公有云開銷隨時間變化的情況,並支援IT團隊按資源型別、客戶屬性等標準檢視開銷的發展趨勢。新版本還給出了其它一些改進,其中包括一個可定製報告的新特性。該特性使得IT團隊可以對運維資料做交叉分析,以洞悉 服務對映(service map) 的執行情況,並做出重新設計。服務對映實現了IT服務與其底層工作負載間的可視性,對IT架構的佔用情況做出組織、視覺化並監控。

此外,新版本的OpsRamp擴充套件了對IaaS和PaaS服務的管理,提供了46個Microsoft Azure整合、28個AWS整合和15個Google Cloud Platform整合。新整合包括用於混合雲監控的 Google Stackdriver 、用於提高服務交付的 ManageEngine ServiceDesk Plus ,以及用於加速舊有的ITOM套件遷移到現代平臺的 Micro Focus Operations Manager 。

為進一步瞭解新版本,InfoQ採訪了OpsRamp的VP工程師 Bhanu Singh 。

InfoQ:是否可使用OpsRamp替代現有的工具,例如Cherwell、ServiceNow和Jira Service Desk等?如果可替代,那麼OpsRamp還提供了哪些獨到特性?如果不能替代,那麼OpsRamp是否可與上述工具整合?如何整合?

Bhanu Singh:很多企業爲了提升服務交付質量,已在ServiceNow、Cherwell和Atlassian Jira等IT服務管理工具上做了一些投資。儘管這些工具提供了使用者所需的所有意外事件管理(IM,Incident management)功能,但是它們最主要的問題在於缺失了對使用者日常IT操作的高效管理能力。OpsRamp交付了一種用於視覺化和控制使用者業務關鍵IT服務及底層基礎設施負載的IT操作平臺。為改進根本原因分析(RCA,Root Cause Analysis)和平均解決問題時間(MTTR,Mean Time To Resolution),OpsRamp已與一些業界領先的IM工具進行了整合。OpsRamp可提供對整個混合架構中意外事件的整體檢視,並可將特定事件與實際業務影響相關聯。OpsRamp實現了將意外事件發生前執行的操作活動與ServiceNow或Cherwell等IM系統相關聯。

InfoQ:OpsRamp工具是如何訪問雲費用支出情況資料的?

Singh:多雲可視性儀表盤提供了標準的API,實現從一些業界領先的雲服務提供商(例如AWS、Azure和Google)處汲取資料。我們進而應用了適當的智慧演算法,抽取出雲費用支出的深層情況。由此,企業可以知悉其在雲提供商、業務單元、IT服務乃至整個企業上的開銷趨勢。

InfoQ:AIOps推理引擎關注的是哪些事件和報警?

Singh:OpsRamp平臺使用原生的和外部的插樁(instrumentation),實現跨應用和架構採集資料和度量。為展現其中的關聯和意義所在,AIOps推理引擎使用拓撲和聚類關聯模型,從獲取的各類度量中聚合事件和報警。舉個例子,如果是網路裝置的操作影響了使用者IT服務的可用性,那麼推理引擎會對這些關係做出關聯,抽取出定位致病根源最需要的訊號。

InfoQ:OpsRamp如何與IT運維專業人員可能使用的已有報警工具一併工作?在一些雲服務提供商的平臺上是否已經如此?Dynatrace、AppDynamics或是New Relic?

Singh:為實現架構和應用監控、事件管理和報警管理,許多企業的IT專業人士使用了不同的管理工具。OpsRamp的任務是幫助IT運維團隊控制管理這些工具中的混亂情況,並對團隊所負責的應用和服務提供場景可見性,這正是團隊所需要的。我們已經構建了OpsRamp與一些常用工具的整合,使IT團隊可以在同一處檢視跨不同工具的日誌、度量、報警、事件和任務單,而無需登入到多個控制檯。

InfoQ:該解決方案如何有助於緩解警報疲勞問題?

Singh:OpsRamp可以自動關聯源自同一問題的報警,並從中建立一次推理。使用者無需知悉、調查並響應每次報警。通過將相關的報警關聯為一次推理,實現將多個報警按單一事件進行管理,進而更快地得以檢測和修復。OpsRamp的整合框架使IT團隊可以將來自不同故障點工具的報警整合為單一事實源(SSOT,Single Source of Truth),這有助於降低報警噪聲,緩解報警疲勞問題。

InfoQ:對於在架構上執行的應用,該工具能為使用者報告哪些情況?

Singh:OpsRamp為多種企業應用提供了預製的監控模板。使用者可通過OpsRamp監控一些常用的業務應用的執行狀況、正常執行時間和效能、程序、檔案和日誌,例如Active Directory,Exchange,SharePoint、Dynamics,以及Cassandra、Redis、MongoDB、SQL Server和MySQL等資料庫,還有Apache、Docker、Kafka、RabbitMQ和Tomcat等基礎架構中介軟體。 IT服務通過服務對映連結到底層基礎設施。服務對映用於定義IT服務與一組事務、應用、虛擬伺服器、網路裝置和雲工作負載的依賴關係。對於業務部門,暴露相關的服務對映即可使業務部門實現對自身重要服務的監控。

InfoQ:Micro Focus是如何為遷移提供幫助的?

Singh:2018年4月,OpsRamp對使用Micro Focus Operations Manager i(OMi)和Micro Focus Operations Bridge(OpsBridge)做事件關聯的企業提供了一種自定義的遷移計劃。5.0版本中進一步深化了與Micro Focus OMi的整合,支援使用者在OpsRamp儀表板按報警檢視OMi事件。對於那些希望加速從傳統ITOM套件向OpsRamp等現代平臺遷移的企業,非常適合採用Micro Focus OMi整合。

InfoQ:您是如何定義「現代」ITOM套件的?

Singh:對於OpsRamp而言,我們認為一個「現代」ITOM套件應該具有以下五個特徵:

  1. 實現對混合多雲IT資產的全面可見性、合規性和透明度,並對物理的、虛擬的和雲工作負載提供的統一檢視。
  2. 能夠擴充套件對基礎架構的管理,瞭解關鍵IT服務的依賴關係。通過提供整個企業IT業務檢視,提升企業對執行態勢的感知能力。
  3. 具有迅速監控、管理和解決IT意外事件的智慧。對所有事件給出最優可用性和效能的上下文警報資訊。
  4. 具有基於策略的管理功能,可大規模地自動執行日常任務、降低重複性任務的手動工作量,並且無論對於傳統的還是現代的工作負載,均可提高執行一致性。
  5. 能夠在同一平臺上無縫地關聯操作和服務管理流程,推動提高客戶體驗、員工生產力和IT自動化。

詳細資訊,可參閱OpsRamp在2018年5月對 Unified Service Discovery的宣告 。

檢視英文原文: OpsRamp Introduces an AIOps Inference Engine

如有侵權請來信告知:酷播亮新聞 » OpsRamp推出AIOps推理引擎