作为“AIOps”的提出者和倡导者,全球著名IT分析机构Gartner当初为这个缩略词设定的含义是“Algorithmic IT Operations”,即基于算法的IT运维。然而在过去几年里,机器学习、深度学习等“Artificial Intelligence”相关技术得到了飞速发展,于是AIOps 中AI的含义也发生了转变,由算法进化为智能。
如今,无论是在Gartner的研究报告还是专业服务商的技术实现过程中,AIOps的定义转变为把机器学习、深度学习等自动化模型发现算法应用于IT运维工具和业务系统所采集的大型数据集,并尝试模拟人类行为(如发现、判断、响应)的智能化运维管理平台。在DevOps、自动化运维方面有深厚积累的诸多国内顶级互联网及电信企业,如腾讯、华为、百度、宜信等,均成立专门的部门对AIOps技术体系开展深入研究,并逐步实现了AIOps的落地。
对于处在数字化转型十字路口的国内大中型企业来说,互联网企业和云服务商的AIOps解决方案主要针对互联网应用场景和相对单一的云环境,无法解决复杂的传统IT环境、异构信息化系统和企业定制化的私有云环境的统一管理和智能运维的需求。
同时,AIOps要想在企业中实现落地,还存在着以下三个技术难点:
不同运维工具和ITSM工具之间的跨工具集集成;
高度可扩展的统一管控平台的搭建和实施;
构建满足不同行业应用场景的机器学习算法;
因此,大中型企业要获得AIOps带来的业务决策和IT管理提升,仍然需要专业AIOps服务商的解决方案能力和服务能力。因为只有专业服务商才能快速解决上述技术难点,同时解决面向业务的跨系统业务追踪与业务/应用性能量化关联分析等数字化业务转型的痛点,为智能化运营打下坚实基础。
本文从Gartner的《Market Guide for AIOps Platforms》推荐的20余家AIOps服务商中,遴选了五家国内外已经实现智能运维落地的解决方案商,从他们的公司实力、产品特点和市场策略等维度进行横向对比,希望对企业AIOps选型提供帮助。
从品牌来看,IBM、BMC等老牌软件企业,在传统IT架构的理解和人员规模等方面拥有强大的实力,而新兴的软件服务企业如Cloudwise、Moogsoft和Splunk虽然公司规模不大,但是专注于AIOps相关领域的研发,实力同样不容小觑,相关AIOps产品的上线时间都在2015年前后。
BMC和IBM的AIOps解决方案主要满足传统IT场景下的IT资源管理、IT服务管理、IT 自动化等需求,针对的用户群体也是以L1/L2级运维工程师为主,这也是此类企业和诸多由ITSM转型AIOps的服务商多年来积累的优势。而Cloudwise、Moogsoft和Splunk自诞生之时恰逢互联网经济大潮的兴起,其产品和解决方案更适合数字化和混合IT场景,应用场景和用户群体也更符合现代企业的需求。
从产品交付形态上看,BMC和IBM的AIOps产品都是按需定制的,而Cloudwise、Moogsoft和Splunk即提供灵活的SaaS服务,也可以按照客户的需求进行定制化开发和私有部署。除了IBM的产品不提供试用,其他几家产品都提供一周到一个月的试用期。
在大数据分析能力方面,IBM、BMC和Splunk都是基于历史的存量数据的,而Cloudwise和Moogsoft提供强大的实时数据分析引擎,可以对IT和业务系统的数据流和增量数据进行即时分析,数据处理模型和算法也各有不同。各家服务商对数字化业务的支持也有所不同,主要体现在服务映射、根因分析和事件关联分析等方面。
Gartner最新一份关于AI在全球市场的商业价值预测报告显示,随着计算能力、数量、速度以及深度神经网络(DNNs)的发展,人工智能技术将在2020年得到普及,并成为决策支持/增强的重要手段。因此,企业在选择AIOps服务商的过程中,不但要考量本文中列举的服务商的产品技术和营销服务能力,还要顺应数字业务发展的大趋势,为未来的智能业务决策打下坚实基础。