基于ITSS的四川省水利信息系统运维体系构建研究
来源:e星体育    发布时间:2025-07-03 20:28:24

  在智慧水利加快建设背景下,水利信息系统的复杂性与业务耦合度持续提升,科学高效的运维体系成为保障系统稳定运行、提升服务效率的重要支撑。针对四川省水利信息系统运维效能提升需求,引入我国自主研制的ITSS 5.0体系原理及标准,构建了适配水利行业特性的运维体系。该体系围绕水利信息系统运维对象划分为“平时”与“战时”两类运维场景,通过服务目录和服务级别管理实现运维需求可量化、可管理,从人员、过程、技术、资源4个核心要素出发,提出运维能力构建思路:人员要素采用混合运维模式,明确管理、技术上的支持、操作3类岗位权责,强化内部人才储备与外包人员风险管控;过程要素设计8项管理流程,通过标准化活动与考核机制解决响应慢、流程不规范等问题;技术要素遵循“自动化—数据化—智能化”演进思路,逐步实现监控告警自动化、数据驱动决策及AI辅助运维;资源要素划分基本级至引领级5个成熟度等级,针对运行维护工具、服务台、知识库等资源,明确分级建设要点。

  智慧水利是水利高水平发展的显著标志,其在物联网、云计算、大数据、AI和数字孪生等技术维度的内涵不断丰富,对水利信息化发展提出了更高层次的要求。近年,四川省将水利信息化作为夯实水文、水资源、水生态、水安全等基础业务工作的重要环节,有序推动项目规划建设,取得了一系列很明显的成效。与此同时,水利信息系统运维工作重要性也愈发显现,适时开展符合现状特点的运维体系构建研究,可以为信息化“重建轻管”典型问题提供解决思路,提升系统运行效率和可靠性。

  国外信息化运维标准体系已较为成熟,主要以信息技术基础架构库(Information Technology Infrastructure Library,ITIL)、ISO/IEC 20000为代表,自20世纪90年代末被我国各行业引进和研用。赖炜在校园数据中心管理引入了ITIL方法论,通过构建体系和运用工具,实现了运维流程化和规范化。戚伟强等和王聪基于ITIL框架分别构建了适应电力系统和医院信息系统的运维服务管理体系。ISO/IEC 20000是由ITIL发展而来的国际标准,给出了提高运维质量的详细规范和实施方法。周澄探讨了在金融系统实施ISO/IEC 20000体系的效益和价值,并详细分析了实施要点。唐航等结合水利部长江水利委员会运行维护工作实践经验,提出了借鉴ISO/IEC 20000和ITIL标准建立水利信息化运维管理体系的思路和目标。国内有关标准体系主要是信息技术服务标准(Information Technology Service Standards,ITSS),自发布以来也进行了一定探索实践。李天池等提出了在ITSS要素之间互相平衡的概念,并探讨研究了相关策略和措施。祝越等将ITSS用于政府云计算中心运维实践,验证了技术和管理层面的可行性。向晟针对铁路主数据中心IT运维资源分配不均的核心问题,基于ITSS提出了运维服务能力提升方案。综上所述,国内外信息化运维标准体系相关研究多集中在交通、能源、金融、医疗等信息密集度和信息化程度较高的行业,针对水利行业的应用研究较少。面对网络安全和信息化领域日趋复杂的国际环境和新形势,强化国内信息技术通用标准在水利领域的实施应用,有助于提升水利信息化的安全性、可靠性。

  相较其他标准体系,ITSS涉及面更广,覆盖了IT服务全生命周期,着重关注服务供需双方的协调互信,并最大限度地考虑了人员、过程、技术和资源四个关键要素,能够很好的满足水利信息系统在运行环境、软件硬件、人的因素等方面的可靠性要求。本文在引入最新的ITSS 5.0运维理念基础上,对四川省水利信息系统运维体系构建开展研究。

  四川省水利信息系统现阶段建设重点为整合升级已建系统、新增部分系统及模块,旨在初步建成覆盖水文、水资源、水生态、水安全、水工程和水政务的“水利大系统”。经调研,目前四川省省级水利信息系统已达12个,数据资源总量超10.35TB,水利管理决策人员、水利业务人员、相关管理单位、社会公众等各类用户总数约3.5万人,具体如下表所示。

  由于开发工具、部署环境、上线时间等存在比较大差异,四川省水利信息系统暂未实现完全整合,未形成统一的运维体系,各系统管理主体根据业务要求及自身情况采用不同的运行维护模式,造成自行维护、外包维护和混合维护并存的局面。在运维对象方面,运维管理工作涵盖了机房基础设施、物理资源、虚拟资源、平台资源、应用、数据等六个层次,不同层次对象之间以业务逻辑相互关联,所需运维技术专业复合性强;在运维活动方面,服务需求主要集中在响应式维护、故障处置、应急响应和安全管理,一般以技术专业化分工方式被动提供相应服务,运维管理仍停留在传统粗放的阶段。

  随着系统整合深化、业务耦合增强,传统运维方式的局限性日益显现,主要存在以下问题:

  ①缺少运维能力建设的顶层设计,难以全面厘清运维服务需求,各管理主体间的运维方法和流程差异大,缺少统筹资源、降本增效的有效途径;

  ②尚未形成完善的运维组织架构,目前各管理主体的运维部门仅为满足自身运维需求而设置,未充分考虑系统整合后的统一管理需求;

  ③未执行统一的服务交付规范,在交付管理、交付方式、交付成果上缺少依据,也不利于自身运维能力水平的提升;

  ④缺少智能运维工具应用,监控分析和运维管理依赖人工,耗费时间和成本较多,不利于运维效率提升,也容易出现人为疏漏和错误;

  ⑤缺乏科学的运维服务质量评价,未形成量化的运维能力指标体系,不利于对工作过程、交付成果实施有效监督和绩效评估。

  制度设计、技术演进、业务诉求、资源保障等各方面都对系统运维的优化升级提出了更高需求,主要体现在以下方面:

  ①系统整合升级是完善运维体系的有利契机,构建“水利大系统”的过程中,组织结构、技术资源、工作流程等面临不同程度的重构优化,有利于节约构建新运维体系的时间和成本;

  ②当前,我国信息系统运维管理体系日趋完善,积累了较多实践经验,但仍需更加先进和体系化的运维管理理念、方法及技术;

  ③国家强化信息化标准实施应用,《信息化标准建设行动计划(2024—2027年)》明确要求建立健全法规引用标准机制,加大政策实施标准配套力度,在法规和政策文件制修订时积极应用相关信息化标准;

  ④信创环境推广为运维转型注入动力,国家政策趋势和市场技术导向使得运维管理标准规范化成为必然要求;

  ⑤行业内运维经费保障日趋规范,水利部自2019年开始《水利信息系统运行维护定额标准》的修订工作,四川省也于2024年有序推进水利信息系统运行维护费支出标准研究,持续优化运维工作资金保障。

  ITSS是我国自主研制的一套信息技术服务标准库,是在工信部和国家标准委联合指导下,由国内IT服务最佳实践经验以及创新成果不断总结固化而成。通过借鉴质量管理原理和过程改进方法,ITSS主要从组成要素和生命周期两个维度对运维服务进行标准化和规范化,组成要素包括人员、过程、技术和资源,生命周期包括规划设计、部署实施、服务运营、持续改进和监督管理5个阶段。ITSS自2009年发布以来已迭代6个版本,其最新版本ITSS 5.0紧密结合国家战略和市场需求,已成为我国信息技术服务业标准化领域的高质量发展标杆,具体分为基础服务标准、通用标准、保障类标准、技术创新服务标准、数字化转型服务标准、业务融合标准六大类。ITSS 5.0体系框架如下图所示。

  ITSS已发布实施的运维相关标准共18项,涵盖了国家标准、行业标准、团体标准3种类型,具体见下表。

  现行2024年版《水利技术标准体系表》中,水利信息系统相关运维标准规范仅有1项,即SL 715—2015《水利信息系统运行维护规范》,该标准给出了水利信息系统运行维护总体要求。由于引用的是ITSS较早版本的部分成果,SL 715—2015《水利信息系统运行维护规范》在时效性和完整性上都有所欠缺,与最新ITSS运维相关标准存在较大的差别。例如关于运行维护相关原理及概念,ITSS中的GB/T 28827.1—2022《信息技术服务 运行维护 第1部分:通用要求》已进行较大更新;关于运行维护过程管理的规定,ITSS中的GB/T 36074.3—2019《信息技术服务 服务管理 第3部分:技术要求》也进行了细化完善。

  参照ITSS 5.0体系原理及相关运维标准,依托四川省水利信息系统整合升级工作,梳理形成运维服务目录和运维服务级别,围绕人员、过程、技术、资源四大要素建设核心运维能力,针对水利业务“平时”和“战时”两种不同运维场景交付服务内容,以全面覆盖和多跨协同为原则,形成统一、安全、高效的“大运维”管理体系。总体框架如下图所示。

  运维对象包括:信息采集设施,指收集、传输和处理各类水利信息的传感器、传输设备和接收处理设备等;机房基础设施,指通风空调、消防、建筑弱电/智能楼宇、电气等系统;物理资源,指终端、网络设备、服务器、存储设备等;虚拟资源,指网络服务、计算能力、存储空间等资源;平台资源,指支撑应用系统运行的环境;应用,指水利业务软件、相关工具软件等;数据,指业务数据、运行维护数据、安全数据等。

  运维能力指利用人员、过程、技术、资源四大要素实现预期运维服务交付质量和交付结果的技能,通过策划、实施、检查和改进,其水平可以循环提升。作为以上过程的重要成果,运维服务目录和运维服务级别上下衔接了运维对象和运维场景,确保各能力要素不断循环优化。

  运维场景按照水利业务特点划分为“平时”和“战时”,“平时”指日常运行时段,“战时”指汛期、重大节假日期间、重要活动期间等运行时段。基于运维场景提供对应级别的调研评估、例行操作、响应支持、优化改善等服务内容,有利于优化配置运维资源。

  运维服务目录是确定运维服务级别的基础,也是构建运维能力的关键。运维服务目录划分为业务服务目录和技术服务目录,构建模型如下图所示。

  业务服务目录基于服务需方视角,使用业务相关语言描述运维工作细节,主要关联业务单元和业务流程;技术服务目录基于服务供方视角,使用技术相关语言描述运维工作细节,主要关联必需的支持服务、共享服务、组件和配置项。以上两种视角的运维服务目录能保证服务信息来源的单一性和连贯性,有助于促进运维各方的沟通,降低运维服务出错率。

  运维服务级别是运维工作各方充分理解的可量化、可管理的指标及目标,并通过动态循环管理过程一直在优化完善,以适应不一样运维场景。针对外包运维方,运维服务级别可以附加相关要素直接形成服务级别协议(Service Level Agreement,SLA),即服务供需双方就服务的品质和性能等方面所达成的一种协定;针对内部运维部门,运维服务级别也能更加进一步形成运维内控制度,用以定义自行维护各参与方的责任,提高运维工作流程规范性;在混合维护模式下,自行维护和外包维护级别应协调一致。运维服务级别与不同参与方的关系如下图所示。

  根据ITSS标准,人员要素包括内部人员和外包人员。由于水利行业内部普遍缺乏信息化专业运维人才,而外包运维人员在政治、安全、保密等方面存在一定管理风险,故本体系采用自行维护和外包维护相互补充的混合运维模式,既建立自身运维机构,又合理规划利用外部专业运维力量。

  运维队伍划分为管理、技术上的支持、操作等主要岗位,根据岗位设定中的工作内容和工作元素制定职责说明书,主要内容有基础信息、岗位概述、岗位工作职责、工作权限与协调关系等。管理岗指管理运维服务的人员,负责规划、检查运维服务各过程,对运维服务能力进行策划、实施、检查、改进;技术上的支持岗指提供特定运维服务的专业方面技术人员,负责对运维服务过程中的请求、事件和问题做出响应;操作岗指日常实施操作的人员,负责根据相关规范和手册执行运维服务各过程。

  人员管理主要指运维人员的储备、培训和绩效考核。内部运维人员储备的重点应是管理岗和中高端技术上的支持岗,外包人员储备应以一般技术上的支持岗和操作岗为主,除在制度和经费上进行充分支持,还需提供必要的管理、技术、工具、过程、交付和应急等培训,建立明确的绩效考核制度,以保障运维人员持续满足运维服务级别要求。

  通过建立知识、技能、经验等评价标准和机制,依据评价结果能确定人员培养目标、内容和方式等,制定内部运维人员发展计划,也可以督促外包运维人员提升服务质量,优化外包管理模式。

  过程导向是基于ITSS的运维有别于传统IT运维的显著特征之一。过程是组织中利用输入实现预期结果的相互关联或相互作用的一组活动,定义了活动、关系、顺序、产出标准等信息。合理的过程设计能够解决现实中运维事件响应慢、故障处理周期长、流程操作不规范、职责权限不明晰、反馈机制缺失等问题。本运维体系过程要素划分为服务级别管理、服务报告管理、事件管理、问题管理、配置管理、变更管理、发布管理、安全管理,主要设计要点见下表。

  在过程整体框架的基础上,还应厘清各过程间的关系和接口,以及各过程的具体活动和考核指标。运维过程要素逻辑关系如下图所示。

  技术是指交付运维服务研究和转化的知识、经验、手段、方法的总和,主要通过技术管理、研发技术和技术应用等活动保障运维能力能够很好的满足不同场景需求。从实践规律来看,规范化运维是运维数字化转型的第一步,四川省水利信息系统运维体系应结合自身业务需求和技术发展趋势,按照“自动化—数据化—智能化”的建设路径不断实践。

  在过程导向规范化运维的基础上,通过运维工具或平台实现任务处理和运维流程的自动化,主要包括监控告警自动化和运维操作自动化等技术。此阶段本质是操作批量化解决运维重复性问题,达到降本增效的目的。

  以数据分析为核心,使用运维过程中产生的数据,挖掘数据的价值和潜力,支撑运维及业务决策,主要包括数据规范、数据获取和数据治理等技术。此阶段目标是实现数据驱动,进一步提升自动化、增强智能化。

  运用AI、大数据和机器学习等先进分析技术,部分替代或增强运维的分析和决策能力,大幅度提升运维效率和质量。智能化是运维数字化转型的必然趋势,目前智能运维技术步入实际应用阶段,并已实现多种基于规则匹配的运维场景,但未来仍面临数据、算法和场景层面的各种挑战。

  按照ITSS 5.0体系标准,资源要素主要包括运行维护工具、服务台、最终软件库、备件库、服务数据和知识等,根据核心特征划分为5个成熟度等级。本运维体系提出了不同等级资源要素的构建方法,以便与人员、过程和技术要素结合,保障运维能力能够满足多种场景需求,具体见下表。

  在四川省水利信息系统运维现状基础上,梳理目前存在的问题,进行需求分析,构建了一种基于ITSS的四川省水利信息系统运维体系,重点阐述了核心要素的建设思路和设计要点,为持续增强系统整合升级后的运维保障提供了一套体系化的理念、方法和技术。该运维体系符合四川省现阶段实际的需求,未来在进入实施部署和服务运营阶段后,可不断通过监督、管理和改进形成全生命周期良性循环,为提高运维工作效率和质量提供有力支撑。

  李腾,卢鑫,阚飞,等.基于ITSS的四川省水利信息系统运维体系构建研究[J].中国水利,2025(11):51-58.