中国银监会办公厅关于加密平台设计缺陷风险提示的通知
(银监办发〔2010〕320号)
各银监局,各政策性银行、国有商业银行、股份制商业银行,邮政储蓄银行,各省级农村信用联社:
2010年8月30日中午12时起,某银行核心系统及总行前置系统交易出现拥堵,造成该行全国网点交易缓慢,柜面业务、网上银行、电话银行、电子支付等业务均不同程度受到影响。事件发生后,该行立即向银监会、人民银行、证监会报送系统故障情况,并采取多项措施以降低影响:一是组织分行业务部门、客户服务中心及柜台人员对客户进行安抚和解释工作;二是明确账务核对和差错处理要求,确保客户资金安全,避免异常交易损失;三是联系人民银行将大额支付系统延时关闭,确保当日大额资金清算;四是实施专项舆情监测,及时跟踪外界反映;五是快速组织行内及厂商技术骨干,排查故障原因,制定系统加固技术方案。经紧急处置,当日15时该行柜面业务基本恢复,17时各类渠道业务基本恢复。
经核查,此次故障的直接原因是该行8月30日上午发起批量增加密钥操作,触发了加密平台在密钥读取加速机制中的设计缺陷,导致加密平台处理性能大幅下降,由于当时正处于业务高峰期,各业务系统的加密相关交易均出现超时,交易成功率下降,出现拥堵现象。该行业务流程设置要求各类交易报文都通过加密平台进行处理,虽然加密平台配置多台设备并设有负载均衡机制,但在特定情况下此负载均衡机制失效,导致加密平台实际成为各类交易处理的瓶颈环节。此次故障的深层次原因在于该行对单点故障风险防范不足、批量操作管控不严、测试不充分和对外通告不够及时有效。为使银行业金融机构充分了解风险情况,举一反三,自查不足,切实提高风险管理能力,现作如下风险提示:
一、加强系统单点故障风险防控
银行业金融机构要提高风险防范意识,加强对重要系统中可能形成业务处理瓶颈的单点故障排查,做好充足的风险应对准备,保障系统安全稳定运行。
二、加强批量操作统一管控
银行业金融机构要认真梳理各个部门和各类系统的日间联机批量操作,充分评估各类批量操作风险,建立全行统一的批量操作管理规范,加强批量操作统一管理和控制。
三、加强测试管理,提高系统可靠性