浅谈数据处理技术在银行业的应用

王宇 1999/06

  我国加入世界贸易组织后,商业银行的各项业务将要全面对外资银行开放,虽然还有一段过渡期,但留给我们的时间已然不多;随着我国市场经济的迅猛发展,企业间的经济交往和投资理财活动日益频繁,商业银行必须改变原有的账户设立方式,真正建立起企业基本账户制度,才能提高银行的市场竞争力和综合经济效益;储蓄实名制的建立,也迫切需要建立个人基本信息系统。因此,要想大力发展商业银行的各项金融业务,努力缩短与外资银行的服务差距,就必须从技术上做好准备,充分利用好各种带有高科技色彩的信息服务手段,为银行的各项业务工作服好务、帮好忙。而数据处理技术在其中起着至关重要的基础核心作用。

一、 传统的数据库技术已经不能满足业务的发展

  银行所需要的数据处理技术,不是一种单一的以数据库为中心,仅能满足日常联机处理的需要,而是能同时满足从联机事务处理、脱机批处理到统计分析和决策支持等方面的数据处理。但是不同类型的数据处理方式有其不同的处理特点,以单一的数据组织方式建立的数据库并不能反映出银行数据处理工作中的这些差异,单一类型的数据库已经满足不了银行数据处理多样性的要求。我国银行业通过多年的数据处理实践,对业务数据处理的多层次性已经有了更清晰的认识。结合当前银行的业务发展要求,我们可以把银行的数据处理工作分为两大类:既操作型业务处理和信息型业务处理。操作型业务处理用现有的数据库技术完全可以胜任,它是为银行某类具体应用服务的。人们关心的是处理响应时间,数据的实时性、安全性和完整性。信息型业务处理则用于统计分析和决策分析,它的特点是要经常访问大量的历史数据,对处理响应的时间不做苛刻的要求。操作型业务处理和信息型业务处理的特点决定了两者之间必然存在着巨大的差异。这也使两者的分离成为必然。例如:要想保证某营业系统24小时联机处理的正常进行,就一定不能同时在该系统中进行算法复杂的信息统计和决策分析处理工作,如果当以业务处理为主的联机事务处理(OLTP)应用和以分析处理为主的决策支持应用同时在一个数据库系统中运行,将会导致极其严重的后果。因此,只有通过建立数据仓库,才能更好进行统计分析和决策支持等信息型的业务处理。只有这样,才能为领导的决策提供强有力的辅助手段,从而不断提高银行自身的服务水平和营运质量。

二、在现有的数据处理过程中存在的问题

  目前我国不少银行的业务数据存在状态是分散而非集成的,造成这种分散的原因是多种多样的。

1. 系统设计人员为了减少开发费用和加快开发进度,总是采用简单而"有效"的开发方案,这种"有效"仅能对解决当前面临的问题有效,而不可能保证对后续问题仍然有效;这种"有效"只能在短期内带来好处,而对于银行各项业务的长远发展是十分有害的。
2. 为了避免对现有的联机处理数据库造成过大的影响,业务人员往往利用数据抽取技术从数据库中查找有用的数据,然后这些被简化了的数据再被放入专用数据库中供用户使用,而这些由抽取过的数据组成的数据库还会被其他用户继续抽取。在反复抽取的过程中,常常会造成数据的不完整、不一致。因而,在对同一问题的分析过程中,由于抽取级别的不同往往会产生误差,甚至造成截然相反的分析结果,使得银行的决策者无从下手。
3. 由于每次分析都直接从原始数据库中采集数据的开销过大,从而造成在一些分析应用中数据采集的时间间隔过长。在一次数据采集后,如果原始数据马上发生了改变,这些变化如不能立即反映给银行的分析人员和决策者,将严重影响分析和决策的准确性。因此,数据采集的周期(如24小时以内)必须较短,这样才能保证分析和决策的质量。
4. 银行目前所采用的数据处理方法,只关心当前数据库中的数据。对于历史数据,只是做到了进行定期备份,然后精心保存起来,使之"束之高阁"。因而使宝贵的历史数据资源未能得到充分合理的利用。

三.数据仓库及其特点

  银行的业务需要不断推动着数据处理技术的发展,银行业迫切需要应用新的数据处理技术--数据仓库,形成一个综合的、面向分析的数据应用环境,以更好地支持信息统计和决策分析。

  银行业所需要的数据仓库应具备下述四个基本特征:

数据仓库的数据是面向主题的

  传统的银行数据库系统中,数据是按业务组织的,一类业务组织成一个子系统。数据仓库中的数据是按主题组织的,一个主题基本上对应一个分析领域,其数据可以跨多个业务,因此按主题组织数据更利于统计分析和决策分析。

  对于数据仓库中数据面向主题的特征,这里将以"个人客户"为例,加以着重说明。有关个人客户的各种信息已经综合在"个人客户"这一主题中,它主要包含三个方面的内容:第一,固定信息,如姓名、身份证号、性别、年龄等一般性描述信息;第二,可变信息,包括本币存款信息、本币贷款信息、外币存款信息、外币贷款信息、其它投资信息、收入情况等。其中,本币存款信息又可分为卡类信息、活期存折信息、定期存款信息、各种短期或中长期投资信息等,其它可变信息也可以再进行细分;第三,历史信息。历史信息真实地记载着个人客户在与银行交往的过程中,所发生的每一笔原始交易。积累一定期限内的个人历史信息对银行开展业务是十分有利的。例如:某一个人客户申请一笔个人消费贷款,通过对固定信息和可变信息的分析,此人具备按期还款能力。但通过对历史信息的分析研究,发现该客户以往的还款情况不是很好,在以前发放给他的十笔贷款中,有七笔未能按期偿还。因此,对于该个人客户的贷款申请,应该审慎考虑,以保证银行的贷款质量。而对于以往还款情况良好的个人客户,在经过全面的调查、分析后,对于其再次申请的贷款,可以在额度和利率等方面给予适当的优惠,以利于吸引优质客户。

  比照银行原有的数据库模式,可以看到:首先,在面向应用向面向主题的转变过程中,丢弃了不必要的、不适于分析的信息,如凭证号码、凭证种类、券种的面额大小等;其次,在原有的数据库中,关于个人客户的信息分散在不同的系统中,如:本币存款信息存在于储蓄系统中,各种卡信息存在于卡类系统中,外币存款信息存在于外币储蓄系统中,住房公积金归集信息存在于公积金系统中。这就造成了在较短的时间内,不可能形成一个有关个人客户的完整性描述信息;而面向主题的数据仓库组织方式可以在短期内形成关于个人客户的信息集合,便于以个人客户为基础对分析对象进行更为深入的分析和处理。

数据仓库的数据是集成的

  数据是集成的,不同来源的数据必须被转换为相同的数据格式、度量单位、存储方式。数据仓库的数据是从原有的多个数据库数据中抽取来得,它所要完成的工作既繁琐又关键。首先,要统一源数据中的所有矛盾之处。因为,在不同的数据库中可能会有下述歧异:同名异义、异名同义、单位不统一、字段长度不一致等等。下面仅举一个简单的例子加以说明。在某银行开发的储蓄系统中,由于开发的时间较早,系统中身份证字段仅留有15位,而在新开发的个人贷款系统中,由于开发时间较晚,已预先考虑到身份证编码原则将要发生的变化,在设计系统时,身份证字段长度留有18位。其次,要对数据进行综合计算。这一项工作可以在从原有的数据库中抽取数据时完成,但更多的是在数据仓库内部进行。

数据仓库的数据是不可更新的

  数据仓库中的数据主要供分析和决策之用,仅涉及查询操作,一般情况下不进行修改操作。

数据仓库的数据是随时间不断变化的

  用户在进行分析处理时,数据仓库中的数据不进行更新操作,但这不表明在整个数据的生存周期中,数据仓库中的所有数据都是一成不变的。数据仓库的这一特性可用以下两点加以解释:

1. 数据仓库随时间变化不断增加新的数据内容。
2. 数据仓库随时间变化不断删除旧的数据内容。这是因为数据仓库的数据也有存储期限,一旦超过期限,数据就应该删除。但应注意一点,就是数据仓库中数据保存期限较长,一般为10至20年。

数据仓库除具有以上四个主要特点外,还有以下几点值得注意:

1. 数据仓库中的数据允许适当的冗余。
2. 数据仓库中数据的键值一般应包含时间项,以表明数据所处的历史时期。

  最后,需要强调一点,建立数据仓库不是要替代原来的联机事
务处理(OLTP)数据库,而是为了互为补充,最终建成能满足银行业务发展需要的数据处理体系化环境。

四、建好数据处理的体系化环境,为发展新型服务手段打下基础

  不论是呼叫中心服务,还是网上银行和自助银行服务,都是银行在现阶段推出的新型金融服务手段,它们都是银行给客户提供的一种现代化的金融服务工具,要想让人觉得"工具"好用,就必须不断完善和增加它的功能,使客户能自觉地随身携带并真正加以利用。

  对于各种新型的金融服务,必须充分利用科技手段,与银行原有营运系统进行紧密结合,才能充分发挥其作用。原有银行营运系统是构筑在数据处理体系化环境之上的,是由各种面向应用的OLTP数据库以及各级面向主题的数据仓库所组成的完整的数据环境。在这一体系化的数据环境上,建立和进行着从联机事物处理到企业管理决策的所有应用。具体地讲,银行原有营运系统应至少包括联机营业系统、客户信息系统、统计分析系统、决策支持系统。

1.联机营业系统是开办新型金融服务的基础,能否尽快与其全方位地连通,是顺利开办新型金融服务的关键所在。但做到了这一步,仅仅说明"工具"可用。

2.可用的"工具"与客户信息系统和统计分析系统相结合,才能初步体现出新型金融服务的优势。例如:在办理个人贷款申请服务中,客户可随时、随地申请个人贷款(通过呼叫中心服务或网上银行服务),银行联机营业系统在与客户建立联系的同时,自动启动客户信息系统数据库。使银行工作人员迅速知晓客户的身份和相关背景资料,银行工作人员在应用统计分析工具后,可对客户进行公正、全面、客观的判断,迅速完成对客户贷款申请的审核,并把审核结果及时通知申请人,这将极大地提高银行的办事效率和服务质量。做到这一步,也仅可以说明"工具"易用。

3.易用的"工具"与决策支持系统相结合,才能全面展示出新型金融服务的效力。银行通过统计分析系统,对进行金融服务所得到的数据进行全面实时的统计、分析,能使各级领导及时了解银行各方面的营运情况。再通过对决策支持系统的应用,可以随时协助银行各级领导对经营状况做出客观有效的正确判断。为不断提高银行的营运质量和服务水平,提高领导决策的科学性、客观性、准确性提供了强有力的辅助手段。做到了这一步,就可以说明"工具"好用。

4.好用的"工具"也必须不断被改进、被完善,才能更全面地发挥作用。改进和完善包括两个方面:第一,对新型金融服务方式的不断丰富,使客户更加喜闻乐见,更易于使用和接受;第二,建立起完善的数据处理体系化环境,就可以不断挖掘出银行内部的数据潜力,不仅做到能为银行内部提供更完善的服务,而且在适当的时候,也可以为银行的客户提供全方位服务,使"工具"变得更加完美。

五、小结

  银行只有通过数据处理体系化环境的建设,才能不断给客户提供全新的、完善的金融服务手段,这不仅能克服传统服务上的地理和时空限制,而且还可以使客户在一定的权限内,自由地运用银行所提供的信息、资源和服务。只有把银行自身的数据处理体系化环境建设好,才能使我国的银行业初步具备和国外同行竞争的基本条件,才能确保我国国民经济稳定健康地发展。面对21世纪,我们必须高度重视科技在银行发展中的突出作用,银行只有把自身数据处理体系化环境建设好,才能不断提高我国银行业的市场竞争力和综合经济效益,才能真正夯实开展各项金融业务的基础,才能坦然面对国外同行的挑战,确保在今后的竞争中立于不败之地。

作者供稿 原文刊登于《建设银行报》1999年6月