银行客户信息整合详解
2003/04/14
随着中国成功加入WTO,并逐步向国际社会开放自己的金融市场,将会有更多的国外商业银行进入中国金融市场。如何在国内国际的金融市场竞争中立于不败之地,并且稳步发展自己,关键在于能否有效地挖掘和利用已经建立起来的和潜在的客户资源。国内各商业银行都已经逐步建立起庞大的综合业务系统,主要应用于银行的交易处理和账户管理。这些系统中积累了大量的面向账户的交易数据,但是由于面向交易的系统往往以产品为中心,信息分散在不同系统中,缺乏对客户统一全面的了解,不能对账户背后的客户有直接全面的认识。
图1 DataStage逻辑架构
常用设计简介
DataStage 提供给开发者非常直观的图形界面,开发者可以遵循一种工作流思考方式来选择数据源、目标数据与过程转换用的组件(Stages),并将之置于一个最初看起来像一个空格一样的“草稿表”模板上。Stage是包含了一定功能的组件,类型很多:作为数据源和目标的可以是各种数据库的连接,可以是文本文件或hash文件等;作为转换功能的可以是排序、聚类统计、数学运算等具有特殊功能的组件。设计者用一种叫做“链接”的箭头来连接这些具有代表性的图标,而这些箭头则阐明了运行开始后数据与元数据的流向。在创建DataStage任务时,用户可以在设计草图上添加注释、说明、标签或是其他可以添加给作业的描述性文字。DataStage使用图形方式建立表的查询、连接关系、排序和汇总运算。图2、图3是几种常用的设计模式:
图2 源数据和目标数据都直接操作数据库
数据抽取的实现
客户信息数据库中的各表以客户编码为关键字进行关联,客户编码是由客户的证件号码经过专门的算法计算产生的唯一客户标识。根据各个系统中客户数据与新系统客户信息的对照关系我们设计数据抽取转换的程序,如图4所示是一个DataStage的Job。
由于源数据量很大,从数据库中直接提取数据效率不高,我们采用先将数据卸载到文本文件中,再从文本中抽取数据进行处理。通过DataStage的Sequential
File Stage可以连接一个指定路径的文本文件,在db1_tab1设定文件的存放位置、文件中分隔符、文件中每个字段的类型、长度和名称,即可以取得客户的证件号码、姓名、电话、职务职称等信息。这些信息需要进行一系列处理:计算客户编码,根据新编码规则进行代码转换,去掉非法字符等,在一个Transformer
Stage Transform1中对各数据进行处理。
图3 源数据和目标数据直接操作文本文件
其中CreateKhbm函数是利用DataStage提供的函数开发环境编写的,目的是产生客户唯一标识客户编码。由于tab1中的身份证号字段存储的证件号码数据不规范,所以在CleanSfzh函数中,我们对不规范的证件号码进行清洗整理,产生规范的证件号码。证件类型(zjlx)由于在不同系统中编码定义不同,因此需要进行转换。通讯地址和邮编两个字段只对空值进行特殊处理。在这样一个Transformer
Stage中只需用很少的代码即可以完成需要的数据处理。
由于不同的源数据中可能包含同一个客户的信息,因此采用Hashed File Stage HF_khjbxx存放输出结果,相同客户的信息根据客户编码覆盖前面产生的信息,避免了重复的客户信息。从不同源数据库取得客户信息,根据数据的真实性依次进行处理后,生成的客户信息全部保存在一个Hash文件中,最后从Hash文件中取出结果数据装载到目标数据库中。
图4 一个DataStage的Job
由于客户数据量很大,为了在不同的数据库中将大量的数据进行整合,数据处理效率十分重要。在实现中不直接操作数据库而使用文本文件的优势在于DataStage直接抽取文本文件数据的效率高于从数据库中抽取,DataStage访问数据库时需要通过ODBC连接相应的数据库Driver,连接上数据库后,从数据库中抽取部分数据存放于DataStage
Server内存中,转换装载完后,再从数据库中抽取一部分数据,所以不适用于大数据量的抽取转换,而且不易于实现多进程同时执行。
对于大数据量的抽取转换(如1000万条记录),我们可以手工卸载成几个文本文件,放到DataStage Server上,DataStage在抽取转换时直接将文本文件内容装载到内存中,省去了连接数据库资源的消耗,并且可以同时执行几个Job(Job的设计可以重用),从而提高抽取转换效率。
在客户基本信息整合完成后,从不同系统将客户的账户数据抽取出来,客户的每个账户、账户类型、币种、状态、余额、积数、开户、销户情况全部整合在一起,建立起一套较为完整的客户总账。在此基础上,对客户的资产负债总量、分布情况可以汇总统计,每日对资产负债变化进行跟踪分析,可以全面地了解客户在银行的资产分布和变化状况。同时,从各交易系统中获得账户的交易情况,可以转换为客户的交易情况,分别统计不同时间段、不同交易地点、不同交易种类的客户交易,从而了解客户的交易习惯和喜好。客户信息整合后,不同角度、不同层面的客户分析可以全面展开。
结束语
目前,各个银行都已具有强大的面向账户的交易系统。真正要做到面向客户服务首先要建立完善的客户信息系统。放弃目前各系统中分散零乱的客户信息而从头积累客户信息是巨大的浪费,从分散的账务系统中抽取整合客户信息通过实践是完全可行的。只要设计一个科学的方法,采用有效的工具,完全可以在很短的时间内将有效的数据提炼出来,建立起拥有几百万客户的信息库。客户信息库不仅为客户服务提供了基础,更为客户分析创造了必要条件。
赛迪网 中国信息化(industry.ccidnet.com)
架构在互联网上的CRM 2003-04-11 |
CRM在闭环中运行 2003-04-11 |
数据仓库支持的“关系优化器” 2003-04-11 |
共同打造一流顾客满意度 2003-03-27 |
借力CRM系统 上海通用为客户需求号脉 2003-03-24 |