工行首席技术官吕仲涛:金融业数据治理的突破口
工行首席技术官吕仲涛:金融业数据治理的突破口
中国金融四十人论坛
吕仲涛表示,当前,我国的数据治理工作面临着一系列问题与挑战,包括数据归属权和使用权界定有待进一步明确,数据流转制度和技术基础有待夯实,跨金融机构数据共享亟待深入推进等。他强调,“数据信息的合理利用与依法有序流动,是商业银行数字化转型、有效防范化解金融风险的关键手段。”
针对这些问题,他对数据治理的工作思路提出三方面建议:? 加快厘清数据归属权和使用权;? 探索适应数据要素市场化流转的制度与技术基础,加快建立多层次数据交易市场;? 大型金融机构先行开展金融领域数据要素市场化试点。
具体而言,吕仲涛提出,国有大行可先行先试,充分利用隐私计算等新技术,防范信贷资金违规使用、多头开户多头授信和欺诈洗钱等金融风险。运作机制方面,可在人民银行的指导和召集下,依托特定交易主体进行试运行,逐步摸索相应的定价、运营和风控模式。
文 | 吕仲涛
数据治理是当前的热门话题。银行本质上是经营数据的行业,承载着大量的客户个人信息和财产信息,且这些信息在银行的经营活动中发挥着非常关键的作用。我将结合新经济形势下出台的一系列政策和法律法规,从技术角度出发,联系自己在银行业的工作体会谈一谈数据治理问题。
1. 数据归属权和使用权的界定有待明确
目前,很多情况下数据的归属权不够明确。例如,客户姓名、身份证号、手机号等个人信息实际上可以被不同组织和机构在不同场合中获取。各项业务的办理过程,如商品购买、财务处理等,也会产生大量数据,在其基础上,又可以进一步加工生成更多的衍生数据。现在这些数据的归属权界定尚不清晰。
与一般生产要素不同,数据在物理层面上并不具有唯一性和独占性的特点——从技术角度来说,数据可以支持不同主体同时分别使用。因此,只有厘清各类数据的归属权与使用权,包括在一定条件下的转让权,数据才可能成为按市场经济规律进行配置的一种生产要素,才可能按照市场化方式进行交易和流转。
目前我国已经针对数据安全、个人信息保护等问题出台了一系列法规,包括《个人信息保护法》《网络安全法》《数据安全法》等。然而,考虑到当前对有效指导和规范市场主体运作的需求,依然有许多地方需要进一步研究明确。
例如,《个人信息保护法》对“个人信息”的定义是,“以电子或其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息”。而问题是,法规中的一些概念在实际操作中很难界定。
比方说,根据法规,客户在银行办理转账业务所产生的数据应该归属于客户,但银行能否合理地使用这些数据?应该在什么情况下使用?在统计分析时能否使用?在产品推介时能否使用?这些问题都有待厘清。
原先一般认为,银行原则上是可以将客户数据用于这些业务的。但细究起来,这种做法在操作层面上存在问题。因为法律规定,银行使用客户的个人信息时,必须“明示”客户特定数据的使用目的和处理方式等,但银行使用这些数据的部分场景,比如涉及复杂统计过程的精准营销,事实上很难详细、个别地向客户说明。可如果不能做到“明示”,银行就超过了自身对数据的使用权限。
在此之外,对于客户开户的三要素信息,即姓名、身份证号和地址,银行使用权的边界在哪里?实际上,很多基本数据经过不同组合可以产生大量新数据,因此厘清银行对这些数据使用权的界限格外重要。这些都是银行在日常工作中经常需要面对的具体问题,在法律法规层面上还需要进一步斟酌完善。
2. 数据流转制度和技术基础有待夯实
可流转是市场经济环境中生产要素的基本特征之一,但由于数据可以无限复制和传播,市场主体在通过交易形式转让数据后并不会完全丧失数据的使用权,从技术层面上看,该主体仍可以继续使用甚至重复转让这些数据。有别于传统生产要素的交易和流转,目前还缺乏能够准确度量特定数据的价值和影响的有效手段,数据流转方面的市场定价标准、风险评估手段等也十分不足。我认为在这个问题上有三个方面需要关注。
第一,可流转数据范围有待明确。哪些数据可以流转、哪些数据不能流转、哪些数据在特定条件下可以流转,都需要有清晰的界定,同时还要考虑跨主体、跨国境等各种数据流转情况。最近部分互联网公司涉嫌信息披露违法违规而被调查、互联网平台的个人信息与金融机构“断直连”等,也在一定程度上反映了当前可流转数据范围存在的问题。
第二,数据交易市场的建立方式需要深入思考。这一问题在征信等垂直领域已经有了一些探索,部分地方政府也在推动建立数据交易市场。然而在必要的行政力量之外,如何构建市场化的交易平台目前仍不明晰。此外,哪些数据应当以市场化的方式交易,哪些又必须基于特定交易主体进行交易,也有必要进行探索。
第三,数据要素市场化机制如何设计,如何定价以确保价格与权益相匹配,还需要探讨。数据市场要做活,必须激发各市场主体的积极性,这当中最重要的一点就是定价。只有通过价格手段有效平衡各参与主体的成本、贡献和收益,数据才能真正流通起来,要素市场才能建立起来。另外还需要考虑的是,如果要确保价格与权益相匹配,就不应当允许市场主体只支付一次就能无限制地使用数据甚至于二次转让数据,这会对市场造成伤害。
3. 跨金融机构数据共享亟待深入推进
数据信息的合理利用与依法有序流动是商业银行数字化转型、有效防范化解金融风险的关键手段。虽然各家金融机构已在内部数据的挖掘方面取得了很大突破、获得了一些成果,但仅从金融风险防范的视角来讲,我们依然迫切需要开展跨金融机构的数据融合应用。
当前不同银行间账户资金往来极其便捷,一笔资金可以在短短几分钟内流转到多家银行,同一客户也可能在多家银行申请信用卡或贷款,频繁的资金往来为鉴定资金的真实来源和流向、规避恶意信用透支等风险带来很大挑战。有时从单一银行范围来看似乎一切正常,可一旦从更高的视角出发进行全局观察,就会发现存在一些潜在的系统性风险。而以各家银行目前的运行机制,很难达到“风险联防联控”的要求。各家银行只有打通数据孤岛、实现跨行数据的共享,才有可能实现对系统性金融风险的防范。
除了这些共性问题,目前金融行业中还普遍存在三个问题,那就是“不敢共享”“不愿共享”“不便共享”。
“不敢共享”方面,实际上金融数据具有一定的敏感性,涉及到个人隐私、商业秘密甚至国家安全,因此在一些法律法规不太清晰的领域,商业银行进行数据共享时会顾忌法律风险、不敢轻易行动。
“不愿共享”,则是因为数据是银行的战略性资源和关键生产要素,数据持有方在缺乏相关利益补偿机制的情况下,主观上缺乏共享数据的动力。
“不便共享”是指传统的数据共享方法面临很多制约条件,较长的实施周期也极大限制了数据价值的发挥。例如,在共享数据时需要进行数据的脱敏、传输、复制、核对、标签等工作,各银行的合作难度很大,实现过程也相对复杂。
1. 加快厘清数据归属权和使用权
要兼顾数据的安全保护与发展,就必须要厘清数据的归属权与使用权。金融数据是价值资产,其作为新生产要素的社会推动作用必将日益凸显,我们需要在数据安全保护与发展利用之间找到平衡点,既要避免管得过紧,影响数据价值发挥,又要避免管得过松,难以保障用户隐私又不利于数据要素的长期可持续发展。对于加快完善法律法规、厘清数据的归属权和使用权,我有四方面建议。
第一,用户个人的自然属性数据,例如姓名、身份证号、手机号等,归属权应当属于用户个人,数据采集主体可在用户授权范围内使用,但要防止过度索权、宽泛索权的问题。
第二,服务办理过程中产生的数据,例如购物、支付数据,可由交易相关主体共同拥有,因为整个交易过程涵盖了买卖双方的信息,整合起来才会成为最终的订单信息。因此这类数据应当是共有的,在各相关方的主体范围内可以自由使用。
如需向任何其他主体提供该数据,必须由相关主体共同授权。例如,对于平台类电商的购物数据,我们认为平台不应拥有数据所有权,其可以在充分尊重数据人格权的前提下,根据相关约定对自然人的有关数据进行统计和所谓的客群分析,但不应进行精准营销行为,因为平台只是中介方,并非真正的交易双方中的任何一方。除非经过交易中甲乙双方用户的专门授权,平台在数据使用中不得追溯至原始自然人信息,信息的所有权由买方和卖方共同拥有。
与此同时,要严格管控非数据直接生成方开展有关主体的数据超融合,这一现象包含着巨大的风险。现在有大量第三方公司自身不产生数据,却通过各种交易市场进行数据搜集,并将之进行超融合。在这种情况下,追溯数据来源将变得非常困难。
第三,上述原始数据进行匿名化处理后得到的衍生数据,在确保数据不可回溯到自然人的前提下,可归数据加工方所有,并由其决定如何使用。在这个过程中,匿名性非常重要,现在我们往往把“去标识化”和“匿名化”混淆,但匿名化处理实际上并没有那么简单,即便用加密算法来做也未必不能破解。因此,对匿名性的判断要更加严谨。
第四,要明确数据的主权属性。数据主权应当是国家主权的一部分,对于境内或者其他某些特定场景产生的数据,国家应当拥有对这些数据的最高权力,前述的数据归属权、使用权等都应该服从于主权管理这个大前提。这与下文将谈到的系统性金融风险防范密切相关——如果从国家数据主权的角度出发,由国家特定机构来负责推进相关事宜是没有问题的。
2. 探索适应数据要素市场化流转的制度与技术基础
数据要素市场化是新生事物,世界各国均无此先例。我们可以在把握好风险底线的基础上,借鉴改革开放之初的特区建设思路,“摸着石头过河”,加快探索在国内建立多层次数据交易市场。
首先,要对关系到国家安全、经济安全、社会稳定和公共健康的数据交易进行严格管控,或者限制市场交易只在特定的交易主体间开展、在国家管理的特定场所进行。有关部门可以通过发布负面清单、完善相关规定、采用类似《征信业管理条例》的方式对市场进行规范。
而另一方面,对于非受限数据,则可给予各地数据交易市场更大的空间。考虑到潜在的不可控因素,也可以借鉴沙盒机制,允许相关数据交易市场在一定数据范围内组织部分有代表性的市场主体,围绕数据定价、交易手段、权益界定、风险防控和技术工具建设等问题展开积极探索,争取在打造数据特区方面开辟出一条可行的道路;通过阶段性地总结特区经验,提炼形成深化数据要素市场化改革的政策框架与法律制度,为后续参与数字领域的国际规则和标准制定做好准备。
对此我提出三点建议:
第一,要完善金融行业数据共享与治理的有关法规。《数据安全法》第21条明确指出,“各地区、各部门应当按照数据分类分级保护制度,确定本地区、本部门以及相关行业、领域的重要数据具体目录,对列入目录的数据进行重点保护。”金融行业的主管部门理应尽快明确金融数据保护的有关管理规定,指导和规范各地区金融数据交易及各金融机构数据共享,现阶段可优先围绕金融风险防控来推进。
第二,要研究建立支撑金融行业数据共享与治理的配套实体。一方面要成立特定的交易主体,负责金融行业数据共享的日常组织和运营;另一方面要成立数据治理的监管机构,监管金融数据的跨行业、跨境流动,并着重从三方面对金融行业数据共享的有关市场主体进行监管:
(1)准确性与安全性,主要包括数据来源是否合法有效,数据的获取、传输、存储是否安全;
(2)透明度与公平性,主要包括数据加工过程中涉及的算法模型是否公正公平,是否具备可解释性、是否注意避免歧视特定人群;
(3)消费者权益保护,主要在于客户的知情权能否得到充分保障。
第三,要研究建立适应数据要素特点的监管能力和工作模式,要建立涵盖事前、事中、事后的全流程监管机制。事前可研究建立由行业专家、领域专家、技术专家、法律专家等参加的听证制度,对数据共享的合规性和必要性进行评估;事中可通过配套的制度性与技术性安排,开展定期的审计评估,对数据共享和数据使用过程进行监督和监管;事后,则要建立数据共享相关的争议仲裁及风险补偿机制。
3. 大型金融机构先行开展金融领域数据要素市场化试点
我大胆设想,中国可依托大型金融机构先行开展金融领域数据要素市场化的试点。对于这一举措有三方面的考虑。
第一,机构禀赋方面,大型金融机构客户覆盖面广、业务和技术能力比较强、风险也比较可控。
第二,技术可行性方面,隐私计算等新兴技术已经取得发展,大型金融机构实际上已经有足够的技术储备来开展跨机构资金流向的追踪、查询、客户授信和审核等。特别是对于防范信贷资金的违规使用、客户多头开户和多头授信、交易流水变增等,目前都可以在技术上实现。然而由于当前跨行数据流通面临的制度障碍,这些措施无法实现。
第三,运作机制方面,可在人民银行的指导和召集下,依托特定交易主体进行试运行,逐步摸索相应的定价、运营和风控模式。这一举措从技术角度来看也是完全可行的。
请先 登录后发表评论 ~