论数据的国家权属及数据衍生权

唐文发

2022年12月29日10:30
文字缩放:

数据已成为与土地、劳动力、资本、技术并列的五大要素之一,是发展数字经济、壮大实体经济的重要基础,是新一轮国际竞争重点领域。但目前数据标准不一、数据权属不明两大核心问题尚未解决。

本文所研究的数据,特指对我国境内人的社会活动事实的记录和描述(以下简称数据)。

产出贡献决定数据资源国家所有

现代产权理论框架下的数据确权

在市场的运行过程中,产权界定和合理配置占有重要地位。在数据确权时,除了依法确认数据采集、存储、加工等数据处理者的劳动付出和收益权,也应该充分考虑“外部性问题”,考虑到社会成本的消耗及社会福利的损失,作出实现外部性内在化的数据产权制度安排,将在合作中形成的数据产权归属于对合作产出边际贡献最大的一方。

“人”元素所有权分析

国家组织规划设计了居民身份证体系,颁布了《居民身份证法》,明确由公安机关登记公民的姓名、性别、民族、出生日期等信息,确保公民身份号码与公民的一一对应。公民身份号码体系是实现“人”元素唯一性的数据基点,国内的信息系统要实现人的唯一性映射必然要使用公民身份号码。在数据采集过程中,采集者仅仅是将客户提供的身份证号码记录到系统中,付出的私人成本远远小于建立公民身份号码的社会成本,而且采集者并未付出社会成本的对价。按照合作中形成的数据产权归属于对合作产出边际贡献最大的一方原则,相关人元素产权应该归“全民所有”。

“地”元素所有权分析

国家制定了《地名管理条例》《中华人民共和国行政区划代码》等,并按标准完成编码。国家地名体系是实现“地”元素唯一性的数据基点,国内的信息系统要实现地的唯一性映射必然要使用国家地名体系。在数据采集过程中,采集者仅仅是将客户提供的地址记录到系统中,付出的私人成本远远小于建立地名体系的社会成本,而且采集者并未付出社会成本的对价。按照合作中形成的数据产权归属于对合作产出边际贡献最大的一方原则,相关地元素产权应该归“全民所有”。

数据的核心元素所有权决定了数据归国家所有

通过上述分析可知,“人”元素数据和“地”元素数据产权“全民所有”是符合现代产权理论的合理制度安排。 “人”元素和“地”元素是数据的核心元素,其他所有社会活动数据均附着“人、地”元素而展开,从“人、地”元素数据的所有权出发,可以认为本文所指数据均具备国家权属,国家可以依据所有权,对企业单位、平台公司的数据采集权、持有权、使用权、衍生权、经营权、收益权、处置权、出口权等作出规划、管理和限制,并实施监管和制约,以确保数据要素市场的有序发展。

数据资源国家所有的必要性

数据资源国家所有符合我国基本经济制度

数据不排除个人所有权和平台公司持有权,但“数据资源”作为一个整体,应体现国家所有的性质。数据资源国家所有,也有利于国家作为数据资源的主体发挥其管理、监督、保护、计划的职权,使得数据要素所带来的收益让全民共享,从而推动数字经济发展利益最大化。数据国家所有的真正目的不是让国家垄断全社会所有数据资源,掌控企业数据交易大盘,而是要更好地保护和促进数据要素市场发展,依法对数据资源进行更加科学、合理、规范的分配,更好地在数据应用和国家、法人、个人等不同主体的权益维护中保持平衡。

数据滥用的现实危害性反证了其国有必要性

一方面,将导致数据垄断和数据封闭。国家放弃数据所有权势必造成数据市场经营主体肆意使用数据。允许数据流通之后,企业在收集到大量数据之后必然形成数据垄断,破坏正常市场经营秩序,阻碍数据行业创新发展。为获取更多收益,让自身平台拥有“独一份”的权利,将不可避免地衍生出“大数据杀熟”、胁迫式收购或打压具有“潜在性威胁”的新创企业。另一方面,将危害国家安全和社会稳定。一是操纵意识形态和舆论走势,数据处理者可以通过数据化处理引导社会舆论走向并反作用于社会公众的思维活动与生活方式。二是影响社会经济发展,在掌握了大量数据优势后,容易对股市、资金放贷等进行控制。三是危害国家安全稳定,导致一些关键数据被相关实体掌握,通过大数据算法,其中可挖掘出非常敏感的个人隐私、商业秘密、安全信息等。

数据交易新模式——衍生权交易

2014 年,全国首个大数据交易平台——数海大数据交易平台在中关村成立。其后,在贵阳、上海、重庆等地又陆续建成数十个交易平台。大数据交易所的建立使之前一对一的双边数据市场向“一对多”或“多对多”的网络数据市场转型,对数据交易市场的发展起到了一定的推动作用。虽然经过多年发展,但是多数大数据交易所成交寥寥,依然处于小规模的探索阶段。

原生数据交易面临的困境

原生数据由于交易价值较小,且产权难以界定,难以实现高效利用和安全交换。一是所有权困境。从法理上来说,数据持有者不能转让自己不具有所有权的资产。二是个人信息保护困境。原生数据中包含大量用户提交的个人数据和用户行为记录,其中很多数据属于个人信息,受到《个人信息保护法》保护。三是交易前无法评估数据价值的困境。信息(数据)与一般商品存在较大差异,买方在购买前因为不了解该信息(数据)无法确定信息的价值,而买方一旦获知该信息(数据),就可以复制,便不会购买。四是产权转移困境。如果交易的是数据全部所有权,卖方应该在将数据提交给买方后清除所有数据记录,但卖方无法证明数据已全部清除,买方也缺乏合适的监督手段。

衍生数据交易面临的困境

一是难以精确匹配购买方的需求。同样一批原生数据,选择不同的应用方向或处理技术,可以生成无穷多的衍生数据,卖方很难完全理解买方的需求,生成完全符合买方需要的衍生数据。二是不能充分发挥购买方自有数据资源的作用。一般来说,数据购买方也是信息化企业,内部同样积累了海量数据,这些数据的维度可能和卖方数据的维度完全不同。比如银行购买电商平台的交易数据用于客户授信评估,如果能将电商的原生数据与银行自有的账户流水结合,其可信度能成倍增长。但银行不愿也不能将账户流水提供给电商,导致无法充分利用自身数据价值,效果必然大打折扣。三是难以结合多个卖方数据。比如银行购买电商平台的交易数据和旅游出行平台的出行数据用于客户授信评估,两个衍生数据整合显然不如原生数据直接结合分析效果好。四是难以实现按需购买。假如卖方数据有 100亿条,涉及 2 亿用户,但买方只需要对自己 2000 万客户做授信评估,如果要按需购买,买方要将自己的客户名单交给卖方,即使买方愿意承担泄露商业机密的风险,这里还涉及到如何合法提供个人信息的问题。为了避免这些麻烦,买方只能买下全量衍生数据,付出了很多不必要的费用。五是数据得不到及时更新。真实、鲜活、有效是数据的重要属性,但购买的衍生数据往往是某一个时刻的数据快照,即使购买定期更新服务,更新周期也不可能无限小,数据存在鲜活度不够和过时失效的风险。

新交易模式产生的技术基础——隐私计算

隐私计算(Privacy compute 或 Privacy computing)是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,达到对数据“可用、不可见”的目的;在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放。与传统数据使用方式相比,隐私计算的加密机制能够增强对于数据的保护、降低数据泄露风险。目前主流的隐私计算技术主要分为三大方向:第一类是以多方安全计算为代表的基于密码学的隐私计算技术;第二类是以联邦学习为代表的人工智能与隐私保护技术融合衍生的技术;第三类是以可信执行环境为代表的基于可信硬件的隐私计算技术。不同技术往往组合使用,在保证原始数据安全和隐私性的同时,完成对数据的计算和分析任务。

按照笔者的构想,数据交易所搭建隐私计算平台作为数据交 易 基 础 设 施 。 使 用 可 信 执 行 环 境 (Trusted Execution Environment,简称 TEE)模式,通过软硬件方法在中央处理器中构建一个安全的区域,单次隐私计算各参与方的输入数据由TEE 采用加密技术统一做去标识化(是指个人信息经过处理,使其在不借助额外信息的情况下无法识别特定自然人的过程)处理, TEE 逻辑上保证其内部加载的输入数据无法输出,只能输出计算结果。同时数据交易所作为可信监管方,从管理上确保隐私计算的严格执行。笔者称该方案为可信数据交易平台。

新交易模式的核心——数据衍生权

在这个基于隐私计算方式的数据交易模式中,交易的显然不再是数据所有权。那么交易的是什么?笔者认为是生成衍生数据的权利,可以算是使用权的一个子集。由于生成衍生数据的权利和其他资产使用权存在差异,比如没有时间上的独占性(可同时在多处使用),使用中没有耗损,使用后会产生新的资产,笔者将其命名为数据衍生权。

笔者建议授予数据生产者数据衍生权,从而构建起数据产业的秩序。让数据生产者对数据拥有法定权利,让他们在数据采集、储存、处理上的投入得到相应产出,使数据产业进入良性的正循环,推进数据要素与土地、劳动力、资本、技术要素同步发展,齐头并进。

数据衍生权的权利归属问题应予以明确,依托激励创新理论,衍生权应归属于对原始数据进行加工处理和投入智力劳动的数据持有方,如政府、数据企业等。赋予数据持有方以数据衍生权受到知识产权保护,不仅能有效促进其投资创新的积极性,更实现了无形财产权的分配正义。不过通常情况下,数据持有方的主体呈现多元化,可参照知识产权归属进行明确。值得注意的是,数据衍生权并不代表放开了数据的界线,必须平衡好数据衍生权在国家、社会公众、数据企业之间的利益关系。

(作者系株洲市副市长、市公安局党委书记、局长。本文仅代表作者观点,不代表本网立场) 

( 编辑:白 翔   送签:白 翔   签发:钟鸣 )