投稿郵箱:qizhixmt@126.com
站內搜索:
旗幟網>>理論武裝

論數據的國家權屬及數據衍生權

唐文發
2022年12月29日10:30
文字縮放:

數據已成為與土地、勞動力、資本、技術並列的五大要素之一,是發展數字經濟、壯大實體經濟的重要基礎,是新一輪國際競爭重點領域。但目前數據標准不一、數據權屬不明兩大核心問題尚未解決。

本文所研究的數據,特指對我國境內人的社會活動事實的記錄和描述(以下簡稱數據)。

產出貢獻決定數據資源國家所有

現代產權理論框架下的數據確權

在市場的運行過程中,產權界定和合理配置佔有重要地位。在數據確權時,除了依法確認數據採集、存儲、加工等數據處理者的勞動付出和收益權,也應該充分考慮“外部性問題”,考慮到社會成本的消耗及社會福利的損失,作出實現外部性內在化的數據產權制度安排,將在合作中形成的數據產權歸屬於對合作產出邊際貢獻最大的一方。

“人”元素所有權分析

國家組織規劃設計了居民身份証體系,頒布了《居民身份証法》,明確由公安機關登記公民的姓名、性別、民族、出生日期等信息,確保公民身份號碼與公民的一一對應。公民身份號碼體系是實現“人”元素唯一性的數據基點,國內的信息系統要實現人的唯一性映射必然要使用公民身份號碼。在數據採集過程中,採集者僅僅是將客戶提供的身份証號碼記錄到系統中,付出的私人成本遠遠小於建立公民身份號碼的社會成本,而且採集者並未付出社會成本的對價。按照合作中形成的數據產權歸屬於對合作產出邊際貢獻最大的一方原則,相關人元素產權應該歸“全民所有”。

“地”元素所有權分析

國家制定了《地名管理條例》《中華人民共和國行政區劃代碼》等,並按標准完成編碼。國家地名體系是實現“地”元素唯一性的數據基點,國內的信息系統要實現地的唯一性映射必然要使用國家地名體系。在數據採集過程中,採集者僅僅是將客戶提供的地址記錄到系統中,付出的私人成本遠遠小於建立地名體系的社會成本,而且採集者並未付出社會成本的對價。按照合作中形成的數據產權歸屬於對合作產出邊際貢獻最大的一方原則,相關地元素產權應該歸“全民所有”。

數據的核心元素所有權決定了數據歸國家所有

通過上述分析可知,“人”元素數據和“地”元素數據產權“全民所有”是符合現代產權理論的合理制度安排。 “人”元素和“地”元素是數據的核心元素,其他所有社會活動數據均附著“人、地”元素而展開,從“人、地”元素數據的所有權出發,可以認為本文所指數據均具備國家權屬,國家可以依據所有權,對企業單位、平台公司的數據採集權、持有權、使用權、衍生權、經營權、收益權、處置權、出口權等作出規劃、管理和限制,並實施監管和制約,以確保數據要素市場的有序發展。

數據資源國家所有的必要性

數據資源國家所有符合我國基本經濟制度

數據不排除個人所有權和平台公司持有權,但“數據資源”作為一個整體,應體現國家所有的性質。數據資源國家所有,也有利於國家作為數據資源的主體發揮其管理、監督、保護、計劃的職權,使得數據要素所帶來的收益讓全民共享,從而推動數字經濟發展利益最大化。數據國家所有的真正目的不是讓國家壟斷全社會所有數據資源,掌控企業數據交易大盤,而是要更好地保護和促進數據要素市場發展,依法對數據資源進行更加科學、合理、規范的分配,更好地在數據應用和國家、法人、個人等不同主體的權益維護中保持平衡。

數據濫用的現實危害性反証了其國有必要性

一方面,將導致數據壟斷和數據封閉。國家放棄數據所有權勢必造成數據市場經營主體肆意使用數據。允許數據流通之后,企業在收集到大量數據之后必然形成數據壟斷,破壞正常市場經營秩序,阻礙數據行業創新發展。為獲取更多收益,讓自身平台擁有“獨一份”的權利,將不可避免地衍生出“大數據殺熟”、脅迫式收購或打壓具有“潛在性威脅”的新創企業。另一方面,將危害國家安全和社會穩定。一是操縱意識形態和輿論走勢,數據處理者可以通過數據化處理引導社會輿論走向並反作用於社會公眾的思維活動與生活方式。二是影響社會經濟發展,在掌握了大量數據優勢后,容易對股市、資金放貸等進行控制。三是危害國家安全穩定,導致一些關鍵數據被相關實體掌握,通過大數據算法,其中可挖掘出非常敏感的個人隱私、商業秘密、安全信息等。

數據交易新模式——衍生權交易

2014 年,全國首個大數據交易平台——數海大數據交易平台在中關村成立。其后,在貴陽、上海、重慶等地又陸續建成數十個交易平台。大數據交易所的建立使之前一對一的雙邊數據市場向“一對多”或“多對多”的網絡數據市場轉型,對數據交易市場的發展起到了一定的推動作用。雖然經過多年發展,但是多數大數據交易所成交寥寥,依然處於小規模的探索階段。

原生數據交易面臨的困境

原生數據由於交易價值較小,且產權難以界定,難以實現高效利用和安全交換。一是所有權困境。從法理上來說,數據持有者不能轉讓自己不具有所有權的資產。二是個人信息保護困境。原生數據中包含大量用戶提交的個人數據和用戶行為記錄,其中很多數據屬於個人信息,受到《個人信息保護法》保護。三是交易前無法評估數據價值的困境。信息(數據)與一般商品存在較大差異,買方在購買前因為不了解該信息(數據)無法確定信息的價值,而買方一旦獲知該信息(數據),就可以復制,便不會購買。四是產權轉移困境。如果交易的是數據全部所有權,賣方應該在將數據提交給買方后清除所有數據記錄,但賣方無法証明數據已全部清除,買方也缺乏合適的監督手段。

衍生數據交易面臨的困境

一是難以精確匹配購買方的需求。同樣一批原生數據,選擇不同的應用方向或處理技術,可以生成無窮多的衍生數據,賣方很難完全理解買方的需求,生成完全符合買方需要的衍生數據。二是不能充分發揮購買方自有數據資源的作用。一般來說,數據購買方也是信息化企業,內部同樣積累了海量數據,這些數據的維度可能和賣方數據的維度完全不同。比如銀行購買電商平台的交易數據用於客戶授信評估,如果能將電商的原生數據與銀行自有的賬戶流水結合,其可信度能成倍增長。但銀行不願也不能將賬戶流水提供給電商,導致無法充分利用自身數據價值,效果必然大打折扣。三是難以結合多個賣方數據。比如銀行購買電商平台的交易數據和旅游出行平台的出行數據用於客戶授信評估,兩個衍生數據整合顯然不如原生數據直接結合分析效果好。四是難以實現按需購買。假如賣方數據有 100億條,涉及 2 億用戶,但買方隻需要對自己 2000 萬客戶做授信評估,如果要按需購買,買方要將自己的客戶名單交給賣方,即使買方願意承擔泄露商業機密的風險,這裡還涉及到如何合法提供個人信息的問題。為了避免這些麻煩,買方隻能買下全量衍生數據,付出了很多不必要的費用。五是數據得不到及時更新。真實、鮮活、有效是數據的重要屬性,但購買的衍生數據往往是某一個時刻的數據快照,即使購買定期更新服務,更新周期也不可能無限小,數據存在鮮活度不夠和過時失效的風險。

新交易模式產生的技術基礎——隱私計算

隱私計算(Privacy compute 或 Privacy computing)是指在保護數據本身不對外泄露的前提下實現數據分析計算的技術集合,達到對數據“可用、不可見”的目的﹔在充分保護數據和隱私安全的前提下,實現數據價值的轉化和釋放。與傳統數據使用方式相比,隱私計算的加密機制能夠增強對於數據的保護、降低數據泄露風險。目前主流的隱私計算技術主要分為三大方向:第一類是以多方安全計算為代表的基於密碼學的隱私計算技術﹔第二類是以聯邦學習為代表的人工智能與隱私保護技術融合衍生的技術﹔第三類是以可信執行環境為代表的基於可信硬件的隱私計算技術。不同技術往往組合使用,在保証原始數據安全和隱私性的同時,完成對數據的計算和分析任務。

按照筆者的構想,數據交易所搭建隱私計算平台作為數據交 易 基 礎 設 施 。 使 用 可 信 執 行 環 境 (Trusted Execution Environment,簡稱 TEE)模式,通過軟硬件方法在中央處理器中構建一個安全的區域,單次隱私計算各參與方的輸入數據由TEE 採用加密技術統一做去標識化(是指個人信息經過處理,使其在不借助額外信息的情況下無法識別特定自然人的過程)處理, TEE 邏輯上保証其內部加載的輸入數據無法輸出,隻能輸出計算結果。同時數據交易所作為可信監管方,從管理上確保隱私計算的嚴格執行。筆者稱該方案為可信數據交易平台。

新交易模式的核心——數據衍生權

在這個基於隱私計算方式的數據交易模式中,交易的顯然不再是數據所有權。那麼交易的是什麼?筆者認為是生成衍生數據的權利,可以算是使用權的一個子集。由於生成衍生數據的權利和其他資產使用權存在差異,比如沒有時間上的獨佔性(可同時在多處使用),使用中沒有耗損,使用后會產生新的資產,筆者將其命名為數據衍生權。

筆者建議授予數據生產者數據衍生權,從而構建起數據產業的秩序。讓數據生產者對數據擁有法定權利,讓他們在數據採集、儲存、處理上的投入得到相應產出,使數據產業進入良性的正循環,推進數據要素與土地、勞動力、資本、技術要素同步發展,齊頭並進。

數據衍生權的權利歸屬問題應予以明確,依托激勵創新理論,衍生權應歸屬於對原始數據進行加工處理和投入智力勞動的數據持有方,如政府、數據企業等。賦予數據持有方以數據衍生權受到知識產權保護,不僅能有效促進其投資創新的積極性,更實現了無形財產權的分配正義。不過通常情況下,數據持有方的主體呈現多元化,可參照知識產權歸屬進行明確。值得注意的是,數據衍生權並不代表放開了數據的界線,必須平衡好數據衍生權在國家、社會公眾、數據企業之間的利益關系。

(作者系株洲市副市長、市公安局黨委書記、局長。本文僅代表作者觀點,不代表本網立場) 

( 編輯:白 翔   送簽:白 翔   簽發:鐘鳴 )