超大规模数据要素市场体系下数据价格生成机制研究
  时间:2022-03-02

:党的十九届四中全会提出价格市场决定、流动自主有序、配置高效公平的数据要素市场制度建设目标。本文系统研究构建了适配超大规模数据要素市场环境的数据产品价格生成机制,从数据价格形成的基本原理出发,在吸收借鉴证券市场价格生成机制的基础上,探索提出涵盖数据卖方、数据买方、数据交易所、第三方机构四类主体的数据价格形成机制和报价-估价-议价相结合的价格生成路径,并基于此提出了一种冷启动期-成熟期分步走的数据产品动态定价策略。

关键词:数字经济;数据要素;数据市场;数据定价;数据交易

一、引言

党的十九届四中全会首次将数据增列为一种生产要素,要求建立健全由市场评价贡献、按贡献决定报酬的机制。中共中央、国务院印发的《关于构建更加完善的要素市场化配置体制机制的意见》提出要加快培育数据要素市场,数据要素市场化配置上升为国家政策。中共中央、国务院印发的《关于新时代加快完善社会主义市场经济体制的意见》提出,要加快培育发展数据要素市场,加快建设统一开放、竞争有序的市场体系,推进要素市场制度建设,实现要素价格市场决定、流动自主有序、配置高效公平。

继农业经济时代的劳动、土地,工业经济时代的资本、技术后,数据已成为数字经济时代的关键生产要素。据《2021年中国数字经济发展白皮书》显示,到2020年数字经济的市场规模达39.2万亿元,占GDP38.6%,数字经济蓬勃发展对数据要素市场化配置提出更强烈需求。发挥市场配置的决定性作用,加快推进数据要素市场化配置,形成市场评价贡献、按贡献决定报酬的数据价格生成机制,是数字经济发展与生产关系演进的客观要求。本文通过文献调研,归纳梳理国内外学者关于数据价格生成机制和数据定价的相关研究成果。综合已有研究和实践经验,借鉴证券市场等成熟要素市场价格机制,结合数据要素自身特点,提出适应超大规模数据要素市场的报价-估价-议价相结合的价格生成路径,构建适应数据要素市场不同发展阶段的动态定价策略。

二、从信息定价到数据定价

市场是一个隐含交易各方行为规则、知识和信息的集合,而价格则是这些元素相互作用的集中体现。在要素市场中,要素在价值生产中的贡献值不可直接测定,只能通过市场经济的竞争简化为要素价格信号,数据定价机制的建立是完善数据市场生态体系的关键问题。

(一)信息价格机制相关研究综述

数据要素定价研究可追溯到对信息定价的研究,目前主要有三条研究路径:

第一,从供需对接的角度分析信息定价的依据。Brindley1993年提出将信息服务和信息产品的定价策略划分为成本导向、需求导向和竞争导向三类,Mariam认为应从信息服务的需求独特性和供给能力综合考虑信息服务的定价问题,Harmon等将信息产品的定价模式区分为基于成本和价值定价两种。后来,有学者从消费者效用和偏好的角度提出差异化定价策略。

第二,从服务场景的角度分析定价收费模式。2000年,Bashyam提出,信息服务可区分为需要物理介质的打包信息服务和通过网络提供的在线信息服务,前者更多采用固定收费机制,后者则会选择固定收费和边际收费两种模式。Wu等探讨了固定费用定价、基于使用情况定价和两部分资费定价等三种方案的适用性。

第三,针对信息服务中出现的新业态新模式提出针对性定价策略。Alexandru针对网格计算服务的特点提出了一个综合考虑信息元素和计算元素的通用定价模型,康艳芳针对云服务市场特点构建了云服务市场定价模型,Chang结合信息服务产品的捆绑销售行为提出了信息商品捆绑协作定价体系,张翼飞等针对互联网平台经济特征构建了双边平台定价模型,Femninella等构建了一个针对云基础设施中引入的物联网服务的定价机制,有研究者还引入博弈论等方法。

(二)数据价格机制相关研究综述

价格反映价值的核心原则下,数据定价遵循真实性、收益最大化、公平、无套利、隐私保护和计算效率等六大基本原则,具有一定的独特性。目前,产业领域存在两种较为普遍的数据定价机制:一是互联网服务商等推出的以自身为主的数据服务平台或产品,如谷歌云平台采取每分钟计价模式和持续折扣模式。二是数据交易平台结合数据质量、完整性、稀缺性等对数据集标价,如贵阳大数据交易所。

由于多数数据产品的了解过程与使用过程重叠,数据有用性无法事先确定,导致买卖双方对数据价值有双向不确定性,加之数据具有高固定成本低边际成本、产权不清、结构多变等特征,定价难度远大于其他产品。数据定价依据的主流观点参见表1


在数据定价方法研究上,王文平分为平台预定价、固定定价、实时定价、协议定价和拍卖定价五种;李成熙等概括为第三方平台预定价、按次计价、协议定价、拍卖定价、实时定价五类;胡燕玲划分为预处理定价、拍卖定价、协商定价、反馈性定价四类;赵子瑞分为平台预定价、平台自动计价、买卖双方协议定价等六类;蔡莉等总结为预定价、固定定价、拍卖定价、实时定价、协议定价和免费增值六类。按照价格可否变动划分为动态价格和静态价格策略,按照市场透明程度又划分为完全信息上下文和非对称信息的策略。

在数据定价方法的选择策略上,Koutris等将每个数据查询操作的结果作为一个数据产品,在此基础上,LiMiklau基于线性聚合查询操作提出了数据交互式查询定价方法;Yu等建立了一个双层模型,在垄断数据市场中考虑数据平台的收益以及数据消费者的效用,从而提出了基于数据质量的定价方法;张志刚等提出了数据资产价值评估模型,其中,将数据资产价值划分为数据资产成本和数据资产应用两个部分。目前,主流的数据定价策略可归纳为三类:一是从共时维度,引入数据分层分类策略,能够反映数据本体不同维度的真实价格,如郭春芳、翟丽丽等。二是历时维度,引入数据产品生命周期策略,能够反映各环节的成本付出,如王卫等。三是针对数据服务的特殊场景,利用新技术手段构建自动定价模型,如基于机器学习、查询、博弈论、元组等的定价,侧重于反映特定市场场景构建下的综合因素对数据价格的影响。

由于权属界定、隐私保护等方面的原因,数据产品不具备证券产品的高流动性与透明性,另外数据交易中不同主体关注数据要素价值的视角各有不同。数据卖方重视数据要素资源的变现能力和未来预期收益,数据买方则重视数据要素资源的应用价值。为此,本研究在参考证券市场等成熟要素市场价格机制的基础上,结合数据要素自身特点,提出超大规模数据要素市场下的数据价格生成体系。

三、报价-估价-议价相结合的数据交易价格生成路径

数据要素市场主体可分为数据卖方、数据买方、数据交易所或者数据交易平台、第三方机构等四类主体。目前,数据交易有经数据交易所或交易平台交易和数据买卖双方点对点交易两种模式。其中,点对点交易存在双方互信机制难建立、交易信息透明度低等缺点,隐私泄露、数据滥用、诈骗等现象时有发生。未来,随着数据要素市场的发展及其机制的健全,数据交易所/交易平台和第三方机构将越来越多地参与到数据要素市场规则和体系的构建之中。基于此,本文从价格形成原理出发,探索涵盖数据卖方、数据买方、数据交易所/交易平台、第三方机构等四类主体的数据价格形成机制,以及与数据要素市场建设目标相适应的报价-估价-议价价格生成路径,促进数据要素高效配置、公平交易和自由流动。

(一)报价-估价-议价的基本原理

数据要素价格形成机理应以价格形成原理为理论基础,参照传统要素市场经济的一般规律,并结合数据要素市场和数据产品的特殊性进行综合分析。

第一,从价格形成主体角度看,在市场经济体制下,大部分传统要素商品的价格形成主体为买卖双方,遵循卖方自主定价报价,买卖双方协商议定最终价格模式,可概括为报价-议价价格生成路径。该路径依赖于透明的供需关系,由众多卖方分散决策、自由定价,买方对比相似商品的质量、价格,通过市场供需关系和竞争的作用,最终形成合理的价格体系。然而,不同于传统要素市场,数据要素市场存在交易信息透明度低以及交易标的权属界定难、标准化程度低、场景依附性强等特殊性,交易所/交易平台、第三方机构等市场主体在价格形成过程中应承担更多的角色。此外,目前数据要素市场供需关系不透明,数据卖方尚未形成价格披露机制,数据买方对数据产品真正价值也缺少了解,难以进行比价竞争,传统要素市场的报价-议价机制无法充分发挥作用。因此,在数据买卖双方外,需引入独立、客观的第三方机构,为买卖双方确定数据产品的公允市场价值。

第二,从价格形成方式角度看,数据要素市场尚未成熟,市场竞争不充分和信息不对称普遍存在,仅依靠报价-议价路径可能导致价格失灵现象。马克思主义价格理论认为价格形成应以价值为基础,并围绕价值上下波动,供需不平衡引起价格与价值的背离。一个完善的价格形成机制,应使价格既充分反映市场供需,又不过于偏离价值。当前数据要素市场中普遍存在价格歧视、价格垄断等乱象,例如,一些大型互联网公司依托其掌握的海量用户数据资源(如用户个人信息、消费行为信息等)优势,以提供服务等方式销售此类数据,在定价时可能掌握绝对主导权,获取垄断性利润。因此,除参照传统要素市场的报价-议价模式外,还应探索形成第三方估价机制,即引入第三方机构,通过建立估价模型科学估计数据产品价值,为数据产品合理定价提供基础,为买卖双方议价提供参考。

第三,从价格影响因素角度看,与传统商品不同,数据产品大多以买方个性化需求为导向,非标准化程度高,难以实行统一的定价标准来衡量数据产品价值。面向复杂的数据交易市场,应综合考量数据成本、数据质量、应用价值、服务水平等价格影响因子,构建多维价值评估指标体系,实现对数据产品的合理估价。

(二)报价-估价-议价的实现路径 

基于上述分析,参考股票发行市场,股票在上市发行前由发行人和券商预估发行价,再通过一级市场投资者询价议价形成最终发行价格。在数据要素市场的交易定价流程设计上,通过结合数据卖方报价、第三方机构估价、数据买方与数据卖方议价的方式,构建多方市场主体共同参与的数据产品价格生成机制,即实现数据交易市场报价-估价-议价相结合的数据交易价格生成路径(参见图1)。


数据卖方报价

数据卖方在数据交易所对相应数据产品报价。数据卖方需综合考虑数据产品开发成本、市场供需关系、产品应用潜力、同类产品竞争性、同领域数据价值、综合历史价格等因素,平衡自身期望,进行合理报价。在特定商业战略目标指引下,数据卖方可能会提供较低的报价,如为积累知名度和增大客户群实行降价促销。数据卖方可基于自身期望和情况自主报价,或结合第三方机构估价结果进行报价。

第三方机构估价

第三方机构对数据产品价值进行分析评估,形成估价。估价机构应充分考虑数据产品类型和价格影响因素设计估价模型,同时,估价应遵循动态反馈机制,通过比对估价结果和议价结果,可促进估价模型不断迭代和完善。

第一,在数据产品类型层面,不同类型数据产品的估价原则不同,在设计估价模型时,应结合产品类型对各项估价指标赋予不同权重。数据产品可分为4类(参见图2),分别是原始数据集、脱敏数据集、模型化数据和人工智能化(AI化)数据。其中,原始数据集和脱敏数据集同属于数据集产品,模型化数据和AI化数据同属于数据服务产品。对于数据集产品,原始数据集来源于网络和各种传感器对特定对象的记录,如遥感卫星、天气预报、宏观经济、网络文本等;脱敏数据集是经过去身份化处理,或者在用户身份和行为数据基础上经过整理、统计、分析之后形成的群体性数据。这两类数据集产品一般只经过简单加工处理,并未根据数据买方需求进行定制,其质量高低对于其市场价值大小具有决定性作用,估价时应侧重考察数据集质量指标如数据集完整性、一致性等。同时,由于是直接交付数据集本身,估价时需要重点评估数据集的隐私保护水平。对于数据服务产品,模型化数据是指结合用户需求进行模型化开发形成的结果数据,如用户画像标签、身份验真服务等,是当下最普遍的数据交易形态;AI化数据是基于原始数据集、脱敏数据集或标签化数据,结合人工智能相关技术形成的人脸识别、语音识别、拍照翻译等人工智能服务。这两类数据服务产品均基于客户需求进行了个性化定制,具有明确、具体的应用场景和业务场景,且在形成产品过程中可能使用多方来源数据,需要多方共建模型。因此,在估价此类数据产品时,应结合具体场景评估数据服务产品对于数据买方的效用和价值。针对多方参与联合训练模型的情况,还须建立科学的多方贡献评估机制,合理分配多方收益。