当前位置:民商法律网 > 学术前沿 >正文

民事法学|申卫星:衍生数据的识别标准与产权配置

发布日期:2026/3/4 正文字号:

文章标签:#数据处理活动  #数据产权  #原始数据  #衍生数据

导语

        数据作为数字经济、人工智能发展的关键要素,其价值的释放源于深度加工与信息挖掘。衍生数据与原始数据如何区分?加工后所形成的衍生数据权属应该如何分配?如何协调原始数据权益人与衍生数据权益人的权益冲突?对此,清华大学申卫星教授在《衍生数据的识别标准与产权配置》一文中对衍生数据的识别标准、产权配置规则、原始数据上在先权利的保护问题进行论证分析,指出衍生数据应符合三重识别标准,并由加工处理者享有数据权利。

内容

一、衍生数据的识别与产权配置困境

  (一)衍生数据的识别症结

  衍生数据的识别是产权配置的前置性问题。当前司法裁判与理论研究仍缺少普遍适用的识别标准,即经由何种程度的数据处理,衍生数据才能在规范意义上被评价为发生质变。司法裁判虽然提出将深度加工作为衍生数据的识别标准,但不同案件中对并原始数据的不可回溯性与衍生数据本身的功能独立性强调不同,未能抽象出普遍标准,裁判理由也不足以为衍生数据的识别提供稳定的规范指引;理论界则存在价值说与贡献度说的分歧。综合而言,各界对衍生数据经由加工发生实质性改变具有基本共识,但究竟如何从量变中生成、其表现形式等,尚未形成一套可供适用的规范要件体系。

  (二)衍生数据的生成场景与产权配置困境

  在产权配置层面,规范困境高度集中于数据处理者对原始数据使用权基础存疑的场景。其一为数据爬取,处理者投入大量算法能力、算力资源与分析劳动,具有价值创造属性,但非法爬取的情况下处理者对原始数据不享有权利基础;其二为超越授权加工,如通过自动勾选等无效授权方式生成用户画像数据。在此类场景下,数据处理者能否取得衍生数据产权,应否承担相应的返还、删除或赔偿责任,均有待进一步厘清。

二、衍生数据的三重识别标准

  (一)衍生数据三重识别标准的确立

  衍生数据的识别与规制可以借鉴民法典物权编中的添附制度,充分考虑二者的共性与本质差异,确立涵盖外在、内在及消极维度的三重识别标准。

  首先,在外在标准上,衍生数据必须发生实质性改变。衍生数据的生成机制和原数据相比,在规范结构上与传统物权法中的加工制度具有高度相似性,在罗马法传统上亦能找到理论支持。具体而言,实质性改变体现在三个关键维度:一是数据结构的变化,涉及组织结构与存储方式的重组;二是数据内容的变化,使数据不再服务于原有的既有用途,转而支持新的分析目标或决策功能;三是数据形式的变化,通过可视化或模型化等方式重塑数据的理解与使用路径。

  其次,在内在标准上,衍生数据应具备价值的显著提升。数据价值的提升是数据分析挖掘等数据处理活动的必然结果,从数据中获取洞见是数据要素市场的核心目标。因此,价值显著增值不仅是判断加工成果归属的参考,更是识别衍生数据是否成立的标志。衍生数据应当产生显著的信息增量或新的应用价值。

  最后,在消极识别标准上,衍生数据应满足不可逆向还原的要求,即衍生数据相较原始数据已发生实质性改变,在通常或合理条件下难以通过逆向工程还原为原始数据,或者难以被用于生成在实质上可合理替代原始数据的其他数据。罗马法对于加工的认定便已提出恢复原状标准。同时,相比有体物,数据加工的特殊之处在于原数据承载个人信息与隐私利益,若衍生数据能够逆向还原为原始数据,则会对原始数据产权及既有权利秩序造成实质影响。但是,不可逆转并不要求达到匿名化或不可识别程度。

  (二)衍生数据三重识别标准的展开

  实质改变标准包括数据结构、内容与形式等实质改变。数据结构的实质改变,是指通过数据处理活动,将原本缺乏逻辑结构或内部关联的数据重组为具有明确组织关系和层次结构的数据形态。内容的实质改变取决于信息是否发生质变,重点考察是否存在源于分析推理的信息增量,以及应用场景是否从原始数据所属领域转向新的决策任务。形式的实质改变则强调表达方式的更迭已足以影响数据的理解与利用路径,例如通过可视化技术使抽象代码转化为直观的决策模型,从而在社会交往中被视为独立的、不同于原始数据的信息产品。

  其次,价值增值标准要求数据的使用价值与交换价值获得显著提升。在使用价值层面,衍生数据应能提供原始数据无法直接呈现的知识洞见与智慧支持;在交换价值层面,因其离散性低、结构性强且紧贴应用场景,衍生数据应具备更强的市场交易流通能力。在认定增值程度时,可借鉴物权法加工制度的逻辑,不苛求加工价值绝对超越原值,只要劳动投入导致价值产生相当程度的提升,即认为该成果已“值得”脱离原物而进入新的法律评价层次,具备识别意义上的独立性。

  最后,不可逆转标准应被理解为规范意义上的还原风险不具有合理可能性。这一标准不追求技术上的绝对不可逆,而是强调在现实条件下,逆向还原原始数据的技术难度和时间成本已远超一般理性主体的范畴。参考欧盟的“合理可能性”标准,在判断时应综合识别成本、可用技术及技术发展等客观因素。

三、衍生数据的产权配置规则与在先权利保护

  (一)衍生数据的产权配置规则

  数据处理者取得衍生数据产权不以享有原始数据使用权为前提。民法物权的添附制度能够在缺乏合意或权利基础的情形中,直接配置加工成果的权利归属,发挥稳定法律关系以及激励价值创造的制度功能。

  衍生数据的权利归属遵循意思自治原则,双方有约定的应依约定。在当事人未就衍生数据的产权归属作出明确约定的情况下,若法律已就特定数据加工关系中加工成果的权利归属作出明确规定,则应当依照法律确定归属,如在构成委托处理关系时参照承揽合同或委托合同的规范意旨处理。

  在既无当事人的有效约定,亦缺乏法律的明确规定的情况下,应将衍生数据的产权配置于数据处理者。此种配置方案既能够准确反映各参与主体在数据价值形成过程中的实际贡献,对数据加工活动形成有效激励;也更有利于实现衍生数据的有效利用并释放其潜在价值。此外,由于衍生数据与原始数据的实质差异性以及加工行为的非毁坏性,数据处理者对衍生数据产权的取得不受非法爬取行为或主观善恶意状态的影响。

  (二)原始数据上在先权利的保护

  衍生数据权利人受到原始数据上附着的信息人格性权益和数据财产性权益限制。信息主体对衍生数据中可能承载的人格性权益,依然享有访问、删除和更正等法定权利,且该权利不因数据处理者的财产权利而受限。但在财产性维度上,由于衍生数据在规范意义上已独立于原始数据,原始数据权利人的财产性权利应限于原始数据本身,不再延伸至衍生数据层面,即个人不再享有对衍生数据的财产性权益或收益分配权。

  在数据处理者超越授权范围、授权无效或被撤销以及授权终止后加工等情形,数据处理者因请求人的给付行为而获利,构成给付型不当得利。应通过让数据处理者停止使用、删除原始数据副本等方式,消除其对原始数据所形成的持续持有与使用状态,实现返还原始数据。并匹配价值额偿还规则,以原始数据的使用费,即假使双方当初进行的是合法、善意的数据授权交易,就本次具体的使用目的和范围所应得的许可费。

  在数据处理者对非法爬取的数据进行加工、未经授权加工等情形,构成权益侵害型不当得利。返还的客体仅限于被侵害权益本身的客观使用对价即数据使用费,而不包括得利人利用该权益所获的利润。但当爬取的数据与最终形成的衍生数据在贡献度、爬取数据的稀缺性与不可替代性上具有相当因果关系时,应按原始数据的贡献度,将由衍生数据产生的部分利润也纳入返还范围。

  衍生数据加工人的主观善恶意,也会影响不当得利的返还范围。善意得利人的责任范围严格限定于现存利益。若该利益已不存在,则返还义务消灭。在数据场景中表现为原始数据或简单聚合数据的副本是否仍存储于得利人处。恶意得利人则应承担加重返还责任,包括删除其所持数据、在所获利润与侵权行为之间具有因果关系时返还全部利润。

结论

  衍生数据作为高附加值的数据形态,其生成过程可类比有体物的加工行为,相关识别标准与产权配置规则的建构可借鉴物权法中的加工制度。衍生数据的识别构成产权配置的前置性判断,只有当加工结果在规范意义上构成独立于原始数据的“新数据”时,才具有进入产权配置讨论的必要性。

  具体而言,衍生数据的识别应同时满足三重标准:实质改变标准要求加工结果在数据结构、内容或形式等方面形成实质不同的独立形态;价值增值标准要求其使用价值和交换价值相较原始数据显著提升;不可逆转标准则强调衍生数据无法在合理范围内通过逆向工程还原。

  在权属配置上,当事人未作有效约定时,衍生数据的产权应归属于处理者,且其权利取得并不以对原始数据享有使用权为前提。针对未经授权的加工行为,在先权利人可依法通过个人信息权益、不当得利返还或侵权损害赔偿等路径获得救济。这一制度安排在肯定数据处理者智力劳动与要素投入的同时,兼顾了原始权利人的合法利益,有助于促进数据要素的良性流动,进一步激活数据作为生产要素的制度潜能。



  (本文文字编辑龚欣雨。本文未经原文作者审核。本文为中国民商法律网“原创标识”作品。凡未在“中国民商法律网”微信公众号正式发布的文章,一律不得转载。)



  文献链接:《衍生数据的识别标准与产权配置

参考文献

本文选编自申卫星:《衍生数据的识别标准与产权配置》,载《法学研究》2026年第1期。
【作者简介】申卫星,法学博士,清华大学法学院教授。中国民商法律网授权学者。

推荐阅读