国务院发展研究中心
内容提要:
本文节选自《中国发展报告2024》一书。本文认为, 数据是数字时代的基础性资源,具有不同于传统资源的新特性。数据驱动的创新开始成为价值创造的新源泉,催生了新产品新服务,同时从多个途径赋能微观主体和宏观经济,助力提升服务水平和治理能力,实现高质量发展。但数据的开发利用还存在一些风险,如数据过度集中带来的垄断风险、个人数据保护和数据安全风险、岗位结构调整和收入极化风险等,值得社会关注。
近年来,经济社会数字化转型加速推进,数字技术进步和数据总量增长,让数据价值日益凸显。对于数据这一新生事物,各方面对其经济特性的认识不一,有正确的方面, 也有夸大的方面,存在不少分歧和争议。大多数观点认为数据丰富了一国的资源结构、提高了企业竞争力、重塑了未来竞争优势,是新兴基础性资源;但也有观点混淆了数据、技术、知识等概念,把数据直接视作资产,甚至资本,夸大了数据的作用。本文认真梳理了国内外权威文献和原创性观点,并调研了从事数据采集、加工、处理和利用等各类企业,形成的主要观点如下。
数据是数字时代的基础性资源,具有不同于传统资源的新特性
(一)数据是记录事物状态、性质及相互关系的符号, 进一步挖掘分析可产生信息和知识
数据自古以来一直存在, 但受记录载体和技术开发能力的限制,过去难以广泛传播和有效利用。进入数字时代, 数据以0和1的二进制形式存储在磁盘、硬盘、光盘等载体上,叠加物联网、云计算、大数据、人工智能等新一代数字技术的群体性突破,使得数据采集、处理、流转和开发利用成本大幅下降。这些数据经过编解码、释读,能够复现其记载的事物状态等信息,再通过深入加工、分析后,可提炼出具有特定内涵和用途的高价值信息。进一步归纳信息背后隐藏的趋势和规律,再辅以理论假设、实验分析和重复验证, 可升华为具有一定普适性的知识。总体而言,数据本身只是一种量化记录,意义相对有限,只有从数据中洞察出信息、萃取出知识,并用于辅助决策、指导实践后,才能释放出其蕴含的经济社会价值。
(二)数据日益成为技术和创意形成的关键投入
从经济增长视角看,新古典增长理论提出,与资本和劳动一样,技术进步是经济增长的源泉;内生增长理论进一步阐明技术进步取决于创意和研发,这才是经济持久增长的根本动力。近几年,学术界逐步认识到无论是技术进步,还是创意形成,数据的作用都在增加,即数据以中间投入的角色驱动经济增长。就区别而言, 数据大都是经济社会活动数字化、网络化之后,自动记录或自然沉淀下来的“副产品”, 技术和创意则需投入劳动力、资金等互补性资源,并在实验室经过多次试错才产生;同时,数据需要在流通利用中释放价值,其保护多通过技术加密手段,而技术和创意一旦产生就容易扩散和泄露,其保护主要靠专利、版权等知识产权制度来实现。
(三)数据的潜在使用价值使其成为新兴基础性资源
全球数据量每年增长27% 左右,叠加数字技术飞速发展,使数据在发现新知识、创造新价值等方面的作用倍加突出,国际组织及美欧等国纷纷将数据列为新兴基础性资源。与土地、劳动力等传统资源相比,数据的独特性表现在:一是可重复使用,数据使用过程中不会发生损耗,且可通过流通、共享和开发利用,衍生出更多数据。二是逼近零边际成本,数据复制、流转、存储成本趋近于零,在合规的前提下,可广泛流转、开发利用。三是部分排他性,政府开放数据、网络公开数据等是非排他使用的,但涉及国家安全、商业秘密和个人隐私的数据往往会限定使用范围。四是有些数据贬值快,数据产生于特定时点、特定场景,一些数据如促销数据、位置数据等实时有效,另一些如生产制造数据、供应链数据、信用数据等则在一定时期内富含商业价值,之后会大幅衰减。五是融合价值倍增,不同来源、不同维度的数据聚合后,通过交叉分析可揭示新的洞见,创造价值的空间就更大。
(四)数据在一定条件下可直接成为无形资产
数据经过清洗、加工、分析等环节后,其使用价值得到进一步提升。按照统计和会计规则,满足合法拥有或控制、有潜在使用价值、能可靠计量等条件的数据,能够转变为无形资产。有研究表明,当前欧洲9个国家已统计的无形资产中大约有50%可归为数据资产。与传统无形资产(如品牌、专利等)易估值和入账的特点相比,有些数据的产权相对明确,有些则因夹杂了平台、商户、用户等多类主体权益,存在较大争议;而且,数据的价值与使用主体、应用场景等密切相关,其估值方法还在探索之中,由此导致数据资产的边界不明确、底数不清楚。2023 年以来,中国开展数据资产入表尝试,部分上市公司已将数据资源确认为无形资产或存货。当数据被列为无形资产后,后续将具备在资本市场上进行抵押、融资乃至出资的潜力,但相关探索才刚刚起步。
基于数据催生出新产品新服务
随着数据采集、存储、加工、分析等环节的成本大幅下降,各方面对数据的开发利用也在深化,数据驱动的创新开始成为价值创造的新源泉。主要有以下4个方面:一是催生数据加工、交易等服务。面对海量、多样化的原始数据,一大批专业从事数据采集、清洗、标注、脱敏、交易、安全等服务的机构应运而生,它们为数据高质量供给夯实了基础,也构成了数据产业生态的主体。二是形成数据集和数据库。为提高数据信息密度和价值含量,往往还需对原始数据进行加工处理,如基于政府开放数据、企业自采数据等加工形成商业数据库、行业数据集等,这些专业化、结构化、高附加值的数据产品是数据变现的直接途径之一。三是支撑大模型和智能产品。以高质量数据集为基础,利用高性能算力和深度学习算法训练出的通用大模型、行业大模型,支撑了智能汽车、智能装备、智能机器人、智能客服等产品和服务创新。此外,基于数据资源和算法模型,还可提供在线数据查询、核验、征信、风险评估等服务。四是辅助应用场景创新。数据可多主体复用、多场景应用,结合数字技术和算法,为各行各业注入新的活力,孕育出平台经济、共享经济、数字贸易等数字经济新模式,也推动传统业态转型升级和治理模式变革。
相较于传统产品和服务, 数据产品和服务有其独特性, 这也对其监管和治理提出新的要求。一是依附性,以数字形式提供,高度依赖于物联网、数据中心、云计算、工业互联网等基础设施,这就要求适度超前部署新型基础设施。二是个性化强,结合个人数据和算法,企业能更好捕捉用户偏好,提供多样化产品,满足不同用户的个性化需求,但也为其实施价格歧视、进行“大数据杀熟”提供了便利,有必要防范其滥用数据。三是迭代速度较快,数据驱动的产品和服务功能更新快、迭代周期短, 也伴生出一些新问题,如对于人工智能知识产权、无人驾驶规则等,现有制度难以覆盖, 亟须加快制度创新。四是商业模式灵活,数据产品的定价模式和交付方式多样,可根据目标受众,采取订阅制、一次性购买、按使用量计费、免费提供搭配广告变现等多种方式, 但对价格监管和行为监管也提出了更高要求。
数据促进经济增长和社会发展
数据从多个途径赋能微观主体和宏观经济,助力提升服务水平和治理能力,实现高质量发展。
(一)数据辅助增强企业竞争力
利用大数据已成为企业开展创新、扩大产出、提升竞争力的普遍选择。OECD调查显示,2015—2023年,成员国采用大数据技术的企业占比从11%提升至34%。从影响来看,美国制造业企业采用大数据后生产率提高了5%—6%, 国内上市公司应用大数据后市值提高了4.21%。其主要机制:一是提升市场需求预测精准度。基于动态销量数据,企业能够及时感知需求、把握市场走势,进行针对性的价格调整,如电商平台的价格调整周期远远短于线下商店;同时还可洞察客户偏好,实现精准分群和个性化定价,发掘出新的市场机会。二是优化内部决策和生产流程。与传统依靠经验的定性决策不同,基于大数据的定量化分析可辅助权衡决策利弊、优选方案,减小决策偏差;也能够帮助企业实现扁平化、高效化管理,提高运营效率,如通过分析订单、物流数据等降低库存成本。三是提升创新效率和加快迭代速度。高质量数据支持的数字仿真试验加速了新药、新材料等前沿创新,缩短研发周期和降低试验成本;互联网企业大范围采用在线、多次、小样本的对比试验,来验证创新性想法,实现算法优化和效率提升。
(二)数据的广泛使用推动经济增长
数据源源不断产生,且可重复使用,在促进经济发展方面具有叠加放大效应。有研究发现,2003—2019年,进入生产过程的数据对同期中国GDP 增长的平均贡献率超过10%。其主要机制:一是减少信息不对称,提高资源配置效率。不同地区、不同部门、不同环节的数据共享利用,可在更大范围内实现匹配供需,减少资源配置扭曲。例如电商平台利用数据撮合供需,突破时空限制,有效降低了交易成本、扩大了贸易机会;金融机构通过大数据“画像”,精准识别企业风险水平和融资需求,高效投放信贷资源。二是以“创造性破坏”推动技术进步。数据加速了知识的形成和扩散,推动技术进步由原来依靠经验传承、缓慢发展的“S”形曲线,转变为快速演进、迭代升级的“J”形曲线,技术创新升级周期明显缩短。例如,基于海量数据训练的人工智能大模型,极大改变了内容创作、软件编程、科学研究等的生产方式。三是赋能传统行业,提升全要素生产率。数据在实体经济中起着“融合剂”的作用,企业数据全流程贯通后, 可实现协同化研发、柔性化生产、预测性维护等,推动制造业向“黑灯工厂”“未来工厂”发展,助力提升产品质量和附加值。四是形成“数据经济”(数据市场对整个经济的整体影响,涉及数字技术支持的数据的生成、收集、存储、处理、分发、分析、细化、交付和利用)新动能。欧盟一项研究显示,仅考虑从数据生产到开发利用相关的“数据经济”的活动,2020—2022年中国“数据经济”产值年均增速22.5%,占GDP的比重达2%, 提供数据相关的就业岗位达1010万个,成为经济增长的新动能。可以预期,随着数据体量更大、维度更丰富,将为数字经济的发展提供更多可能。
(三)数据助力提升社会发展和治理效能
数据驱动的新模式新业态层出不穷,深刻影响着人们的生活方式和社会治理模式。一是推动生活方式变革。网络空间汇聚了海量的数据、信息和知识,如社交媒体促进了信息的多向、立体化传播,搜索服务让知识触手可及,电子商务实现“全球买、全球卖”, 基于位置的服务如网约车、餐饮外卖、地图导航实现了服务精准供给。中国互联网络信息中心数据显示,截至2023 年底,中国网上零售额达15.4 万亿元,连续11年位居全球首位,线上办公、网络支付、网上外卖用户分别占网民总体的49.2%、87.3%、49.9%,重新“定义”了人们的工作、学习和生活方式。二是满足品质化的精神需求。以网络视听、在线展览、在线演艺等为代表的数字文化新模式蓬勃发展,叠加虚拟现实、全息呈现等创新技术,打造出更具逼真性、沉浸感的文化体验, 极大改变了文化消费方式。根据国家数据局数据,截至2023年底,中国数字阅读、网络视听用户分别达到5.7亿、10.74亿人,全国累计在线发布古籍及特藏文献影像资源13万余部(件), 有效满足了人们精神文化需要。三是促进公共服务的普惠化。政务数据支撑了“一网通办”“异地可办”“跨省通办” 等政务新模式;数字化的优质教育资源、医疗健康资源可通过网络向基层延伸,加速扩容下沉;数字社保服务解决了跨省异地就医和养老需求,根据国家数据局数据,2023年电子社保卡开通全国“一卡通”服务专区,电子社保卡累计访问量约100亿次。四是助力提升社会治理能力。数据可辅助提高决策的科学性,帮助政府在风险识别、灾害预警、应急救援、日常监管等方面实现关口前移、精准施策。监管部门通过大型数字平台及算法等技术手段对多源异构数据进行挖掘,可有效识别欺诈等行为, 提升监管效能。
数据的开发利用还存在一些值得关注的风险
(一)数据过度集中带来垄断风险
数据驱动的新业务新模式如电子商务、网络支付、即时通信、网络直播等,容易出现“强者恒强”的寡头垄断市场格局。少数大型平台企业在经营活动中沉淀积累起海量数据,这些数据一旦被滥用,如针对初创企业实施“扼杀式” 并购、定向排挤或限制潜在竞争对手,就可能会损害潜在竞争;再如大型平台利用数据实施“二选一”等排他性行为可能会剥夺中小商家等主体的选择权,限制市场竞争,进一步强化其垄断地位。还需注意的是,这些平台服务着数亿用户,扮演着公共基础设施的角色,一旦数据存储、处理和使用出现异常,很有可能在短期内波及经济社会正常运行。
(二)个人数据保护和数据安全风险
数据管理不善或被非法获取和利用,可能带来难以预料的个人数据泄露、商业利益损失乃至国家安全威胁。个人数据因其商业利用价值高,若采集、流通、交易等环节存在不规范行为,就可能给个人带来财产损失乃至人身安全威胁, 如遭受电信诈骗、骚扰电话、网络暴力等。商业数据往往富含商业秘密,有些还可能涉及国家安全,例如智能汽车、网约车采集的数据,若处理不当,可能造成空间地理数据安全隐患。此外,利用大数据、人工智能技术收集、分析和评估网络上的公开数据,包括文本、视频、社交媒体、地理空间等,愈发成为开源情报获取的重要渠道,个别国家甚至四成左右的情报都来自公开数据分析。
(三)岗位结构调整和收入极化风险
数据驱动的创新存在显著的“双刃剑”效应,一方面提供了新兴岗位,包括数据加工师、数据经纪人、数据合规官、安全工程师等;另一方面冲击了既有岗位结构,特别是生产、分配、流通、消费各环节的数字化转型,深化了半个世纪以来的自动化进程,让具有重复性、规则性、可编程等特征的中等技能岗位被机器加速替代。人工智能异军突起,已经在检验检测、运营调度、风险识别等高技能岗位形成实质性替代,并开始给文书类、创意类工作带来威胁。顺应技术变革、重塑劳动力技能是大势所趋,但研究表明只有少数劳动力能够掌握新技能、获得技术溢价,岗位分化和收入极化的趋势已成为近年来发达国家学术研究和政策讨论的热点。
(四)数据权属划分仍存在争议
数据通常由多方主体共创形成,还涉及商业秘密、个人隐私乃至国家安全,围绕数据利用的权属划分争议较大。从国际做法看,提高数据“可及性”优先于数据确权,过分强调和细分所有权将导致权利人相互掣肘,不利于数据利用。从国内实际看,对非个人数据的使用,主要通过合同来约定双方权责,其权益受《中华人民共和国著作权法》“信息网络传播权”、《中华人民共和国反不正当竞争法》“商业秘密”、《中华人民共和国刑法》“非法获取计算机信息系统数据罪”等制度保护,这方面争议不大。对涉及个人信息的数据,虽已立法确立了保护的总基调,但其产权是配置给个人还是企业尚属空白;商业实践中,企业多要求用户签署格式化的“服务协议”来征得用户同意,授权企业进行开发利用。2022年《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》出台后,国内围绕个人数据权属的讨论升温,或导致过度主张个人权利而抑制企业投资激励,阻碍数据再利用及潜在价值释放。
(参考文献略)
本文由国务院发展研究中心企业研究所协调,马源、袁东明、许伟、薛菲、郭宁、董倩等参与写作。
Visits: 6