提高人工智能数据的高效交付

不久前,世界数据机构在北京成立。它是世界上第一个旨在促进数据开发和治理实践的国际专业组织。数据作为人工智能发展的关键要素,就像发动机的燃料。其供给能力直接影响人工智能发展的速度和质量。随着人工智能产业范式从“模型为王”向“数据为王”转变,数据供给能力不仅关系到人工智能产业的发展,也决定着国家在未来竞争环境中的地位。如何最大限度地发挥数据潜力,促进数字经济更快发展,值得关注。近年来,我国在培育要素数据资源市场方面取得了显著成效,数据资源的规模经济不断扩大并转化为产业化。l 优点。然而,中国语料库数据供给不足正在成为我国人工智能应用创新的重要问题。中文语料库供应不足,不仅存在语义偏差风险,限制人工智能发展效率,还可能产生文化误解和意识形态风险。随着单边主义、保护主义抬头​​,我国创新和人工智能发展可能面临更加严重的数据“不足”困境。 “十五五”期间,加强人工智能数据的高效提供,有利于最大限度发挥数据资源的规模经济,抢占未来技术发展的制高点。扩大数据供应的“水库”。构建高效数据供给体系的核心是不断扩大数据规模、丰富数据类型。目前,已形成清晰的结构性框架。我国数据供给不平衡,互联网娱乐数据相对过剩,而行业应用和技术创新所需的高价值数据严重短缺。进一步推动公共数据开放和权威运行,加强物联网等数据接口开放,促进行业数据共享和融合,促进社会数据采集,拓展数据供给广度和深度。为数据质量打造坚实的“稳定石”。数据质量是价值实现的前提。高质量的数据意味着态度、诚信、合规,我们不仅要求以下几点,更强调场景适应性和知识密度。数据处理能力不足会降低大量数据的时效性,低估其价值并使其难以提取和重用。大量数据一旦创建就会“消失”。改善dATA处理能力和保证数据供应的质量和适用性,应进行数据资源规划和管理,建立数据注释规范和数据集质量评估标准。为数据流动开辟“快车道”。当前,大量数据被长期“锁定”在政府、大学、科研院所和企业的数据壁垒后面。报告预计,2023年数据交易需求将是供给的1.75倍,数据产品交易率仅为17.9%。提高数据分发效率,消除“数据孤岛”和分发拥堵区域,要着力抓好技术创新和制度创新“两个轮子”。另一方面,隐私计算技术为解决安全与数据流通之间的矛盾提供了新的思路。可信数据空间成为新模式为数据资源大规模分布和利用开辟一条新路径。区块链技术为数据的验证和流通提供了可靠的保障。另一方面,制度创新将“减慢和加速”数据流动。培育数据提供“新生态”。要释放人工智能的全部威力,需要将其与应用场景中的超大规模模型进行对接。满足国家实际需求,综合利用政府和社会资源,打通数据采集、开发、分发和利用的链条,构建互利交流、共创合作的生态系统。加速数据标注,提高质量和效率。数据集开发周期长、成本高。通过创新技术手段,优化资源配置,实现数据集中高效传递。建立行业数据联盟,实现数据共建和复用。发挥市场导向作用,建立健全数据集定价和收益共享机制,创新数据开发利用方式,优化数据集运营模式,提高数据输入输出比例,让社会各方面参与提供数据。我们将结合各方共同努力,共同打造高效的数据供应生态系统。 (本文来源:经济日报 作者:刘斌芳)
(编辑:胡峰)

推荐文章

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注