您的位置: 网界网 > 新闻 > 正文

数字化创新深度报告:《数据竞赛白皮书》发布_附下载

2019年12月06日 15:46:24 | 作者:佚名 | 来源: | 查看本文手机版

摘要:近年来,“数据竞赛”无疑是大数据与人工智能领域最热门的话题。

标签
数字化
数据竞赛白皮书

近年来,“数据竞赛”无疑是大数据[注]与人工智能领域最热门的话题。

什么是数据竞赛?

数据竞赛到底有多火?

为什么有这么多企业和机构办赛?涉及哪些行业场景?

都有谁在办赛?参赛的都是哪些人?

为什么“数据竞赛”被视为数字化转型的敏捷形态?

办好数据竞赛需要哪些条件?

为了回答这些问题,在大数据系统软件国家工程实验室的指导下,和鲸科技携旗下第三方数据竞赛平台和鲸社区(Kesci),联合AWS,通过搜集整理1000场全球竞赛数据、1000余份问卷调研、几十位行业专家及企业办赛负责人的访谈、超过1200小时的分析研究,共同打造并发布了《数据竞赛白皮书》(以下简称“白皮书”)。白皮书分为《数据竞赛白皮书·上篇·1000场竞赛的深度分析》和《数据竞赛白皮书·下篇·办好一场竞赛的实操手册》两部分。

据公开资料显示,白皮书指导单位“大数据系统软件国家工程实验室”是由清华大学作为承担单位,北京理工大学为参与单位,联合百度、阿里巴巴网络技术有限公司、腾讯计算机系统有限公司、国防科技大学、北京大学、中山大学、中国人民大学以及国家环保部信息中心、国家气象中心、中国农业科学院、中石油规划总院北京市遥感信息研究所、公安部第一研究所、公安部沈阳消防研究所、北京工业大数据创新中心共同建设。大数据系统软件国家工程实验室围绕我国大数据系统软件自主安全可控的需求,建设大数据系统软件研究与应用服务平台,集聚和培养产业急需的技术创新人才群体,形成产学研协同的持续创新机制,旨在为推动我国大数据系统软件技术进步和产业发展提供技术支撑。

在《数据竞赛白皮书·上篇·1000场竞赛的深度分析》中,系统介绍了数据竞赛的发展历程与现状,并对比赛的核心价值进行了深度剖析。白皮书通过对全球范围内的1000多场数据竞赛的数据分析发现,数据竞赛这种模式,正在催生数据智能时代全球性政、企、学、研、 资各界联动的新常态。

据不完全统计,2014年至今,全球范围内的各类数据竞赛总量已突破1000余场。其中,仅中国市场就已发 布共计逾400场数据竞赛,年均增长率高达108.8%。236家企业、政务部门、高校和科研 机构作为赛事主办方参与其中;吸引约36万支团队、120万人次参赛;奖金规模合计高达2.8 亿元人民币,赛题覆盖33个行业应用场景。

1997年,享誉全球的国际顶级学术会议KDD推出KDD Cup,开启了数据竞赛的新模式, 20余年以来的赛题设计始终带有鲜明的工业应用色彩。ICCV、NeurlPS、ISBI、Euro CSS、 ECML-PKDD、VoxCeleb、MICCAI、C-MIMI、IEEE-CIS、CVPR(ActivityNet)、IWCS、 ECCV等国际顶尖学术会议在全球化浪潮下也纷纷开始牵头组织数据竞赛。

通过对15个竞赛案例的详细介绍,白皮书回答了“数据竞赛为何成为数字化创新的有效手段”这一时下热门话题。白皮书研究表明,以赛题承载应用场景,在紧凑的竞赛周期内高效整合数据、算法、算力、人才等要素,可敏捷验证各类AI在真实商业场景中的落地方向和实效。

同时,白皮书中还指出了数据竞赛对数据人才培养的重要作用。

85%的数据人才高度认同竞赛对技术实践能力的培养作用,竞赛成为打破高校学科建设与人才培养瓶颈的有效手段。竞赛推进前沿科研探索落地,通过跨学科协作促进AI在不同领域价值释放。竞赛成为数字化创新要素和汇集产、学、研、政各界资源的枢纽 ,助力数据创新生态建设和产业落地。

在《数据竞赛白皮书·下篇·办好一场竞赛的实操手册》中,数据科学协同平台——和鲸科技,总结了自身100+场专业赛事服务经验,开源了数据竞赛管理方法论与业界最佳实践,可谓是干货满满,其成为“数据竞赛领域基础服务平台”的意图也在白皮书中充分展现出来了。

据悉,和鲸科技成立于2015年,其前身是中国最早的数据竞赛平台之一——Kesci科赛网。由Kesci发展而来的和鲸社区,已成为数据科学家的专业社区,在用户数、用户质量、活跃度方面均有出色表现。通过与中国联通、中国平安、招商银行、腾讯、百度、字节跳动、携程、IBM、华为、默克中国、南京市人民政府、深圳市人民政府、鹏城实验室等头部企业与机构合作,通过开放竞赛的机制和数据科学的手段,解决各个行业的业务难题。

和鲸科技在《数据竞赛白皮书·下篇·办好一场竞赛的实操手册》中,通过面向千余名参赛选手的调研结果显示,奖金并非竞赛核心诉求,从专业性赛题、科学性评审, 到协作式工具、精细化运营,组织一场优质的数据竞赛颇有挑战。

白皮书指出,竞赛全生命周期都面临着来自参赛选手和主办方的双重审视,既要能够通过打造良好的参赛体验高度激发数据科学人才的能动性和生产力,又要通过专业的数据科学服务能力和精细的运营流程充分满足赛事主办方贯穿赛事全程的多元诉求。保障赛事功能,开创数据科学研发全新协作模式——“数据科学协作平台”成为数据时代最重要的基础设施之一。

附白皮书下载方式:“和鲸”公众号,后台回复“数据竞赛白皮书”即可领取。

参考资料

1.大数据:(Big Data),研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 ...详情>>

[责任编辑:袁媛 yuan_yuan@cnw.com.cn]