6月10日,杭州玳数科技有限公司(以下简称“袋鼠云”)牵头,联合浙江省标准化研究院等省内10余家单位制定的全国首个《数据中台元数据规范》团体标准正式发布。标准规定了数据中台元数据的元模型、描述方法、扩展要求、校验及表示,适用于数据中台的数据集编目、建库,以及数据交换、数据集成等。 该标准通过了来自浙江大学、浙江省数字化与设计制造创新中心、阿里云等行业内专家评审,为推动数字行业标准化提供了样板,填补了我国数据中台元数据标准空白,也为困扰行业多年的“数据孤岛”问题找到了解决之道。
评审会现场 2020年,中共中央国务院《关于构建更加完善的要素市场化配置体制机制的意见》,首次将“数据”与土地、劳动力、资本、技术等传统要素并列为要素之一,提出要加快培育数据要素市场,规范数据开发利用的场景,推动物联网等领域数据采集标准化。 在政策的强劲利好背景下,大数据行业亟待快速迭代升级。纵览市场,行业面临最大的问题之一是数据开放程度低,数据之间彼此割裂,数据共享的壁垒高,让数据高效利用和价值交互成为了镜花水月。 而造成这个问题背后最主要的原因,是市面上的参与者各自执行各自的元数据标准,甚至有些企业内部都未形成统一的元数据标准,导致多个企业间需要数据交互或者单个企业数据重建时,并不能快速对齐规则,最终造成数据重复建设,导致浪费时间、成本等问题。放在具体的场景中来举例,在没有标准的情况下,操作者可能会随意对一个表格进行命名,有中文、有英文、有中文加数字等,当需要调取或者重建时,发现无法检索定位到这个数据。而当元数据被标准化之后,命名格式、数据类型、最大出现次数等都有据可依,就会让数据中台的框架更加系统和一致。 当然,要想实现数据之间真正的打通,还需要越来越多的数据来支撑。本次,袋鼠云将元数据作为数据中台领域标准研制的第一站,是因为元数据在数据中台中有着特殊地位。 如果将数据中台比作一本书,元数据就相当于是书本的目录。有了元数据,我们才能快速了解书本的架构、特征,并准确检索到所需内容。因此,当元数据的逻辑不一样,就像是有的图书按照字母排序、有的图书按照笔画、有的图书按照类别等,想要形成一套“四库全书”,最初要做的一定不是装订在一起,而是把排序标准先统一了。 当元数据有了统一的标准后,数据中台的底层逻辑基本上就被统一了,这将更有益于数据之间的交互、提高数据使用的价值。因此,《数据中台 元数据规范》不仅是数据中台领域标准的开端,更是大数据行业的又一标准化创举。 “我们认为本次元数据规范的推出是一个开端。后续,也期待和袋鼠云等重磅企业构建出更多促成大数据行业更加繁荣和开放的标准出来。”浙江省标准化研究院、省技术性贸易措施研究与应对中心主任周树华博士说。 浙江省物联网产业协会副理事长兼秘书长纪卫平表示:“标准的制定和推广是打破数据中台领域数据孤岛的有效手段,也是行业发展的必然趋势。我们将会为这一标准提供更多的落地政策和实践机会,让数据创造出更高的社会价值,助力浙江数字经济高质量发展。” 业内专家表示:“《数据中台 元数据规范》作为数据中台领域的首个团体标准,让我们看到了标准化更多的可能性。希望与数据行业的各位领导者和推动者携手努力,让数据能惠及更多的人。” 袋鼠云创始人、董事长陈吉平表示:“很感谢众多业内专家和合作伙伴对《数据中台 元数据规范》的支持。我们作为领先的全场景数字化基础设施供应商,将数据标准化视为自己的职责。未来,我们也希望更多业内企业和专家一起来参与相关标准制定,共同为全行业的标准化建设做贡献。” 无论是推动大数据行业标准建设,还是不断倡议和践行开源精神,都是袋鼠云对初心的坚守:让数据产生价值。为了这个价值能够让更多人获益,让行业更繁荣,袋鼠云还将围绕数字化转型的各个环节撰写一系列的标准,也期待和更多伙伴、行业参与者一起携手,为大数据行业打造出更光明的未来。 |