政府作为拥有全社会数据最多的载体,其数据开放已成为必然。随着信息时代的到来,政府对数据开放工作的高度重视,政府数据开放平台也日渐成为地方数字政府建设和公共数据治理的标配。
 

 

数据来源:中国地方政府数据开放报告(2020 下半年)

 

目前,从近期发布的2020下半年《中国地方政府数据开放报告》看,省级政府数据开放平台排名中,浙江和上海的综合表现最优,开放数级位列第一等级;山东和贵州也总体表现优秀,位列开放数级第二等级;其次是广东、四川等地方。在四个单项维度上(准备度、数据层、平台层、利用层),在全国所有 142 个在评地方平台中,浙江在准备度和数据层上排名全国第一,山东在平台层上排名全国第一,上海在利用层上排名全国第一。
本文旨在以普通用户的角度,参考开放数林评估指标体系的准备度、数据层、平台层、利用层这四个维度对综合排名靠前的五大省级政府开放平台(广东、贵州、浙江、山东、四川)进行测评,管中窥豹,以此观察不同省级政府开放平台之间的优劣势和差异之处[具体测评指标说明参见文末]。


01 准备度

五省筹备都很完善,内容制定均有待提升

 

  • 广东省政府开放平台专设了一个“资讯动态”的版块,里面收录了近几年来发布的政策法规并进行详细的归类,广东省在数据资源开放的技术规范和管理规范上都制定了标准,但并未收录在数据开放平台里,需在网络上查找其详细说明;
  • 贵州省政府开放平台也专设了一个“资讯”的版块,里面收录了近几年来发布的政策法规、标准规范和工作指南等;
  • 浙江省政府开放平台在“政策动态”版块整理了与数据开放相关的法规政策和新闻动态,其收录的《浙江省公共数据开放工作指引》《浙江省公共数据开放技术规范》则对数据标准和工作指引进行了详细说明;
  • 山东省政府开放平台在首页的“资讯”版块清晰地展示了新闻动态、工作动态、政策法规、标准规范、用户指南几个方面的详细内容;
  • 四川政府开放平台的“文件资料”版块收录了动态资讯、地方标准、政策法规、开放清单、操作指南共5个方面的相关内容。

成立政府数据开放工作主管部门来推动开放平台的建设工作的力度和效果至关重要,5个政府部门成立时间如下表所示。
 

可以很明显地感受到各平台在准备度这方面的筹备和管理是比较详细和完整的。
综上,在准备度上的测评结果如下:
 


02 数据层

广东省开放数据集最多,优质数据集的占比最大


对这五个平台上所有可下载的数据集(共约 11794 个)按照数按照下载量排序,最终选出排名居于前 1% 的数据集作为优质数据集(共约118 个),五省的优质数据集占比情况如下图。


 
五个平台都提供了常见的可机读数据格式供用户下载使用,如:xlsx、csv、json、xml等格式;值得注意的是,在浙江省的数据集详情界面,一直都找不到下载的位置,最后发现其实际下载数据则是通过调用接口,而无法直接下载xlsx、csv等格式的文件,相较其他平台获取数据就略显麻烦了。

 

五个政府开放平台的开放范围如下图所示。可以明显看出,贵州省的主题领域和部门覆盖面综合来说是最广泛的。


在五个开放平台分别随机抽取一个按月更新的数据集,

  • 广东省的“学校卫生A级单位公示信息”,实际开放的两个数据,时间跨度竟然将近半年;
  • 贵州省的“贵阳市白云区法律援助中心月报表”,两次更新时间跨度为两年;
  • 浙江省的“临时救助对象基本信息表”,更新日期即发布日期,说明该数据集自发布一次后就未再进行更新;
  • 四川省的“大中型客货车驾驶人满分信息”出现同上述浙江省的数据集一样的情况;
  • “山东省危险化学品登记信息”,更新频率写的是“每月”,实际能下载到的最新数据是2020年4月发布的。

这些情况让人感觉更新不及时是数据开放平台的一个通病。



 

综上,在数据层的测评结果如下:


 

从以上指标对比结果可以得出,

  • 广东省虽然开放数据集最多同时优质数据集的占比最大,但开放覆盖的范围却是最少的;
  • 四川省开放数据集的数量排名第二,但优质数据集占比最小;
  • 贵州省与山东省优质数据集占比相近,但贵州省开放的数据集和开放范围都相较更多更广;
  • 值得注意的是,虽然浙江省开放数据集在五省中相对较少,但其优质数据集和开放范围的排名却很靠前。
  • 最后,在更新频率方面,五省都需要加大力度进行改进和管理,才能使用户更好地利用这些开放数据集。

 

 03平台层

山东省平台增加的“高级搜索”功能强大,更细致地满足了用户筛查需求
 

  • 广东省平台在首页用醒目的方式展示了热门数据集、最新数据集、热门API、最新API和资讯动态;在数据导引方面,广东省平台提供了可下载的开放数据目录,推荐了关联数据集还提供了数据集预览功能。
  • 贵州省平台按主题、场景分类去展现数据,并对最新数据、最热数据、最新应用进行了推荐,同样也向用户展示了相关资讯;点击主题图标或全部主题进入数据列表页面,通过左侧筛选功能可按照数据类型、主题、部门等维度属性浏览数据列表,通过搜索功能可查询所需数据。
  • 浙江省平台首页也按主题、场景分类去展现数据,同时,数据动态、接口动态、新闻动态都分别展示了最新和最热推荐。但筛选条件就较简单,只能通过筛选领域和格式进行查找。
  • 四川省平台在首页也集中展示了最新数据、推荐数据、应用推荐等版块让用户可以更清晰了解该平台的开放情况。

令人惊喜的是,区别于其他平台都会有的普通筛选搜索功能,山东省平台增加的“高级搜索”功能则更细致地让用户有目的性进行筛查。


 

在无条件开放数据获取方面,用户在广东省、四川省平台下载数据集则必须登录才能获取,贵州省、山东省平台则是无需登录即可下载文件,浙江省的数据集如上述,获取需通过调用接口无法直接下载
在有条件开放数据获取方面,即调用API接口获取数据,可直接点击“申请调用”,申请成功即可使用,部分数据集的API接口则需要时间审核申请。
除浙江省对应用的介绍展示较简略外,其余四大平台在利用成果展示方面,都有说明应用简介同时公布数据来源信息。
在用户与平台之间的沟通反馈渠道方面,

  • 广东省平台对用户的数据请求、数据纠错和意见建议进行了及时有效回复。
  • 贵州省在数据纠错和平台建议方面进行了及时的回复,但还未开设数据集申请功能。
  • 浙江省、山东省对于有条件开放数据的申请或者平台体验等方面的问题,通常一个工作日内就会有回复,还是比较及时的。
  • 四川省对于有条件开放数据的申请从19年的当天回复到现在一般在一周内进行回复,相比其他平台回复速度稍微有些慢了。

 

综上,在平台层的测评结果如下:



04利用层

成果形式多,主题覆盖广,山东省以147个应用摘得桂冠

利用促进是指政府为了推动开放数据的社会化利用而组织的各类活动。五大政府平台近年来组织的创新大赛如下表所示。


 

五省平台展示的有效利用成果数量却大相径庭,山东省以147个应用同时成果形式和覆盖主题最具多样性摘得桂冠,情况对比如下。 

综上,在利用层的测评结果如下:


 

近年来,政府开放数据的利用越来越得到政府及社会的重视。因此,如何挖掘数据规律,在社会生活中产生实际价值,促进开放数据的利用和落地,是需要我们不断探究和前进的方向。

05结语

更新频率跨度大,更新不及时是未来急需改进的痛点问题
 

本文的测评标准虽然不具有严格意义上的科学依据,但却是站在一个普通用户从不同维度对政府开放平台的使用体验角度来进行评定。
从五省在准备度、数据层、平台层、利用层的表现得以看出政府在数据开放平台的建设可以说是成绩斐然,同时在部分功能上又各具特色,优化细节值得相互借鉴学习。遗憾的是,五省平台数据集公示的更新频率与实际更新情况不符是一个痛点问题,需要深入挖掘原因并采取改进措施。
数据要升级为资产,数据价值要极大化释放,在技术、应用模式、监管和制度设计等方面与发达国家之间还存在一定差距,建设一个“数据开放中国”还面临着一系列挑战。

附:本次测评指标说明
为了使本次测评易于理解,我们分别为四个维度(准备度、数据层、平台层、利用层)设定对应的评价指标,以是(þ)或否(ý)判定、以及指标对应的五大省级相对排名来作为评定标准。

1.准备度

 

2.数据层

3.平台层

4.利用层