投稿问答最小化  关闭

万维书刊APP下载

从信息公开到数据开放:政府数据开放的意义(附社科公开数据库)

2023/8/9 10:07:39  阅读:33 发布者:

以下文章来源于平凡生活札记 ,作者蜜思高

上周末,信息资源管理系黄萃教授邀请了复旦大学国际关系与公共事务学院教授、复旦大学数字与移动治理实验室主任郑磊访问了浙江大学,并做了一场题为“政府数据开放的意义与挑战”的讲座。郑老师表达能力一流——还不只是口才。他理论训练扎实,讲述逻辑层次清晰;有着商界的从业经历,PPT版式漂亮、表达更有听众意识;他还很了解中国的数字治理实践,历程、进展和问题都抓在点上。我简要记录了讲座中的三个议题(不全)。学术产权归属郑老师。

郑老师主要讲了三个问题:

第一是以场景为基础,回答了“为什么要开放政府数据”,建立了政府开放数据后改善公共治理的想象空间;

二是与信息公开做对比,澄清了“什么是开放政府数据”,为各级政府“准确”开发数据提供了行动原则;

三是以事实为依归,呈现了中国大陆各地区政府数据开放的现状。

为什么要开放政府数据?

很多时候,人们都会混淆信息公开与数据开放两个问题。郑老师以疫苗事件为案例,说明了“什么不是开放政府数据”。在去年疫苗案发生后,有工程师试图了解问题疫苗究竟去了哪里,却发现数据极难获取。其中的原因包括一些政府网站需要登陆才能下载,一些徒有搜索框却无法点按,有的数据只有

,有的则找不到信息。郑老师指出,政府开放数据指的是“机器可以读取的、可以处理的(标准化的)数据”。在这个案例中,则是工程师花了14个小时标准化、结构化之后的数据,这才是政府开放数据的应有形态。

这类标准化、结构化的政府数据开放,有什么意义呢?郑老师提供了几个非常有趣的场景。

一是以Yelp为例,说明数据开放为市场、社会参与市场监管成为可能,可以推动建设更安全的城市。美国有一个类似大众点评的应用Yelp,它不仅提供了用户对餐厅服务质量、菜品口味的打分,还基于政府提供的卫生检查数据提供了一项权威信息,叫做Health Score。这一分值的基础是政府每次组织卫生检查时对每个餐厅所给予的打分。显然,这一打分的基础是政府在餐厅卫生检查中的开放数据(数据集),在官方网站上,政府部门根据实际的检查情况,以数据表的形式公布了每一次检查的时间,餐厅名称,所在地址(路名、门牌号、电话、右边),餐厅提供的食物范围,以及该餐厅在本次卫生检查中的得分情况,和发现的问题类型。这一基础数据集为民众根据个人需要开发便于应用的APP提供了基础。如有人开发了一个叫做“Dont Eat At”的APP,用户在允许APP读取地理定位信息后,一旦进入一家卫生有问题的餐厅,APP就会跳出一个警示“⚠”,提醒用户这家餐厅的潜在卫生问题。Yelp则通过在APP上加入Health Score的项目,为用户提前选择餐厅提供了可参考的信息。

二是以曼哈顿消防栓管理为例,说明数据开放也有助于政府等公共部门更有可能借助社会力量改进日常工作。伴随着城市发展,交通拥堵和停车难是麻烦问题。不管停车再怎么困难,也得有一些基本规范,譬如消防栓边上就不应停车,以免危机来临消防车无法开到消防栓边上。为此,纽约规定若车辆停靠在消防栓边上,警察就得贴出罚单——这也是为了保护司机。倘若真的发生紧急情况,消防车有权利直接撞开不当停靠的车辆,以免危害公共安全。政府收了钱,就得“开放数据”。怎么开放?同样是提供一个数据集,里面清清楚楚写名每一次罚金收取的消防栓名称、所在地点,收取的罚金数量等等。这一数据一开放,有工程师就很好奇“哪个消防栓‘最赚钱’?”他分析后发现,每年“赚钱”最多的是Manhattan的一个消防栓,罚金达到了33117美金/年。特殊现象背后常有原因。他调出Gmap一看,原来这个地方政府画的线不太对。消防栓边上不是车行道,而是自行车道,自行车道旁边才是停车的道。这里就有一个判断问题,即自行车道的宽度是否已经足够让消防车进入?换句话说,许多司机并非有意违背规则停在消防栓边上,而是无从判断。工程师发现后,就在社交媒体发布了这一信息。很快,纽约市警察局做出反馈,真诚感谢工程师,并表示未来也将基于数据分析改进工作。

三是波士顿大学后维护消防栓的故事,表明数据开放有助于充分挖掘社会中隐藏的志愿力量,实现参与式治理、协同治理。我也在波士顿住过,冬天漫长,常常下雪。大雪封道后,消防栓就会被盖住。怎么办?网格化管理的方案是包干到人,这也是一种办法。波士顿的方案是开放数据:每一个消防栓的位置都清清楚楚公布在网上。不得不说,工程师真是一个充满了好奇心和行动力的群里。一群工程师就发起了Code for America的行动,完成了一个叫做Adopt a Hydrant的行动,即设计了一个APP,可以让用户注册并认领一个消防栓。认领以后,就得去帮忙把它从大雪中拯救出来,拯救完毕拍照上传,就可以有积分。这样,用户之间就可以相互比赛,知道自己“战胜了”多少城中用户。谁最喜爱这个APP呢?是活力无处安放的小朋友们!

四是江苏的交通APP。郑老师举的是上海、北京的例子,地铁线图的APP与公交线路的APP难以互通,到一个城市,换一种类型,就得切换一个APP。这是因为这些公司并没有开放数据(数据集)。江苏省在实现这一领域的政府数据开放后,百度等公司就可以基于数据集去做整合,使得市民只需要用一个APP(百度地图),就可以便捷查找公交+地铁线路。

什么是开放政府数据呢?

按照郑老师的讲述,政府开放的应当是最基础的数据集,这一数据集为数据利用者,包括软件工程师,也有可能是大学里的教授分析数据提供了可能。政府成为了数据的提供者,老百姓可以是参与者,市场上可以去开放应用。换句话说,开放政府数据的价值在于应用。

倘若这么说还比较抽象,郑老师还给了一个比方,即原始数据是大米,它不是经过加工的米饭。一旦政府只提供米饭,比如根据自身的数据直接给社会提供了一个结果“餐厅卫生情况优秀”,社会很难利用这个数据再做分析。政府需要给市场的,不是“米饭”这样的结果,而是“大米”这样的原材料,有了大米,市场可以开放合作、各取所需,把它做成炒饭、煲仔饭、白饭、饭团,等等等等。参照这一标准,许多政府网站上发布的统计报告或数据分析结果就不是开放数据,给出的单条查询也不是开放数据,列举的一条一条数据也不是开放数据,实时发布但没有积累的数据也不是开放数据。只有底层的数据集开放了,才是真正意义上能够被开发利用的政府开放数据。这一标准,显然比政府信息公开的标准,要高得多、难得多。政府信息公开只是让公众知道,而开放政府数据则还要让公众能够应用。

开放政府数据的目标是被开发利用、创造新的社会价值。在这一意义上,政府数据就是一种公共基础设施,开放政府数据就是提供一种公共服务。当然,开放政府数据也要讲点规则和方法,比如要注意保护国家机密、商业机密和个人隐私,特别是避免开放数据被关联分析后有可能会泄露国家机密、商业秘密和个人隐私的情形。

定义一百遍,不如一个例证。Data.gov为政府推进开放政府数据提供了一个可能的范例。

中国政府数据开放的现状如何?

郑老师的团队做了一个中国开放数林指数,基于他们建立的评估指标体系,形成了对各地区政府数据开放现状的评价。若感兴趣,可点击http://ifopendata.fudan.edu.cn/了解更多信息。

社科最好用的公开数据库

中国学术调查数据资料库

http://cnsda.ruc.edu.cn/index.php

中国营养健康调查(CHNS

中国疾病预防控制中心营养与食品安全所与美国北卡罗莱纳大学人口中心合作开展https://www.cpc.unc.edu/projects/china

中国教育追踪调查(CEPS)

中国人民大学中国调查与数据中心(NSRC)

https://ceps.ruc.edu.cn/

北京师范大学中国收入分配研究院

http://www.ciidbnu.org/chip/index.asp

中国家庭金融调查(CHFS

西南财经大学中国家庭金融调查与研究中心

https://chfs.swufe.edu.cn

北京大学开放研究数据平台

https://opendata.pku.edu.cn/

中国家庭追踪调查(CFPS

http://www.isss.pku.edu.cn/cfps/index.htm?CSRFT=8F5T-3G8T-VPG9-I70W-YLZJ-HED0-K3HG-OTFR

转自:“量化研究方法”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com