转载 | 超2亿栋建筑的开源欧洲建筑物数据集EUBUCCO
人们在建筑物中居住、工作、学习、生产、经营等,大部分建筑物是人类活动频繁的场所,建筑物轮廓及其属性数据是重要的地理空间信息基础数据,可用于城市管理、城市规划、防灾减灾等领域。基于高分辨率卫星(或航空)光学遥感图像和深度学习技术来获取、更新区域和全球的建筑物轮廓数据是可行、成本较低的方式,微软和谷歌公司均采用此方法生产了全球大部分区域的建筑物轮廓数据集(和)。
EUBUCCO是一个欧洲范围的约2.02亿栋建筑的单个建筑物足迹数据集,除了建筑物足迹还包含3个主要属性:建筑高度、建造年份和建筑类型。相比于谷歌和微软的建筑物数据集,属性信息是其特色,该建筑物数据集可以根据需要直接使用,也可以结合高分辨率光学遥感图像制作训练建筑物自动提取深度学习模型所需的建筑物轮廓样本数据集。文末有该开源数据集的官网和数据下载地址。
一、数据集基本情况
EUBUCCO是一个科学数据集,其来源于欧洲的50个开源政府数据集(见图1)和开放街道地图(OpenStreetMap, OSM),经过收集、协调和部分验证处理后生成,当前版本号是V0.1(EUBUCCO V0.1)。EUBUCCO V0.1共包含了27个欧盟国家和瑞士的40829个城市的2亿多栋建筑的单体建筑物足迹及其属性信息。
图1解析生成EUBUCCO的50个数据集(来自参考链接及文献2)▼
EUBUCCO数据集的建筑足迹特色是含有重要的属性信息(见图2),其中建筑高度、建筑类型和施工年份3个主要属性的占比分别为45%、74%和24%。
图2EUBUCCO数据集建筑物轮廓及属性展示图▼
EUBUCCO数据集以两种数据格式分发:(1)Geopackage(.gpkg)格式:含有足迹的几何坐标和建筑属性信息;(2)CSV(.CSV)格式:仅包括建筑物属性信息。用于所有几何图形的坐标参考系为EPSG:3035。
二、数据集的生成
创建EUBUCCO v0.1有3个主要步骤:(1)识别相关数据;(2)从各个网站检索和获取;(3)将各种输入数据集统一为一种通用格式,该格式具有一致的建筑占地面积几何形状、属性(高度、类型和施工年份)和行政边界(国家、地区和城市)。工作流程的不同步骤如图3所示,数据处理工作流程几乎完全用Python编写,可以最大限度地提高自动化和再现性。
图3EUBUCCOv0.1的处理工作流程概述图(来自参考链接及文献2)▼
在整个工作流程中执行了广泛的数据验证程序,以确保完整性、最小错误和无重复。技术验证分析侧重于保证三个主要领域的数据质量:(1)在给定可用数据的情况下,确保最大限度的建筑存量完整性;(2)最小化不正确数据点的数量;(3)确保没有重复条目。进行了11次单独的检查,包括对原始数据的分析和整个工作流程的一致性检查,以监测数据更改可能导致的数据丢失,只要可能都会实施自动测试,例如删除无效或空的几何图形,旨在通过设计确保数据的有效性。
三、数据集访问和下载
该数据集的介绍和下载地址发布在其官网上(见参考链接及文献1),具体的下载网址为:,了解数据集的详细信息可看发表在科学数据(scientific data)上的论文(参考链接及文献2)。
图4EUBUCCO网站首页图(来自参考链接及文献2)▼
参考链接及文献
[1]EUBUCCO.
[2]Milojevic-Dupont, N., Wagner, F., Nachtigall, F. et al. EUBUCCO v0.1: European building stock characteristics in a common and open database for 200+ million individual buildings. Sci Data 10, 147 (2023). .
(全文完)