OpenStreetMap 标志 OpenStreetMap

Некоторое время назад на официальном портале “открытых” данных data.mos.ru был опубликован набор данных “Адресный реестр зданий и сооружений города Москвы”. Также было получено подтверждение разрешения на использование этих данных в OpenStreetMap. Давайте же посмотрим, что из себя представляют эти данные, на что они годятся.

Для начала, собственно формат. Это JSON. Не GeoJSON. То есть он не годится для непосредственной загрузки в ГИС или любой софт, работающий с GeoJSON. Для того, чтобы его к этому подготовить, нужно изрядо повозиться.

Если геометрия объекта - multipolygon (имеет отверстия и т.п.), хранится она тоже криво. Сами товарищи из Департамента информационных технологий не осилили это поддержать, потому на карте все показывается в виде полигонов, без отверстий.

Теперь к самой геометрии. Волей случая (на каком-то пиратском сайте) мне попался набор данных, подготовленный в Autocad, называвшийся “Топосъемка Москвы” и датированный концом девяностых годов, то есть это то, что сняли первый раз после развала СССР. Данные были в системе координат МГГТ, там содержалось все - дороги, здания, газоны, уличные фонари. Так вот, около 90% геометрии в этом новом адресном реестре полностью оттуда. Качество перепроецирования в WGS84 - достойное.

У геометрии есть свои особенности. Многие здания обведены по footprint-у, то есть по уровню земли. В итоге, в контур попадает подъезд, но не его козырек, а выдающаяся наружу часть здания. У некоторых обведена проекция. Тогда в контур попадает козырек. То же может касаться всяких боковых входов в подвал или даже подвальных помещений, которые выходят за пределы контура наземной части.

Поскольку в исходных данных детали зданий (основная часть, козырьки подъездов и т.п.) были изображены отдельно, а при экспорте всякого рода дополнительные элементы в большинстве случаев были выброшены, геометрия имеет много лишних точек, где к основному контуру примыкали дополнительные. Их можно использовать для обнаружения и обозначения входов (не забывая подумать), но если они лежат просто на прямой, их лучше удалить - лишние точки не нужны.

Как и водится в казённых наборах данных, там достаточно неточностей.

Очень хорошо выглядит все, что стоит достаточно давно без изменений - хрущевские пятиэтажки, панельные девяти- и двенадцатиэтажные жилые дома. Эти сооружения можно считать практически эталоном.

Дома, которые построены после 1991-го года несут сюрпризы достаточно часто. То их положение не вяжется с положением остальных (кривая топосъемка или обработка ее результатов). То их контуры обрезаны. То они вообще не соответсвуют форме, потому что скопированы из какой-то проектной документации неизвестной актуальности, а не сняты на местности.

Естественно, присутствует явление, когда снесенные здания в реестре все еще числятся, а построенные недавно - отсутствуют. Системы в этом нет.

Некоторые особые типы зданий могут иметь проблемы с геометрией и положением, потому что были перестроены. Это касается, например, детских садов, которые прошли реконструкцию (на самом деле, были снесены и построены заново) и трансформаторных подстанций, которые перестраивали и расширяли, когда в кварталах хрущевской застройки стали сносить старые и строить на их месте новые жилые дома, требующие большей подводимой мощности. То же может касаться тепловых пунктов (ЦТП).

Что касается атрибутов, то адреса выглядят очень неплохо. Лично мне откровенных ошибок там найти не удалось, хотя они, вероятно, все же есть. Заметное число ошибок при этом есть в карте, которая используется как фоновая на самом data.mos.ru и atlas.mos.ru. Тут надо отметить, что эта карта и реестр - не одно и то же, так что в эту карту смотреть вообще не надо и нельзя - это карта Геоцентр-консалтинг.

Тем не менее, внесением данных о каждом сарае размером три на пять метров на территории промышленных предприятий я бы тоже не увлекался - это сегодня есть, а завтра - нет. Вероятно, у некоторых участников есть соблазн “догнать и перегнать Google или Яндекс”, но имейте в виду, что эти адреса используются только в какой-то учетной документации, практической пользы от них исчезающе мало, а верифицировать факт их наличия никто особенно не стремится, так что такие данные могут, в итоге, осесть неактуальным мусором в базе. Подчеркну, что это не касается, например, складов на территории коммерческих комплексов, обычно занимаемых разными арендаторами - там, наоборот, иметь полный набор адресов - очень ценно.

Другое применение адресной информации на территориях промышленных и коммерческих зон - определение принадлежности территории к одной организации. Часто, те территории, которые застраивались до 1991-го года, получали адресацию в пределах “владений”, таким образом, здания, принадлежавшие одной организации получали один номер дома и разные корпуса или строения. Иногда это даже дает возможность разделить общую промышленную территорию на части, относящиеся к отдельным компаниям и учреждениям, даже если забор между ними на снимке различить сложно.

Другой атрибут, который может возникнуть соблазн использовать - это дата постановки на учет, она же - “дата документа”. Имейте в виду: это не обязательно дата постройки, потому в start_date эта дата попадать просто так не должна. У домов, которые поставлены на учет после 2004, года есть шанс того, что дата ввода здания в эксплуатацию совпадает с датой постановки на учет с точностью до года. Если вы видите там дату до 1991-го года, то также есть немалая вероятность, что она совпадает с годом постройки. Если же там 2004-й, она, вероятнее всего, соответствует просто постановке на учет, который проводился массово именно тогда.


Как уже много раз говорилось, такие данные не должны вноситься непосредственно. Они должны использоваться только как справочные. Как сказано выше - часть из того, что в них содержится, обладает высокой степенью достоверности, часть - вообще никакой.

Также эти данные неплохо можно использовать для поиска смещений снимков и для привязки других данных - приложений к законам, проектам, самодельной аэрофотосъемки. Помните только о том, что не вся геометрия в этом справочнике - качественная. Предпочтение отдавайте отдельностоящим домам постройки до восьмидесятых-девяностых годов.

电子邮件图标 Bluesky图标 Facebook图标 LinkedIn图标 Mastodon图标 Telegram图标 X图标

讨论

az092016年01月 7日 16:55 的评论

Ваши “открытые данные” хотя бы содержат координаты. У нас например только адреса.

登录以留下评论