Эстония

К сожалению, я совсем не учёл этот способ адресации…

Запишу в Todo:
Пройтись по всем контурам, и у контуров, у которых есть адрес, снести адрес с точек, входящих в контур.
Но это уже будет другой тип обработки, и надо снова просить разрешения у сообщества :slight_smile:

Единственное, с чем не соглашусь - очень плохая идея делать две разных вещи за один импорт.

  1. В одном сложном скрипте проще допустить ошибку, чем в двух простых и понятных.
  2. В случае ошибки, разгребать последствия гораздо сложнее, когда всё перемешано в одном чейнджсете.

Весьма забавно. Согласно базе данных адресов, на этот дом (200516986) зарегистрировано аж 8 адресов:

Lai tänav		48
Lai tänav		46
Oleviste tänav		5
Pikk tänav		61
Oleviste tänav		3
Pagari tänav		4
Oleviste tänav		1
Pagari tänav		2

а я выгружал только первые два адреса, данный случай посчитал крайне редким :frowning:
По количеству адресов на дом статистика сейчас такая:


(количество адресов на дом - количество домов)
1 - 543277 (95.33%)
2 - 12155 (2.13%)
3 - 3058 (0.54%)
4 - 1381 (0.24%)
5 - 1039 (0.18%)
6 - 658 (0.12%)
7 - 501 (0.09%)
8 - 774 (0.14%)
9 - 714 (0.13%)
10+ - 6344 (1.11%)

Фух, еле затолкал! На всё ушло 6 часов. Сервер OSM жуёт медленно, думает долго, ошибки выплёвывает по одной…
Конфликт версий возникал 27 раз - кто-то трогал сегодня здания, которые я импортировал.
В остальном, импорт прошёл успешно.

Таллинн - 23562 зданий
остальные города - 18427
прочие населённые пункты - 15209
итого: 57198

Импортировалось:
addr:street
addr:housenumber
addr:housenumber2
addr2:street
addr2:housenumber
addr:suburb
addr:city
addr:country=EE
source:addr=Maa-amet 2012
maaamet:ETAK
maaamet:orig_tunnus

Попутно вырезалось:
created_by=xybot

В обработке участвовали:
все здания, у которых не было addr:housenumber или addr:street

Всего зданий в начале обработки:
Пронумерованных: 26425
Непронумерованных: 101410

Прогнозируемое количество после:
Пронумерованных: 83614
Непронумерованных: 44221

Пропущено зданий автоматическим анализом изображения (из-за отсутствия надписей внутри полигона):
40739

Где-то потерялось: 44221-40739=3482 (проанализируем ниже)


Контроль качества: каждое здание показывалось дважды :slight_smile:
Здания, относительно которых не сошлись во мнении: 2633 (пока отправлены в заморозку)
Здания, прошедшие контроль качества: 59912
(порядок номеров в зданиях с двумя адресами при контроле значения не имел)

Из этих 59912:
Не содержащие цифр (всякие “!” и “*”, а также пустые значения): 1936 (пока отправлены в заморозку)
Здания, номера которых распознаны, но не нашлось адреса в базе: 779 (пока отправлены в заморозку)

Итого к импорту: 59912-1936-779=57197

Все цифры сошлись, ничего не потерялось.

Здания, помеченные “!” и “*”, если у кого есть желание заняться: http://svimik.com/osm/list_ways_marked.php
3173 шт.

Хм… меня направляет на Оманский залив. Похоже, что долгота и широта поменялись местами.

Поменял местами, пробуй (у меня просто нет JOSM чтобы проверить).

Ага, теперь все ок.

Синхронизировал с OSM. Чьи-то 292 домика ещё появились :slight_smile:
(update)
уже обкликаны :slight_smile:

Кончились 292 домика. Можно импортировать :slight_smile:

Не очень хорошо сделано.
Нужно так, чтобы либо (a) можно было пометить запись, как обработанную, либо (b) она по открытию в JOSM помечалась обработанной автоматически на сутки, а после проверки (не знаю, как лучше проверить - тут есть варианты) либо вычеркивалась из этой очереди, либо в нее возвращалась.
Так как записи по одной в большом списке помечать обработанными очень утомительно, то третьей альтернативой могло бы быть (с) выдача записей блоками по 5 или по 10, с возможностью на странице блока пометить, что весь блок обработан. Опять же, записи этого блока не будет никому выдаваться до проверки.

В общем, со списком это не очень просто, но так, как сейчас - тоже неправильно - открываешь несколько первых записей списка, а они уже сделаны.

P.S. Напомню, что изначально я предлагал (1 + 2) эту очередь обрабатывать точно так же, как обычную - по одной, с картинкой, с кнопками “Открыть в JOSM”, “Пометить, как разрезанный”, “Пропустить”.
Когда записи выдаются автоматически - кликать на кнопки гораздо проще, чем выискивать записи в списке.

Согласен. Сделал пока ради обзора, можете не редактировать пока не будет нормального интерфейса.

Сделал ещё несколько обзорных таблиц. Итог:

Очень странное место я обнаружил, одни дома, без улиц: http://svimik.com/osm_uglase.png
Улицы я конечно нарисую, но что интересно - они безымянные. Реально весь район в Maa-amet обозначен одним адресом O_o

Ссылка на карту (основную массу уже обрисовал): http://www.openstreetmap.org/?lat=59.47598&lon=25.04258&zoom=16&layers=M

(update)
Оказалось, что безымянные улицы - нормальное явление для landuse=allotments

Неплохо бы наконец включить Эстонию (а заодно и Латвию с Литвой) в ближнее зарубежье на http://peirce.gis-lab.info/qa - появится еще один инструмент контроля наличия адресов

Обнаружился еще один недочет импорта - кто-то вбивал буквенные индексы в нижнем регистре, как на карте, а кто-то, из самых благих побуждений, вероятно - в верхнем. Отчасти этим может объясняться такое большое количество “разных” номеров.

Вообще посылать каждый номер дважды на заполнение - хорошая идея, я даже заподозрил нечто вроде, когда начал встречать повторы :slight_smile: Но надо было все-таки предупредить, что предстоит проделать двойную работу :wink: И направлять заполнение одного номера разным участникам :slight_smile:

Вообще оно есть, но только за второе число: http://peirce.gis-lab.ru/qa/EE-FULL
С адресами пока надо ждать обновления, а вот другие ошибки можно и посмотреть.

Есть ещё вот такой сервис: http://qa.poole.ch/?zoom=12&lat=59.42476&lon=24.7685&layers=TTB0
Правда, не совсем понятно, что с ним делать. Служебные проезды название иметь и не будут, как и каждая собачья будка адреса тоже не имеет… Так что карта не отражает реальное положение вещей.

Перед сравнением я все в нижний регистр перевёл.

Отчасти это объясняется тем, что один ввёл “!”, а второй всё-таки ввёл номер.
Обрабатывать я такое не стал, ибо если у одного закрались сомнения - наверное что-то с контуром не то.
Полный список несоответствий: http://svimik.com/osm/dup_check.htm

Каждый отреагирует на это по-своему. Некоторые могли передумать, так что не стал заранее расстраивать :wink:
Да и потом, народ бы расслабился. А так хоть может более ответственно подошли к делу. И то, опечаток хватило :slight_smile:

Теперь сразу по два раза подряд предлагает :slight_smile:
Домиков мало - рандом не катит. На второй раз-то надо обязательно другому пользователю подсовывать. Либо в конец очереди ставить однажды показанные.

Автор, дай исходники, какими бы замучанными они не были. Полезная вещь очень, не хочется заново писать.

А вот пожалуйста - как это понимать?
(слева - слой Maa-amet, который есть в JOSM по умолчанию):

Скинул в аську.

Видимо да. Помучай другие wms слой, там можно составить нормальную карту.

:slight_smile:

Грозился - сделаю. Алгоритм не сложный. Но чуть погодя, сейчас сложно найти время для этой задачи. На форуме-то не ответить, пытаюсь устранить хоть данный пробел. Если пропустил какой интригующий вопрос без ответа, извиняйте.

Не могу не поделиться результатом импорта по данным статистики моего валидатора (соответсвие адресных данных ОСМ к данным Мааамет).

Общая картина по уездам (слева до импорта, справа - после):

Т.е. в общем, адресов стало более чем в 2 раза больше.

Картина по Таллину (в шапке, также как и на предыдущем скрине общее значение по Эстонии):

Адресная составляющая Пирита улучшена в более чем 30 раз :slight_smile:

Может, их на гит хаб какой-нить?

PS: " (прошу совета)" в наименовании темы подтереть бы…

Ты тему начтнал - тебе и подтирать:)
Попробуй отредактировать первое сообщение темы