Иногда приходится этим заниматься. В нашем проекте по флоре России на iNaturalist значилось пару часов назад 6939 видов сосудистых растений. Но это только на бумаге. Сегодня удалось настроить движок, который будет помогать нам отлавливать ляпы в полуавтоматическом режиме. Итог: -10 видов. Лиха беда начало.
Итак, выгруженный 23 июля бэкап объемом 610 000 записей отфильтрован на предмет редких таксонов: тех, по которым есть от 1 до 3 записей. Это кандидаты на первую волну зачистки: это 4658 записей по 2785 таксонам.
Самые интересные (и сомнительные) - уникальные находки. Таковых 1446 единиц (и таксонов, и наблюдений). Их и нужно по одной проверить на вшивость. Дальше ручной труд (я пока только начал это делать).
Типовые проблемы нашего массива данных (выводы, сделанные при просмотре уникальных находок):
Главная новость действительно очень хорошая: большинство уникальных находок - это не артефакты с кривыми определениями, а вполне себе редкие кадры редких видов. Вот лидеры по уникальным находкам на 23 июля:
@ramazan_murtazaliev 231
@vvolkotrub 89
@ledum 50
@mallaliev 47
@pyakai 38
@convallaria1128 35
@taimyr 34
@phlomis_2019 33
@sapsan 32
@apseregin 30
@katerina_kashirina 27
@aleksandrebel 24
@lenatara 22
@mihail13 20
@daba 19
@olga_chernyagina 18
@cryptobasis 13
@pavel_golyakov 13
ВАЖНО (экспертам). Желающие получить выгрузки по своим регионам для ручной проверки уникальных находок, напишите в комментариях. Постараюсь не задерживать с присылкой. С вас - уверенное знание местной флоры и обязательство проверить определение каждой такой находки (по гиперссылкам). Самые распространенные проблемы описаны выше. Это очень важный этап поддержания в относительном порядке нашего массива данных.
評論
Очень важная работа. Терпения и удачи экспертам!
Если не горит, могу посмотреть по Сибири.
@aleksandrebel , @allaverkhozina , кинул выжимки на почту
у нас есть ряд видов-синонимов, которые существуют параллельно будто разные виды. сама хочу сделать такой список, только не знала кому его передать. надо же синонимы объединять как-то. я правильно понимаю?
Присылайте на почту список, по осени будем разбираться.
С количеством проблем нет, теперь будем понемногу работать над качеством
Про синонимы: я бы там ставил у младшего флаги кураторам с указанием на дублирование вида в базовых списках. Для этого надо в наблюдении кликнуть по видовому названию (заголовок странички), откроется страничка вида, и там в середине слева есть плашка "курирование", открыв которую и обнаруживаем искомый "флаг для куратора". Т.е. флаг идёт не наблюдению, а виду. Ежели сработает, то по данному виду проблема решится глобально по всему i-Nat, что тоже полезно :).
Новосибирская область.
сделала флаг для Плюща крымского (он же Hedera helix L.).. не хотят они его присоединять, ссылаясь на POWO/ так и будут люди думать, что это два разных плюща))
@sultanov-rinat , скинул на почту. Большое спасибо!
Если в POWO что-то не так, то мне писали, что им напрямую нужно писать с источниками, они могут у себя поменять.
Для орхидеи Калипсо луковичной на платформе есть 2 варианта: Calypso bulbosa и Calypso bulbosa var. bulbosa. Что выбирать? (P.S. Такого подвида в справочниках лично мне найти не удалось₽
Разумеется первый. В целом, типовые подвиды и разновидности не стали общепринятой нормой, да и по Кодексу Calypso bulbosa s.str. = Calypso bulbosa var. bulbosa
Моя Catabrosella humilis упорно исправляется тут на Dupontia fisheri. Как этого избежать, не знаю :-)
https://www.inaturalist.org/observations/42224873
Запросил: https://www.inaturalist.org/taxa/162152/flags/new
Нижегородская область в деле.
Брянская участвует
@beerolha , @panasenkonn , отправил на почту
@cryptobasis , таксон добавлен в базу
Ага, посмотрел: Catabrosella humilis в окошке появляется. Но ставить не стал, ибо не знаю оных :).
Отлично, спасибо!
新增評論