Обновлена "Копилка флоры России" (апрель 2022 г.)

Дорогие друзья!

В седьмой модели распознавания видов, которая была запущена 12 апреля, были использованы новые критерии отбора видов для обучающего датасета: теперь минимальный порог равен не ста наблюдениям, а ста фотографиям.

Из-за этого примерно половина видов нашей копилки (около 150 из 300) оказались уже известны системе, и она их уже предлагает пользователям при определении снимков. IT-специалист команды Цифрового гербария МГУ Олег Платко написал скрипт, который пробежался по страницам таксонов флоры России, и собрал список видов, которые всё ещё незнакомы системе.

Этот список позволил нам полностью обновить "Копилку флоры России" (https://www.inaturalist.org/projects/kopilka-flory-rossii-uchim-mashinu). Как и прежде, список включает 300 видов (правда, теперь гораздо более редких), по каждому из которых нужно набрать ровно 100 наблюдений.

Мы будем регулярно менять виды, преодолевшие этот порог, на те, что находятся ниже по списку. После выхода восьмой модели мы снова устроим генеральную чистку и обновим копилку.

Можно целенаправленно пополнять копилку, ориентируясь как на список видов (добавляя региональные фильтры), так и на карту, по которой вы можете глянуть на ближайшие к вам точки.

Подписались здесь на обновления: @natalia_gamova, @marina_gorbunova, @andrey_sdobnikov, @alexfamilyteam, @serycherny, @oleg_kosterin, @oksana_serikova, @taimyr, @yurii_basov, @madmanserg, @urij777, @tsn, @pavelsus, @denis_ivanov, @daba, @yuriydanilevsky, @julia_shner, @irinabobyleva, @tatyana_ilina, @windof, @petr_kosachev, @tanniii66, @grigoriy_yashin, @svetlanakutueva, @naturalist19358, @prokhozhyj, @forestru, @marina_sad, @tls-60, @cat_arch_angel, @irina_lebedeva83, @hoktokon, @daria_dru, @millione, @nikita_gerasin, @yuliaspiridonova, @woodmen19, @konstantin_shiryaev, @sennator, @stepan_vdovichenko, @nikolaydorofeev, @anaumkin, @svetlana-bogdanovich, @aleks-khimin, @pavelkomkov, @katya, @nikolay_sobolev, @dinanesterkova, @magrat666, @svetlana_katana, @irinasavenko, @liyixuan, @eugenia_urusova, @chimik, @naturalist57011, @tatianavladimirova, @v199rus, @wildpendulum, @dakileno, @gushchina_angelina, @pyakai, @danilinav, @npz, @tivanik, @okasana, @solisia, @cyathus, @cryptobasis, @vera_sokolova, @ev_sklyar, @alexandrtichonov, @caseymclowe, @mallaliev, @beerolha, @olga-2021, @olga_neogeo, @pamari, @alex_iosipenko, @alexander_ignatenko, @dni_catipo, @yaroslavmagazov, @naturalist34144, @zhu_lixun, @liyixuan, @iljar, @phlomis_2019, @savva_chigarkov, @sansan_94, @elena526, @ivan_savinov, @a-travva, @aleksandrebel, @eliooblomoff, @natalya_vilyaeva, @antropov_alexandr, @nadya_n, @xueqiqi, @sokolkov2002, @pavel_golyakov, @aeroself, @alexanderdubynin, @pushai, @kristina_k, @tatiana_dolgova, @tr3gl_svg, @volnushka, @alexanderlakomov, @tatiana_moscow, @tomegatherion, @vladimirpenzyak, @vikaryabkova, @xueqiqi, @ksenia_urakova, @eremchi, @siburhan, @tatiana_gerasenko, @kazakovdenis, @zhang_luyu, @natalia_trifuz (если вы заполняли форму, но вас тут нет, значит, вы написали свой ник с ошибкой - заполните форму ещё раз).

由使用者 apseregin apseregin2022年04月27日 17:24 所貼文

評論

Лайк :).

發佈由 prokhozhyj 約 2 年 前

"по каждому из которых нужно набрать ровно 100 наблюдений."
Судя по всему - теперь уже тоже фотографий, а не наблюдений?

發佈由 oleg_kosterin 約 2 年 前

Я так понимаю Алексей Петрович оставил именно сто наблюдений из логики, что 100 фотографий гораздо сложнее отследить, но при этом вид со 100 наблюдениями наверняка имеет 100 фото более менее приемлемого качества.
Разница теперь лишь в том, что процесс подбора видов для копилки несколько автоматизирован скриптом.

發佈由 yurii_basov 約 2 年 前

@oleg_kosterin, Олег, да, безусловно вы правы, однако штатного счётчика фотографий на сайте нет (кажется, есть через api). Поэтому я оставил порог в 100 наблюдений для гарантии. По опыту седьмой модели, почти для всех видов хватало 75-80 наблюдений. Впрочем, остаётся неясным, в какой именно момент начнётся обсчёт восьмой модели.

@kildor, Костя, подскажи, есть в api возможность дёргать число фотографий по таксонам?

發佈由 apseregin 約 2 年 前

@oleg_kosterin,

Судя по всему - теперь уже тоже фотографий, а не наблюдений?

Не совсем так. Нужно сто фотографий, а не наблюдений, при этом от одного наблюдения может быть использовано не более пяти фотографий.

@apseregin,

Костя, подскажи, есть в api возможность дёргать число фотографий по таксонам?

Не-а.
Можно скачать все наблюдения таксона и посчитать общее число фотографий, но это будет весьма сильно нагружать сервер. Плюс, учитывая то, что я написал выше, это несёт ещё меньше смысла.

發佈由 kildor 約 2 年 前

新增評論

登入註冊 添加評論