iNaturalist стал крупнейшим поставщиком данных по сосудистым растениям в GBIF!


Важная инструкция (как поменять лицензию для всех ваших наблюдений в четыре клика) дана здесь.


Дорогие друзья!

У нас еще одна чрезвычайно важная знаменательная дата.

Сегодня, 8 января 2023 года, после очередного еженедельного обновления данных, которые iNaturalist поставляет в GBIF (https://www.gbif.org/ ), произошло ещё одно историческое событие: платформа iNaturalist стала крупнейшим поставщиком данных по сосудистым растениям мира!

Напомним, что в GBIF попадают не все записи из iNaturalist, а только то, что имеет "исследовательский уровень" и один из трёх типов открытых лицензий. Так что на самом деле данных по сосудистым растениям в iNaturalist гораздо больше - 48,8 млн наблюдений (без учёта культурных растений). И всё это лежит в свободном доступе.

Распределение GBIF-данных по сосудистым растениям из iNaturalist по странам каждому из нас хорошо известно, но ради такого случая нелишне это напомнить. Итак, на первом месте США, далее с пятикратным отставанием Россия, почти на 140 тыс. наблюдений опережающая Канаду. Остальные страны перечислены ниже.


Постепенно к сообществу проекта "Флора России" присоединяются всё новые пользователи. Изредка мы рассказываем о том, как взаимодействуют iNaturalist и GBIF. Самое время рассказать об этом еще раз.

Итак, Global Biodiversity Information Facility - это глобальная платформа-агрегатор данных о биоразнообразии. Их здесь очень много: 2 271 618 068 фактов присутствия того или иного вида в той или иной точке. Это и наблюдения, и гербарные/музейные образцы, и окаменелости, и данные литературы, и каталоги живых растений ботанических садов. Чтобы все эти данные оказались доступны в одном месте (https://www.gbif.org/), 1951 организация по всему миру объединили здесь свои 80 398 баз данных - больших и малых. Любой пользователь может освоить несложную поисковую систему GBIF и найти то, что ему интересно.

Конечно, среди баз данных о биоразнообразии есть очень большие массивы! Вот, как выглядит десятка самых больших (по всем группам живых организмов):

1) EOD – eBird Observation Dataset 1 060 970 490
2) Artportalen (Swedish Species Observation System) 93 943 201
3) Observation.org, Nature data from around the World 69 494 603
4) iNaturalist Research-grade Observations 55 266 634
5) DOF - Observations from the Danish Ornithological Society 30 017 930
6) Norwegian Species Observation Service 28 854 301
7) INPN - Données flore des CBN agrégées par la FCBN 20 999 334
8) Southern African Bird Atlas Project 2 19 732 869
9) USGS PWRC - Bird Banding Lab - US State Centroid - 1960-2010 14 079 367
10) NSW BioNet Atlas 13 161 804

Данные из iNaturalist являются одним из ведущих источников данных в GBIF по всем группам живых организмов, а по сосудистым растениям - важнейшим.

На iNaturalist 124,5 млн наблюдений, а в GBIF попадает лишь 55 млн. Почему? Дело в том, что одновременно:

  • наблюдение должно иметь исследовательский статус;
  • наблюдение должно иметь открытую лицензию (CC0, CC-BY, CC-BY-NC);
  • а сами данные при этом публикуются с задержкой (сейчас доступна выгрузка от 03.01.2023).

Давайте сравним две ссылки на одно и то же наблюдение:

https://www.gbif.org/occurrence/2882925758
https://www.inaturalist.org/observations/61666594

Автор не указал своего настоящего имени в профиле, поэтому в GBIF он числится как "ctahkih". Не нужно менять ник - достаточно указать настоящее имя в профиле в соответствующем разделе. На странице наблюдения в iNaturalist имеется ссылка на GBIF в правом нижнем углу. Обратная ссылка с сайта GBIF имеется с момента заливки наблюдения. Интересно и то, что это наблюдение было создано с помощью приложения Seek.

У GBIF своя номенклатура, которая автоматически стыкуется с названиями iNat, а также имеется в расширенном поиске фильтр по автору находки, так что можете выбрать и посмотреть, какие ваши наблюдения попали в GBIF.


Если вы хотите, чтобы ваши наблюдения попали в GBIF и пошли в зачёт статистики нашей страны, то необходимо удостовериться, что у вас выставлена открытая лицензия (для этого подходят только лицензии CC0, CC-BY, CC-BY-NC). Если у вас не проставлена лицензия, то в карточке каждого наблюдения у вас в правом нижнем углу написано "Все права защищены", если проставлена, то, как правило, - "Некоторые права защищены".

Если вы хотите, чтобы ваши данные попадали в GBIF, в "Настройках учётной записи" нужно перейти в раздел "Контент и отображение" (подраздел "Лицензирование"). Там вы в выпадающем списке выбираете отдельно лицензии для наблюдений, фото и аудио и обязательно ставите галочку "Обновить существующие фото новыми вариантами лицензий". Спустя пару недель все ваши наблюдения исследовательского уровня отправятся в GBIF.

Традиционно: тэги тех участников, кто еще не перешел на открытые лицензии (таких 11,6%). Вдруг, передумают?

Это пользователи (из числа топ-500 наблюдателей по флоре России за 2022 год), которые пока не перешли на лицензии CC0, CC-BY, CC-BY-NC для своих фотонаблюдений, а потому их данные не идут в GBIF (а, значит, и в "Атлас флоры России"):

@alexey_zakharinskij
@naturalist39336
@fyodorp
@katto4ka
@ilya_rudenko
@artyom_t
@alenalatsveeva
@tatyanadavidova1
@ivanprst
@velmyr
@kazakovdenis
@anatoliy7
@alena133
@hapugin88
@dmitrydunin369
@naturalist56454
@botalex
@kim_potapov
@natalia_trifuz
@lenaperova
@hikuta
@naturalist23374
@gulina
@dmitrii_mostovoi
@vyatka
@nightlighty
@tatyana20
@centaurea_c
@irinahohryakova
@nikvas
@anatolii_ananin
@naturalist49367
@emisitdikova
@captainclover
@natalia-em
@vladimir_dvorkin
@katevbg
@alyona4
@natur58
@irinakudinova
@melnikova_olga
@anna-solisia
@dmitrygeltman
@dmitriy1997
@nina_kulakova
@kirann
@ll_r
@oleg84
@denispeace
@tatjana_ivankina
@agata_
@katerina207
@leragoncharuk
@nataliagalkina
@anton_nikolaev
@vit_polyak
@naturalist_evgeniya_lisa
@tatyana87

Ещё раз: подходят только лицензии CC0, CC-BY, CC-BY-NC, поскольку этот список жёстко регламентирован требованиями GBIF.

Отдельно отмечу, что доля наблюдений проекта, заблокированных жёсткими лицензиями, сократилась до исторического минимума в 9,2%! Это наше большое общее достижение в деле открытого доступа к данным о биоразнообразии. Большое спасибо, что не оставили без внимания предыдущие посты о GBIF и поставили открытые лицензии. Возможно, в этот раз отклик будет еще шире.

Зачем всё это нужно?

Самый простой ответ заключается в том, что именно из GBIF исследователи выгружают данные о растениях, грибах и животных в удобном виде (csv-выгрузки). Каждая такая выгрузка получает doi, с помощью которого отслеживаются цитирования в научных исследованиях. Так, массив данных iNaturalist (https://www.gbif.org/dataset/50c9509d-22c7-4a22-a47d-8c48425ef4a7) процитирован через GBIF уже 3183 раза! Это рекорд среди всех участников GBIF.

Важная инструкция (как поменять лицензию для всех ваших наблюдений в четыре клика) дана здесь.


Подписались здесь на персональные уведомления журнала "Флора России": @natalia_gamova, @marina_gorbunova, @andrey_sdobnikov, @alexfamilyteam, @serycherny, @oleg_kosterin, @oksana_serikova, @taimyr, @yurii_basov, @madmanserg, @urij777, @tsn, @pavelsus, @denis_ivanov, @daba, @yuriydanilevsky, @julia_shner, @irinabobyleva, @tatyana_ilina, @windof, @petr_kosachev, @tanniii66, @grigoriy_yashin, @svetlanakutueva, @naturalist19358, @prokhozhyj, @forestru, @marina_sad, @tls-60, @cat_arch_angel, @irina_lebedeva83, @hoktokon, @daria_dru, @millione, @nikita_gerasin, @yuliaspiridonova, @woodmen19, @konstantin_shiryaev, @sennator, @stepan_vdovichenko, @nikolaydorofeev, @anaumkin, @svetlana-bogdanovich, @aleks-khimin, @pavelkomkov, @katya, @nikolay_sobolev, @dinanesterkova, @magrat666, @svetlana_katana, @irinasavenko, @liyixuan, @eugenia_urusova, @chimik, @naturalist57011, @tatianavladimirova, @v199rus, @wildpendulum, @dakileno, @gushchina_angelina, @pyakai, @danilinav, @npz, @tivanik, @okasana, @cyathus, @cryptobasis, @vera_sokolova, @ev_sklyar, @alexandrtichonov, @caseymclowe, @mallaliev, @beerolha, @olga-2021, @olga_neogeo, @pamari, @alex_iosipenko, @alexander_ignatenko, @dni_catipo, @yaroslavmagazov, @naturalist34144, @zhu_lixun, @liyixuan, @iljar, @phlomis_2019, @savva_chigarkov, @sansan_94, @elena526, @ivan_savinov, @a-travva, @aleksandrebel, @eliooblomoff, @natalya_vilyaeva, @antropov_alexandr, @xueqiqi, @sokolkov2002, @pavel_golyakov, @aeroself, @alexanderdubynin, @pushai, @kristina_k, @tatiana_dolgova, @tr3gl_svg, @volnushka, @alexanderlakomov, @tatiana_moscow, @tomegatherion, @vladimirpenzyak, @vikaryabkova, @xueqiqi, @ksenia_urakova, @eremchi, @siburhan, @tatiana_gerasenko, @kazakovdenis, @zhang_luyu, @natalia_trifuz, @divitre, @dmitrii_mostovoi, @olga2019kuryakova, @evgeniyaast, @anastasiaredflower99, @anastasiya_spb, @svetlanakhanty, @ekaterinavoinova, @sergilus, @osting, @ninacourlee, @evgeny_ananyev, @irine_shlojmis, @wkent, @mariasakal, @elena_tikhonova, @evgeniq_benihanov, @ankhen, @radlena, @gerda_new, @komar281, @lilia_rakitianskaia, @igalka, @ganser8, @nikolai_nakonechnyi, @repta, @olya333555, @atachkin, @chortovatravka, @lebedeva_na, @sergey_shitov (если вы заполняли форму, но вас тут нет, значит, вы написали свой ник с ошибкой - заполните форму ещё раз).

由使用者 apseregin apseregin2023年01月08日 16:30 所貼文

評論

Кажется в списке ошибки - и у Алексея Захарьинского, и у Анатолия Хапугина открытая лицензия, возможно какие-то отдельные наблюдения закрыты до публикации.

發佈由 julia_shner 超過 1 年 前

Ошибки нет: у них выставлена какая-то экзотика, которая не поддерживается GBIF (http://creativecommons.org/licenses/by-nc-nd/4.0/ у @alexey_zakharinskij и http://creativecommons.org/licenses/by-nc-sa/4.0/ у @hapugin88)

發佈由 apseregin 超過 1 年 前

У А. Хапугина из 7200 наблюдений 634 CC-BY-SA - https://www.inaturalist.org/observations?photo_license=CC-BY-SA&place_id=any&subview=map&user_id=hapugin88&verifiable=any, остальные открытые

發佈由 taimyr 超過 1 年 前

Что-то не сходится у нас недавно отмечали 2 300 000 а у них и двух миллионов нет.

發佈由 sokolkov2002 超過 1 年 前

@taimyr, Игорь, я обсчитывал выгрузку 2022 года - именно этот год у Анатолия и закрыт целиком.
@sokolkov2002, Юрий, потеря на закрытых лицензиях + крымские данные в GBIF не идут в зачёт России

發佈由 apseregin 超過 1 年 前

Спасибо - вообще не смотрел на лицензии, поставил открытую.

發佈由 hikuta 超過 1 年 前

Исправился )

發佈由 anatoliy7 超過 1 年 前

Спасибо за информацию, исправила)

發佈由 lenaperova 超過 1 年 前

Спасибо за информацию, не знала о том, что здесь можно ставить лицензии, поставила.

發佈由 kirann 超過 1 年 前

Спасибо, не знала про этот пункт. Исправила.

發佈由 alyona4 超過 1 年 前

Интересно, почему старые посты идут как новые?

發佈由 denis_ivanov 10 個月 前

Воу, интересная фича. Я просто дополнил старый пост актуальной ссылкой на инструкцию

發佈由 apseregin 10 個月 前

И ещё отсечки по второму разу в обновах появились.

發佈由 denis_ivanov 10 個月 前

У меня вроде бы стоит CC-BY-NC везде после прошлого напоминания.

發佈由 hikuta 10 個月 前

А, так это старый пост)

發佈由 hikuta 10 個月 前

Тоже удивился. Вроде бы сделал лицензии открытыми, а опять в список "двоечников" попал. Впрочем, никто никому ничем не обязан. )

發佈由 kim_potapov 9 個月 前

新增評論

登入註冊 添加評論