2024年10月03日

愛自然觀察紀錄的異常偵測器

《愛自然》的異常偵測器

當我們首次介紹「生物分布地理模型(geomodel)」時,我們提到它有助於顯示不尋常的觀察紀錄。今天,我們很高興分享實現這一願景的第一步,我們內部稱其為「異常偵測器(Anomaly Detector)」。

對於生物分布地理模型涵蓋超過九萬種物種,如下圖所示的橫帶人面蜘蛛(Trichonephila clavata),我們根據相對的地理分數(Geo score)排序其觀察紀錄的「異常程度」。橫帶人面蜘蛛原產於亞洲,現在已快速地在美國東南部蔓延。

未設定門檻值的 Geomodel 地圖中,觀察紀錄(橙色點)出現在較淺藍色區域的,表示其地理分數較低,因而被視為異常的觀察紀錄。例如,最不尋常的橫帶人面蜘蛛觀察紀錄位於奧克拉荷馬州,其次是波士頓的兩筆觀察紀錄——這兩個地點的發現最近還上了新聞

您現在可以在「鑑定工具」中使用新的篩選器來搜尋這些異常的觀察紀錄。操作方式如下:

  • 啟用研究等級:鑑定工具預設只會顯示「需要鑑定的觀察紀錄」,請先切換至顯示「研究等級的觀察紀錄」。
  • 按地理分數排序:將「排序的依據」設定為「地理分數(升冪排序)」來篩選
  • 排除私有位置:套用「隱藏私有位置的觀察紀錄」選項來排除這些紀錄
  • 不在預期區域附近:若要專注於真正異常的觀察紀錄,選擇「不在預期區域附近(Not expected nearby)」選項,此選項會顯示位於已設門檻值的 Geomodel 地圖上藍色「預期區域附近(Expected nearby)」範圍外的觀察紀錄。
  • 精確度調整:若要排除位置不精確的觀察紀錄,您可以在「最大位置精度」的篩選框中輸入精度數值(以公尺為單位)。

理解異常的觀察紀錄

異常的觀察紀錄通常分為兩類:錯誤(例如錯誤鑑定位置不精確)和有趣的發現(例如橫帶人面蜘蛛抵達波士頓)。目前,大多數顯示的異常觀察紀錄屬於錯誤的類型。

請使用此工具來修正這些錯誤!

  • 對於位置不精確的觀察紀錄:請禮貌地留言詢問觀察者來重新檢查位置,並在「位置精準」選項中投「否」一票。

  • 針對錯誤鑑定:提交一個正確的鑑定或不同意該鑑定的上一階層分類群(註:例如到屬)。

然而,並非所有異常的觀察紀錄都是錯誤的。例如波士頓的橫帶人面蜘蛛,這可能是一個重要的發現。因此,謹慎評估每一個案例十分重要。若有任何疑問,請禮貌地與觀察者及社群討論以釐清問題點。

生物分布地理模型的限制

需要注意的是,生物分布地理模型並非完美的。例如,儘管在德國有一個文獻記載的義大利洞穴蠑螈引進的族群(有超過 60 筆觀察紀錄),生物分布地理模型仍未學會這個範圍,並將這些觀察紀錄標記為「不在預期範圍內」且地理分數偏低。我們正在積極改進生物分布地理模型的預測準確性,但目前的限制可能會影響觀察紀錄的顯示。

未來展望

我們希望此工具能夠在《愛自然》上突顯出不尋常的觀察。在短期內,它可能主要幫助標記不準確的位置和修正錯誤鑑定——這些都是提升 《愛自然》 資料集品質的關鍵任務。但從長遠來看,我們相信這一功能有可能演變成一個令人興奮且強大的早期偵測系統,幫助我們更快地發現重要發現,例如橫帶人面蜘蛛在新區域的入侵,這最終有助於保育學者和入侵物種管理者能更有效地做出應對

感謝所有幫助改進資料品質並挖掘重要發現的人!

由使用者 mutolisp mutolisp2024年10月03日 06:22 所貼文 | 0 評論 | 留下評論

2023年09月23日

《愛自然》的生物分布地理模型(geomodel)

介紹 《愛自然》 生物分布地理模型

今天,我們將建議上的「附近可見(Seen Nearby)」標籤更改為「附近預期會出現(Expected Nearby)」。這個標籤來自我們首次介紹的愛自然生物分布地理模型所做的預測。

什麼是「生物分布地理模型」?

你們大多數人都熟悉 《愛自然》 的電腦視覺模型,它將照片作為輸入,並根據視覺上的相似性顯示最有可能的物種作為輸出。我們在一組約 80,000 種足夠資料的生物上訓練該模型,並每月更新(今天我們發布了 2.7 版本)。

《愛自然》生物分布地理模型以位置為輸入,返回該位置上最有可能的物種作為輸出。像電腦視覺模型一樣,它是一個深度學習模型,根據相同的分類群資料集來進行訓練,並按相同的每月計劃更新。我們與協助開發 iNaturalist 電腦視覺模型的 Visipedia 團隊合作開發和發表了生物分布地理模型。下面的地圖顯示了美洲鼠兔(Ochotona princeps)的生物分布地理模型預測。地理模型僅使用 iNaturalist 觀察紀錄和海拔梯度圖上來訓練。

從網格觀測到生物分布地理模型預測

自今年六月起,《愛自然》 使用生物分布地理模型為電腦視覺建議加權。從今天開始,我們使用「生物分布地理模型」來套用至「附近預期會出現」標籤中。

之前,我們使用原始觀察紀錄的網格版本來為電腦視覺建議加權並套用在附近可見的標籤上。我們計算每個物種在1度網格(grid cell)上的相對觀察記錄之數量。如果在周圍的9個網格中有該分類群的任何觀察紀錄,我們會將「附近可見」之標籤套用於建議上。我們使用網格中的相對觀察紀錄數量為電腦視覺建議來加權。注意,由於一筆錯誤鑑定的觀察紀錄,墨西哥角蟬(Membracis mexicana)在巴西南部的網格可能出現。

我們現在使用地理模型預測的「附近預期會出現的地圖」來套用於附近可見之標籤。您可以將「預期附近地圖」視為該物種在位置附近是否存在的預測。

從「附近可見」到「附近預期會出現」的名稱變化旨在明確表示該標籤來自模型預測,而不是觀察紀錄之網格。請注意,這些預測並不完美。例如,墨西哥角蟬可能不會出現在加拉巴戈或古巴,儘管有預測。對於某些物種,生物分布地理模型的表現非常好,而對於其他物種,預測的誤差則非常大。我們正在進行深入理解這些模型並修正的實驗中。但正如我們下面所示,平均來說,生物分布地理模型改善了它所替代的1度網格方法,我們期望未來的生物分布地理模型版本會持續改進。

我們使用「預期附近地圖」的未調整閾值版本(譯註:原本的生物分布地理模型預測機率值,在上述的生物分布地理模型會設定一個門檻值,超過其值代表該生物預期會出現)來為電腦視覺建議加權。您可以將未調整閾值地圖視為物種出現在某位置的相對機率。

您可以在我們連結至所有約80,000種生物的分類頁面上,探索我們用於為電腦視覺建議加權的「附近預期會出現地圖」和「未調整閾值地圖」,在我們的新生物分布地理模型預測頁面上查看。

為何使用生物分布地理模型以及下一步計劃

我們從1度網格的資料轉換成生物分布地理模型,主要有四個原因:

1. 改進電腦視覺的鑑定建議

如下面的「評估生物分布地理模型」部分之詳細說明,與1度網格方法相比,生物分布地理模型提高了電腦視覺在鑑定建議上的準確性。今天發布的2.7版本,其對最相似的第一筆鑑定上的建議之準確性提高了大約4%,我們預期隨著模型方法的不斷改善和更多觀察紀錄的上傳,未來生物分布地理模型版本的準確性將繼續增加。

2. 未來方向:快速/離線地理空間資訊

生物分布地理模型參數的數量不到1度網格資料大小的2%。這意味著生物分布地理模型夠小且夠快,可以在安裝Seek上的行動裝置中運作,就像電腦視覺模型那樣。這為包括在Seek相機建議中加入地理空間資訊和在行動裝置上離線顯示分類群地圖等功能提供了可能性。我們尚未開發這些功能,但生物分布地理模型將提高其可行性。

3. 未來方向:呈現不尋常的觀察

隨著《愛自然》的增長,社群需要更好的工具來呈現可能代表誤鑑定或重要發現之不尋常觀察,例如分布範圍擴展或外來入侵種的早期偵測。

下圖顯示210萬筆的蜻蜓觀察結果,按生物分布地理模型預測的地理分布不尋常性來排序。直方圖的右側顯示了最不尋常的0.01%的觀察紀錄。我們將這223個不尋常的觀察結果傳送給蜻蜓專家@dennispaulson 進行審核。197次觀察紀錄(88%)是錯誤鑑定的(紅色條形),例如這次被誤識別為纖細絲蟌的雨池絲蟌。其餘的26次代表了一些真正不尋常的記錄(白色條形),例如從科羅拉多州的石青蜻蜓擴張範圍。

有些在白色柱狀圖中的觀察對我們的模型來說是不尋常的,但對@dennispaulson 來說並不是,例如這來自海地的高地草地蜻蜓,生物分布地理模型認為它是不尋常的。隨著更多來自低取樣率的地區之觀察紀錄和鑑定,生物分布地理模型的準確性將隨著時間而增高。

蠅類專家@zdanko以50萬筆食蚜蠅觀察紀錄來協助進行了一個類似的實驗。與蜻蜓相似,在365個最不尋常的觀察紀錄中,有267次觀察(73%)是錯誤鑑定。

我們對於相關生物分布地理模型來建立工具的潛力感到興奮,以幫助更快地揭露出這些不尋常的觀察,進而吸引專家的更多關注,以便修正錯誤鑑定並不遺漏重要的發現,例如物種範圍的擴展。

4. 未來方向:範圍大小的背景資料

從保育觀點來看,一個物種的最重要特性之一是其地理分布範圍大小。在其他條件相同的情況下,分布範圍較小的物種比範圍較大的物種更有滅絕的風險。為了優先分配稀缺的保育資源和關注,土地管理者需要工具來確定哪些物種是小範圍分布的當地特有種(在世界上其他地方都不存在的物種)。
如下面「評估生物分布地理模型」部分所述,生物分布地理模型對分布範圍區域的預測與分布範圍地圖的區域(如在分類群頁面上,某些分類群分布範圍上出現來自外部來源)具有很好的相關性。

下圖顯示了生物分布地理模型對全球10種小規模分布鳥類的範圍區域的預測。我們希望建立生物分布地理模型的相關工具,以便更容易確認哪些觀察紀錄屬於小範圍的特有物種,以幫助土地管理社群優先考慮這些保育的目標。

「附近預期會出現的地圖」在生物分布地理模型預測頁面上以粗糙的1800平方公里的解析度來呈現,因此不會公開地揭露敏感物種的精確資訊。我們持續改善《愛自然》,安全地調整敏感物種資料和精確預測,以達到保育的目標。

評估生物分布地理模型

我們透過以下方式來評估生物分布地理模型:

  1. 改進建議的準確性
  2. 在「預期附近會出現」子資料集中保留正確的建議
    3.「預期附近會出現」地圖和分類群分布範圍之間的重疊

1. 改進建議的準確性

平均而言,透過使用1度網格對原始電腦視覺分數進行加權,最相似的第一筆鑑定建議的準確性從75%提高到83%(+8%)。相反,使用生物分布地理模型進行加權,最相似的第一筆鑑定建議的準確性提高到87%(+12%)。我們在地理和分類分組內重複了此分析,在所有案例中,生物分布地理模型的表現均優於1度網格的資料。

2. 在「預期附近會出現」子資料集中保留正確的建議

預設情況下,我們只會顯示「附近」所建議的子資料集(譯註:也就是只出現在附近的生物)。這個做法具有刪除不太可能出現於該地點出現物種之建議的優勢,但也存在刪除正確建議的風險。我們計算了召回率統計(recall statistics,譯註:即實際上樣本是真的情況下,有多少是預測正確的),測量在從生物分布地理模型和1度網格得到的附近子資料集中,正確的建議並保留之頻率。平均而言,兩種方法得到的召回率相同,均為0.94,這意味著每100次觀察,正確的結果在附近子資料集中被包含了94次。

3.「預期附近會出現」地圖和分類群分布範圍之間的重疊

為了衡量「預期附近」地圖與《愛自然》分類群頁面上顯示的分布範圍有多適配,我們進行了比較並計算了精確度和召回率統計。分類群之分布範圍也不是完全準確的,所以為了評估,我們使用了大約5,000個分類群分布範圍的子資料集,其中至少包含了該分類群中90%的觀察紀錄。

我們重複了此分析,將1度網格和生物分布地理模型與分類群分布範圍進行比較。生物分布地理模型的預測提高了精確度和召回率的平均值。F1統計量(精確度和召回率的調和平均數)對於地理模型比1度網格提高了9%。

在由均方對數誤差(Mean Logarithmic Squared Error; MLSE)測定的分類群分布範圍區域配對上,生物分布地理模型也比1度網格表現更好。

感謝你們

我們想要特別致上謝意給我們的研究合作夥伴,包括 Oisin Mac Aodha (愛丁堡大學)、Elijah Cole (加州理工學院)、Grant Van Horn (麻州大學阿默斯特分校)、Christian Lange (愛丁堡大學)、Pietro Perona (加州理工學院) 以及 @tbrooks (IUCN)。同時也感謝 Climate Change AI 2021–2022 創新基金的慷慨支持,讓這項工作得以實現。

我們對生物分布地理模型今天在在鑑定建議的準確性上所達成的進展感到很興奮,以及它為我們在未來幾個月中探索方向的潛力。感謝整個《愛自然》社群建立了所有的觀察紀錄與鑑定,這使得像生物分布地理模型這樣強大的模型訓練成為可能!

由使用者 mutolisp mutolisp2023年09月23日 14:02 所貼文 | 0 評論 | 留下評論

2023年03月15日

Facebook 的第三方登入即將無法使用,請大家儘速修改

因為 facebook 說要在 3/20 停止 iNaturalist 的第三方登入,請大家若使用 facebook 登入者,請用下列的方法設定您的帳號密碼:

  1. 如果是登入的狀態,請先到這裡 https://www.inaturalist.org/users/edit#profile
  2. 更改您的密碼,接下來您將會被登出
  3. 再回到 https://www.inaturalist.org/login 登入頁面,用剛剛修改的密碼重新登入
  4. 接下來就是用這樣的方式登入

Facebook 對於從其平台第三方登入的程序,包括支援使用 Facebook 帳戶登入的任何應用程式有越來越嚴格的安全要求。其中大多數要求基本上立意良善,但實作起來可能很困難,而 iNaturalist 團隊中只有兩到三個人有能力達到 Facebook 要求並修正 iNaturalist 的程式碼。只是評估他們的要求並回復到修正 iNaturalist 用 Facebook 的第三方登入可能需要幾天時間。我們希望在截止日期之前滿足他們的要求,但您應該採取上述步驟,以確保您能夠順利登入您的 iNaturalist 帳戶。我們也不打算在未來繼續支持 Facebook 登入,因此確保您有一個可用的密碼是非常重要的。

目前如果用 facebook 第三方登入而儲存的個人資料有

  1. 使用者 id
  2. 名字 (為了要建立在 iNaturalist 上的初始名字)
  3. email (如果您忘記密碼的話,可透過 email 聯絡您)
  4. 個人帳號的大頭照 (為了要建立在 iNaturalist 上的初始個人大頭照)

我們並不會儲存窺探您在 Facebook 上的其他私人訊息、貼文等隱私資料,有任何問題請再提出喔
有任何問題可以詢問 @mutolisp (or mutolisp+inat@gmail.com)

造成大家不便請見諒!

由使用者 mutolisp mutolisp2023年03月15日 02:13 所貼文 | 0 評論 | 留下評論

2022年10月04日

鑑定者側寫:@galanhsnu

This is a traditional Chinese translation from iNaturalist blog (original post).

這是第13次每月(或將近每個月)報導《愛自然》上面厲害的鑑定者系列。最近愛自然臺灣加入國際成員網路,所以我們覺得應該要來報導一下臺灣最頂尖的鑑定者。

雖然謝佳倫(@galanhsnu)在臺北這個大都市長大,能夠時常出外探索自然都要感謝他的父母在週末帶他出門健行。年少之時,他喜愛觀察昆蟲,但在國中的時候看到由郭城孟博士撰寫、黃崑謀先生繪圖的《蕨類入門》第一版(再版的書籍連結)後,「當看到各式各樣蕨類(當然也有石松類植物)錯綜複雜的葉子形態時,我整個非常驚訝且深深被吸引了」。從這本書開始,我的興趣逐漸延伸到所有類群的植物,不單是只有蕨類,也包含了開花植物...「我相信如果人們可以仔細觀察特定類群植物的話,永遠都能找到新世界。」

在植物上的興趣後來引導他現在進入中央研究院(臺灣)生物多樣性中心鍾國芳博士的實驗室並擔任研究助理。目前的研究計畫包含探討小檗科植物(Berberidaceae)的系統分類學、藉由構樹(Broussonetia papyrifera)來探究南島語族的遷徙、報春苣苔(Primulina, 苦苣苔科)、秋海棠屬(Begonia)還有龍膽屬(Gentiana)的原質體(plastome)演化等。

2018 年,佳倫在從南非旅程回來後和《愛自然》邂逅。「南非多樣化的植物相真的太精采了,但對新來者而言也很令人疑惑」,他解釋道。然後他搜尋好望角植物相時發現了《愛自然》。在四處看過網站後,我很快了解到《愛自然》不是只有南非或西方的國家,而是一個全球分享所有世界角落生物觀察的平台。此時,我也非常興奮我找到一些臺灣的觀察紀錄和使用者,而我的朋友林政道博士(@mutolisp)是臺灣《愛自然》主要的推廣者和策展人。

現在我很頻繁使用《愛自然》來學習關於我不知道植物的知識,透過分類群頁面,我能夠取得分類階層、分布範圍、物候和照片等非常詳細的資訊。透過世界各地大眾持續的貢獻,還有仔細地鑑定觀察紀錄資料,我相信《愛自然》可以成為全世界所有類群生物最強大和資訊豐富的資料庫。它同時也是各種生物多樣性研究上寶貴的公眾科學資料來源。我很開心我找到一個如此激勵人心的場所!

自從在近四年半他加入《愛自然》候,佳倫僅在臺灣就鑑定了 22.2 萬筆可證實的植物觀察紀錄,讓他成為最頂尖的鑑定者。他一直尋找從臺灣新上傳的觀察紀錄(植物且沒有任何鑑定的),而且也透過科級的篩選來鑑定既有的「需要鑑定」觀察紀錄。有時候他也會確認「研究等級」的觀察紀錄看是否需要更正的,但沒有在現有研究等級觀察紀錄上新增同意的鑑定。「此外」,他說,「我強迫我自己在幫別人鑑定時總是輸入學名。藉由這個方式,我可以逐漸記更多日常生活中不常使用的學名。這是一個非常好的植物學訓練方式。」

當我問他為什麼如此熱衷在《愛自然》上鑑定觀察紀錄時,佳倫如此解釋:

「我對於任何不知道或之前從未看過的(臺灣的)植物有非常強烈的好奇心。如果第一眼我無法講出那個植物的名字,我將會非常努力去查找。當我接近答案時,我能得到非常巨大的成就感。所以我很享受花時間在鑑定、查找和閱讀關於如何鑑定各式各樣植物的資訊」

「我真的很感謝《愛自然》,它是一個累積生物多樣性資料的平台,也是全世界自然愛好者互相交流和分享知識的地方。因此我希望能貢獻自己的能力來提昇《愛自然》觀察紀錄的品質。我有時候需要從《愛自然》取得資料時也能從此獲益,而且我需要確認這些紀錄是正確的,並為後續的分析做好準備。

《愛自然》對我而言是個很棒的地方來持續練習和吸收不同分類群的新知識。自從我在 2018 開始使用《愛自然》後,我學到非常多東西,而且透過幫其他人鑑定與和其他使用者或專家溝通之下,也增進許多我對植物鑑定技巧。舉例來說,我從 @guido_mathieu 身上獲得很多新的椒草屬(Peperomia)分類知識和鑑定技巧、從 @nathantaylor 學到大戟屬(Euphorbia)地錦草類(Chamaesyce)、從 @jeanphilippeb 學到決明屬(Senna)、從 @chris971 學到芭蕉屬(Musa),以及從許多臺灣使用者和專家身上學到各種臺灣植物的知識,還有更多有待列出的....

在回顧和鑑定植物時,這是一件令人愉快的事情—就如同我遇到許多舊朋友和新朋友一樣。

由使用者 mutolisp mutolisp2022年10月04日 13:48 所貼文 | 1 評論 | 留下評論

存檔