海洋研究人員使豐富的深海數(shù)據(jù)更容易獲得發(fā)表時間:2022-12-23 20:02 來自深海的數(shù)千張圖像存儲在世界各地海洋研究機構(gòu)的服務(wù)器上。 到目前為止,這些視頻和照片很難通過互聯(lián)網(wǎng)找到,因為它們沒有被一致地編目和描述。在GEOMAR的領(lǐng)導(dǎo)下,亥姆霍茲德國研究中心協(xié)會的一個團隊開發(fā)了一種通用數(shù)據(jù)標準,以促進全球圖像的使用。新的元數(shù)據(jù)格式現(xiàn)在發(fā)表在《自然科學(xué)數(shù)據(jù)》雜志上。 深海中的生命越來越多地被安裝在遙控或自主水下航行器上的高分辨率相機記錄下來。專家對這些圖像進行科學(xué)分析,以獲取有關(guān)開闊水域和海底以及地質(zhì)結(jié)構(gòu)中的生命信息。大量此類照片和視頻數(shù)據(jù)存儲在全球海洋研究機構(gòu)的服務(wù)器上,但編目方式卻大不相同。為了使這些豐富的數(shù)據(jù)在國際上可用,重要的搜索詞和信息,如潛水機器人在記錄過程中的位置、使用的相機技術(shù)以及探險隊和參與的科學(xué)家的姓名,必須以普遍可讀的格式存儲在圖像文件中。 為了確保這一點,亥姆霍茲德國研究中心協(xié)會的一個工作組,包括基爾的GEOMAR Helmholtz海洋研究中心,阿爾弗雷德·韋格納研究所,亥姆霍茲極地和海洋研究中心(AWI)和亥姆霍茲中心,為水下圖像開發(fā)了國際標準的元數(shù)據(jù)格式。來自亥姆霍茲研究領(lǐng)域地球與環(huán)境的數(shù)據(jù)倡議DataHub和亥姆霍茲元數(shù)據(jù)協(xié)作組織(HMC)的專家也參與其中。該提案發(fā)表在當前一期的《自然科學(xué)數(shù)據(jù)》雜志上。 Timm Schoening博士,文章的主要作者和數(shù)據(jù)科學(xué)家喬馬爾,他說:“幾年來,全世界一直在努力使數(shù)據(jù)普遍可用。憑借我們一貫的元數(shù)據(jù)標準,我們?yōu)樯詈5目茖W(xué)照片和視頻創(chuàng)造了條件,以便根據(jù)這一倡議在國際上訪問。我們正在提供軟件以使該標準可用。 新格式建立在國際公認的可持續(xù)研究數(shù)據(jù)管理的“FAIR”原則之上。首字母縮略詞代表“可查找、可訪問、可互操作和可重用”。其他研究人員可以根據(jù)其元數(shù)據(jù)獲得的文件稱為FAIR數(shù)字對象(FDO)。現(xiàn)在展示的水下圖像的FAIR數(shù)據(jù)格式被命名為“圖像FAIR數(shù)字對象”(iFDO)。在某種程度上,它是一個信息索引卡,清楚地總結(jié)了對圖像很重要的所有方面。它不僅包含有關(guān)圖像數(shù)據(jù)本身的描述性信息,還包含指向圖像數(shù)據(jù)的固定Web鏈接。 亥姆霍茲團隊已經(jīng)多次在國際上提出iFDO概念。“我們的方法引起了極大的興趣,”Schoening博士報告說。“因此,我們相信它將成為水下圖像新國際標準的模板。 作為對iFDO元數(shù)據(jù)格式的補充,該小組開發(fā)了幾種軟件工具,使采用iFDO格式進行各種生物或地質(zhì)解釋成為可能。另一個想法是在未來配備相機系統(tǒng),以便在拍攝圖像時自動生成iFDO格式的元數(shù)據(jù)。GEOMAR研究人員在大西洋的M182探險期間與研究船METEOR進行了測試。自主水下航行器ANTON,LUISE和ABYSS上的相機,以及拖曳儀器和固定系泊設(shè)備上的相機,在操作過程中直接存儲iFDO元數(shù)據(jù)。“這次經(jīng)歷非常積極,仍然導(dǎo)致文檔和軟件工具的一些補充 - iFDO本身在這次探險中工作得很好,”Timm Schoening說。 圖像和視頻記錄的一個特殊挑戰(zhàn)是計算機無法輕易評估它們。這與溫度或深度測量不同:數(shù)值可以很容易地存儲并顯示在圖表中。另一方面,視頻只是計算機的像素數(shù)據(jù)流。因此,必須首先標記和定義圖像材料中的每個對象 - 例如,細長對象如海參。專家將其稱為注釋,并為此目的使用專門的軟件,例如BIIGLE(生物圖像索引和圖形標簽環(huán)境),這是比勒費爾德大學(xué)開發(fā)的,也在GEOMAR中使用。 “我們在開發(fā)iFDO時直接將注釋步驟包含在數(shù)據(jù)格式中。我們將該功能內(nèi)置到BIIGLE軟件中,因此這個廣泛使用的工具現(xiàn)在已經(jīng)支持iFDO格式,“Schoening博士說。“這是在我們的演示中已經(jīng)引起廣泛關(guān)注的兩大優(yōu)勢:iFDOS不僅可以用作元數(shù)據(jù)的標準,還可以用作注釋的標準,并且有可用的軟件支持該格式。 這就是FAIR原則的好處得到回報的地方,因為它允許有效地重用數(shù)據(jù):因此,圖像數(shù)據(jù)和注釋也可用于訓(xùn)練機器學(xué)習(ML)算法。由于它們已經(jīng)以FAIR數(shù)據(jù)格式在iFDO中提供,因此ML算法的開發(fā)要簡單得多。 |