Дарвиннің негізгі мұрағаты - Darwin Core Archive

Дарвиннің негізгі мұрағаты (DwC-A) - а биоалуантүрлілік информатика пайдаланатын деректер стандарты Дарвин Кор түрлердің пайда болуы, бақылау тізімі, іріктеу оқиғасы немесе материалдың іріктелген деректері үшін жеке, дербес деректер жиынтығын жасау шарттары. Негізінде бұл қарапайым дескрипторы бар мәтіндік (CSV) файлдар жиынтығы (meta.xml) басқаларға сіздің файлдарыңыздың қалай ұйымдастырылғанын хабарлау үшін. Пішім Дарвиннің негізгі мәтіндік нұсқауларында анықталған.[1] Бұл деректерді жариялау үшін қолайлы формат GBIF желі.

Дарвин Кор

Дарвиннің негізгі стандарты[2] GBIF желісінде байқау жазбаларының және үлгілердің пайда болуының басым көпшілігін жұмылдыру үшін қолданылды.[3] The Дарвин Кор стандарт бастапқыда заманауи биологиялық үлгілер, олардың кеңістіктік-уақыттық пайда болуы және олардың коллекцияларға енгізілген дәлелдемелері (физикалық немесе сандық) туралы ақпаратты табуға, іздеуге және интеграциялауға ықпал ету үшін ойлап табылған.

Қазіргі кездегі Дарвин өзегі ауқымы жағынан кеңірек. Ол биологиялық әртүрлілік туралы ақпаратпен алмасу үшін тұрақты, стандартты анықтамалық қамтамасыз етуге бағытталған. Терминдердің глоссарийі ретінде Дарвин өзегі әртүрлі контексттерде максималды қайта пайдалануға болатын тұрақты семантикалық анықтамалар береді. Бұл дегеніміз, Дарвин Core-ді бұрынғыдай қолданылуы мүмкін, бірақ сонымен бірге күрделі терминалдарды құру үшін негіз бола алады, сонымен бірге жалпы терминдер жиынтығы арқылы өзара әрекеттесуді қамтамасыз етеді.

Мұрағат форматы

Мұрағаттың негізгі идеясы - оның файлдық файлдары жұлдыз тәрізді логикалық түрде орналастырылған, бір негізгі деректер файлы кез-келген «кеңейтімдермен» қоршалған. Әрбір кеңейтілім жазбасы (немесе ‘кеңейту файлының жолы’) негізгі файлдағы жазбаға нұсқайды; Осылайша, әрбір бір негізгі жазба үшін нөлден көптеген кеңейту жазбаларына дейін болуы мүмкін, бұл деректерді берудің кеңістіктегі тиімді әдісі, балама кестеге барлық деректерді қосудың баламасынан гөрі көптеген бос ұяшықтарды қамтуы мүмкін.

Ұсынылған кеңейтімдер туралы егжей-тегжейлі мәліметтерді олардың тиісті бөлімдерінен табуға болады және барлық қол жетімді кеңейтімдерді каталогтайтын GBIF тізілімінде кең құжатталған болады.

DiGIR және TAPIR сияқты веб-қызметтерді пайдаланудың орнына барлық деректер жиынтығын бөлісу деректерді әлдеқайда қарапайым және тиімді тасымалдауға мүмкіндік береді. Мысалы, TAPIR арқылы 260 000 жазбаны іздеу тоғыз сағатқа созылады, 500 МБ XML форматталған деректерді жіберу үшін 1300 http сұрауларын береді. DwC-A-мен кодталған және зиптелген дәл сол мәліметтер жиынтығы 3 МБ файлға айналады. Сондықтан, GBIF DwC-A құрған кезде ZIP немесе GZIP көмегімен архивті қысуды ұсынады.

Мұрағат негізгі жазбалар үшін тұрақты идентификаторларды қажет етеді, бірақ кеңейту үшін емес. Ортақ деректердің кез келген түрі үшін қандай-да бір жергілікті жазба идентификаторлары болуы қажет. Уақыт бойынша тұрақты және жазба жойылғаннан кейін қайта пайдаланылмайтын идентификаторларды түпнұсқа деректермен сақтау жақсы тәжірибе болып табылады. Мүмкіндігінше, жергілікті емес, глобалды бірегей идентификаторларды беріңіз.

Мұрағат дескрипторы

Аяқталуы керек.


Мәліметтер жиынтығы

Дарвиннің негізгі архивінде бүкіл деректер жиынтығын сипаттайтын метадеректерден тұратын файл болуы керек. The Экологиялық метадеректер тілі (EML) - бұл ең кең таралған формат, бірақ қарапайым Dublin Core файлдары қолданылады.

Әдебиеттер тізімі

  1. ^ Дарвиннің негізгі мәтіндік нұсқаулары
  2. ^ Виезорек, Джон; Д.Блум; Р.Гуралник; С.Блум; М.Дёринг; Р.Де Джованни; Т.Робертсон; D. Vieglais (2012). «Дарвин өзегі: дамып келе жатқан қауымдастық әзірлеген биоалуантүрлілік туралы мәліметтер стандарты». PLOS ONE. 7 (1): e29715. Бибкод:2012PLoSO ... 729715W. дои:10.1371 / journal.pone.0029715. PMC  3253084. PMID  22238640.
  3. ^ Дарвиннің негізгі мұрағаты - нұсқаулық

Сыртқы сілтемелер