NCSA қоңыр иті - NCSA Brown Dog

NCSA қоңыр иті - бұл ғылыми зерттеулердің үлкен органдарының ұзақ мерзімді өміршеңдігін сақтау мақсатында сақталған тарихи зерттеулерге оңай қол жеткізу әдісін әзірлеуге арналған ғылыми жоба. Оған Ұлттық суперкомпьютерлік қосымшалар орталығы Қаржыландырады (NCSA) Ұлттық ғылыми қор (NSF).[1]

Тарих

Қоңыр ит - бұл бөлігі DataNet серіктестер бағдарламасы 2008 жылы NSF қаржыландырды. DataNet ғылымның, техниканың және білімнің цифрлық және деректерді көп қажет ететін сипатын шешу үшін ойлап табылды. Қоңыр ит - бұл келесі әрекеттің бөлігі Мәліметтер инфрақұрылымының блоктары (DIBB), DataNet-ті қолдау үшін бағдарламалық жасақтама жасауға бағытталған. Жобаны NCSA және The зерттеушілері ұсынды Иллинойс Университеті Урбана-Шампейн зерттеушілері сияқты Бостон университеті және Чепел Хиллдегі Солтүстік Каролина университеті.

Құрылымсыз, өңделмеген, ұзын құйрық туралы мәліметтер

Көптеген ғылыми деректер аз, құрылымсыз және емделмеген және осылайша оңай бөлінбейді. Мұндай деректерді кейде «ұзын құйрық» деректер деп те атайды. Бұл статистикалық терминді алады және жобаның өлшемдерін үлестіруге қатысты. Шағын жобалардың көпшілігінде олар шығаратын деректерді дұрыс басқаруға ресурстар жетіспейді. Бұрынғы және қазіргі кездегі «ұзын құйрық» деп аталатын мәліметтер көптеген зерттеу бағыттары бойынша болашақ зерттеулерді ақпараттандыруға мүмкіндігі бар. Бұл деректердің көп бөлігі ескірген бағдарламалық жасақтама мен файл пішімдеріне байланысты қол жетімсіз болды. Нәтижесінде ескі зерттеулердің деректерін қарастырудың мүмкін еместігі жалпы ғылыми зерттеу жобасын бұзады.[2]

Тәсіл

Қоңыр ит өзін бағдарламалық жасақтаманың «супер мут» ретінде сипаттайды[3] (осылайша «Қоңыр ит» атауы), интернеттегі сандық деректер мазмұнын интерфейстеу үшін төмен деңгейлі деректер инфрақұрылымы ретінде қызмет етеді. Оның тәсілі - мүмкіндігінше осы деректердің көпшілігімен жұмыс істей алатын қызметті құру үшін сенімді автоматтандырылған анықтамалық көзді (мысалы, бағдарламалық жасақтаманы) пайдалану.[4] Жоба өз жұмысының неғұрлым кең әсерін жалпы мәліметтерге және барлық файл форматтарына қазіргі кездегі веб-сайттар сияқты қол жетімді ету мақсатымен «деректерге арналған DNS» ретінде қарапайым халыққа қызмет ету әлеуетінен көреді.

Технология

Қоңыр ит екі қызметті дамыту арқылы деректердің өңделмеген және құрылымдалмаған жиынтығын пайдаланумен байланысты мәселелерді шешуге тырысады: файл форматтарын түрлендіруге көмектесетін Data Access Proxy (DAP) және автоматты түрде шығару үшін Data Tilling Services (DTS). файл мазмұнындағы метадеректер. Зерттеушілер мен жалпы пайдаланушылар дамығаннан кейін Brown Dog құралдар каталогынан шолғыш плагиндерін және басқа құралдарды жүктей алады.[1][5]

Деректерді өңдеу қызметі

Деректерді толтыру қызметі (DTS) пайдаланушыларға жинақтағы басқа ұқсас файлдарды табу үшін бұрыннан бар файлды қолдану арқылы деректер жинағын іздеуге мүмкіндік береді. DTS іздеу өрісі мысал файлдарын тастауға болатын конфигурацияланған браузерлерге қосылады. Бұл DTS-ке берілген файл бойынша барлық файлдарды іздеуді ұсынады URL мекен-жайы түсірілген файлға ұқсас файлдар үшін. Мысалы, желідегі кескіндер жиынтығын қарау кезінде пайдаланушы іздеу өрісіне үш адамның суретін түсіре алады, ал DTS коллекциядағы барлық суреттерді де үш адамнан тұрады. Егер DTS шетелдік файл форматына тап болса, файлға қол жетімді ету үшін DAP-ті қолданады. DTS сонымен қатар деректерді индекстейді және пайдаланушыларға кездесетін деректер түрін түсінуге мүмкіндік беретін метамәліметтерді файлдар мен жинақтарға шығарып, қосады.

Бұл қызмет 9443 портында жұмыс істейді.

Деректерге қол жеткізуге арналған прокси

Data Access Proxy (DAP) пайдаланушыларға, әйтпесе оқылмайтын деректер файлдарына қол жеткізуге мүмкіндік береді. Интернет шлюзіне ұқсас немесе Домендік атау қызметі, DAP конфигурациясы пайдаланушының машинасына және шолғыш параметрлеріне енгізілетін болады. Деректер сұранысы аяқталды HTTP алдымен DAP арқылы клиенттік құрылғыда жергілікті файл пішімін оқуға болатындығын анықтау үшін тексеріледі. Егер олай болмаса, DAP файлды клиенттік машина оқитын қол жетімді ең жақсы форматқа айналдырады. Сонымен қатар, пайдаланушы өзі қалаған форматты көрсете алады.

Бұл қызмет 8184 портында жұмыс істейді.

Істерді қолданыңыз

Қоңыр ит үшке бағытталған істерді қолдану ішіндегі топтар ұсынған EarthCube зерттеу қауымдастықтары. Осы қауымдастықтардың зерттеушілері мен зерттеушілері қолдану жағдайлары бойынша бірлесіп жұмыс жасайтын болады геология ғылымы, инженерлік, биология және әлеуметтік ғылымдар.

Экологиядағы және жаһандық өзгерістер биологиясындағы ұзын құйрықты өсімдіктер туралы мәліметтер

Бұл жағдайды басқарады Майкл Дитце, Бостон университеті

Өсімдік жамылғысының көптігі, түрлік құрамы және құрылымы туралы мәліметтер экология, табиғатты сақтау, табиғат ресурстарын басқару және жаһандық өзгерістер биологиясының көптеген пәндері үшін өте маңызды. Алайда, осы пәндердегі көптеген өзекті мәселелерді шешу үшін құрлықтағы биосфера мен гидрологиялық модельдер бар, бірақ негізінен қол жетімді емес ұзын құйрықты деректердің көп мөлшерін игере алуды талап етеді. Қоңыр ит тобы Дитценің зертханасындағы зерттеулермен бірлесіп, көптеген онжылдықтар бойына жиналған кішігірім зерттеуге бағытталған өсімдіктер туралы мәліметтер жиынтығын және 1785 жылдан бастап қоғамдық жерге орналастыру деректеріне енген тарихи өсімдіктер туралы мәліметтерді алуға көмектеседі. модельдердің бастапқы шарттары ретінде, басқа үлкен деректер жиынтығын түсіну үшін және модельді калибрлеу және тексеру үшін қолданылады.[1][6]

Нөсер суларын және адамның қажеттіліктерін ескере отырып, жасыл инфрақұрылымды жобалау

Бұл жағдайды басқарады Барбара Минскер, Урбан-Шампейндегі Иллинойс университеті; Уильям Салливан, Иллинойс Университеті Урбана-Шампейн; Артур Шмидт, Иллинойс Университеті Урбана-Шампейн

Бұл жағдайлық зерттеу романның дамуын қамтиды жасыл инфрақұрылым дауыл суларын басқару мен экожүйеге, адамдардың денсаулығы мен әл-ауқатына қойылатын талаптарды біріктіретін критерийлер мен модельдер. Жасыл желектерді жобалаумен байланысты ғылыми және әлеуметтік мәселелерді шешу үшін деректердің қол жетімділігі мен қол жетімділігі басты мәселе болып табылады. Бұл зерттеуде қолданыстағы жергілікті канализация көрсеткіштері жетіспейтін және жасыл инфрақұрылым арқылы су өткізбейтін аймақтың өзгеруі қызмет көрсетілетін аудандарға пайдалы болатын Чикаго қаласының ішіндегі «Жасыл дені сау елді-мекенді жоспарлау» аймағына бағытталған. Қоңыр ит адамның ландшафты таңдауы мен денсаулыққа әсері туралы ұзын құйрықты эксперименттік мәліметтерді алу үшін қолданылады. Бұл деректер адам денсаулығына әсер ету моделін жасау үшін пайдаланылады, содан кейін бұл жердегі биосфера моделімен және Brown Dog технологиясын қолданатын дауыл суларының моделімен байланысты болады.[1]

Аймақтық зерттеулерді әзірлеу және қолдану

Бұл жағдайды басқарады Praveen Kumar, Иллинойс Университеті Урбана-Шампейн

Сындарлы аймақ (CZ) - бұл микробтардан биомға дейінгі масштабта жұмыс істейтін тіршілік процестері құратын ағаштың басынан бастап тау жынысына дейін созылатын жердің «терісі». Сындарлы аймақ барлық тірі жүйелерді қолдайды. Оның жоғарғы бөлігі - био-мантия. Бұл жерде жердегі биоталар өмір сүреді, көбейеді, энергияны пайдаланады және жұмсайды, олардың қалдықтары мен қалдықтары жиналып, ыдырайды. Ол суды және еріген заттарды, энергияны, газдарды, қатты денелерді және организмдерді атмосферамен, биосферамен, гидросферамен және литосферамен өзара әрекеттесетін геомембрананың рөлін атқаратын топырақты қамтиды. Бұл био-динамикалық аймаққа климат пен ормандарды кесуден бастап ауыл шаруашылығына, жайылымға және адамның дамуына дейінгі әртүрлі драйверлер әсер етеді. Осы әсерлерді түсіну және болжау өмірлік маңызды және қолдау үшін маңызды болып табылады экожүйелік қызметтер мысалы, топырақтың құнарлылығы, суды тазарту және азық-түлік ресурстарын өндіру, және үлкен масштабтарда көміртектің ғаламдық айналымы және көміртекті секвестрациялау. CZ жер үсті және жер бетіне жақын ортаны біріктірудің бірыңғай негізін ұсынады және биологиялық күрделі торды көрсетеді химиялық процестер мен адамның әсер етуі уақытша және кеңістіктегі әртүрлі масштабтарда жүреді. Бұл деректердің табиғаты CZ пәнаралық зерттеулеріне айтарлықтай қиындықтар тудырады, себебі мәліметтер мен өнімдердің модельдері мен түрлерінің интеграциясы кедергі болды. Екінші жағынан, CZ деректері Brown Dog технологияларын анықтауға, сынауға және енгізуге тамаша мүмкіндік береді. Бұл тұрғыда «құрылымдық емес» мәліметтер уақытша және тәртіптік мұраларды бейнелейтін форматтары бар гетерогенді мәліметтер жиынтығынан, арзан метаберілген және сенсорлық сипаттамалары жоқ, анықталған арзан аппараттық құралдар негізіндегі датчиктерден және енгізілген сенсорлық желілерден алынған мәліметтер жиынтығынан тұрады. сонымен қатар карталар, кескіндер және мәтін түрінде қол жетімді деректер.[1]

NSF сыйлығы

CIF21 DIBB: қоңыр ит 2013 жылдың қысында 2013 жылдың 1 қазанында басталған күнімен марапатталды. Болжалды жарамдылық мерзімі - 2018 жылдың 30 қыркүйегі.[7]

Сыйақы мөлшері ең үлкен DIBB марапаты - 10 519 716,00 долларды құрады. Бас тергеуші - Урбан-Шампейндегі Иллинойс университетінің NCSA қызметкері Кентон МакХенри. Coleaders - Джонг Ли NCSA / UIUC; Барбара Минскер, Азаматтық және қоршаған ортаны қорғау, Иллинойс университеті, Урбана-Шампейн; Praveen Kumar, Азаматтық және қоршаған ортаны қорғау, Иллинойс университеті, Урбана-Шампейн; Майкл Дитце, Бостон университетінің Жер және қоршаған орта кафедрасы.

Пайдаланылған әдебиеттер

  1. ^ а б c г. e «Қоңыр ит». NCSA қоңыр иті. Алынған 31 шілде 2014.
  2. ^ «DataUp - ғылымның ұзақ құйрығы үшін мәліметтер курациясы». Microsoft Research Connections блогы. Microsoft зерттеу байланыстары тобы. Алынған 7 тамыз 2014.
  3. ^ Вуди, Алекс. «NCSA жобасы деректер үшін DNS тәрізді қызмет құруды мақсат етеді». датанами. Алынған 7 тамыз 2014.
  4. ^ Плец, Джон. «I of зерттеушілері үлкен трендтерді жұтып қою үшін» супер мут «үшін миллиондап алады». Chicago Business. Crain Communications, Inc. Алынған 7 тамыз 2014.
  5. ^ Джеветт, Барбара. «ДЕРЕКТЕР ЖИНАТЫ ТЕГІН». NCSA Access журналы. NCSA. Алынған 7 тамыз 2014.
  6. ^ «BU ғалымы, әріптестері анықталмаған мәліметтерге арналған бағдарламалық жасақтама жасауға 10,5 миллион доллар грант алады». www.newswise.com. Бостон университетінің өнер және ғылым колледжі. Алынған 7 тамыз 2014.
  7. ^ «Сыйлық # 1261582 - CIF21 DIBBs: қоңыр ит». nsf.gov. Алынған 31 шілде 2014.

Сыртқы сілтемелер