Discovery Net - Discovery Net - Wikipedia

Discovery Net а-ның алғашқы мысалдарының бірі болып табылады ғылыми жұмыс процесі жүйесі пайдаланушыларға негізделген қашықтықтағы қызметтердің орындалуын үйлестіруге мүмкіндік беру Веб-қызмет және Grid Services (OGSA және Grid Services архитектурасын ашыңыз стандарттар. Жүйе әзірленді және енгізілді Лондон императорлық колледжі Discovery Net пилоттық жобасы аясында Ұлыбританияның электрондық ғылым бағдарламасы қаржыландырады (E-Science § Ұлыбритания бағдарламасы ). Discovery Net ұсынған көптеген тұжырымдамалар кейінірек басқа да ғылыми жұмыс процестерінің жүйелеріне енгізілді.

Тарих: Discovery Net электрондық ғылымның пилоттық жобасы

Discovery Net жүйесі Discovery Net пилоттық жобасының (2001–2005) шеңберінде жасалды, бұл қаржыландыру £ 2 млн. EPSRC e-Science бағдарламасы бойынша Ұлыбритания (E-Science § Ұлыбритания бағдарламасы ). Жоба бойынша зерттеу жүргізілді Лондон императорлық колледжі Есептеу техникасы, физика, биохимия және жер туралы ғылымдар мен инженерия кафедралары арасындағы ынтымақтастық ретінде. Жалғыз институттық жоба болғандықтан, бұл жоба көп институционалды болып табылатын EPSRC қаржыландыратын басқа 10 пилоттық жобамен салыстырғанда ерекше болды.

Discovery Net жобасының мақсаты зерттеушіліктің негізгі мәселелерін зерттеу және шешу болды электрондық ғылым әр түрлі жоғары өткізу қабілеті бар құрылғылар жасаған мәліметтерден ғылыми жаңалық ашуға арналған платформа. Бастапқыда өмір туралы ғылымға, гео қауіпті мониторингке, экологиялық модельдеуге және жаңартылатын энергияға қатысты талаптарды қарастырды. Жоба Discovery Net-ті дамытумен бірге барлық мақсаттарын сәтті жүзеге асырды жұмыс процесі платформа және жұмыс процесі жүйесі. Бірнеше жыл ішінде жүйе көптеген басқа салалардағы өтінімдерді, соның ішінде дамыды биоинформатика, химинформатика, денсаулық информатикасы, мәтіндік тау-кен қаржылық және іскери қосымшалар.

Ғылыми жұмыс процесі жүйесі

Жоба аясында жасалған Discovery Net жүйесі - бұл алғашқы ғылыми мысалдардың бірі жұмыс процесі жүйелер. Бұл электрондық пошта платформасы, бұл ақпараттардың таратылған көздері мен аналитикалық құралдардың интеграциялануын қолдайды, осылайша соңғы пайдаланушыларға интернетте орналасқан құрылғылардан, датчиктерден, мәліметтер базаларынан, талдау компоненттерінен және есептеу ресурстарынан жаңа білім алуға мүмкіндік береді. тор.

Сәулет және жұмыс процесінің сервері

Жүйе көп деңгейлі архитектураға негізделген, жұмыс ағынының сервері жұмыс процесін жасау мен орындау үшін қажет бірқатар қолдау функцияларын ұсынады, мысалы, интеграция және қашықтағы есептеу және деректер ресурстарына қол жеткізу, ынтымақтастық құралдары, визуализаторлар және жариялау механизмдері. Архитектура бірнеше жылдар ішінде жұмыс ағыны серверінің ішкі жағына бағытталған (Ghanem et al. 2009), бірнеше қолданбалы домендерге, сонымен қатар әр түрлі орындау орталарына кеңейту мүмкіндігін қолдау үшін дамыды.

Жұмыс процесінің визуалды авторизациясы

Discovery Net жұмыс ағындары DPML (Discovery Process Markup Language) көмегімен есептеледі және мәліметтер ағынының есептеу моделін (аналитикалық жұмыс ағындары үшін) және басқару ағынының моделін қолдайтын жұмыс процесінің графикасына арналған XML негізіндегі ұсыну тілі (бірнеше бөлінген жұмыс ағындарын ұйымдастыру үшін) арқылы ұсынылады және сақталады. .

Көптеген қазіргі заманғы жұмыс ағыны жүйелеріндегідей, жүйе қолданушыларға түйіндерді біріктіру арқылы өз қосымшаларын оңай құруға мүмкіндік беретін апарып тастау визуалды интерфейсін қолдайды.

DPML ішінде жұмыс ағыны графигіндегі әрбір түйін орындалатын компонентті ұсынады (мысалы, есептеу құралы немесе белгілі бір деректер көзінен деректерді шығарып ала алатын ораушы). Әрбір компонентте пайдаланушы орната алатын бірнеше параметрлер бар, сонымен қатар мәліметтерді қабылдау және беру үшін кіріс және шығыс порттары бар.

Графиктің әрбір бағытталған шеті шығыс порттан, яғни шеттің құйрығынан кіру портына, дәлірек айтқанда, шеттердің басынан қосылуды білдіреді. Егер порттан / немесе одан бір немесе бірнеше қосылым болса, порт қосылады.Сонымен қатар, графиктегі әр түйін компоненттің кірісі мен шығыс портын сипаттайтын метамәліметтерді, оның құрамдас бөлігіне берілетін мәліметтер түрін және параметрлерін ұсынады пайдаланушы өзгерткісі келетін қызмет. Мұндай ақпарат жұмыс ағындарын тексеру және компоненттердің мағыналы тізбегін қамтамасыз ету үшін қолданылады. Кіріс пен шығыс порт арасындағы байланыс тек типтер үйлесімді болған жағдайда ғана дұрыс болады, бұл қатаң түрде орындалады.

Мәліметтер мен басқару ағындары арасындағы айырмашылық

Жүйенің негізгі үлесі оның ғылыми жұмыс процестеріндегі мәліметтер ағыны мен есептеулердің басқару ағыны модельдері арасындағы таза бөлінуі болып табылады. Бұған мәліметтер ағынының толық фрагменттерін басқару ағыны құрылымдарының блоктық құрылымдалған фрагменттерімен енгізуге мүмкіндік беретін ендіру тұжырымдамасы арқылы қол жеткізіледі. Бұл басқа ғылыми жұмыс процестерінің жүйелерімен салыстырғанда қарапайым жұмыс ағындарының графиктерін тудырады, мысалы. Taverna жұмыс үстелі және Кеплердің ғылыми жұмыс процесінің жүйесі сонымен қатар олардың қасиеттерін талдау үшін формальды әдістерді қолдануға мүмкіндік береді.

Деректерді басқару және көптеген деректер модельдері

Жүйені жобалаудың басты ерекшелігі оның жұмыс процесі қозғалтқышының ішіндегі деректерді басқаруды қолдауы болды. Бұл маңызды ерекшелік, өйткені ғылыми эксперименттер көп мөлшерде гетерогенді және таратылған мәліметтер жиынтығын жасайды және пайдаланады. Жүйе аралық деректер өнімдерінің табандылығы мен кэштелуін қолдауға, сондай-ақ қашықтағы есептеу ресурстарының көмегімен үлкен көлемді деректер жиынтығында ауқымды жұмыс процесінің орындалуын қолдауға арналған.

Discovery Net жүйесінің екінші маңызды аспектісі терілген жұмыс процесінің тіліне және оның пайдаланушы анықтаған ерікті деректер түрлерін қолдауға негізделгендігіне негізделген. Мәліметтерді теру жұмыс процесінің ғылыми ағынын жеңілдетеді, жұмыс ағындарын оңтайландырады және жұмыс ағындарын тексеру кезінде қателіктерді тексеруді күшейтеді. Ғылыми қосымшаларға, әр түрлі деректерді өндіруге қолдау көрсету үшін жүйеге бірқатар стандартты деректер түрлері енгізілген. Оларға а реляциялық модель кестелік мәліметтер үшін, а биоинформатика деректер моделі (FASTA ) негізінде гендер тізбегін ұсыну үшін және негізінде мәтінді өндіруге арналған белгілеу моделі Типстер сәулет.

Әрбір модельде импорттау және экспорттау туралы мәліметтер жиынтығы, сондай-ақ жүйеде жалпы импорттау, экспорттау және визуализация құралдарымен біріктірілген спецификуализаторлар бар. Мысал ретінде, кең таралған SMILES-те ұсынылған химиялық қосылыстар (Оңайлатылған молекулалық кіріс сызығының кіру сипаттамасы ) форматты деректер кестесінің ішінен импорттауға болады, мұнда олар үш өлшемді көріністі немесе оның құрылымдық формуласын қолдану арқылы жеткілікті түрде көрсетілуі мүмкін. Реляциялық модель деректерді интеграциялаудың негізгі моделі ретінде де қызмет етеді және жалпы деректерді тазарту және түрлендіру міндеттерінің көпшілігінде қолданылады.

Қолданбалар

Бұл жүйе ACM SC02 (Supercomputing 2002) конференциясы мен көрмесінде «Инновациялық деректерді интенсивті қолдану бойынша марапатты» толығымен интерактивті үлестірілген геномның аннотациялық құбыр желісін безгек геномы бойынша зерттеу негізінде жеңіп алды. Жүйенің көптеген мүмкіндіктері (архитектуралық мүмкіндіктер, визуалды фронт, қашықтан басқарылатын веб-және торлы қызметтерге жеңілдетілген қол жетімділік және жұмыс ағыны дүкенін қосу) сол кезде жаңа болып саналды, содан кейін олар басқа академиялық және коммерциялық жүйелерге жол тапты , және әсіресе, ерекшеліктері биоинформатика жұмыс процесін басқару жүйелері.

Discovery Net жобасынан басқа жүйе көптеген ғылыми қосымшаларда қолданылған, мысалы, BAIR: Инсулинге төзімділіктің биологиялық атласы жобасы қаржыландырады. Жақсы сенім және де қаржыландырылатын көптеген жобаларда EPSRC және BBSRC Ұлыбританияда Discovery Net технологиясы мен жүйесі сонымен қатар коммерциялық өнімдерге айналды, бірақ Imforial College Spinout компаниясы InforSense Ltd, ол әрі қарай кеңейтілген және көптеген коммерциялық қосымшаларда жүйені қолданды, сонымен қатар одан әрі ғылыми жобалар, соның ішінде SIMDAT, TOPCOMBI, BRIDGE және АРГУГРИД[дәйексөз қажет ].[1]

Сондай-ақ қараңыз

Әдебиеттер тізімі

  1. ^ Лондон, басты кампустың мекен-жайы: Император колледжі; Кампус, Оңтүстік Кенсингтон; SW7 2AZ, Лондон; карталар, тел: +4420 7589 5111 кампус; , ақпарат | Осы сайт туралы | Бұл сайт кукиді | қолданады Қате мазмұн туралы хабарлау | Журнал. «IT-аналитиканы жақсарту үшін жаңа серіктестік басталды | Imperial News | Imperial College London». Императорлық жаңалықтар. Алынған 2019-04-25.
  1. Ганем, М; Гуо, У; Роу, А; Вендел, П (2002). «Информатиканың жоғары өнімділігі үшін торға негізделген білімді анықтау қызметі». IEEE жоғары өнімділігі бойынша таралған есептеуіш техникасы бойынша 11-ші халықаралық симпозиум материалдары. б. 416. дои:10.1109 / HPDC.2002.1029946. ISBN  0-7695-1686-6.
  2. Курчин, V; Ганем, М; Гуо, У; Köler, M; Роу, А; Сид, Дж; Вендел, П (2002). «Discovery net». Білімді ашу және деректерді өндіру бойынша сегізінші ACM SIGKDD халықаралық конференциясының материалдары - KDD '02. 658-63 бет. дои:10.1145/775047.775145. ISBN  1-58113-567-X.
  3. Джамил Сайд, Мустафа Ганем, Йике Гуо. Табу процестері: ұсыну және қайта пайдалану. Бірінші электронды ғылымның Ұлыбритания конференциясының материалдары, Шеффилд, Ұлыбритания. Қыркүйек, 2002 ж.
  4. Николаос Джаннадакис, Мустафа Ганем, Йике Гуо. Электрондық ғылымға арналған ақпараттық интеграция. Бірінші электронды ғылымның Ұлыбритания конференциясының материалдары, Шеффилд, Ұлыбритания. Қыркүйек, 2002 ж.
  5. Ганем, Мустафа М; Гуо, Йике; Лодхи, Хума; Чжан, Ён (2002). «Жергілікті өрнектерді қолданып автоматты түрде ғылыми мәтінді классификациялау». ACM SIGKDD Explorations ақпараттық бюллетені. 4 (2): 95. дои:10.1145/772862.772876.
  6. Роу, А; Калайцопулос, D; Осмонд, М; Ганем, М; Guo, Y (2003). «Биоинформатиканың өнімділігі жоғары жүйені табу». Биоинформатика. 19 Қосымша 1: i225-31. дои:10.1093 / биоинформатика / btg1031. PMID  12855463.
  7. Альсайрафи, Салман; Эммануил, Филиппия-София; Ганем, Мустафа; Джаннадакис, Николаос; Гуо, Йике; Калайцопулос, Димитриос; Осмонд, Мишель; Роу, Энтони; Сайд, Джамил; Вендел, Патрик (2016). «Discovery Network дизайны: білімді ашуға арналған торлы қызметтерге қарай». Жоғары нәтижелі есептеуіш қосымшалардың халықаралық журналы. 17 (3): 297. дои:10.1177/1094342003173003.
  8. Джаннадакис, Николаос; Роу, Энтони; Ганем, Мустафа; Гуо, Ии-ке (2003). «InfoGrid: білімді ашуға арналған ақпараттық интеграцияны қамтамасыз ету». Ақпараттық ғылымдар. 155 (3–4): 199–226. дои:10.1016 / S0020-0255 (03) 00170-1.
  9. Мустафа Ганем, Йике Гуо, Энтони Роу. Биоинформатиканы қолдауға арналған интеграцияланған деректер және мәтіндік іздеу. AHM 2004 Ұлыбританияның 3-электронды ғылыми қол конференциясының материалдары, Ноттингем, Ұлыбритания. Қыркүйек, 2004 ж.
  10. Васа Курчин, Мустафа Ганем, Йике Гуо. Тордағы SARS талдау. AHM 2004 Ұлыбританияның 3-электронды ғылыми қол конференциясының материалдары, Ноттингем, Ұлыбритания. Қыркүйек, 2004 ж
  11. Питер Ау, ​​Васа Курчин, Мустафа Ганем, Николаос Джаннадакис, Йике Гуо, Мохаммад Джафри, Мишель Осмонд, Энтони Роу, Джамил Сайд, Патрик Вендел, Йонг Чжан. Неліктен тор негізінде деректерді өндіру маңызды? Тордағы табиғи апаттармен күресу: ЖРВИ-ден құрлықтағы слайдтарға дейін. AHM 2004 Ұлыбританияның 3-электронды ғылыми қол конференциясының материалдары. 2004 ж. Қыркүйек
  12. Курчин, V; Ганем, М; Йике Гуо; Роу, А; Ол, В; Хао Пэй; Лу Цян; Юанюань Ли (2004). «Интегративті жүйелер биологиясының ақпараттық сервисінің инфрақұрылымы». IEEE Халықаралық конференциясы Қызметтер Есептеу, 2004. (SCC 2004). Іс жүргізу. 2004 ж. 123–31 бет. дои:10.1109 / SCC.2004.1357998. ISBN  0-7695-2225-4.
  13. Мустафа Ганем, Васа Курчин, Йике Гуо, Нил Дэвис, Роб Гайзаускас, Икун Гуо, Хенк Харкема, Ян Робертс, Джонатан Ратклифф. GoTag: Ұлыбританиядағы электрондық ғылымның жалпы инфрақұрылымын пайдалану туралы жағдайлық зерттеу. 4-ші Ұлыбританиядағы электронды ғылымның қолмен кездесуі 2005. қыркүйек, 2005
  14. Нил Дэвис, Хенк Харкема, Роб Гайзаускас, Икун Гуо, Мустафа Ганем, Том Барнвелл, Йике Гуо, Джонатан Ратклифф. Биомедициналық рефераттарды тегтеудің үш әдісі. CEUR семинарының материалдары. Сәуір, 2006.
  15. Ганем, Мустафа; Азам, Набил; Boniface, Майк; Феррис, Джастин (2006). «Өнеркәсіптік өнімді жобалауға арналған тормен жұмыс процестері» (PDF). 2006 ж. IEEE екінші электрондық конференция және электрондық есептеу жүйесі (e-Science'06). б. 96. дои:10.1109 / E-SCIENCE.2006.261180. ISBN  0-7695-2734-5.
  16. Мустафа Ганем, Набил Азам, Майк Бонифас. Торлы жүйелердегі жұмыс процесінің өзара әрекеттесуі. Краков торының шеберханасы 2006. қазан, 2006
  17. Васа Курчин, Мустафа Ганем, Йике Гуо, Костас Статис, Франческа Тони. Аргументтік агенттерді қолдана отырып, қызметке бағдарланған архитектураны құру. Тор қызметтерін басқару және басқару бойынша 3-ші халықаралық конференция (GSEM 2006). Springer Verlag. Қыркүйек, 2006 ж.
  18. Патрик Вендел, Арнольд Фунг, Мустафа Ганем, Йике Гуо. Тауарлық қызметтерді қолдана отырып, Java негізіндегі Grid жоспарлағышын жобалау. Ұлыбританияның e-Science All Hands Meeting 2006 жинағы. Ноттингем, Ұлыбритания, қыркүйек 2006 ж.
  19. Цян Лу, Синьцзун Ли, Мустафа Ганем, Йике Гуо, Хайян Пан. R-ді Discovery Net-ке біріктіру. Ұлыбританияның e-Science All Hands Meeting отырысы 2006 ж., Қыркүйек, 2006 ж.
  20. . дои:10.1109 / E-SCIENCE.2006.17. Журналға сілтеме жасау қажет | журнал = (Көмектесіңдер); Жоқ немесе бос | тақырып = (Көмектесіңдер)
  21. Ричардс, М; Ганем, М; Осмонд, М; Гуо, У; Хассард, Дж (2006). «Атмосфералық ауаның ластануы туралы деректерді тораптық талдау». Экологиялық модельдеу. 194 (1–3): 274–286. дои:10.1016 / j.ecolmodel.2005.10.042.
  22. Сайд, Джамил; Ганем, Мустафа; Гуо, Йике (2007). «Discovery Net-тегі ғылыми жаңалықтарды қолдау». Параллельдік және есептеу: тәжірибе және тәжірибе. 19 (2): 167. дои:10.1002 / cpe.1049.
  23. Васа Курчин, Мустафа Ганем, Йике Гуо, Джон Дарлингтон. Электрондық ғылыммен жұмыс процесінде дәрілік заттардың жағымсыз реакцияларын өндіру. 4-ші Каирдегі халықаралық биомедициналық конференцияның материалдары, 2008. CIBEC 2008. желтоқсан, 2008.
  24. Курчин, V; Ганем, М (2008). «Жұмыс процесінің ғылыми жүйелері - бір өлшем бәріне сәйкес келе ме?». 2008 жылы Каирдегі халықаралық биомедициналық конференция. 1-9 бет. дои:10.1109 / CIBEC.2008.4786077. ISBN  978-1-4244-2694-2.
  25. Ганем, Мустафа; Курчин, Васа; Вендел, Патрик; Гуо, Йике (2009). «Discovery Net-те аналитикалық жұмыс процестерін құру және пайдалану». Торларды есептеу орталарында деректерді өндіру әдістері. 119–39 бет. дои:10.1002 / 9780470699904.ch8. ISBN  978-0-470-69990-4.
  26. Курчин, Васа; Ганем, Мустафа М; Гуо, Йике (2009). «Ғылыми жұмыс процестерін есептеу ағашының логикасымен талдау». Кластерлік есептеу. 12 (4): 399. дои:10.1007 / s10586-009-0099-6.
  27. Антже Вольф, Мартин Хофман-Апитиус, Мустафа Ганем, Набил Азам, Димитриос Калайцопулос, Куньциан Ю, Винод Касам. DockFlow - төрт түрлі қондыру құралдарын біріктіретін виртуалды скринингке арналған PharmaGrid прототипі. HealthGrid 2009 еңбектерінде 147-том, 3–12 бб. Денсаулық сақтау технологиялары мен информатикасы бойынша зерттеулер, мамыр, 2009 ж.

Сыртқы сілтемелер