DELPH-IN - DELPH-IN

DELPH-IN
Академиктер
Пән:
Формализм:
Табиғи тілді өңдеу
HPSG, ХАНЫМ
DELPH-IN саммиттері
Ұлықтау:Лиссабон (2005)
Соңғы:DiderotTop (2018)
Алдағы:TBA

Деэп Lингуистік Processing HПСЖ - INқайталанатын (DELPH-IN) - бұл бүкіл әлемдегі есептеу лингвистері дамитын ынтымақтастық табиғи тілді өңдеу үшін құралдар терең лингвистикалық өңдеу адам тілінің.[1] DELPH-IN мақсаты - мәтіндер мен айтылымдардың мағынасын есептеу арқылы түсіну үшін лингвистикалық және статистикалық өңдеу әдістерін біріктіру.

DELPH-IN жасаған құралдар терең лингвистикалық талдау үшін екі лингвистикалық формализмді қабылдайды, яғни. басшылыққа алынған фразалық құрылым грамматикасы (HPSG) және минималды рекурсиялық семантика (ХАНЫМ).[2] DELPH-IN ынтымақтастығындағы барлық құралдар жалпы қолдану үшін әзірленген ашық көзі лицензиялау.

2005 жылдан бастап DELPH-IN жыл сайынғы саммит өткізеді. Бұл еркін құрылымдалған үнсіздік онда адамдар бір-бірімен істеп жатқан жұмысы туралы бір-бірін жаңартады, ағымдағы жұмыс туралы кері байланыс іздейді және анда-санда стандарттар мен озық тәжірибелер туралы келісімдер жасайды.

DELPH-IN технологиялары мен ресурстары

DELPH-IN ынтымақтастығы есептеу құралдарын біртіндеп құрып келеді терең лингвистикалық талдау, сияқты:

Терең лингвистикалық өңдеу құралдарынан басқа, DELPH-IN ынтымақтастығы есептеу ресурстарымен қамтамасыз етеді Табиғи тілді өңдеу мысалы, компьютерлік HPSG грамматикасы және тілдік прототиптер мысалы:

  • DELPH-IN грамматикасы: тиісті тілдерге тән терең лингвистикалық талдау жасау үшін қолдан жасалған HPSG есептеу грамматикасының каталогы [6]
  • LinGO грамматикалық матрицасы: LKB-мен үйлесімді кең ауқымды дәлдік грамматикасын жылдам прототиптеуге арналған ашық бастапқы стартер жиынтығы. Онда компьютерлік грамматиктер өздерінің HPSG грамматикалары үшін мұрагерлік ете алатын жалпыға ортақ тілдік құбылыстардың кітапханасы бар.[7]
  • CLIMB кітапханалары (Матрица негізіндегі салыстырмалы кітапханалар): грамматикалық матрицаға негізделген кеңейтілген тілдік кітапхана. CLIMB кітапханасының мақсаты - әр түрлі тілдерде бір құбылыстың баламалы талдауларын жүргізу, олардың ұзақ мерзімді грамматиканың дамуына әсерін тексеру.[8]

DELPH-IN ресурстарының басқа ауқымы деректерді пайдаланудан айырмашылығы жоқ таяз лингвистикалық өңдеу, сияқты Мәтін_корпус және ағаш жағалаулары:

  • MRS Test Suite: кейбіреулерін алуға арналған қысқа, бірақ репрезентативті сөйлемдер жиынтығы минималды рекурсиялық семантика құбылыстар. Сынақ бөлмелері болгар, ағылшын, француз, неміс, грек, жапон, мандарин, норвег, португал, орыс және испан тілдерінде қол жетімді.[9]
  • Wikiwoods: WikiWoods - бұл талданған корпус бұл ағылшынша Википедияға бай синтакто-семантикалық аннотациялар ұсынады.[10]
  • DeepBank1989 ж. Wall Street Journal мәтінінің бір миллион сөзіне түсініктеме беру үшін жүргізіліп жатқан жоба (Penn Treebank жобасында баяндалған сөйлемдердің дәл сол жиынтығы) ағылшын тілінің грамматикасымен толық қамтылу үшін PCFG-ді жақындатып толықтырды.[11][12]
  • Собор және базар: Эрик Реймондтың «Ашық дереккөзге» арналған көптеген очерктерінің жиынтығы. Бұл әртүрлі грамматикалар бойынша талдауды салыстыруға мүмкіндік беретін көп тілді ортақ тест жиынтығы ретінде ұсынылды.[13][14]

DELPH-IN ынтымақтастығының көзі ашық мәдениеті Табиғи тілді өңдеу массиві бар қоғамдастық терең лингвистикалық өңдеу құралдар мен ресурстар. Алайда, DELPH-IN құралдарының ыңғайлылығы DELPH-IN экологиясы үшін жаңа қолданушылар мен қосымшаларды жасаушыларға қатысты мәселе болды.[дәйексөз қажет ] DELPH-IN әзірлеушілері бұл пайдалану мәселелерін біледі және DELPH-IN технологиялары бойынша оқулықтар мен оқулықтарды жетілдіруге тырысып жатыр.[15]

Сондай-ақ қараңыз

Әдебиеттер тізімі

  1. ^ DELPH-IN: ашық қайнарлы терең өңдеу
  2. ^ Энн Копестейк, Дэн Фликингер, Карл Поллард және Иван А. Саг. 2005 ж. Минималды рекурсиялық семантика: кіріспе. Тіл және есептеу туралы зерттеулер еңбектерінде.
  3. ^ PET Parser веб-сайты
  4. ^ ACE талдаушы / генератордың басты беті
  5. ^ Стефан Оепен, Эрик Велдалдал, Ян Торе Лоннинг, Пол Мейер, Виктория Розен және Дэн Фликингер. 2007 ж.Сапаға бағытталған гибридті аудармаға қарай. Тіл білімі және ықтималдықтар туралы. Машиналық аудармадағы теориялық және әдіснамалық мәселелер бойынша 10-шы Халықаралық конференция материалдары, б.144–153. Скевде, Швеция.
  6. ^ DELPH-IN каталогы
  7. ^ Фоккенс, Анцке, Эмили М.Бендер және Варвара Грачева. 2012 жыл. LinGO Грамматикалық Матрицасын Customize System Documentation. Интернет-ресурс.
  8. ^ Фоккенс, А., Августинова, Т., және Чжан, 2012 ж. Грамматика бойынша өрмелеу: метаграммалық инженерияны қолданатын үш жоба. Тілдік ресурстар және бағалау жөніндегі сегіз халықаралық конференция материалында (LREC’12), Стамбул, Түркия.
  9. ^ MRS Test Suite беті
  10. ^ Дэн Фликингер, Стефан Оепен және Жизль Итрестоль. 2010 жыл. WikiWoods: Ағылшын Уикипедиясына арналған синтакто-семантикалық аннотация. LREC-2010 жинағында, 1665–1671 беттер.
  11. ^ Дэн Фликингер, Валия Кордони және И Чжан. 2012 жыл. DeepBank: Уолл-стрит журналының динамикалық аннотацияланған ағаш банкі. TLT-11 материалында, Лиссабон, Португалия.
  12. ^ DeepBank-тің басты беті
  13. ^ DELPH-IN CatB беті
  14. ^ Ресми собор және Базар веб-парағы
  15. ^ DELPH-IN 2013 Саммиті: Пайдалануға арнайы қызығушылық тобы

Сыртқы сілтемелер