Сөздің қателік коэффициенті - Word error rate

Сөздің қателік коэффициенті (БІР) а-ның жалпы метрикасы сөйлеуді тану немесе машиналық аударма жүйе.

Өнімділікті өлшеудің жалпы қиындығы, мойындалған сөз тізбегінің анықтамалық сөз тізбегінен өзгеше ұзындыққа ие болуында (дұрысы дұрыс). WER-дан алынған Левенштейн қашықтығы, орнына сөз деңгейінде жұмыс жасау фонема деңгей. WER әр түрлі жүйелерді салыстыруға, сондай-ақ бір жүйенің жетілдірілуін бағалауға арналған құнды құрал болып табылады. Өлшеудің бұл түрі, алайда, аударма қателіктерінің табиғаты туралы егжей-тегжейлі мәлімет бермейді, сондықтан негізгі қате көздерін (анықтаушылары) анықтау және кез-келген зерттеу күштерін жұмылдыру үшін қосымша жұмыс қажет.

Бұл мәселе алдымен танылған сөз тізбегін анықтамалық (айтылған) сөздік қатармен динамикалық жолды туралау көмегімен туралау арқылы шешіледі. Бұл мәселені зерттеу күштілік заңы деп аталатын теория арқылы көрінеді, онда түсініксіздік пен сөз қателігінің арақатынасы көрсетілген.[1]

Сөздің қателік коэффициентін келесі түрде есептеуге болады:

қайда

  • S ауыстыру саны,
  • Д. өшіру саны,
  • Мен кірістіру саны,
  • C дұрыс сөздердің саны,
  • N - сілтемедегі сөздер саны (N = S + D + C)

«Жою» мен «кірістірудің» артында тұрған түйсігі гипотезаға сілтемеден қалай шығуға болады. Егер бізде «Бұл - уикипедия» және «Бұл _ википедия» гипотезасы болса, біз оны жою деп атаймыз.

Сөйлеуді тану жүйесінің өнімділігі туралы есеп берген кезде, кейде сөз дәлдігі (WAcc) орнына қолданылады:

Бастап бері екенін ескеріңіз N - сілтемедегі сөздер саны, сөздің қателік коэффициенті 1,0-ден үлкен болуы мүмкін, сондықтан сөздің дәлдігі 0,0-тан аз болуы мүмкін.

Тәжірибелер

Әдетте, сөздің қате жылдамдығы сөйлеуді тану кезінде жоғары дәлдікті көрсетеді, ал жоғары сөз қателігімен салыстырғанда. Алайда, кем дегенде бір зерттеу көрсеткендей, бұл шындыққа сәйкес келмеуі мүмкін. Ішінде Microsoft Research эксперимент көрсеткендей, егер адамдар «түсіну үшін оңтайландыру мақсатына сәйкес келеді» (Ванг, Ацеро және Челба, 2003) бойынша оқытылса, олар төменгі деңгейдегі қателіктерді көрсеткен басқа адамдарға қарағанда тілді түсінудің жоғары дәлдігін көрсететін болады. сөйлеу тілін шынайы түсіну тек сөз танудың жоғары дәлдігіне ғана тәуелді емес екенін көрсете отырып.[2]

Басқа көрсеткіштер

Жоғарыда келтірілген сияқты жалпы формуланы пайдаланудағы бір мәселе, әр түрлі қателіктердің сәтті нәтижеге жету мүмкіндігіне әсерін есепке алмауында, мысалы. кейбір қателер басқаларға қарағанда бұзылуы мүмкін, ал басқалары басқаларға қарағанда оңай түзетілуі мүмкін. Бұл факторлар нақты болуы мүмкін синтаксис сыналып жатыр. Тағы бір проблема, ең жақсы туралау кезінде де, формула алмастыру қатесін біріктірілген жою мен кірістіру қателігін ажырата алмайтындығында.

Хант (1990) орындау дәлдігінің өлшенген өлшемін қолдануды ұсынды, мұнда алмастыру қателері бірлікте өлшенеді, бірақ жою және кірістіру қателері тек 0,5-те өлшенеді, сондықтан:

Алайда Ханттың формуласын бір жүйенің жұмысын бағалау үшін дұрыс қолдануға бола ма, жоқ па, ол туралы біраз пікірталастар бар, өйткені ол анағұрлым әділ бәсекелес кандидаттық жүйелерді салыстыру құралы ретінде жасалған. Берілген синтаксис қателерді түзетуге мүмкіндік бере ме, жоқ па, егер бұл мүмкін болса, бұл процесс қолданушыға қаншалықты оңай болатындығына байланысты тағы бір қиындық туындайды. Осылайша, өнімділік өлшемдерін өлшенетін белгілі бір жүйеге сәйкес жасау керек деген аргументтің белгілі бір мәні бар.

Қай метрика қолданылса да, жүйенің жұмысын бағалаудағы негізгі теориялық проблемалардың бірі - сөздің «дұрыс айтылмағанын», яғни ақаулық қолданушыға немесе танушыға байланысты бола ма, жоқ па деген мәселені шешу болып табылады. Бұл, әсіресе, белгілі бір тілде сөйлемейтіндерге немесе аймақтық екпінмен күресуге арналған жүйеде маңызды болуы мүмкін.

Өлшеу процесінде сөздердің айтылу қарқыны, сонымен қатар субъектілердің өзгергіштік көзі болып табылады, сондай-ақ субъектілердің демалуы немесе дем алуы қажет. Барлық осындай факторларды қандай-да бір жолмен бақылау қажет болуы мүмкін.

Мәтіндік диктант үшін өнімділіктің дәлдігі 95% -дан төмен жылдамдықпен қабылданбайды деп келісілген, бірақ бұл синтаксис және / немесе доменге тән болуы мүмкін, мысалы. тапсырманы орындау үшін пайдаланушыларға уақыт қысымы бар ма, аяқтаудың баламалы әдістері бар ма және т.б.

«Бір сөздің қателік коэффициенті» термині кейде жүйелік лексикадағы әр түрлі сөздердің дұрыс емес танылуының пайызы деп аталады.

Қашықтықты өңдеу

Қате деңгейі сөзін нормаланған ұзындық деп те атауға болады қашықтықты өңдеу.[3] X пен Y арасындағы нормаланған редакциялау қашықтығы, г.(X, Y) W (P) / L (P) минимумы ретінде анықталады, мұндағы P - X пен Y арасындағы түзету жолы, W (P) - P, элементарлы редакциялау операцияларының салмақтарының қосындысы, және L (P) - бұл амалдардың саны (P ұзындығы).[4]

Сондай-ақ қараңыз

Пайдаланылған әдебиеттер

Ескертулер

  1. ^ Клаков, Дитрих; Джохен Питерс (қыркүйек 2002). «Сөздердің қателіктері мен түсініксіздігінің корреляциясын тексеру». Сөйлеу байланысы. 38 (1–2): 19–28. дои:10.1016 / S0167-6393 (01) 00041-3. ISSN  0167-6393.
  2. ^ Ванг, Ю .; Acero, A .; Chelba, C. (2003). Сөз қателіктері сөйлеу тілінің дәлдігін түсінудің жақсы индикаторы ма?. IEEE сөйлеуді автоматты түрде тану және түсіну бойынша семинар. Сент-Томас, АҚШ-тың Виргин аралдары. CiteSeerX  10.1.1.89.424.
  3. ^ Nießen және басқалар (2000)
  4. ^ Нормаланған өңдеу қашықтығын есептеу және қолдану: AndrCs Marzal and Enrique Vidal

Басқа ақпарат көздері