Сөйлеуді қабылдаудың сапалық өлшемі - Perceptual Speech Quality Measure

Сөйлеуді қабылдаудың сапалық өлшемі (PSQM) - анықталған есептеу және модельдеу алгоритмі ITU Ұсыныс ITU-T Дауыс диапазонының (300 - 3400 Гц) дауыстық сапасын объективті түрде бағалайтын және сандық анықтайтын P.861 сөйлеу кодектері.Оларды өнімділікті дәрежелеу үшін қолдануға болады сөйлеу кодектері әр түрлі сөйлеу деңгейімен, сөйлеушілермен, бит жылдамдығымен және кодтармен. ITU-T P.861 алынып тасталды және оны P.862 (PESQ ) сөйлеуді бағалаудың жетілдірілген алгоритмін қамтиды.

Неліктен ол қолданылады

PSQM стандартын қолдану автоматтандырылған, имитациялық тестілеу әдістемелеріне сөйлеу айқындығын және берілген дауыс сапасын объективті түрде бағалауға мүмкіндік береді. Осы тестілеуді жеңілдету үшін әртүрлі бағдарламалық жасақтама және / немесе аппараттық өнімдер жасалды. Бұл дауыстық сигналдарды субъективті бағалау және дауыс сапасын бағалау үшін адамдардың үлкен топтарын пайдаланудың дәстүрлі тәжірибесінде шығындар мен уақытты айтарлықтай үнемдеуге әкеледі. Оның үстіне, ол сенімді және қайталанатын объективті нәтижелер береді. Бұл жоғары деңгейге қол жеткізуге міндетті телефон байланысы операторлары үшін өте маңызды Қызмет сапасы стандарттар.

Алгоритм

PSQM жіберілген дауыстық сигналдарды алдын-ала және кейінгі талдау үшін психоакустикалық математикалық модельдеуді (перцептивті және когнитивті) пайдаланады, бұл сигнал сапасының нашарлауының өлшемі болып табылатын және 0-ден (деградация жоқ) 6,5-ке дейін (ең жоғары деградация) PSQM мәнін береді. Өз кезегінде, бұл нәтиже а-ға аударылуы мүмкін пікірдің орташа мәні (MOS), бұл сандық шкала бойынша қабылданған ақпараттың қабылданған сапасының 1-ден 5-ке дейінгі аралықта қабылданған өлшемі болып табылады, 1 мәні қабылданбаған, сапасыз дауысты білдіреді, ал 5 мәні ешқандай дау тудырмайтын дауыстың жоғары сапасын білдіреді.

PSQM алгоритмі физикалық-домендік сигналдарды уақыттық-жиіліктік картаға түсіру, жиіліктің қисаюы және интенсивтіліктің қисаюы сияқты сызықтық емес процестердің сериясы арқылы сезінетін мағыналы психоакустикалық доменге айналдырады.

Кодталған сөйлеудің сапасы ішкі көріністегі айырмашылықтарға байланысты бағаланады. Айырмашылық уақыт пен жиіліктің функциясы ретінде шудың бұзылуын есептеу үшін қолданылады. PSQM алгоритмі перцептивті модельдеуден басқа, субъективті және объективті өлшеулер арасындағы жоғары корреляцияларды алу үшін дыбыстық деңгей масштабтау және асимметриялық маскировка сияқты когнитивті модельдеуді қолданады.

Шектеулер

Бастапқыда ойластырылған PSQM желіні есепке алу үшін әзірленбеген Қызмет сапасы жиі кездесетін мазасыздықтар IP арқылы дауыс беру пакеттердің жоғалуы, дисперсияның кешігуі (дірілдеу) немесе дәйекті емес пакеттер сияқты қосымшалар. Бұл жағдайлар, әдетте, желінің ауыр жүктемесін модельдеу кезінде орынсыз нәтижелер береді, бұл дауыстың сапалық деңгейінің нақты жоғалуын ескермейді. Пакеттің үлкен жоғалуын енгізу арқылы желінің ақауларын қайталауға тырысу жалған көтерілгенге сәйкес келетін PSQM мәндеріне әкеледі MOS құндылықтар.

Осы шектеуден шығу үшін PSQM + бастапқы алгоритмді өзгерту арқылы жасалды. PSQM + қолайсыз өнімділікті дәлірек көрсететін нәтижелер шығарады сөйлеу кодектері нақты желі жүктемесі жағдайында.

Басқа ойлар

Басқа мәселелер әр түрлі бағалау үшін қолданылатын тестілік сигналдарда стандарттаудың болмауына байланысты сөйлеу кодектері. PSQM сенімді және дәйекті қамтамасыз етеді MOS егер сапаны объективті және субъективті бағалау үшін МӘС ұсынылған әдістеріне сәйкес қолданылса, мәндер (ITU-T P.800 / P.830 / P.861). Бұл ұсыныстарға -20дБ орташа деңгейінде ерлердің де, әйелдердің де дауыстық анықтамалық сигналдарын қолдану кіреді[түсіндіру қажет ]. Дауыстың немесе сигналдың түрі, жынысы, ұзақтығы, пайдасы PSQM мәніне немесе MOS баллына шекті деңгейлерге, қоңыраулар санына және қоршаған ортаның басқа конфигурация параметрлеріне аз әсер етуі мүмкін. Дауыстық сапа өлшемдерін салыстыру кезінде сигнал, қоршаған орта және конфигурацияларды ескеру қажет.

Көптеген сөйлеу кодектері бар және әртүрлі қосымшаларда қолданылады. Жүйе талаптарын сәйкестендіру үшін тиісті сөйлеу кодектерін мұқият таңдау қажет. Жалпыға ортақ тізім сөйлеу кодектері және олармен байланысты әртүрлі PSQM / PSQM + алынған MOS мәндері желінің әр түрлі жүктеме жағдайларында алынған.

Әдебиеттер тізімі

  • ITU-T ұсынысы P.861 (қайтарып алынды) Телефон диапазонындағы (300–3400 Гц) сөйлеу кодектерінің объективті сапасын өлшеу. P.861 қолданудың белгілі бір салаларында шектеулер бар деп танылды. Оның орнына сөйлеу сапасын бағалаудың жетілдірілген объективті алгоритмі бар П.862 келді.
  • ITU-T ұсынысы П.862: Сөйлеу сапасын перцептивті бағалау (PESQ): тар диапазондағы телефон желілері мен сөйлеу кодектерінің сөйлеу сапасын ұштастыра бағалаудың объективті әдісі
  • https://secure.aes.org/forum/pubs/journal/?elib=6957

Сондай-ақ қараңыз