Оцінювання якості алгоритмів корекції мовленнєвих сигналів

Порівняння якості алгоритмів компенсації шумової завади при використанні препроцесорів корекції мовленнєвого сигналу (алгоритм спектрального віднімання, MMSE, logMMSE) та оцінювання потенційних можливостей показників якості, що застосовуються при цьому.

Рубрика Коммуникации, связь, цифровые приборы и радиоэлектроника
Вид статья
Язык украинский
Дата добавления 15.08.2015
Размер файла 160,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Національний технічний університет України «Київський політехнічний інститут»

Оцінювання якості алгоритмів корекції мовленнєвих сигналів

Продеус А.М.

03056, Київ, вул. Політехнічна 16, тел. (044) 454 90 72

E-mail: aprodeus@gmail.com

В наш час, із поширенням мобільних комунікаційних пристроїв, актуальною є проблема підвищення стійкості систем автоматичного розпізнавання мовлення (САРМ) до дії завад шляхом використання препроцесорів корекції мовленнєвого сигналу (рис. 1).

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Рис. 1 - Препроцесор корекції мовленнєвого сигналу у складі САРМ

Метою даної роботи є, по-перше, порівняння якості п'яти алгоритмів компенсації шумової завади, а по-друге, оцінювання потенційних можливостей дев'яти показників якості, що застосовуються при такому порівнянні.

Розглянуто алгоритми спектрального віднімання, MMSE, logMMSE [1], Wiener-TSNR, Wiener-HRNR [2]. Всі ці алгоритми належать до групи так званих алгоритмів «частотної корекції», згідно яких корекція спотвореного сигналу здійснюється за співвідношенням

де та - спектри потужності сигналу та відновленого сигналу , - частотна характеристика фільтра, що коригує. В якості фази відновленого сигналу приймається фаза сигналу .

Оскільки коректор входить до складу САРМ, для оцінювання його якості доцільно використовувати показник «точність розпізнавання слів» [3]:

,

де - загальна кількість слів, що їх розпізнають; - кількість помилкових видалень слів; - кількість замінених слів; - кількість помилково вставлених слів. Недоліком показника Асс% є необхідність моделювання САРМ, що є досить складним завданням.

Для усунення цього недоліку, доцільно дослідити можливості «проміжних» показників (рис. 1). Серед таких в даній роботі розглянуто: сегментне відношення сигнал-шум SSNR, логарифмічно-спектральне спотворення LSD, логарифмічне відношення правдоподібності LLR, дистанція зважених спектральних схилів WSS, дистанція Ітакури-Саіто, кепстральна дистанція, композитний показник , перцептуальні оцінки якості мовлення BSD та PESQ [4].

Як і очікувалося, наскрізний показник Acc% вичерпно характеризує якість алгоритмів корекції мовленнєвих сигналів у складі САРМ (рис. 2).

Рис. 2 - Залежність Асс% від вхідного відношення сигнал-шум

Серед «проміжних» показників, що досліджувалися, лише два - LRR та SCI - непогано узгоджуються із показником Асс% (рис. 3), констатуючи низьку якість алгоритмів Wiener-TSNR та Wiener-HRNR.

А

Б

Рис. 3 - Залежність LLR (а) та SCI (б) від вхідного відношення сигнал-шум

Але, як бачимо, суттєвим недоліком показників LRR та SCI є те, що одержані за їх допомогою оцінки носять якісний характер. Крім того, показники LRR та SCI, на відміну від Acc%, не спроможні відобразити досить суттєву різницю в ефективності алгоритмів спектрального віднімання, MMSE та logMMSE.

В подальшому є доцільним дослідити причину несподівано низької ефективності алгоритмів Wiener-TSNR та Wiener-HRNR.

алгоритм якість мовленнєвий сигнал

Література

1. Springer Handbook of Speech Processing / Ed. J. Benesty, M. Sondhi, Y. Huang - Berlin Heidelberg: Springer-Verlag, 2008. - 1176 p.

2. Plapous C., Improved Signal-to-Noise Ratio Estimation for Speech Enhancement / C. Plapous, C. Marro, P. Scalart // IEEE Transactions on Audio, Speech, and Language Processing, Vol. 14, Issue 6, Nov. 2006. - P.2098-2108.

3. The HTK Book / Ed. S. Young, G. Evermann, M. Gales. - Cambridge: University Engineering Department, 2009. - 375 p.

4. Hu, Y. and Loizou, P. Evaluation of objective quality measures for speech enhancement / Y. Hu, P. Loizou // IEEE Transactions on Speech and Audio Processing, 16(1), 2008. - P. 229-238.

Размещено на Allbest.ru


Подобные документы

  • Розрізнення як найголовніший параметр якості при передаванні документів, існуючі режими розрізнення факс-апаратів. Історія стандартизації факсимільного зв'язку. Опис алгоритмів стиснення інформації та опціональність корекції помилок при передачі факсів.

    реферат [14,3 K], добавлен 14.11.2010

  • Характеристика параметричних моделей випадкових процесів. Особливості методів спектрального оцінювання, апроксимація даних з використанням детермінованої експоненціальної моделі по методу Проні. Автокореляційна функція як часова характеристика сигналу.

    реферат [243,3 K], добавлен 04.12.2010

  • Типи задач обробки сигналів: виявлення сигналу на фоні завад, розрізнення заданих сигналів. Показники якості вирішення задачі обробки сигналів. Критерії оптимальності рішень при перевірці гіпотез, оцінюванні параметрів та фільтруванні повідомлень.

    реферат [131,8 K], добавлен 08.01.2011

  • Технічна діагностика радіоелектронної апаратури. Розробка та обґрунтування процесу контролю якості. Дефекти, які можна виявити при контролі якості. Розробка методики досягнення запланованого рівня якості. Розробка статистичного методу контролю.

    дипломная работа [9,3 M], добавлен 20.06.2012

  • Загальні поняття та визначення щодо якості обслуговування. Класифікація показників якості обслуговування в телекомунікаційних системах. Поняття номінальної пропускної здатності середовища передачі інформації. Складові затримки під час передачі пакетів.

    реферат [84,8 K], добавлен 27.03.2011

  • Типи даних, які використовує Mpeg-4 Visual: статичні текстури, рухомі зображення. Застосування формату стиснення H.264/MPEG-4 Part 10. Аналіз програми MSU Video Quality Measurement Tool. Особливості формату Visual part 2, функції. Основні умови праці.

    дипломная работа [7,0 M], добавлен 05.04.2012

  • Аналіз якості лінійних безперервних систем автоматичного управління. Методи побудови перехідної функції, інтегральні оцінки якості. Перетворення структурної схеми, аналіз стійкості розімкнутої та замкнутої систем. Розрахунок часових та частотних функцій.

    курсовая работа [1,1 M], добавлен 07.03.2014

  • Спектральний аналіз детермінованого сигналу. Дискретизація сигналу Sv(t). Модуль спектра дискретного сигналу та періодична послідовність дельта-функцій. Модулювання носійного сигналу. Амплітудні та фазові спектри неперіодичних та періодичних сигналів.

    курсовая работа [775,5 K], добавлен 05.01.2014

  • Загальні основи побудови мережі Інтернет і протоколу IP. Принципи пакетної передачі мови. Види з'єднань і організація вузла зв’язку у мережі IP-телефонії. Забезпечення якості IP-телефонії на базі протоколів RSVP та MPLS. Протокол встановлення сесії (SIP).

    дипломная работа [2,2 M], добавлен 05.06.2019

  • Короткі відомості про системи автоматичного регулювання та їх типи. Регулятори: їх класифікація та закони регулювання. Розробка моделі автоматичного регулювання в MATLAB/Simulink і побудова кривої перехідного процесу. Аналіз якості функціонування системи.

    курсовая работа [402,4 K], добавлен 20.11.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.