Исследование процессов формирования и передачи аудиоинформации с борта летательного аппарата

Средства передачи с борта и их характеристики. Методы и алгоритмы повышения разборчивости речи. Свойства речевых сигналов и слуха, влияющие на нее. Анализ акустических шумов в кабине летательного аппарата. Разработка модели формирования "очищенной" речи.

Рубрика Транспорт
Вид дипломная работа
Язык русский
Дата добавления 19.03.2015
Размер файла 4,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Словесная разборчивость может быть вычислена по формантной разборчивости:

. (4.11)

речь акустический шум разборчивость

5. Модель формирования очищенной речи и ее исследование

5.1 Построение спектрограмм-specgram [10]

В данной работе в качестве основного средства отображения частотно-временных характеристик исследуемых сигналов использованы спектрограммы.

Спектрограмма - это изображение, показывающее зависимость спектральной плотности мощности сигнала от времени. Это очень мощное и современное средство визуализации спектра. Он представляет зависимость амплитуды спектральных составляющих БПФ, вычисляемого в перемещающемся окне, от момента времени, задающего положения окна. Фактически спектрограмма строится в плоскости частота-время, а амплитуда каждой спектральной составляющей определяет цвет построения каждой точки спектрограммы. При построении спектрограммы используется функциональная окраска - рисунок 5.1,например.

Рисунок 5.1 График зависимости плотности спектральных составляющих от частоты

Из рисунка видно, что спектрограмма в качестве средства отображения очень наглядна.

Особенности, которые видны на спектрограмме:

- Горизонтальные линии на НЧ и СЧ - это гудящие наводки (часть шума);

- Узорчатый фон на всех частотах - это широкополосный шум;

- Волнистые линии - это гармоники голоса;

- Вертикальные светлые области на СЧ и ВЧ - это шипящие и свистящие согласные;

- Шумовое облако в районе 2 секунды - это вдох;

- Вертикальные штрихи в районе 1.7 секунды - это слюни, сопровождающие открывание рта.

Алгоритм вычисления спектрограмм содержит три характерных шага:

1. Разбивка x на перекрывающиеся блоки, на каждый из которых накладывается окно.

2. Выполнение nttf - точечного БПФ для соответствующего отрезка времени, что создает соответствующий столбец матрицы B, после чего окно перемещается на число точек, равное (length(window)-numoverlap). Если число точек БПФ превышает количество отсчетов в окне, то перед выполнением БПФ блок дополняется нулями.

3. При вещественных компонентах x спектрограмма строится для положительных частот, и матрица B содержит при четном nfft( nfft/2)+1 строк, а при nfft нечетном - (nfft+1)/2 строк, и k=fix((n-numerlap)/(length(window) - numerlap)) столбцов.

Спектр зашумленного сигнала представляет собой сумму спектров речевого сигнала и шума. Следовательно, подавить шум в речевом сигнале можно путем вычитания из спектра зашумленного сигнала спектр шума. В результате мы получим спектр очищенного речевого сигнала. Сложность данной задачи заключается в том, что необходимо оценить спектр шума, используя смесь речь+шум, которая доступна для обработки. Рассмотрим один из классов шумов - аддитивные стационарные шумы.

Аддитивность означает, что шум суммируется с "чистым" сигналом y[t] и не зависит от него: x[t] = y[t] + noise[t].

Стационарность означает, что свойства шума (мощность, спектральный состав) не меняются во времени.

Примерами таких шумов могут являться постоянное шипение микрофона или усилительной аппаратуры, гул электросети. Работа различных приборов, не меняющих звучания по времени (вентиляторы, компьютеры) также может создавать шумы, близкие к стационарным. Не являются стационарными шумами различные щелчки, удары, шелест ветра, шум автомобилей.

Для подавления аддитивных стационарных шумов существует алгоритм спектрального вычитания.

5.2 Шумоподавление на основе алгоритма спектрального вычитания

Этапы алгоритма спектрального вычитания:

1. Разложение сигнала с помощью кратковременного преобразования Фурье (STFT) или другого преобразования, компактно локализующего энергию сигнала (рисунок 5.3).

2.Оценка спектра шума (рисунок 5.4).

3."Вычитание" амплитудного спектра шума из амплитудного спектра сигнала.

4.Обратное преобразование STFT - синтез результирующего сигнала (рисунок 5.5).

В качестве банка фильтров рекомендуется использовать STFT с окном Ханна, длиной порядка 50 мс и степенью перекрытия 75%. Амплитуду весового окна надо отмасштабировать так, чтобы при выбранной степени перекрытия окон банк фильтров не менял общую амплитуду сигнала в отсутствие обработки.

Рисунок 5.2 Наложение весовых окон Ханна в процессе STFT

Оценка спектра шума может осуществляться как автоматически, путем поиска участков минимальной энергии в каждой частотной полосе, так и вручную, путем анализа спектра на временном сегменте, который пользователь идентифицировал как шум.

Вычитание амплитудных спектров может осуществляться по формуле

(5.1)

что эквивалентно следующей функции подавления:

. (5.2)

Здесь X[f,t] и W[f,t] - амплитудные спектры сигнала и шума соответственно, - амплитудный спектр результирующего очищенного сигнала, а k - коэффициент подавления. Фазовый спектр очищенного сигнала полагается равным фазовому спектру зашумленного сигнала.

Рисунок 5.3. Спектрограмма зашумленного сигнала

На спектрограмме рисунок 5.3 цифрами показаны участки с шумом, соответствующие им спектрограммы приведены ниже на рисунке 5.4.

а б

в г

Рисунок 5.4 Спектрограммы шумов: а) Спектрограмма шума на участке 1; б) Спектрограмма шума на участке 2; в) Спектрограмма шума на участке 3; г) Спектрограмма шума на участке 4

Рисунок 5.5. После спектрального вычитания

Исследования качества и разборчивости речи, получаемой в результате применения описанной методики, показали, что в тех случаях, когда шум или помеха имеют стационарный (или квазистационарный) характер и их спектр имеет гармоническую структуру, достигается значительное на слух повышение как качества так и разборчивости речи. Однако, в случае шумов с быстроизменяющимися спектральными характеристиками такая обработка малоэффективна. Для этих шумов необходимо применить адаптивную фильтрацию.

5.3 Адаптивное шумоподавление на основе спектрального вычитания

Процесс адаптивной фильтрации предполагает непрерывное определение пауз в речи и нахождение спектров шумов в этих паузах, с последующим вычитанием на интервале с речью.

Последовательность действий при адаптивной фильтрации включает в себя:

1. Для выделения шумового участка происходит оценка мощности сигнала (если мощность сигнала становится меньше порога речи, то происходит оценка шума и формируется фильтр).

2. Разложение сигнала с помощью кратковременного преобразования Фурье (STFT) (рисунок 5.6).

3.Оценка спектра шума (рисунок 5.7).

4. После появления события превышение порога мощности происходит "Вычитание" амплитудного спектра шума из амплитудного спектра сигнала.

5.Обратное преобразование STFT - синтез результирующего сигнала (рисунок 5.8).

На рисунке 5.6 приведена спектрограмма зашумленного речевого сигнала. Цифрами указаны участки с шумом. Соответствующие им спектрограммы приведены ниже на рисунке 5.7.

Рисунок 5.6. Спектрограмма зашумленного сигнала

а б

в г

д

Рисунок 5.7 Спектрограммы шумов: а) Спектрограмма шума на участке 1, б) Спектрограмма шума на участке 2, в) Спектрограмма шума на участке 3, г) Спектрограмма шума на участке 4, д) Спектрограмма шума на участке 5

Рисунок 5.8. Спектральное вычитание на первом временном отрезке

Рисунок 5.9 Спектральное вычитание на втором временном отрезке

Рисунок 5.10 Спектральное вычитание на третьем временном отрезке

Рисунок 5.11 Спектральное вычитание на четвертом временном отрезке

Рисунок 5.12 Спектральное вычитание на пятом временном отрезке

5.4 Адаптивное подавление акустических шумов методом наименьших квадратов

На рисунке 5.13 изображена схема использования алгоритма наименьших квадратов (МНК алгоритм) для вычитания помехи из входного сигнала. Адаптивный LMS фильтр использует опорный сигнал на входном порту и полезный сигнал на эталонном порту для автоматического уравновешивания ответа с фильтра. По мере приближения модели к правильной модели фильтра, помеха фильтрации вычитается, и ошибочный сигнал содержит только изначальный сигнал.

Рисунок 5.13 Схема моделирования адаптивного подавителя акустических шумов по методу наименьших квадратов

Рисунок 5.14 Спектр исходного сигнала

Рисунок 5.15 Спектр зашумленного сигнала

Рисунок 5.16 Спектр сигнала после шумоподавления адаптивным подавителем акустических шумов по методу наименьших квадратов

5.5 Сходимость Адаптивных фильтров

На рисунке 5.18 приведен пример, который показывает траектории сходимости, присущие различным адаптивным алгоритмам фильтрования. График - последовательность точек формы (w1, w2) где w1 и w2 - веса адаптивного фильтра. Синие точки в числе указывают контурные линии ошибочной поверхности. Каждый из адаптивных фильтров можно включать по отдельности.

LMS - алгоритм адаптивной фильтрации по критерию наименьшего среднеквадратичного отклонения;

NLMS- нормированный LMS алгоритм;

SELMS- алгоритм LMS, для адаптации используется только знак сигнала ошибки (sign_error);

SSLMS- алгоритм LMS, для адаптации используются только знаки cигнала ошибки и данных, содержащихся в линии задержки фильтра (sign_sign);

Рисунок 5.17 Схема моделирования сходимости адаптивных фильтров

Описание блоков схемы моделирования сходимости адаптивных фильтров.

На рисунке ниже приведены графики сходимости адаптивных фильтров.

Рисунок 5.18 Графики сходимости адаптивных фильтров

Из графика сходимости адаптивных фильтров, изображенного на рисунке 5.18, видно что наиболее быстросходимым является LMS фильтр.

5.6 Медианная фильтрация [11, 12, 13].

Для очистки сигналов от импульсных шумов эффективным является медианный фильтр. Структурная схема медианного фильтра приведена на рисунке 5.19.

Рисунок 5.19 Структурная схема медианного фильтра

Принцип фильтрации. Медианы давно использовались и изучались в статистике как альтернатива средним арифметическим значениям отсчетов в оценке выборочных средних значений. Медианой числовой последовательности х1, х2, … , хn при нечетном n является средний по значению член ряда, получающегося при упорядочивании этой последовательности по возрастанию (или убыванию). Для четных n медиану обычно определяют как среднее арифметическое двух средних отсчетов упорядоченной последовательности.

Медианный фильтр представляет собой оконный фильтр, последовательно скользящий по массиву сигнала, и возвращающий на каждом шаге один из элементов, попавших в окно (апертуру) фильтра. Выходной сигнал yk скользящего медианного фильтра шириной 2n+1 для текущего отсчета k формируется из входного временного ряда …, xk-1, xk, xk+1,… в соответствии с формулой:

yk = med(xk-n, xk-n+1,…, xk-1, xk, xk+1 ,…, xk+n-1, xk+n), (5.3)

где med(x1, …, xm, …, x2n+1) = xn+1, xm - элементы вариационного ряда, т.е. ранжированные в порядке возрастания значений xm: x1 = min(x1, x2,…, x2n+1) ? x(2) ? x(3) ? … ? x2n+1 = max(x1, x2,…, x2n+1).

Таким образом, медианная фильтрация осуществляет замену значений отсчетов в центре апертуры медианным значением исходных отсчетов внутри апертуры фильтра. На практике апертура фильтра для упрощения алгоритмов обработки данных, как правило, устанавливается с нечетным числом отсчетов, что и будет приниматься при рассмотрении в дальнейшем без дополнительных пояснений.

Одномерные фильтры. Медианная фильтрация реализуется в виде процедуры локальной обработки отсчетов в скользящем окне, которое включает определенное число отсчетов сигнала. Для каждого положения окна выделенные в нем отсчеты ранжируются по возрастанию или убыванию значений. Средний по своему положению отчет в ранжированном списке называется медианой рассматриваемой группы отсчетов. Этим отсчетом заменяется центральный отсчет в окне для обрабатываемого сигнала. В силу этого медианный фильтр относится к числу нелинейных фильтров, заменяющим медианным значением аномальные точки и выбросы независимо от их амплитудных значений, и является устойчивым по определению, способным аннулировать даже бесконечно большие отсчеты.

Алгоритм медианной фильтрации обладает явно выраженной избирательностью к элементам массива с немонотонной составляющей последовательности чисел в пределах апертуры и наиболее эффективно исключает из сигналов одиночные выбросы, отрицательные и положительные, попадающие на края ранжированного списка. С учетом ранжирования в списке медианные фильтры хорошо подавляют шумы и помехи, протяженность которых составляет менее половины окна. Стабильной точкой является последовательность (в одномерном случае) или массив (в двумерном случае), которые не изменяются при медианной фильтрации. В одномерном случае стабильными точками медианных фильтров являются "локально-монотонные" последовательности, которые медианный фильтр оставляет без изменений. Исключение составляют некоторые периодические двоичные последовательности.

Благодаря этой особенности, медианные фильтры при оптимально выбранной апертуре могут сохранять без искажений резкие границы объектов, подавляя некоррелированные и слабо коррелированные помехи и малоразмерные детали. При аналогичных условиях алгоритмы линейной фильтрации неизбежно «смазывает» резкие границы и контуры объектов. На рисунке 5.20 приведен пример обработки сигнала с импульсными шумами медианным и треугольным фильтрами с одинаковыми размерами окна N=3. Преимущество медианного фильтра очевидно.

Рисунок 5.20 Обработка сигнала с импульсными шумами медианным и треугольным фильтрами

В качестве начальных и конечных условий фильтрации обычно принимаются концевые значения сигналов, либо медиана находится только для тех точек, которые вписываются в пределы апертуры.

На рисунке 5.21 приведен пример медианной фильтрации модельного сигнала ak, составленного из детерминированного сигнала sk в сумме со случайным сигналом qk, имеющим равномерное распределение с одиночными импульсными выбросами. Окно фильтра равно 5. Результат фильтрации - отсчеты bk.

Рисунок 5.21 Медианная фильтрации модельного сигнала ak

Пользуясь схемой 5.19 пропустим полезный сигнал, ссумированный с шумом через медианный фильтр.

На рисунке 5.22 изображена спектрограмма суммированного полезного сигнала с шумом. Вертикальная линия в районе 6 секунды - это щелчок.

Рисунок 5.22 Спектрограмма полезного сигнала с шумом

На рисунке 5.23 изображена спектрограмма после медианной фильтрации.

Рисунок 5.23 Спектрограмма после медианной фильтрации

6. Исследование влияния канала передачи информации на конечное качество речевого сигнала

В качестве канала передачи был выбран готовый вариант, реализованный средствами MatLab -спутниковый канал CDMA 2000.

Схема моделирования спутникового канала CDMA 2000 приведена на рисунке 6.1

Рисунок 6.1 Схема моделирования спутникового канала CDMA 2000

Для исследования сквозного канала передачи рассмотрено прохождение речевого сигнала от источника (кабины) до потребителя (диспетчера). При этом использованы разработанные выше модели, скомпонованные как представлено на схеме рисунок 6.2.

В ходе исследования варьировались типы голосовых сообщений, типы шумовых воздействий, алгоритмы шумоподавления и виды оценок.

При проведении исследований использовалась одна и та же исходная речевая последовательность длительностью 13 секунд. Оценка ее формантной разборчивости 41%, а словесной 97%.

Рисунок 6.2 Структурная схема прохождения речевого сигнала от источника (кабины) до потребителя (диспетчера)

Данные исследований округлены до целых значений.

В таблицах, приведенных ниже, Ф1- это Спектральное вычитание;

Ф2- Адаптивное шумоподавление на основе спектрального вычитания;

Ф3- Адаптивное подавление акустических шумов методом наименьших квадратов.

Таблица 6.1 Стационарный Белый шум

С/Ш, Дб

РАЗБОРЧИВОСТЬ

Тип

До очистки

После фильтра

После канала передачи

Ф1

Ф2

Ф3

Ф1

Ф2

Ф3

-18,7

Формантная, %

5

5

5

Испытания не проводились

5

5

Испытания не проводились

Словесная, %

4

14

16

12

15

-14,7

Формантная, %

5

5

5

5

5

Словесная, %

8

18

20

16

19

-10,7

Формантная, %

5

6

6

6

6

Словесная, %

19

29

31

27

30

-0,7

Формантная, %

11

19

20

27

19

Словесная, %

70

80

82

78

81

Таблица 6.2 Стационарный Розовый шум

С/Ш, Дб

РАЗБОРЧИВОСТЬ

Тип

До очистки

После фильтра

После канала передачи

Ф1

Ф2

Ф3

Ф1

Ф2

Ф3

-18,7

Формантная, %

2

5

5

Испытания не проводились

5

5

Испытания не проводились

Словесная, %

2

12

14

11

13

-14,7

Формантная, %

5

5

5

5

5

Словесная, %

5

15

17

13

16

-10,7

Формантная, %

5

6

6

6

6

Словесная, %

17

27

29

25

28

-0,7

Формантная, %

11

16

19

15

19

Словесная, %

68

78

80

76

79

Таблица 6.3 Стационарный Коричневый шум

С/Ш, Дб

РАЗБОРЧИВОСТЬ

Тип

До очистки

После фильтра

После канала передачи

Ф1

Ф2

Ф3

Ф1

Ф2

Ф3

-18,7

Формантная, %

5

5

5

Испытания не проводились

5

5

Испытания не проводились

Словесная, %

5

15

17

13

16

-14,7

Формантная, %

5

6

6

5

6

Словесная, %

14

24

26

22

25

-10,7

Формантная, %

8

8

8

7

8

Словесная, %

34

44

46

42

45

-0,7

Формантная, %

27

41

41

32

41

Словесная, %

88

95

96

93

95

Таблица 6.4 Стационарный шум- шум двигателя в крейсерском режиме полета

С/Ш, Дб

РАЗБОРЧИВОСТЬ

Тип

До очистки

После фильтра

После канала передачи

Ф1

Ф2

Ф3

Ф1

Ф2

Ф3

-18,7

Формантная, %

5

6

6

6

5

6

6

Словесная, %

20

25

30

28

23

28

26

-14,7

Формантная, %

6

7

7

7

7

7

7

Словесная, %

35

40

45

43

38

43

41

-10,7

Формантная, %

7

9

9

9

8

9

9

Словесная, %

45

50

55

53

48

53

51

-0,7

Формантная, %

20

29

41

30

28

35

29

Словесная, %

82

92

97

94

90

95

92

Таблица 6.5 Нестационарный шум- шум двигателя самолета на взлете

С/Ш, Дб

РАЗБОРЧИВОСТЬ

Тип

До очистки

После фильтра

После канала передачи

Ф1

Ф2

Ф3

Ф1

Ф2

Ф3

-18,7

Формантная, %

5

5

6

6

5

6

6

Словесная, %

20

21

30

28

19

28

26

-14,7

Формантная, %

7

7

9

9

7

9

8

Словесная, %

42

43

52

50

41

50

48

-10,7

Формантная, %

11

10

15

13

10

13

12

Словесная, %

64

65

74

72

63

72

70

-0,7

Формантная, %

12

21

35

29

20

29

28

Словесная, %

85

86

95

93

84

93

91

Таблица 6.6 Нестационарный шум- воздействие других голосов

С/Ш, Дб

РАЗБОРЧИВОСТЬ

Тип

До очистки

После фильтра

После канала передачи

Ф1

Ф2

Ф3

Ф1

Ф2

Ф3

-18,7

Формантная, %

5

6

6

6

6

6

6

Словесная, %

20

30

32

30

28

30

28

-14,7

Формантная, %

5

7

7

7

7

7

7

Словесная, %

30

40

42

41

38

40

39

-10,7

Формантная, %

9

10

10

10

9

10

9

Словесная, %

50

60

62

61

58

60

59

-0,7

Формантная, %

17

25

28

25

22

25

22

Словесная, %

79

89

91

89

87

89

87

По проведенным выше исследованиям можно сделать вывод, что при различных соотношениях сигнал-шум наибольшее повышение разборчивости дает адаптивный алгоритм шумоподавления на основе спектрального вычитания.

Оценивая разборчивость речи на выходе канала передачи, адаптивный алгоритм шумоподавления на основе спектрального вычитания также обеспечивает хорошую разборчивость. Выбранный канал передачи незначительно влияет на разборчивость речи.

Заключение

Данная дипломная работа была направлена на исследование возможности улучшения характеристик канала связи с центром управления (диспетчером).

В ходе исследования были решены следующие задачи:

- Рассмотрены имеющиеся и перспективные каналы передачи с борта летательного аппарата;

- Проанализированы алгоритмы и средства повышения разборчивости речи;

- Рассмотрены методы распознавания речи и выбраны методы оценки разборчивости речи;

- Исследованы и классифицированы виды аудио шумов в кабине, мешающих распознаванию речи;

- Разработана модель формирования «очищенной» речи;

- Выбран и построен канала связи;

- Исследована эффективность предложенного формирователя.

Список использованной литературы

1. Покровский Н.Б. Расчет и измерение разборчивости речи. - М., Связьиздат, 1962, 390с.

2. Железняк В.К., Макаров Ю.К., Хорев А.А. Некоторые методические подходы к оценке эффективности защиты речевой информации//Специальная техника. - М.: 2000.- № 4.

3. ГОСТ Р 50840-95. Государственный стандарт Российской Федерации. Передача речи по трактам связи. Методы оценки качества, разборчивости и узнаваемости. Издание официальное. - М.: Госстандарт России, 1997.

4. Вахитов Я.Ш. Слух и речь. - Л., изд.ЛИКИ, 1973.

5. Сапожков М.А., Михайлов В.Г. Вокодерная связь. - М., Радио и связь,1983,247с.

6. Хорев А.А., Макаров Ю.К. К оценке эффективности защиты акустической (речевой) информации

7. Ковалгин Ю.А., Володин Э.И. Цифровое кодирование звуковых сигналов. С-Пб, КОРОНА принт, 2004, 231с.

8. Котович А.Е., Рябенький В.М. Спектрально-адаптированные нормы защиты речевой информации от утечки по акустическому каналу. - Безопасность информации, №1(9), 1998,сс.32-35.

9. Хекл М., Мюллер Х.А. Справочник по технической акустике. - Л., Судостроение, 1980.

10. Владимир Дьяконов, Ирина Абраменкова “Matlab. Обработка сигналов и изображений” Специальный справочник. - СПБ.: Питер, 2002.-600 с.: ил.

11. Яровой Н.И. Адаптивная медианная фильтрация.

12. Черненко С.А. Медианный фильтр.

13. Радченко Ю.С. Эффективность приема сигналов на фоне комбинированной помехи с дополнительной обработкой в медианном фильтре. - "Журнал радиоэлектроники", №7, 2001.

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.