Шумоочистка фонограмм

В некоторых областях человеческой деятельности необходима точная расшифровка звукозаписи речи. В данной статье речь пойдет о проблемах, которые возникают при расшифровке фонограмм, и способах их решения.

Звукозапись речи активно используется как одно из средств обеспечения безопасности в различных направлениях деятельности человека. В частности, на магнитофонной ленте фиксируются устные распоряжения и переговоры экипажей самолетов и больших кораблей, персонала сложных технических объектов, записываются телефонные переговоры различных медицинских, аварийных и правоохранительных служб, некоторых коммерческих организаций. В некоторых случаях требуется фиксация речи и других акустических сигналов в производственных помещениях. Явные и скрытые средства звукозаписи используются для протоколирования оперативной информации в ходе переговоров, встреч, лекций, совещаний, а также во время розыскных, контролирующих и других действий по обеспечению охраны и безопасности.

В ряде случаев низкое качество полученной звукозаписи (фонограммы) создает определенные трудности для расшифровки необходимой информации. Причины этого обычно кроются как в неудачном или неумелом выборе и использовании средств передачи и записи акустической информации, так и в объективной трудности и даже невозможности получения высококачественной, «чистой» записи звука в некоторых конкретных обстоятельствах.

В данной статье мы не будем останавливаться на вопросах выбора микрофонов и других источников съема акустического сигнала, их размещения, организации каналов связи с аппаратурой записи или оптимального выбора звукозаписывающей техники. Этой безусловно важной теме следует посвятить отдельную публикацию. Хотелось бы только отметить, что в большинстве случаев дешевле, проще и полезнее вложить средства и время в техническое и организационное обеспечение процесса звукозаписи хорошего качества, нежели потом пытаться «выжать» необходимую информацию из низкокачественных записей. Например, мы считаем, что для получения оперативной записи звука в серьезных ситуациях малопригодны миниатюрные диктофоны типа «Pearicorder» японской фирмы Olimpus, так как они не обладают необходимыми рабочими характеристиками для звукозаписи тихой и зашумленной речи.

Задачи обработки звукозаписи

При обработке звукозаписи перед техническим специалистом встают следущие задачи:
- установить и отпечатать на бумаге текстовое содержание записанной речи, то есть получить «текстовку»;
- подготовить из исходных звукозаписей необходимый демонстрационный звуковой материал;
- провести максимально возможную очистку речи с удалением помех и искажений;- провести экспертизу звукозаписей.

При проведении экспертизы обычно требуется установить наличие следов умышленного монтажа или копирования звукозаписи; определить тип или идентифицировать конкретный экземпляр звукозаписывающего устройства; констатировать обстоятельства звукозаписи, метод, окружающую обстановку, размещение средств записи звука, тип источника слышимых шумов и т. п,; установить тождество или отличие голоса на данной (спорной) звукозаписи с голосом, образец которого представлен на другой (сравнительной) фонограмме. В некоторых случаях требуется определить по звукозаписи устной речи отличительные особенности диктора (например, пол, возраст, место рождения, профессию, наличие заболеваний и т. п.).

При работе со звукозаписью высокого качества и небольшом объеме записанного материала первые две задачи может решить практически любой пользователь обычного магнитофона, При большом объеме материала только установление точного текстового содержания звукозаписи может потребовать неприемлемо больших временных затрат.

А вот для любой работы с записями звука низкого качества необходим технически грамотный, подготовленный специалист и различные технические средства.

В свою очередь для решения любой экспертной задачи требуется квалифицированный специалист, владеющий специальными методиками, в распоряжении которого должна быть необходимая дополнительная аппаратура.

Текстовка записанной речи

Несмотря на кажущуюся простоту, эта задача имеет свои подводные камни. Для получения текстовки необходимо прослушивать звукозапись и одновременно фиксировать текст на бумаге. Так как писать или печатать текст в темпе произнесения речи обычно не удается, то приходится часто останавливать воспроизведение записи и отматывать магнитофонную ленту назад для повторного прослушивания. В том случае, если создание текстовок проводится эпизодически, то для этого потребуются лишь обычный магнитофон и ручка с листком бумаги или пишущая машинка. Но если такая работа выполняется часто и в больших объемах, требует срочности или вообще является ежедневной рутиной, тогда уместно пользоваться специальным оборудованием.

Понятно, что оптимальным было бы использование чисто автоматического устройства, способного самостоятельно распознавать речь и печатать текст. Авторы данной статьи являются давними сторонниками и разработчиками подобных средств. Однако на сегодняшний день в продаже нет такой техники, обладающей приемлемыми характеристиками (в лучшем случае нужна длительная настройка на конкретного диктора), и рассчитывать на автоматическое распознавание произвольной зашумленной речи в этом веке, по-видимому, не приходится.

Что такое магнитофон-транскрайбер?

Уже давно для получения текстовок звукозаписей используется специальный магнитофон-транскрайбер, управляемый ножной педалью с электронным переключателем «Стоп»/«Воспроизведение»/«0ткат» (фирм Philips, Grundig, Sanyo). Работа с магнитофономтранскрайбером удобнее и производительнее, чем с обычной звуковоспроизводящей техникой. Однако следует указать на серьезные недостатки транскрайберов. В их числе довольно медленная механическая перемотка, малый срок службы (постоянные механические переключения вскоре приводят к отказам), растягивание ленты (это становится недопустимым, если данная кассета единственное вещественное доказательство), низкое качество звука, требующее многократного прослушивания ключевых фрагментов. Много времени занимает сверка, то есть сопоставление фонограммы и текста после распечатки (в ответственных случаях это является обязательной процедурой). Кроме того, при распечатке текста записей в реальном времени (например, когда переговоры еще идут, но уже требуется текстовка высказываний их начального этапа) возникает серьезная проблема с неоднократной сменой кассет в магнитофонах и их срочной доставкой машинистке. Наконец, для очистки звукозаписи от шумов и помех необходимо подключать дополнительные устройства.

Возможности компьютерного транскрайбера

Современные компьютерные транскрайберы (например, «Цезарь-16») лишены вышеперечисленных недостатков. Обычно компьютерный транскрайбер это плата, вставляемая в персональный компьютер, или небольшой блок, соединенный с принтерным портом ПК.

Перед работой к входу транскрайбера подключается диктофон, а к одному из выходов головные телефоны. Оператор вставляет кассету с надиктованным текстом в подключенный диктофон, включает программу транскрайбера и печатает текст звукозаписи, прослушивая необходимые фрагменты в удобном режиме. При этом звукозапись с кассеты параллельно вводится в память компьютера.

Программа транскрайбера обеспечивает оптимальное сочетание свойств современного текстового редактора (для быстрого набора текста) и функций цифрового магнитофона (это обеспечивает качество прослушивания звука). Кроме того, только для цифровых транскрайберов доступны некоторые совершенно новые возможности. Так, с помощью «горячих» клавиш производится управление («Стоп», «Откат», мгновенная «Перемотка, повторное воспроизведение»), установка в тексте маркеров (чтобы отметить фрагмент, к которому следует вернуться для более тщательного прослушивания). Во время работы на экране отражаются счетчики времени воспроизведения и записи звука в ПК. Вся система меню и «горячих» клавиш позволяет наиболее удобно организовать работу.

Так как во время работы звукозапись с кассеты преобразуется в цифровую форму и непрерывно переписывается на жесткий диск ПК, то для оптимального качества звука (полоса частот до 4,5 кГц, динамический диапазон более 70 дБ) на жестком диске ПК требуется 36 Мбайт свободного пространства на каждые полчаса речи. Практика показывает, что применение каких-либо методов сжатия потока речевой информации для транскрайбера нецелесообразно, так как при этом неизбежно ухудшается качество звука и утомляется оператор.

Программной «изюминкой» изделия является обеспечение режима дуплекса, то есть режима непрерывной записи звука на жесткий диск ПК при одновременном воспроизведении звука с того же диска, но с любого произвольно выбранного места этой или любой другой, ранее введенной цифровой звукозаписи. Режим дуплекса позволяет сразу же начинать обработку звукозаписи, не дожидаясь завершения ввода в ПК.

Преимуществом компьютерного транскрайбера является то, что кассета переписывается только один раз, и важные звукозаписи, как и сам магнитофон, не изнашиваются от многочисленных включений, выключений и перемоток. В то же время малоразборчивые места звукозаписи могут быть правильно распечатаны благодаря многократному прослушиванию в «кольце» с замедленным воспроизведением записи без искажения тембра звучания.

Кроме того, последние модели цифровых транскрайберов обладают еще одним чрезвычайно полезным свойством — они автоматически связывают набираемый текст с соответствующим звуковым рядом. Это дает уникальную возможность оперативно сверять текстовые распечатки и исходные звукозаписи, что обязательно требуется при документировании ответственных материалов. Все спорные вопросы могут быть легко решены, так как по любому фрагменту текста автоматически вызывается соответствующий ему звуковой фрагмент, а по выбранному участку звукозаписи сразу же находится текст.

Использование цифровых транскрайберов позволяет не только сократить время подготовки документов и снизить вероятность ошибок, но и повысить общую эффективность и комфорт профессиональной деятельности. Они прошли тщательную практическую проверку и показали свою эффективность для оперативного делопроизводства в аппарате органов правопорядка и прокуратуры, в банках, больницах и других организациях.

Транскрайберы с шумоочисткой

Дополнительные преимущества пользователю предоставляют компьютерные транскрайберы со встроенными аппаратными средствами шумоочистки. Например, в изделии «Цезарь16Ш» прямо на плате ввода/вывода речи расположены специальные процессоры обработки сигналов, которые позволяют автоматически удалять помехи. Управление такой шумоочисткой достаточно простое и доступно обычной машинистке. Несмотря на то, что такие транскрайберы не обладают всеми возможностями специализированных АРМ по шумоочистке, они вполне достаточны и чрезвычайно полезны во многих ситуациях. Можно отметить, что по своим «шумоочищающим» качествам данные транскрайберы превосходят такие отечественные изделия, как АФ-512, КОРС, ПАКОРС, Золушка-Моно, зарубежные DAC-256.

Расшифровка низкокачественных записей устной речи

Процедура повышения качества речевого сигнала звукозаписи преследует две цели. Во-первых, помочь оператору установить точное текстовое содержание исходной звукозаписи. Во-вторых, удалить шумы и искажения, чтобы неподготовленные слушатели (например, розыскники и охранники, руководители, судьи, публичная аудитория) могли удовлетворительно понять содержание фонограммы. Для решения этих задач используются разные методы и средства.

Оператор во время работы с записанной речью старается извлечь максимум полезной информации, он напрягает внимание и готов относительно долго настраиваться на необычное или даже неприятное звучание. Оператор может терпеть сильные шумовые нагрузки, многократно прослушивать один и тот же материал в разных режимах. Поэтому шумоочистка здесь ориентирована не на удаление шумов как таковых, а на помощь оператору, на максимальное использование именно его слуховых особенностей, то есть на «размаскировку» полезного сигнала в шуме. Например, если шум заметен, но не мешает пониманию речи, то его удалять не всегда целесообразно, так как при этом может пострадать полезный сигнал. В то же время для операторов, постоянно прослушивающих зашумленные записи в течение длительного времени, шумоочистка желательна, так как чем выше качество записи, тем меньше утомляется оператор и тем дольше он может эффективно работать.

Но с точки зрения заказчика-дилетанта, использующего фонограмму иначе, нежели оператор, «очищенная» звукозапись должна содержать минимум шумов в паузах речи и максимально приближенный к естественному тембр звучания, порой даже в ущерб разборчивости.

Как использовать свойства слуха

Для успешной работы со звукозаписью следует использовать достоинства и учитывать недостатки человеческого слуха. Поэтому отметим его специфические свойства: чувствительность и селективность, маскировку, адаптацию, утомляемость, индивидуальность, ассоциативность организации речевой памяти. Теперь можно рассмотреть, как учитывается каждое свойство при обработке звукозаписей низкого качества.

Например, оптимизируя и выравнивая громкость звучания всех реплик до одного уровня, необходимо учитывать, что способность слуха обнаруживать сигналы на окружающем фоне и различать их малые изменения нелинейно зависит от громкости и частоты сигнала. Так, для тихой речи уровень обнаружимости сигнала на частоте 100 Гц может быть на 40 дБ больше уровня обнаружимости для 2000 Гц, а для громкого звучания частота практически не существенна. Поэтому рекомендуются два типовых варианта прослушивания, которые позволяют в большинстве ситуаций услышать максимум возможного. Первый вариант 80-90 (±6) дБ при выравнивании средней амплитуды всех спектральных составляющих записанного сигнала. Второй — 40 дБ при подъеме выровненного среднего амплитудного спектра на 25 дБ для 100 Гц и на 8 дБ для 5000 Гц по отношению к 2000 Гц.

Так как существует самомаскировка речи (например, после громких звуков тихие некоторое время не воспринимаются), то следует помнить, что оператор меньше утомляется, прослушивая запись на стабильно низком уровне громкости. Слуховая маскировка одних составляющих звукового сигнала другими приводит к тому, что рядом с сильными спектральными пиками не слышны более слабые частотные компоненты. Поэтому для повышения разборчивости следует стремиться удалить из сигнала шумовые импульсы, выровнять амплитуду и сгладить спектр. Причем иногда это важно делать даже на участках звучания отдельных слов, так как при определенных условиях отдельные звуки в слове могут маскировать своих «соседей».

Необходимо также учитывать, что целенаправленное «вслушивание» повышает способность выделять из фона искаженный речевой сигнал. При этом у опытных операторов-«раскрутчиков» фонограмм появляются уже готовые слуховые стереотипы эффективного распознавания полезных сигналов в помехах привычного вида. Это связано с адаптацией слуха, которая приводит к кратковременной (доли секунды) и долговременной (минуты) настройке параметров слуховой системы на характеристики прослушиваемого сигнала. Однако следует учитывать, что кратковременная адаптация слуха иногда приводит к нежелательному сдвигу порогов восприятия на стыках малоразборчивых слов. Поэтому такие словосочетания полезно прослушивать по частям, постепенно меняя границу «разреза» сигнала во фрагментах речи.

Средняя длительность участка зашумленной фонограммы, расшифрованной оператором, приведена в следующей таблице:

Сложность за 1 час за полный раб. день
низкая 4-10 мин 25-60 мин
средняя 30-50 сек 3-6 мин
высокая 5-10 сек 20-50 сек

Нельзя забывать, что после долгого прослушивания громких звуков снижается способность слуха различать малые звуковые изменения, а восстанавливается она довольно медленно (от 2 минут до суток). Поэтому оператор должен избегать слуховых перегрузок и работать с «тяжелой» зашумленной речью по 20—40 минут с такими же перерывами, но не более 4-6 часов в день.

Так как слуховая система человека рассчитана на обработку стереосигнала, то определенный выигрыш в распознавании сложных записей дает некоторое «разнесение» свойств сигнала, подаваемого на прослушивание в каждое ухо отдельно. Это позволяет сделать обработку каждого сигнала звука более специализированной. Такую возможность предоставляет режим «псевдостерео», который вносит в один звуковой моносигнал по отношению к другому некоторое изменение в спектральной или временной области.

Немалое значение также имеет свойство человеческой памяти автоматически ассоциировать услышанные звукосочетания с известными словами. В том случае, если сигнал неразборчив, неосознанный перебор всех возможных слов-кандидатов может занять недопустимо большое время. Поэтому оператор должен знать содержание текста и иметь дополнительную информацию, чтобы сузить круг вероятных слов для лучшего распознавания записи.

Вообще, чувствительность и способность слуха распознавать речь в шуме (особенно на высоких частотах) индивидуальна и, как правило, снижается с возрастом. Поэтому пожилые опытные операторы должны иметь возможность выравнивать частотные характеристики тракта прослушивания. Но для расшифровки зашумленной фонограммы предпочтительны операторы в возрасте до 35 лет с высокой слуховой чувствительностью и гибкой психикой,

Как расшифровать малоразборчивую звукозапись?

Мы предлагаем рассмотреть два варианта работы с малоразборчивой фонограммой, Первый — решение относительно простой задачи текстовой расшифровки и шумоочистки для сигнала низкой/средне-низкой сложности (исходная разборчивость 70-80% слов). Второй — шумоочистка «тяжелой» звукозаписи с нулевой исходной разборчивостью.

Шумоочистка в относительно простых ситуациях

Выполняется оператором, имеющим техническое образование и опыт работы с аудиоаппаратурой. Для выполнения работы необходимо следующее оборудование: высококачественный магнитофон, головные телефоны, усилитель мощности с колонками (высшего класса), персональный компьютер для подготовки текстовых расшифровок и компьютерный транскрайбер (желательно со встроенным адаптивным фильтром), графический эквалайзер (имеющий не менее 16 полос в диапазоне 100-6000 Гц при динамическом диапазоне регулировки не менее 30 дБ, отношение сигнал/шум в сквозном канале не хуже 70 дБ и соответствующий анализатор текущего спектра), адаптивный фильтр с числом коэффициентов для полосы сигнала до 4000 Гц не менее 500. Оптимальным является использование компьютерного АРМ на базе ПК с платой ускорителя вычислений.

Метод решения задачи шумоочистки в относительно простых ситуациях

Определить средний спектр сигнала звукозаписи с помощью спектроанализатора (для всей обрабатываемой кассеты или для ее начального участка в 1-2 минуты).

Обрезать спектр сигнала сверху и снизу (обычно до диапазона 2003900 Гц). Выровнять спектр внутри этого диапазона с помощью эквалайзера до максимально возможного плоского вида, затем подобрать на слух оптимальное по звучанию положение движков эквалайзера на начальном участке звукозаписи.

Установить оптимальный уровень громкости с помощью усилителя.

Подать сигнал на адаптивный фильтр, подобрать на слух наилучшее положение регулировок (скорость адаптации, задержка, порог запуска адаптации).

Подать сигнал с магнитофона через установленную цепочку (усилитель, эквалайзер, адаптивный фильтр) на вход компьютерного транскрайбера (удобно использовать адаптивный фильтр, расположенный на плате транскрайбера). Ввести звук в ПК, размещая его на жестком диске при использовании частоты квантования 10 000 Гц и 16-битового цифрового представления сигнала без какого-либо сжатия.

Печатать текст звукозаписи в программе транскрайбера. Малоразборчивые участки речи можно многократно прослушивать в «кольце», регулируя громкость произнесения и скорость воспроизведения звука. Кольцо должно быть «скользящим» по сигналу с регулируемой длительностью в пределах не менее 0.5-15 сек.

В конце работы проводится сверка текста с фонограммой и окончательная запись очищенного звука на магнитофон.

Шумоочистка в сложных ситуациях

Выполняется инженером-оператором по шумоочистке, имеющим техническое образование, опыт работы с аудиоаппаратурой и знания об основах спектрального анализа, фильтрации сигналов и физиологии слуха. Также желательна высокая индивидуальная слуховая чувствительность.

Наиболее эффективна работа в паре: инженер + оператор-«слухач» (не старше 35 лет, с устойчивой психикой и достаточным опытом). Отметим, что с получением текстовок звукозаписей как с постоянной обязанностью, как правило, женщины справляются лучше мужчин.

Для выполнения работы необходимо следующее оборудование: высококачественный магнитофон с возможностью настройки под характеристики ленты, высококачественные головные телефоны (2-3 пары), усилитель мощности с колонками (высшего класса), АРМ шумоочистки на базе ПК (не ниже 486DX2-66, VLB/PCI, 8 Мбайт ОЗУ, НЖМД 540 Мбайт) с дополнительным ускорителем вычислений для обработки сигналов в реальном масштабе времени, автономный внешний адаптивный фильтр на число коэффициентов в полосе до 4000 Гц не менее 2000, обеспечивающий возможность задания скорости, алгоритма, режимов адаптации, задержки, режимов прослушивания (псевдостерео, предсказание, фильтрация). В программное обеспечение АРМ должен входить мощный сигнальный редактор, программы для преобразования сигнала во времени, удаления импульсивных помех, программный эквалайзер реального времени с числом полос не менее 500, программа удаления широкополосных помех, компьютерный транскрайбер с адаптивным фильтром, программы энергетического, спектрального и автокорреляционного анализа сигнала. Безусловно, в ряде случаев полезными могут оказаться и дополнительные аппаратные и программные средства, но для решения большинства практических задач вполне достаточно вышеперечисленных.

Метод работы со сложной фонограммой (например, с нулевой исходной разборчивостью)

Сложная звукозапись может потребовать от оператора различного подхода к обработке отдельных реплик. Такую работу удобно выполнять с помощью компьютерных средств. Поэтому сначала вся звукозапись вводится на жесткий диск ПК и хранится там в виде файла данных, который затем обрабатывается различными программами (при вводе фонограммы в ПК разрядность цифрового представления обычно составляет 16 бит, частота дискретизации 10 000 или 16 000 Гц).

Затем текст печатается в программе транскрайбера. Так как для достижения разборчивости применяются то одни, то другие приемы, то переход между различными программами обработки сигналов удобно выполнять в среде Windows в многозадачном режиме.

Дальнейшие действия могут выполняться над всей звукозаписью, но если звуковые характеристики сильно различаются от участка к участку, то регулировка обработки звука подбирается отдельно для ее каждого однородного участка.

Необходимо оптимизировать громкость звучания. Для выравнивания громкости отдельных реплик фонограммы используются ручная нормировка и амплитудные нелинейные преобразования. Сигнал прослушивается на разной громкости с согласованно изменяемой частотной характеристикой, для этого в компьютерном эквалайзере «заготавливаются» типовые фильтры приведения спектра звука на данной звукозаписи к требуемому виду, которые и используются при прослушивании. Быстрый переход от одного вида спектрального преобразования сигнала к другому происходит в реальном масштабе времени за счет использования дополнительного ускорителя вычислений в составе АРМ шумоочистки.

Привести сигнал к оптимальному виду во временном и спектральном представлении и удалить аддитивные помехи, «размаскировать» полезный сигнал. При этом сигнал обрабатывают непосредственно во временном представлении, устраняют импульсивные помехи (щелчки) и большие перепады амплитуды сигнала (ступеньки). Кроме того, спектральные характеристики сигнала обрабатываются с помощью спектроанализатора и многополосного эквалайзера:- ограничивается полоса частот сверху и снизу (обычно до 200-3900 Гц или 100-6300 Гц);- сглаживается спектр (удаляются спектральные пики и резкие перепады более 6 дБ в пределах каждой полуоктавы);- выравнивается динамический диапазон среднего спектра (не более 10 дБ в пределах октавы), компенсируются искажения АЧХ сигнала в канале звукозаписи.

Также весьма эффективен режим автоматической инверсной фильтрации, который устанавливается в рамках комплекса «ИКАР» или на ультрасовременном и чрезвычайно дорогом аудиопроцессоре фирмы Digital Audio Corp.

С помощью адаптивной фильтрации можно устранить узкополосные стационарные и медленно меняющиеся во времени помехи (сетевые и телефонные наводки, гудки, транспортные помехи, шумы механизмов, плавную музыку). Число коэффициентов адаптивного фильтра составляет 400-4000 в зависимости от типа помехи. Вполне оправдано и применение внешнего автономного фильтра.

Широкополосные стационарные и медленно меняющиеся помехи устраняют с помощью частотного вычитания, В последнюю очередь устраняют или уменьшают шумы в паузах.

Естественно, что в каждой конкретной ситуации с сигналом производятся только необходимые операции, причем пользователь вынужден ориентироваться на реально доступные технические средства. Среди них можно отметить АРМ эксперта «ИКАР» и пока еще единственный на рынке автономный прибор — цифровой адаптивный фильтр нового поколения «Золушка-31» (с числом коэффициентов фильтра до 5600, а также набором разнообразного, действительно необходимого и полезного сервиса).

Необходимо также отметить, что системы, предназначенные для очистки музыкальных аудиозаписей и подготовки мастер-дисков и кассет (например, «NoNoise» фирмы Sonic Solutions), дороги и для шумоочистки оперативных звукозаписей малоэффективны, так как позволяют из «хороших» записей делать «очень хорошие», но на обработку сильных помех и искажений принципиально не рассчитаны.

Стереошумоочистка

Необходимо упомянуть альтернативный подход к получению очищенных фонограмм, который основан на использовании звукозаписи от двух и более источников звука. Например, это может быть стереозапись, при которой сигнал в смеси с помехой записывается в одном моноканале, а эта же помеха на другом моноканале. Или это может быть стереозапись сигнала с двух микрофонов, которые по-разному расположены относительно источников полезного сигнала и помехи.

Так, с помощью некоторых систем (например, «Золушка-С» и «Золушка31»), можно автоматически построить оптимальный фильтр, устраняющий помеху из звукозаписи (на входы подается два сигнала: полезный в смеси с помехой на основной вход и сигнал помехи на второй, опорный вход). К примеру, так может быть записан тихий разговор в помещении, где громко звучит радиотрансляция или телевизор. При этом на одну дорожку магнитофона пишется звук с микрофона, расположенного в помещении и передающего смесь полезного сигнала и помехи, а на другую дорожку этого же магнитофона пишется либо сигнал непосредственно с источника помехи (с точки радиотрансляции или звукового выхода телевизора), либо сигнал со второго микрофона, направленного на запись звука помехи. Далее на основе такой стереозвукозаписи с помощью адаптивного стереофильтра получают разборчивый сигнал для любого вида помехи, причем это возможно даже тогда, когда на исходной звукозаписи почти не слышно речи.

Интересно отметить, что чем громче «играет музыка» и чем меньше разговаривающие опасаются прослушивания, тем лучше устраняется помеха из зашумленного сигнала.

Адаптивная стереофильтрация позволяет увеличить разборчивость и повысить качество звукозаписи при использовании стереопары обычных или направленных микрофонов. Однако в этом случае необходим определенный опыт в использовании микрофонов в конкретной обстановке звукозаписи, при этом желательно, чтобы в один микрофон попадал полезный речевой сигнал и звук помех, а в другой, в основном, только звук тех же помех. Чем лучше соблюдено это правило, тем выше результат стереошумоочистки.

Статья опубликована на сайте: 07.08.2000


Яндекс.Метрика