Автоматизированный комплекс распознавания дикторов в фонограммах телефонных переговоров "Трал"
Назначение и области использовния
Комплекс предназначен для создания оперативных фоноучетов и автоматической идентификации дикторов по фонограммам телефонных переговоров
Функциональные возможности
- Идентификация дикторов по фонограммам телефонных переговоров, в т.ч. низкого качества, на основе сравнения "дикторских карточек". "Дикторская карточка" содержит в концентрированном виде индивидуальные, идентификационно значимые, характеристики голоса и речи диктора, а также текстовые комментарии пользователя Комплекса и ссылку на звуковой файл с речью диктора.
- Создание фоноучетов объемом до 100 000 дикторов
- Возможность работы с одной фонотекой одновременно нескольких пользователей
Отличительные особенности
- Высокая эффективность работы с реальными сигналами, свободной речью дикторов, а не только с парольными фразами.
- Возможность идентификации дикторов по сигналам низкого качества.
С учетом того, что во многих странах мира, включая Россию, до сих пор широко используются аналоговые АТС и линии, проложенные еще в начале прошлого века, это является немаловажным фактором. - Максимальная автоматизации процесса идентификации, что позволяет минимизировать требования к уровню подготовки обслуживающего персонала и повышает скорость принятия решения.
- Возможность хранения в фонотеке, наряду со звуковыми, текстовых и графических файлов
Собственно процедура идентификации заключается в автоматическом попарном сравнении так называемых «дикторских карточек», в которых закодированы индивидуальные характеристики голоса и речи диктора.
Основные характеристики
Показатели надежности при идентификации «дальнего» диктора: (данные показатели получены при тестировании системы на официално зарегистрированной телефонной базе фонограмм русской речи: по 6 телефонных сообщейний с использованием различных телефонных линий от каждого из 100 дикторов различного пола и возраста)
- 91% при сравнении пары речевых сигналов длительностью каждого не менее 96 сек
- 85% при сравнении пары речевых сигналов длительностью 16 сек и 96 сек соответственно
- 82% при сравнении пары речевых сигналов длительностью 16 сек каждый
- не менее 90% при сравнении пары речевых сигналов длительностью 16 сек и 96 сек передаваемых по одному и тому же каналу связи
- Время создания одной «дикторской карточки» – 3…4 сек
- Время сравнения одной пары «дикторских карточек» (принятия решения о принадлежности голоса и речи конкретному лицу) – не более 0.7 сек (при использовании ПК на базе Pentium III/1ГГц)
- Максимальное количество эталонов («дикторских карточек») для проведения автоматического сравнения – 100 000
Состав
Комплекс включает две или более связанных в сеть ПЭВМ с установленным программным обеспечением, работающим в режиме клиент-сервер:
- SpeechMarker – программное обеспечение для сегментирования сигнала
- FormeBuilder – программное обеспечение для создания фонотек (баз данных), регистрации пользователей Комплекса и управления ими, а также задания структуры фонотеки
- Server - модуль, необходимый для обеспечения хранения и использования «дикторских карточек» в рамках Комплекса
- Operator – программное обеспечение для создания, просмотра и редактирования разделов фонотеки, добавления «дикторских карточек» и работы с ними
Описание актуально на: 15.12.2004.
Для уточнения технических характеристик «Автоматизированный комплекс распознавания дикторов в фонограммах телефонных переговоров "Трал"», а также для получения информации по наличию и условиям поставки Вы можете заполнить форму запроса ниже.
Внимание! Поставка оборудования осуществляется только юридическим лицами и только по безналичному расчёту.