В проводных аналоговых телефонных сетях голос передавался в виде электросигналов, его качество определялось протяжностью, состоянием телефонной линии, качеством микрофона, динамка и коммутационной аппаратуры. С переходом на «цифру» появилась острая необходимость в кодировании/сжатии голоса, что послужило началом импульсно-кодовой модуляции (ИКМ).
Основа ИКМ
Процесс преобразования звуков в поток цифрового типа, названный ИКМ, отличается «скромными» требованиями к пропускной способности канала. Для разборчивой человеческой речи достаточно частот 0,3-3,4 кГц, что эквивалентно 64 кбит/с. И первым кодеком стал ИКМ-64 (G.711 PCM), который даже в 2022 году используются в телефонных коммуникациях, поскольку у него есть 3 преимущества:
- проста кодирования;
- нетребовательность к DSP VoCoder’ам;
- отсутствие потери качества преобразования аналог-цифра-аналог.
Однако ИКМ-64 отсекает высокие гармоники, что делает голос «плоским». Кроме того, он ресурсоемок в беспроводных сетях и не адаптируется к неизбежным потерям данных. Поэтому используют его (в основном) в VoIP и фиксированных сетях.
Недостатки кодека заставили искать альтернативные варианты импульсно-кодовой модуляции для мобильных сетей.
Мобильные голосовые кодеки
Операторы сотовой связи используют различные стандартные кодеки, поддерживаемые той или иной технологией передачи данных. Активно используется всего 3 варианта кодеков:
- AMR — один из базовых кодеков для сетей GSM, UMTS, VoLTE. Работает в тех же частотах, что и ИКМ-64, однако преобразует звуковую речь в поток 4,75-12,2 кбит/с с дискретизацией 8 кГц.
- WB-AMR — еще один базовый кодек с частотой дискретизации 16 кГц. Имеет 2 конфигурации. В GSM, UMTS, VoLTE скорость потока достигает 12,65 кбит/с при частотах 0,1-6,4 кГц. В VoLTE и UMTS также используется конфигурация со скоростью потока до 23,85 кГц и частотой кодирования 0,1-7,0 кГц.
- EVS — наиболее современный кодек для сетей VoLTE с битрейтом до 128 кбит/с, работающий с полным частотным диапазоном. В силу избыточности часто используют усеченный EVS-WB и EVS-SWB с максимальной скоростью до 24,4 кбит/с и частотой дискретизации до 32 кГц.
Для сетей 5G разрабатывается собственный вариант кодека — IVAS. Это будет тот же EVS с небольшими отличиями. Например, будет внедрена поддержка передачи данных одновременно с нескольких микрофонов для создания пространственных звуковых эффектов окружения.
Каждый кодек имеет адаптацию — механизм понижения скорости потока при ухудшении качества связи. Низкая скорость потока обеспечивает приемлемое качество связи при неуверенном приеме сигнала, пусть и с потерей качества и «плоскостью» гармоник. Наглядно «познакомиться» с адаптацией можно посредством кодека Opus, используемого в популярных мессенджерах (например, WhatsApp) и сервисах видеоконференций (например, Zoom). Он острее реагирует на проседание канала связи, из-за чего качество звука падает.
Измерение качества голоса
Каждый оператор сотовой связи оценивает качество передаваемого голоса по MOS — субъективной средней оценке. 5 баллов дается за идеальное качество, 1 балл за неразборчивую голосовую речь. Технология оценки отрабатывалась на большой выборке людей, итогом чего стало построение математической модели.
Тестовые телефоны звонят друг другу и транслируют ранее записанный диалог. Трансляцию разбирает специализированная программа, которая сравнивает частотные характеристики звонка и оригинального сэмпла, а затем по алгоритмам POLQA или PESQ выставляет оценку MOS.
Регулярная оценка качества голосовой связи в разных локациях помогает мобильному оператору выявлять места, где качество голоса проседает, чтобы своевременно устранять пробелы. Это способствует развитию сотовой связи как в России, так и в других странах. Подключайте безлимитные тарифы с интернетом для планшетов от GARTEL!