В проводных аналоговых телефонных сетях голос передавался в виде электросигналов, его качество определялось протяжностью, состоянием телефонной линии, качеством микрофона, динамка и коммутационной аппаратуры. С переходом на «цифру» появилась острая необходимость в кодировании/сжатии голоса, что послужило началом импульсно-кодовой модуляции (ИКМ).
Процесс преобразования звуков в поток цифрового типа, названный ИКМ, отличается «скромными» требованиями к пропускной способности канала. Для разборчивой человеческой речи достаточно частот 0,3-3,4 кГц, что эквивалентно 64 кбит/с. И первым кодеком стал ИКМ-64 (G.711 PCM), который даже в 2022 году используются в телефонных коммуникациях, поскольку у него есть 3 преимущества:
Однако ИКМ-64 отсекает высокие гармоники, что делает голос «плоским». Кроме того, он ресурсоемок в беспроводных сетях и не адаптируется к неизбежным потерям данных. Поэтому используют его (в основном) в VoIP и фиксированных сетях.
Недостатки кодека заставили искать альтернативные варианты импульсно-кодовой модуляции для мобильных сетей.
Операторы сотовой связи используют различные стандартные кодеки, поддерживаемые той или иной технологией передачи данных. Активно используется всего 3 варианта кодеков:
Для сетей 5G разрабатывается собственный вариант кодека — IVAS. Это будет тот же EVS с небольшими отличиями. Например, будет внедрена поддержка передачи данных одновременно с нескольких микрофонов для создания пространственных звуковых эффектов окружения.
Каждый кодек имеет адаптацию — механизм понижения скорости потока при ухудшении качества связи. Низкая скорость потока обеспечивает приемлемое качество связи при неуверенном приеме сигнала, пусть и с потерей качества и «плоскостью» гармоник. Наглядно «познакомиться» с адаптацией можно посредством кодека Opus, используемого в популярных мессенджерах (например, WhatsApp) и сервисах видеоконференций (например, Zoom). Он острее реагирует на проседание канала связи, из-за чего качество звука падает.
Каждый оператор сотовой связи оценивает качество передаваемого голоса по MOS — субъективной средней оценке. 5 баллов дается за идеальное качество, 1 балл за неразборчивую голосовую речь. Технология оценки отрабатывалась на большой выборке людей, итогом чего стало построение математической модели.
Тестовые телефоны звонят друг другу и транслируют ранее записанный диалог. Трансляцию разбирает специализированная программа, которая сравнивает частотные характеристики звонка и оригинального сэмпла, а затем по алгоритмам POLQA или PESQ выставляет оценку MOS.
Регулярная оценка качества голосовой связи в разных локациях помогает мобильному оператору выявлять места, где качество голоса проседает, чтобы своевременно устранять пробелы. Это способствует развитию сотовой связи как в России, так и в других странах. Подключайте безлимитные тарифы с интернетом для планшетов от GARTEL!