Что такое дизеринг в телевизоре
Что такое дизеринг в телевизоре
Мы создали специальную тему в конференции, где собрали вопросы по теме «Дизеринг и нойз-шейпинг». Любой желающий мог задать свой вопрос Алексею Лукину, известному эксперту по цифровой обработке сигналов, разработчику алгоритмов компании iZotope (США). К вопросам читателей мы добавили и несколько редакционных. Благодарим читателей за активное участие!
Введение
Преобразование звукового сигнала из аналоговой в цифровую форму можно представить в виде двух этапов: дискретизации по времени и квантования по амплитуде. На первом этапе (дискретизация) мгновенные значения сигнала замеряются с некоторым шагом по времени. На втором этапе (квантование) каждое из измеренных значений сигнала представляется в виде числа с некоторой точностью — разрядностью квантования.
На заре цифровой звукозаписи бытовало представление о разрушительном действии оцифровки на звуковой сигнал. И даже сейчас можно услышать мнение, что искажения в цифровом звуке зависят от уровня сигнала. В этой статье мы рассмотрим, как возникают искажения квантования и как их можно предотвратить.
Квантование сигнала
В начале эпохи цифровой звукозаписи разрядность АЦП и ЦАП была невысокой: 8 либо 16 бит в бытовой технике и 16–18 бит в профессиональной. Эффективных алгоритмов компрессии (типа mp3) еще не существовало, дисковое пространство было дорогим, а интернет — медленным. Поэтому нередко первые цифровые звукозаписи распространялись в формате 8 бит. Всем, конечно, знаком их хрустящий и искаженный звук. Вскоре 8-битный формат сменился 16-битным CD-форматом, и качество звука значительно выросло. Однако даже при 16-битном квантовании требуется уделять внимание возможным искажениям тихих звуков.
При квантовании сигнала амплитуда каждого отсчета округляется до ближайшего значения разрядной сетки (рис. 1). Нетрудно видеть, что для звуков малой амплитуды это может приводить к значительному искажению формы сигнала (рис. 2). Такой простейший способ квантования называется усечение (truncate, транкейт) либо округление (rounding).
Разница между исходным и квантованным сигналом называется ошибкой квантования или шумом квантования. Для сигналов малой амплитуды ошибка квантования сильно коррелирует с сигналом, что приводит к нелинейным искажениям и грязному звучанию (в этом смысле, термин «шум квантования» не очень удачен, так как ошибка квантования не похожа на шум). При 16-битном квантовании мощность ошибки квантования составляет приблизительно −98 дБ RMS (за 0 дБ RMS принимается мощность синусоиды максимального уровня, согласно стандарту AES-17).
Дитеринг
К счастью, существует метод сделать ошибку квантования практически не зависимой от исходного сигнала. Он называется английским словом дитеринг (dithering, в русской транскрипции также встречается «дизеринг») и заключается в подмешивании к сигналу шума перед квантованием (рис. 3).
Амплитуда шума дитеринга выбирается особым образом, чтобы устранить нелинейные искажения при последующем квантовании. Если амплитуда дитеринга мала, то нелинейные искажения будут устранены не полностью, либо амплитуда ошибки квантования будет меняться вместе с сигналом. Если амплитуда дитеринга велика, то шум станет заметным в записи.
Наиболее распространенным типом дитеринга является стандартный TPDF-дитеринг — белый шум с пиковой амплитудой ±1 LSB (least significant bit — шаг квантования) и треугольным распределением вероятности амплитуд. Почти любая цифровая рабочая станция (DAW) умеет генерировать дитеринг такого типа.
Важным моментом в применении дитеринга является его добавление к сигналу до, а не после квантования. Неправильно понимать дитеринг как шум, скрывающий или маскирующий искажения квантования. На самом деле дитеринг предотвращает появление искажений. Попытка замаскировать уже возникшие искажения потребовала бы шума значительно большей амплитуды.
Продемонстрируем работу дитеринга на тестовом сигнале «плавающий синус» с уровнем −80 дБ и плавным затуханием в конце (рис. 4). Для лучшей слышимости искажений сигнал после квантования в 16 бит был усилен на 55 дБ. Будем изучать как форму волны, так и спектрограмму.
| наведите мышь На спектрограмме сигнала, квантованного без дитеринга, видны сильные нелинейные искажения, усиливающиеся при уменьшении уровня сигнала. В конце записи сигнал полностью исчезает, так как его амплитуда становится меньше половины шага квантования. Спектрограмма с дитерингом показывает, что после квантования искажений в сигнале не появилось, а добавившийся шум однороден. Однако его мощность превышает мощность искажений при транкейте (−98 дБ) и составляет −93 дБ. Нойз-шейпингПовышенная мощность ошибки квантования при дитеринге порождает вопрос: можно ли проводить дитеринг не белым шумом, а таким, который будет менее заметен? Например, высокочастотным шумом. К сожалению, напрямую этот метод не работает. Если вместо белого шума дитеринга подмешать окрашенный шум, то ошибка квантования все равно будет близка к белому шуму. Кроме того, существует опасность неполного подавления нелинейных искажений квантования. Чтобы придать спектру ошибки квантования нужную форму, существует более сложный метод, называемый нойз-шейпингом (noise shaping, формирование спектра шума). В этом методе присутствует обратная связь: разница между квантованным и исходным сигналами пропускается через фильтр и прибавляется к следующему отсчету сигнала (рис. 5). Варьируя частотную характеристику фильтра, можно добиться нужного спектра ошибки квантования. Наиболее часто ошибку квантования вытесняют в диапазон высоких частот и ультразвука, где она будет наименее слышна. В слышимом диапазоне частот спектр нойз-шейпинга обычно приблизительно повторяет кривую порога слышимости. При нойз-шейпинге общая мощность ошибки квантования возрастает (по сравнению с дитерингом), но ее субъективная громкость снижается (рис. 4). Чем сильнее требуется снизить мощность шума в слышимой полосе (нижние и средние частоты), тем больше шума появляется в области верхних частот. Слишком большая мощность верхних частот в аудиосигнале нежелательна: она может затруднить последующую обработку сигнала, его кодирование в mp3, восстановление царапин при ошибках чтения с CD. Поэтому при 16-битном квантовании принято использовать нойз-шейпинг, не превышающий по уровню −60 дБ. Снижение субъективной слышимости шума при этом достигает 10–15 дБ по сравнению со стандартным TPDF-дитерингом. Обратите внимание, что файл с нойз-шейпингом звучит чисто. Так же, как при дитеринге, ошибка квантования представляет собой ровный шум без нелинейных искажений, не зависящий от сигнала. Понижение разрядностиКвантование сигнала происходит не только при оцифровке звука в АЦП, но и при последующей работе с цифровым сигналом: обработке, преобразовании формата, изменении уровня. Когда сигнал определенной разрядности (например, 16 бит) подвергается пересчету, его разрядность автоматически увеличивается (например, до 32 бит). Далее, если сигнал необходимо записать в файл исходного формата (16 бит), то происходит повторное квантование: из 32 бит в 16. При этом квантовании возможны те же искажения, что и в АЦП. Поэтому процесс дитеринга должен быть встроен в любые программы и алгоритмы, обрабатывающие сигнал. Чтобы минимизировать эффект от операций повторного квантования, обработка сигнала часто происходит в повышенной разрядности (24 или 32 бита), а окончательное снижение разрядности (до 16 бит) применяется после всех остальных операций. Понижение разрядности сигнала используется также в звуковых ЦАП: большинство из них имеют небольшую разрядность (1–5 бит), но высокую частоту дискретизации (порядка 10 МГц). При этом ЦАП заявляется как 24-битный, в том смысле, что он принимает на вход 24-битный аудиосигнал. Но внутри сигнал подвергается передискретизации (oversampling) — повышению частоты дискретизации и понижению разрядности с нойз-шейпингом. Поскольку финальная частота дискретизации очень высока, то в ультразвуковом диапазоне (выше 20 кГц) присутствует много места для шума нойз-шейпинга. Поэтому даже при малой разрядности сигнала (1–5 бит) агрессивный нойз-шейпинг способен создать динамический диапазон порядка 120 дБ в слышимой области частот. На рис. 5 показано сравнение типичных спектров шума нескольких звуковых форматов высокого разрешения: CD-формата (PCM 16 бит, 44 кГц) со стандартным TPDF-дитерингом, формата «24 бита 96 кГц» и двух форматов DSD с различными частотами дискретизации. Поскольку DSD-форматы имеют разрядность 1 бит, в них присутствует значительный нойз-шейпинг. У формата «DSD-2.8 МГц» быстрый подъем мощности шума начинается сразу за 20 кГц. У формата «DSD-5.6 МГц» шум лежит вдвое выше (уже за пределами графика на рис. 5). Квантование изображенийПохожие алгоритмы квантования используются и в обработке изображений, когда надо представить цвет малым числом доступных градаций. Проиллюстрируем это на примере 4-битного квантования (16 градаций яркости). наведите мышь |
Эффект от простого квантования цветов называется постеризацией: на изображении появляются ложные контуры, а часть деталей исчезает (рис. 6). Постеризации можно избежать, добавив перед квантованием шум дитеринга. Однако более качественного результата достигает алгоритм диффузии ошибки. Аналогично нойз-шейпингу, он вытесняет ошибку квантования в область верхних частот, где чувствительность глаза невысока. Диффузия ошибки часто применяется в офсетной печати для смешивания цветов.
Вопросы и ответы
Нужен ли дитеринг при работе в формате 32-bit float?
Нет, не нужен. Для этого формата не существует правильного дитеринга, так как ошибка квантования зависит от уровня сигнала: она имеет уровень примерно −150 дБ по отношению к уровню каждого отсчета. Точность этого формата составляет примерно 25 бит, так что быстрого накопления ошибок квантования можно не опасаться.
Нужен ли дитеринг при преобразовании из 32-bit float в 24-битный формат?
Да, при квантовании сигнала в разрядность 24 бита (и менее) нужен дитеринг. При 24 битах дитеринг в большинстве случаев не будет заметно влиять на результат, но его применение должно быть автоматическим, без лишних раздумий.
Нужен ли дитеринг при конвертировании файла в mp3?
Все зависит от того, сохраняете ли вы файл с низкой разрядностью перед конвертацией в mp3 или конвертируете в mp3 непосредственно из формата высокой разрядности. Дитеринг нужен для сохранения файла с низкой разрядностью, а не для mp3. Некоторые mp3-кодеры умеют компрессировать звук из форматов с высокой разрядностью, что позволяет избежать лишних конвертаций. Впрочем, артефакты mp3 обычно намного сильнее, чем искажения от конвертации разрядности.
Какой вид нойз-шейпинга использовать?
Это вопрос личных предпочтений и даже отчасти аудиофильский. Многие профессиональные инженеры мастеринга используют стандартный TPDF-дитеринг без нойз-шейпинга с отличными результатами. Другие — имеют предпочтения и считают, что тип нойз-шейпинга влияет на окончательное звучание фонограммы. Например, Боб Кац активно участвовал в создании нескольких режимов нойз-шейпинга MBIT+ для плагина Ozone 5. Я считаю, что в дитеринге и нойз-шейпинге важнее повсеместное и своевременное применение, нежели конкретный вид или алгоритм.
Достаточно ли уже имеющегося в записи шума для дитеринга?
В некоторых случаях — да, но не всегда. Шум дитеринга должен иметь определенные статистические свойства: требуемую мощность в каждой полосе частот, случайность распределения амплитуд. Поэтому надежнее применять дитеринг в любом случае, автоматически и без лишних раздумий.
Что применять сначала: дитеринг или преобразование частоты дискретизации (SRC)?
Так как SRC повышает разрядность сигнала (аналогично любой другой обработке), то сначала выполняется SRC, а затем дитеринг. Причем, между ними необходимо проверить, нет ли клиппирования, так как SRC может повысить пиковый уровень записи.
В статье Н. Сухова «Hi-Fi правда и High-End сказки» написано, что у аналоговой записи на пленке динамический диапазон определяется шумом снизу, а у цифровой — нет, потому что у 16-битного цифрового сигнала динамический диапазон равен 50 дБ из-за шумов квантования, которые дают 1% искажений. Верно ли это?
Статья Н. Сухова была написана в 1998 году, когда понимание дитеринга еще не было повсеместным. В статье рассматривается только случай квантования транкейтом. Однако при корректном использовании дитеринга и нойз-шейпинга никаких нелинейных и интермодуляционных искажений не возникает. При этом динамический диапазон компакт-диска составляет честные 93 дБ, а структура шума такая же, как у магнитной пленки.
Можно ли говорить о том, что нойз-шейпинг увеличивает динамический диапазон в наиболее слышимой СЧ-области?
Да, нойз-шейпинг увеличивает динамический диапазон в области средних частот (либо даже во всем диапазоне 0–15 кГц, в зависимости от алгоритма). В частности, может улучшиться A-взвешенный динамический диапазон.
Вопрос о возможном конфликте нойз-шейпинга в файле и нойз-шейпинга в конвертере. Не повредит ли нойз-шейпинг в исходном файле ЦАП-у с агрессивным нойз-шейпингом?
Нет. Насколько я понимаю, они не мешают друг другу и повсеместно используются вместе.
Благодарим Алексея Лукина за подробные ответы
и за потраченное время на обсуждение в нашей конференции!
Что такое дитеринг: Окончательное руководство для начинающих
Мы ответим на все эти и другие вопросы в этой статье и постараемся сделать концепцию дизеринга как можно более понятной.
Что такое дитеринг?
Посмотрите этот видеоролик от Rowntree Audio для быстрой и простой демонстрации процесса дизеринга:
[VIDEO EMBED] https://www.youtube.com/watch?v=cLnuoQ6pIKk
Чтобы понять ответы на эти вопросы, необходимо сначала разобраться в том, как работает цифровое аудио.
Какое отношение имеет дизеринг к цифровому аудио
Уменьшение сигналов в размерах
Если вы хотите, чтобы ваша музыка была максимально доступной, вы должны уменьшить свои высококачественные записи, чтобы они соответствовали этим различным форматам. Таким образом, при экспорте аудиофайлов вы должны понизить дискретизацию (т.е. уменьшить битовую глубину). В то же время, при уменьшении битовой глубины не следует удалять нюансы и динамику звука.
Именно здесь вступает в игру сила dither.
Дизеринг: Прояснение искаженной концепции
Что бы произошло при преобразовании цифрового звука из более высокого разрешения в более низкое без применения дизеринга? Как вы можете себе представить, те блочные числа (те, которые представляют входящий сигнал), о которых мы упоминали ранее, стали бы скомканными и еще более блочными, превратив то, что раньше напоминало непрерывную волну, в нечто, больше похожее на лестницу. Этот процесс называется усечением и приводит к тому, что известно как ошибка квантования, искажение квантования или шум квантования.
Если вы знакомы с формами волн и тем, как звучат различные конфигурации в зависимости от внешнего вида, вы знаете, что эта ступенчатая форма звучит искаженно. Точнее говоря, пониженное дискретизированное аудио, не подвергнутое дитерингу, дает гармоники, которые коррелируют с исходным аудиосигналом и прорезают человеческое ухо довольно громко (гармоническое искажение).
Конечно, меньше всего вам хочется, чтобы непреднамеренные шумовые искажения распространялись по всему вашему первозданному аудио. Когда вы добавляете низкоуровневый шум в аудио перед процессом квантования, эти гармонические искажения, по сути, скремблируются и значительно теряют свое присутствие.
В конечном счете, дизеринг позволяет вашему миксу сохранить динамический диапазон и оригинальное общее звучание при доводке до более низкого разрешения.
Дизеринг полагается на случайные колебания
Если концепция дизеринга все еще не совсем ясна, помните, что все дело в рандомизации. Шум, который добавляет дизеринг к вашему аудио, является случайным и некоррелированным (вспомните «шипящий» звук, издаваемый белым шумом). В результате, те громкие коррелированные искажения, которые возникают при уменьшении битовой глубины аудио, не могут пробиться наружу.
Эта концепция добавления случайного шума к чему-либо возникает и при обработке изображений. Представьте, что вы смотрите на четкое изображение на телевизоре высокой четкости. Затем представьте себе просмотр того же изображения на старом телевизоре с гораздо меньшим разрешением. Много данных будет потеряно в этом процессе, создавая пикселированное изображение, изобилующее цветовой полосой (которая возникает, когда информация о цвете представлена неточно).
Этот переход от высокой четкости к низкой четкости может быть сглажен с помощью дизеринга. Вместо того чтобы непосредственно втискивать изображение в меньшее пространство, информация изображения сначала скремблируется, уменьшая глубину цвета. В итоге уменьшенное изображение сохраняет свою относительную форму, цвет и структуру.
Приведенный ниже рисунок даст вам лучшее понимание того, как работает дизеринг на изображениях.
Когда использовать дизеринг
Итак, когда следует добавлять дизеринг в аудио? Основное правило заключается в том, что при понижении дискретизации аудио (часто на этапе мастеринга или экспорта) всегда следует использовать дизеринг. Другими словами, используйте дизеринг всякий раз, когда в аудио появляются искажения квантования (а они появляются при изменении битовой глубины с большей на меньшую).
Дизеринг почти всегда следует выполнять во время прыжков или экспорта, или использовать в качестве последнего эффекта в цепи сигнала (некоторые лимитеры имеют собственную функцию дизеринга).
Когда не следует использовать дизеринг
Однако то, что дизеринг является стандартной практикой в цифровом аудиопроизводстве, не означает, что он всегда необходим. Например, если вы готовите трек к мастерингу с помощью мастеринг-инженера или eMastered, вам не следует делать дизеринг, поскольку это будет сделано за вас (как уже упоминалось выше, дизеринг обычно используется в процессе мастеринга).
Иногда можно обойтись без дизеринга, даже если он не требуется. В некоторых случаях добавленный шум не будет достаточно слышен, чтобы изменить что-либо в вашем аудио. В худшем случае, однако, ваша дорожка может получить заметное шипение, которое никто не хочет слышать. Чтобы обезопасить себя, следуйте вышеупомянутому правилу: используйте дизеринг только для сокрытия искажений квантования (т.е. при экспорте аудио из более высокой битовой глубины в более низкую).
Различные типы дизеринга
Различные DAW и плагины предлагают различные варианты dither. В Logic Pro X, например, можно использовать три основных типа дизеринга при сведении: POW-r #1, POW-r #2 и POW-r #3. Правильная настройка дизеринга для ваших целей будет в основном зависеть от динамического диапазона вашего аудио.
POW-r #1 Dithering
Эта первая категория дизеринга, предлагаемая Logic Pro, не обеспечивает формирование шума и лучше всего подходит для миксов с низким динамическим диапазоном.
POW-r #2 Dithering
В основном используется для речи (т.е. подкастов или радиопередач), POW-r #2 dithering (формирование шума) уменьшает шум в диапазоне частот 2 кГц и усиливает его в районе 14 кГц и выше, скрывая при этом искажения квантования. Эта мягкая эквализация хорошо подходит для прояснения многих типов вокала.
POW-r #3 Dithering
Что касается третьего варианта дизеринга в Logic Pro, то дизеринг (формирование шума) POW-r #3 лучше всего подходит для высокодинамичных миксов, таких как акустическая, оркестровая музыка или музыка больших групп. Модуляция/выравнивание шума, применяемые при этом типе дизеринга, превосходят возможности POW-r #2, что имеет смысл для более динамичных записей.
Другие виды дизеринга
Изучая другие DAW и плагины лимитеров/шумоподавителей, вы можете встретить такие термины, как «нет», «умеренный» и «ультра». Эти слова относятся к количеству шумоподавления, применяемого к данному сигналу. Вообще говоря, шумообразование, предлагаемое различными типами dither, уменьшает низкочастотное содержание сигнала (область 2 кГц) и усиливает его высокие частоты.
Вопросы и ответы по дизерингу
Должен ли я использовать дизеринг?
Если вы понижаете дискретизацию аудио с большей битовой глубины до меньшей (т.е. с 32-битной фиксированной точки до 24- или 16-битной), вам следует использовать дизеринг.
В каких случаях следует выполнять дизеринг звука?
Всегда используйте dither при экспорте, сведении или мастеринге аудио. Другими словами, используйте dither при снижении битовой глубины дорожки.
Нужно ли использовать дизеринг при мастеринге?
Да. На самом деле, процесс мастеринга часто является лучшим моментом для использования дизеринга, поскольку он позволяет скрыть любые нежелательные искажения квантования до снижения битовой глубины звука. Таким образом, ваш трек будет готов к воспроизведению на различных платформах и устройствах.
Ты слышишь, что происходит?
О: Если вы правильно наложите дитеринг на аудио, вы вообще не услышите шум низкого уровня, особенно в контексте. Конечно, можно услышать дизеринг, если применить его к тихим аудиофайлам и значительно увеличить громкость. Dither будет звучать как некая вариация белого шума (мягкий, постоянный, шипящий).
Можете ли вы услышать разницу между 16-битным и 24-битным звуком?
О: Если у вас нет хорошо натренированного уха или вы не слушаете высокодинамичную музыку на высококачественных колонках, вы вряд ли заметите разницу между 24- и 16-битным звуком.
Какой шум полезен для дизеринга?
Белый, коричневый и розовый шум могут быть полезны для дизеринга. Все они представляют собой разновидности «шипящего» звука, который вы можете узнать при настройке радиоприемника. Белый шум распределен по частотному спектру, коричневый шум находится на нижнем конце, а розовый шум находится где-то между ними.
Предпочтителен ли синий шумоподавитель?
Сглаживание синего шума полезно для сохранения достоверности изображения при снижении его разрешения на значительно низких частотах дискретизации. В Proceedings of the IEEE есть всестороннее исследование этого явления.
Имеет ли значение дизеринг?
Да, особенно если ваша песня имеет высокий динамический диапазон. Правильное дизеринг аудио при уменьшении его битовой глубины позволит уменьшить искажения квантования, сохранив или улучшив динамику.