Разрядность (аудио)

При использовании импульсно-кодовой модуляции (англ. pulse code modulation, PCM), битовая глубина или разрядность — это число бит информации в каждом сэмпле, и это напрямую соответствует разрешающей способности каждого сэмпла. Примерами битовой глубины являются звуковой компакт-диск, который использует 16 бит на сэмпл, и DVD-Audio и Blu-ray диск, которые могут поддерживать до 24 бит на сэмпл.

В базовых реализациях различия в разрядности в основном влияют на уровень шума от ошибки квантования — а следовательно, на отношение сигнал/шум и динамический диапазон. Однако, такие методы, как дизеринг, формирование шума и передискретизация (избыточная дискретизация) могут смягчить эти эффекты без изменения битовой разрядности. Разрядность влияет на битрейт (скорость передачи) и размер файла.

Разрядность полезна для описания цифровых сигналов PCM. Отличные от PCM форматы, например, использующие сжатие с потерями, не имеют связанной с ними разрядности.^[a]

Двоичное представление

Сигнал PCM является последовательностью цифровых аудиосэмплов, содержащих данные, необходимые для восстановления исходного аналогового сигнала. Каждый сэмпл представляет амплитуду сигнала в определённый момент времени, а сами сэмплы по времени равномерно распределены. Амплитуда является единственной информацией, хранящейся в сэмпле явно, и обычно она представлена в виде целого числа или числа с плавающей запятой в двоичной системе счисления с фиксированным числом знаков – разрядность сэмпла, которую называют также длиной или размером слова.

Разрешение указывает количество дискретных значений, которые могут быть представлены в диапазоне аналоговых значений. Разрешение двоичных целых чисел экспоненциально растёт с увеличением длины слова — добавление одного бита удваивает разрешение, добавление двух битов учетверяет его и так далее. Количество возможных значений, которое может представлять целочисленная разрядность, рассчитывается по формуле 2ⁿ, где n — разрядность^[1]. Таким образом, 16-битная система имеет разрешение 65536 (2¹⁶) возможных значений.

Целочисленные аудиоданные в формате PCM обычно хранятся как числа со знаком в дополнительном коде^[2].

В настоящее время большинство форматов аудиофайлов и цифровых звуковых рабочих станций (англ. digital audio workstation , DAW) поддерживают форматы PCM с представлением сэмплов в виде чисел с плавающей запятой^[3]^[4]^[5]^[6]. Форматы файлов WAV и AIFF поддерживают такое представление^[7]^[8]. В отличие от целых чисел, состоящих из единой последовательности битов, число с плавающей запятой состоит из отдельных полей, математическое соотношение которых формирует число. Наиболее распространённым стандартом является IEEE 754, в котором число состоит из трёх полей: бита знака, указывающего, является ли число положительным или отрицательным, мантиссы, и экспоненты, определяющей множитель степени двойки для масштабирования мантиссы. Мантисса выражается в виде двоичной дроби в форматах с плавающей запятой IEEE по основанию два^[9]

Квантование

Разрядность определяет максимальный уровень отношения сигнал/шум восстановленного сигнала, который ограничивается ошибкой квантования. Разрядность не имеет влияния на амплитудно-частотную характеристику, которая определяется частотой дискретизации.

Ошибка квантования, возникающая при аналого-цифровом преобразовании (АЦП), может быть смоделирована как шум квантования. Это ошибка округления между входным аналоговым напряжением АЦП и выходным оцифрованным значением. Этот шум нелинеен и зависит от сигнала.

В идеальном АЦП, где ошибка квантования равномерно распределена в пределах $\scriptstyle {\pm {\frac {1}{2}}}$ наименьшего значащего бита, а сигнал имеет равномерное распределение, охватывающее все уровни квантования, отношение сигнал – шум квантования (ОСШК) может быть рассчитано исходя из

ОСШК

=20\log _{10}({\sqrt {1{,}5}}\cdot 2^{b})\approx (1{,}76+6{,}02\,b)\ {\text{дБ}},

где b — количество бит квантования, а результат измеряется в децибелах (дБ)^[10]^[11].

Таким образом, 16-битное цифровое аудио на CD имеет теоретический максимальный показатель отношения сигнал/шум 98 дБ, а профессиональное 24-битное цифровое аудио достигает 146 дБ. По состоянию на 2011 год технология цифровых аудиоконверторов ограничена отношением сигнал/шум около 123 дБ^[12]^[13]^[14] (эффективно 21 бит) из-за реальных ограничений в проектировании интегральных схем^[b]. Тем не менее, это примерно соответствует возможностям человеческого слуха^[17]^[18]. Несколько преобразователей могут использоваться для охвата различных диапазонов одного и того же сигнала, объединяясь для записи более широкого динамического диапазона в долгосрочной перспективе, при этом оставаясь ограниченными динамическим диапазоном отдельного преобразователя в краткосрочной перспективе, что называется расширением динамического диапазона^[19]^[20].

Отношение сигнал/шум (ОСШ) и разрешение по разрядности (без взвешивания)
# бит	ОСШ (аудио)	ОСШ (видео)	Минимальный шаг в дБ (ошибка квантования /округления)	Число возможных значений (на сэмпл)	Диапазон (на сэмпл) для знакового представления
4	25,84 дБ	34,31 дБ	1,723 дБ	16	от −8 до +7
8	49,93 дБ	58,92 дБ	0,1958 дБ	256	от −128 до +127
11	67,99 дБ	77,01 дБ	0,03321 дБ	2,048	от −1024 до +1023
12	74,01 дБ	83,04 дБ	0,01807 дБ	4096	от −2048 до +2047
16	98,09 дБ	107,12 дБ	0,001497 дБ	65536	от −32768 до +32767
18	110,13 дБ		0,0004201 дБ	262144	от −131072 до +131071
20	122,17 дБ		0,0001165 дБ	1048576	от −524288 до +524287
24	146,26 дБ		0,000008717 дБ	16.777.216	от −8.388.608 до +8.388.607
32	194,42 дБ		4,52669593⋅10⁻⁸ дБ	4.294.967.296	от −2.147.483.648 до +2.147.483.647
48	290,75 дБ		1,03295047⋅10⁻¹² дБ	281.474.976.710.656	от −140.737.488.355.328 до +140.737.488.355.327
64	387,08 дБ		2,09836113⋅10⁻¹⁷ дБ	18.446.744.073.709.551.616	от −9.223.372.036.854.775.808 до +9.223.372.036.854.775.807

Плавающая запятая

Разрешение чисел с плавающей запятой обрабатывается не так просто, как целочисленные сэмплы, поскольку значения с плавающей запятой расположены неравномерно. В представлении с плавающей запятой расстояние между любыми двумя соседними значениями пропорционально самому значению.

Компромисс между форматами с плавающей запятой и целыми числами заключается в том, что расстояние между большими числами с плавающей запятой больше, чем между большими целыми числами одинаковой битовой глубины. Округление большого числа с плавающей запятой приводит к большей ошибке, чем округление малого числа с плавающей запятой, тогда как округление целого числа всегда приводит к одинаковому уровню ошибки. Иными словами, у целых чисел округление равномерно, всегда округляя младший значащий бит до 0 или 1, а формат с плавающей запятой имеет равномерное отношение сигнал/шум, уровень шума квантования всегда пропорционален уровню сигнала^[21]. Уровень шума чисел с плавающей запятой возрастает с увеличением сигнала и падает с его уменьшением, что приводит к слышимым отклонениям, если битовая глубина достаточно мала^[22].

Обработка аудиосигнала

Большинство операций обработки цифрового звука включают повторное квантование сэмплов и, следовательно, вносят дополнительные ошибки округления, аналогичные исходной ошибке квантования, возникающей при аналого-цифровом преобразовании. Чтобы предотвратить ошибки округления, превышающие неявную ошибку при АЦП, вычисления во время обработки должны выполняться с более высокой точностью, чем входные сэмплы.

Цифровая обработка сигналов (ЦОС, англ. Digital signal processing, DSP) может выполняться использованием либо арифметики с фиксированной запятой, либо арифметики с плавающей запятой. В обоих случаях точность каждой операции определяется точностью аппаратных операций, используемых для выполнения каждого этапа обработки, а не разрешением входных данных. Например, на процессорах x86 операции с плавающей запятой выполняются с или одинарной или двойной точностью, а операции с фиксированной запятой — с разрешением 16, 32 или 64 бита. Следовательно, вся обработка, выполняемая на оборудовании на базе Intel, будет осуществляться с учётом этих ограничений, независимо от формата исходных данных^[c].

Цифровые сигнальные процессоры (англ. Digital signal processor, DSP) с фиксированной запятой часто поддерживают определённые длины слов для обеспечения соответствующего разрешения сигнала. Например, Motorola 56000 DSP использует 24-битные множители и 56-битные сумматоры для выполнения операций умножение-сложение над 24-битными сэмплами без переполнения или усечения^[23]. На устройствах, не поддерживающих большие сумматоры, результаты с фиксированной точкой могут быть усечены, что снижает точность. Ошибки накапливаются, проходя через несколько этапов обработки сигнала, со скоростью, зависящей от выполняемых операций. Для некоррелированных этапов обработки аудиоданных без постоянной составляющей ошибки считаются случайными с нулевым средним. При таком допущении стандартное отклонение распределения представляет собой сигнал ошибки, а ошибка квантования масштабируется пропорционально квадратному корню из числа операций^[24]. Высокая точность необходима для алгоритмов, включающих многократную обработку, например, свёртку^[25]. Высокая точность также требуется в рекурсивных алгоритмах, таких как фильтры с с бесконечной импульсной характеристикой (БИХ)^[26]. В частном случае БИХ фильтров ошибка округления может ухудшить частотную характеристику и вызвать нестабильность^[25].

Дизеринг

Шум, возникающий из-за ошибок квантования, включая ошибки округления и потерю точности при обработке звука, можно уменьшить, добавив небольшой уровень случайного шума, называемого дизерингом, к сигналу перед квантованием. Дизеринг устраняет нелинейное поведение ошибок квантования, обеспечивая очень низкие искажения, но ценой незначительного повышения уровня шума. Рекомендуемый уровень дизеринга для 16-битного цифрового аудио, измеренный с использованием взвешивания шума ITU-R 468, составляет около 66 дБ ниже установочного сигнала^[27], или 84 дБ ниже цифровой полной шкалы, что сопоставимо с уровнем шума микрофона и помещения и поэтому имеет незначительное значение в 16-битном аудио.

Для 24-битного и 32-битного аудио дизеринг не требуется, поскольку уровень шума цифрового преобразователя всегда выше необходимого уровня любого дизеринга, который мог бы быть применён. Теоретически 24-битное аудио может кодировать динамический диапазон в 144 дБ, а 32-битное аудио может достигать 192 дБ, но на практике это практически невозможно, поскольку даже лучшие датчики и микрофоны редко превышают 130 дБ^[28].

Дизеринг может также быть использован для увеличения эффективного динамического диапазона. Воспринимаемый динамический диапазон 16-битного аудио может составлять 120 дБ и более с формирующем шум дизерингом, используя частотную характеристику человеческого уха^[29]^[30].

Динамический диапазон и запас по уровню

Динамический диапазон — это разность между наибольшим и наименьшим сигналами, который система способна записать или воспроизвести. Без дизеринга динамический диапазон коррелирует с уровнем шума квантования. Например, 16-битное целочисленное разрешение обеспечивает динамический диапазон около 96 дБ. При правильном применении дизеринга цифровые системы могут воспроизвести сигналы с уровнями ниже тех, которые обычно допускает их разрешение, расширяя эффективный динамический диапазон за пределы, установленные разрешением^[31]. Использование таких методов, как передискретизация и формирование шума может дополнительно расширить динамический диапазон дискретизированного аудио путём перемещения ошибки квантования за пределы интересующей полосы частот.

Если максимальный уровень сигнала ниже допустимого для разрядности, запись имеет запас по уровню^[32]^[33]. Использование более высокой разрядности при студийной записи позволяет создать этот запас, сохраняя при этом тот же диапазон. Это снижает риск клиппинга без увеличения ошибок квантования на низких уровнях громкости.

Передискретизация

Передискретизация является альтернативным методом повышения динамического диапазона PCM аудио без изменения числа бит на сэмпл^[10]. При передискретизации аудиосэмплы получаются с частотой, кратной желаемой частоте дискретизации. Поскольку предполагается, что ошибка квантования равномерно распределена по частоте, бо́льшая часть этой ошибки смещается в ультразвуковые частоты и может быть удалена цифро-аналоговым преобразователем во время воспроизведения.

Для увеличения разрешения, эквивалентного дополнительным n битам, сигнал должен быть передискретизирован на

число сэмплов

=(2^{n})^{2}=2^{2n}.

Например, 14-битный ADC может создать 16-битное 48 кГц аудио, если работает на частоте передискретизации 16×, или 768 кГц. Передискретизированный PCM, таким образом, обменивает меньшее число бит на сэмпл на большее число сэмплов, чтобы получить то же разрешение.

Динамический диапазон может быть также улучшен путём передискретизации при восстановления сигнала, даже если передискретизация отсутствовала на этапе записи. Рассмотрим 16× передискретизацию при восстановлении сигнала. Каждый сэмпл при восстановлении будет уникален, поскольку для каждой точки исходного сэмпла будет вставлено пятнадцать новых, рассчитанных с помощью цифрового фильтра восстановления. Механизм увеличения эффективной разрядности был обсуждён ранее и заключается в том, что мощность шума квантования не уменьшилась, но спектр шума распределился по полосе пропускания, в 16 раз превышающей исходную звуковую полосу.

Историческая справка. Стандарт компакт-диска был разработан в результате сотрудничества компаний Sony и Philips. Первое потребительское устройство Sony оснащалось 16-битным DAC, в то время как первое устройство Philips имело двойной 14-битный DAC. Это вызвало путаницу на рынке и даже в профессиональных кругах, поскольку 14-битный формат PCM обеспечивает отношение сигнал/шум 84 дБ, 12 дБ меньше чем 16-битный формат PCM. Philips применила 4× передискретизацию с формированием шума первого порядка, что теоретически позволило реализовать полный 96 дБ динамический диапазон формата CD^[34]. На практике у Philips CD100 показатель отношение сигнал/шум в звуковом диапазоне от 20 Гц до 20 кГц составлял от 90 дБ, как и у Sony CDP-101^[35]^[36].

Формирование шума

При избыточной дискретизации сигнала уровень шума квантования становится одинаковым на единицу полосы пропускания для всех частот, а динамический диапазон увеличивается лишь пропорционально квадратному корню из коэффициента избыточной дискретизации. Формирование шума является техникой, которая добавляет дополнительный шум на высоких частотах, компенсирующий часть ошибок на низких частотах, что приводит к более значительному увеличению динамического диапазона при избыточной дискретизации. Для формирование шума n-го порядка, динамический диапазон избыточно дискретизированного сигнала увеличивается дополнительно на 6n дБ по сравнению с передискретизацией без формирования шума^[37]. Например, для аналогового аудио с частотой 20 кГц, дискретированного с 4-кратным избытком и формирование шума второго порядка, динамический диапазон увеличивается на 30 дБ. Следовательно, 16-битный сигнал, дискретизированный с частотой 176 кГц, будет иметь разрядность, эквивалентную 21-битному сигналу, дискретизированному с частотой 44.1 кГц без формирования шума.

Формирование шума обычно реализуется с помощью сигма-дельта-модуляции. Используя эту модуляцию, DSD достигает теоретического соотношения сигнал/шум 120 дБ на звуковых частотах с использованием 1-битного аудио при 64-кратной передискретизации.

Приложения

Разрядность является фундаментальным свойством реализаций цифрового аудио. В зависимости от требований приложения и возможностей оборудования, для различных приложений используются различные разрядности.

Пример приложений и поддерживаемая разрядность
Приложение	Описание	Аудиоформат(ы)
CD-DA (Red Book)^[38]	Цифровой носитель	16-битная LPCM
DVD-Audio^[39]	Цифровой носитель	16-, 20- и 24-битная LPCM^[A]
Super Audio CD^[40]	Цифровой носитель	1-битный Direct Stream Digital (PDM)
Blu-ray Аудиодиск^[41]	Цифровой носитель	16-, 20- и 24-битный формат LPCM и другие^[B]
DV аудио^[42]	Цифровой носитель	12- и 16-битный несжатый формат PCM
ITU-T рекомендация G.711^[43]	Стандарт сжатия для телефонии	8-битный формат PCM с компандированием^[C]
NICAM-1, NICAM-2 и NICAM-3^[44]	Стандартные сжатия для телерадиовещания	10-, 11- и 10-битные форматы PCM соответственно, с компандированием^[D]
Ardour	DAW от Пауля Дэвиса и компании Ardour	32-битная плавающая точка^[45]
Pro Tools 11	DAW от компании Avid Technology	16- и 24-битные или 32-битные сессии с плавающей запятой и сведение с использованием 64-битных чисел с плавающей запятой^[46]
Logic Pro X	DAW от Apple Inc.	16- и 24-битные проекты и сведение с использованием 32- и 64-битных чисел с плавающей запятой ^[47]
Cubase	DAW от Steinberg	Позволяет обрабатывать звук с точностью до 32- или 64-битных чисел с плавающей запятой^[48]
Ableton Live^[6]	DAW от Ableton	32-битная разрядность с плавающей запятой и 64-битный сумматор
Reason 7	DAW от Propellerhead Software	16-, 20- и 24-битное I/O, 32-битная арифметика с плавающей запятой и 64-битным сумматором^[49]
Reaper 5	DAW от Cockos Inc.	8-битный PCM, 16-битный PCM, 24-битный PCM, 32-битный PCM, 32-битный FP, 64-битный FP, 4-битный IMA ADPCM & 2-битный cADPCM рендеринг; целочисленное 8-, 16-, 24-, 32-битное, с плавающей запятой 32- и 64- битное сведение
GarageBand '11 (версия 6)	DAW от Apple Inc.	16-битное по умолчанию с записью реальных инструментов в 24-бита^[50]
Audacity	Аудиоредактор с открытым кодом	16- и 24-битный формат LPCM и 32-битный с плавающей запятой^[51]
FL Studio	DAW от Image-Line	16- и 24-битные целые числа и 32-битные числа с плавающей запятой (управляется ОС)^[52]

↑ DVD-Audio также поддерживает опциональное сжатие Meridian Lossless Packing, схему сжатия без потерь.
↑ Blu-ray поддерживает различные форматы, отличные от LPCM, но все они соответствуют некоторой комбинации 16, 20 или 24 бит на сэмпл.
↑ ITU-T определяет алгоритмы компадирования A-закон и Мю-закон, сжимая данные с 13 и 14 бит соответственно.
↑ Системы NICAM 1, 2 и 3 сжимаются с 13, 14 и 14 битами соответственно.

Битрейт и размер файла

Разрядность влияет на битрейт и размер файла. Биты — это основная единица данных , используемая в вычислительной технике и цифровой связи. Битрейт относится к объему данных, в частности битов, передаваемых или принимаемых в секунду. В формате MP3 и других аудиоформатах с потерями со сжатием, битрейт описывает объём информации, используемой для кодирования аудиосигнала. Обычно он измеряется в килобитах в секунду кБ/с^[53].

См. также

Измерения звуковой системы
Глубина цвета, соответствующая характеристика цифровых изображений
Эффективное число бит

Примечания

↑ Например, в MP3 квантование выполняется над представлением сигнала в частотной области, а не над сэмплами во временно́й области, связанными с разрядностью.
↑ Хотя существуют 32-битные преобразователи, они служат исключительно маркетинговым целям и не дают практических преимуществ перед 24-битными. Дополнительные биты либо нулевые, либо кодируют только шум^[15]^[16].
↑ Аппаратное обеспечение AMD x86 может обрабатывать более высокую точность, чем 64 бита, или даже произвольно большие числа с плавающей запятой или целые числа, но обработка занимает гораздо больше времени, чем для нативных типов.

↑ Thompson, 2005.
↑ Smith, Julius. Pulse Code Modulation (PCM) . Mathematics of the Discrete Fourier Transform (DFT) with Audio Applications, Second Edition, online book (2007). Дата обращения: 22 октября 2012.
↑ Campbell, 2013.
↑ Wherry, Mark. Avid Pro Tools 10 . Sound On Sound (март 2012). Дата обращения: 10 августа 2013.
↑ Price, Simon. Reason Mixing Masterclass . Sound On Sound (октябрь 2005). Дата обращения: 10 августа 2013.
↑ ¹ ² Ableton Reference Manual Version 10, 32. Audio Fact Sheet . Ableton (2019). Дата обращения: 3 сентября 2019.
↑ Kabal, Peter. Audio File Format Specifications, WAVE Specifications . McGill University (3 января 2011). Дата обращения: 10 августа 2013.
↑ Kabal, Peter. Audio File Format Specifications, AIFF / AIFF-C Specifications . McGill University (3 января 2011). Дата обращения: 10 августа 2013.
↑ Smith, Steven. The Scientist and Engineer's Guide to Digital Signal Processing, Chapter 4 – DSP Software / Floating Point (Real Numbers) . www.dspguide.com (1997–1998). Дата обращения: 10 августа 2013.
↑ ¹ ² Kester, Walt. Taking the Mystery out of the Infamous Formula, "SNR = 6.02N + 1.76dB," and Why You Should Care . Analog Devices (2007). Дата обращения: 26 июля 2011.
↑ Kester, Walt. Oversampling Interpolating DACs . Analog Devices. Дата обращения: 19 августа 2013. Архивировано из оригинала 19 мая 2012 года.
↑ Nwavguy. NwAvGuy: Noise & Dynamic Range . NwAvGuy (6 сентября 2011). — «24-битные DAC часто достигают лишь примерно 16-bit performance and the very best reach 21-bit (ENOB) performance». Дата обращения: 2 декабря 2016.
↑ PCM4222 . — «Динамический диапазон (−60 дБ вход, A-взвешенный): 124 дБ (типичное значение) динамичный диапазон (−60 dB вход, полоса пропускания 20 kHz): 122 дБ (типичное значение)». Дата обращения: 21 апреля 2011.
↑ WM8741 : High-Performance Stereo DAC . Cirrus Logic. — «отношение сигнал/шум 128dB (‘A’-вх\звешенное моно @ 48 kHz) отношение сигнал/шум 123 дБ SNR (невзвешенное стерео @ 48 kHz)». Дата обращения: 2 декабря 2016.
↑ The great audio myth: why you don't need that 32-bit DAC (амер. англ.). Android Authority (19 января 2016). — «Таким образом, ваш 32-битный цифро-аналоговый преобразователь сможет выдавать максимум 21 бит полезных данных, а остальные биты будут маскироваться шумом схемы.» Дата обращения: 2 декабря 2016.
↑ 32-bit capable DACs . hydrogenaud.io. — «все существующие сейчас '32-битные' DAC микросхемы имеют реальное разрешение меньше 24 бит.» Дата обращения: 2 декабря 2016.
↑ D. R. Campbell. Aspects of Human Hearing . — «Динамический диапазон человеческого слуха [приемерно] равен 120 дБ». Дата обращения: 21 апреля 2011. Архивировано из оригинала 21 августа 2011 года.
↑ Sensitivity of Human Ear . — «Практический динамический диапазон можно определить как диапазон от порога слышимости до порога боли [130 dB]». Дата обращения: 21 апреля 2011. Архивировано 4 июня 2011 года.
↑ , "Multiple A to D converters for enhanced dynamic range", US6317065B1
↑ Christodoulou, Lane, Kasparis, 2010, с. 1–4.
↑ Smith, Steven. The Scientist and Engineer's Guide to Digital Signal Processing, Chapter 28 – Digital Signal Processors / Fixed versus Floating Point . www.dspguide.com (1997–1998). Дата обращения: 10 августа 2013.
↑ Moorer, James. 48-Bit Integer Processing Beats 32-Bit Floating-Point for Professional Audio Applications . www.jamminpower.com (сентябрь 1999). Дата обращения: 12 августа 2013. Архивировано из оригинала 14 февраля 2019 года.
↑ DSP56001A . Freescale. Дата обращения: 15 августа 2013.
↑ Smith, Steven. The Scientist and Engineer's Guide to Digital Signal Processing, Chapter 4 – DSP Software / Number Precision (1997–1998). Дата обращения: 19 августа 2013.
↑ ¹ ² Tomarakos, John. Relationship of Data Word Size to Dynamic Range and Signal Quality in Digital Audio Processing Applications . www.analog.com. Analog Devices. Дата обращения: 16 августа 2013.
↑ Carletta, 2003, с. 656–661.
↑ Регулировка уровня сигнала в записи и вещании . Дата обращения: 28 декабря 2025.
↑ Choosing a high-performance audio ADC, 14 сентября 2011, Дата обращения: 7 мая 2019
↑ Montgomery, Chris. 24/192 Music Downloads ...and why they make no sense . xiph.org (25 марта 2012). — «Благодаря использованию формирующего дизеринга, который перемещает энергию шума квантования на частоты, где ее труднее услышать, эффективный динамический диапазон 16-битного аудио на практике достигает 120 дБ, что более чем в пятнадцать раз превышает заявленные 96 дБ. 120 дБ — это больше, чем разница между комаром где-то в той же комнате и отбойным молотком в футе от вас... или разница между пустой "звукоизолированной" комнатой и звуком, достаточно громким, чтобы за несколько секунд повредить слух. 16 бит достаточно, чтобы сохранить все, что мы можем услышать, и этого будет достаточно навсегда.» Дата обращения: 26 мая 2013. Архивировано из оригинала 7 июля 2013 года.
↑ Stuart, J. Robert. Coding High Quality Digital Audio . Meridian Audio Ltd (1997). — «Одно из величайших открытий в импульсно-кодовой модуляции заключалось в том, что добавление небольшого случайного шума, который мы называем дизерингом, позволяет устранить эффект усечения. Еще более важным стало осознание того, что существует "правильный" вид случайного шума для добавления, и когда используется правильный дизеринг, разрешение цифровой системы становится «бесконечным».» Дата обращения: 25 февраля 2016. Архивировано из оригинала 7 апреля 2016 года.
↑ Dithering in Analog-to-Digital Conversion . e2v Semiconductors (2007). Дата обращения: 201107-26. Архивировано из оригинала 4 октября 2011 года.
↑ Владимир Лакодин. Громкость, гейн и уровень в звукозаписи: понятный гайд для музыкантов (без формул) (15 декабря 2023). Дата обращения: 28 декабря 2025.
↑ Словарь звукорежиссера . Дата обращения: 28 декабря 2025.
↑ The history of the CD . philips.com. Дата обращения: 7 октября 2020.
↑ Philips CD100 . hifiengine.
↑ Sony CDP-101 . hifiengine.
↑ B.1 First and Second-Order Noise Shaping Loops . Дата обращения: 19 августа 2013.
↑ Sweetwater Knowledge Base, Masterlink: What is a "Red Book" CD? www.sweetwater.com. Sweetwater (27 апреля 2007). Дата обращения: 25 августа 2013.
↑ Understanding DVD-Audio . Sonic Solutions. Дата обращения: 25 августа 2013. Архивировано из оригинала 4 марта 2012 года.
↑ Shapiro, L. Surround Sound, Page 10 . ExtremeTech (2 июля 2001). Дата обращения: 26 августа 2013.
↑ White paper Blu-ray Disc Format, 2.B Audio Visual Application Format Specifications for BD-ROM Version 2.4 . Blu-ray Disc Association (апрель 2010). Дата обращения: 25 августа 2013. Архивировано из оригинала 8 июля 2011 года.
↑ Puhovski, Nenad. DV – A SUCCESS STORY . www.stanford.edu (апрель 2000). Дата обращения: 26 августа 2013. Архивировано из оригинала 27 октября 2004 года.
↑ G.711 : Pulse code modulation (PCM) of voice frequencies (PDF). International Telecommunication Union. Дата обращения: 25 августа 2013.
↑ DIGITAL SOUND SIGNALS: tests to compare the performance of five companding systems for high-quality sound signals . BBC Research Department (август 1978). Дата обращения: 26 августа 2013. Архивировано 8 ноября 2012 года.
↑ Ardour Key Features . Ardour Community (2014). Дата обращения: 8 апреля 2014. Архивировано из оригинала 8 апреля 2014 года.
↑ Pro Tools Documentation, Pro Tools Reference Guide (ZIP/PDF). Avid (2013). Дата обращения: 26 августа 2013.
↑ Logic Pro X: User Guide . Apple (январь 2010). Дата обращения: 26 августа 2013.
↑ Cubase Pro 10.5 Manual . Steinberg (2020). Дата обращения: 2 сентября 2020.
↑ Reason 7 Operation Manual . Propellerhead Software (2013). Дата обращения: 26 августа 2013. Архивировано из оригинала 24 мая 2013 года.
↑ GarageBand '11: Set the audio resolution . Apple (13 марта 2012). Дата обращения: 26 августа 2013.
↑ Audacity: Features . wiki.audacityteam.com. Audacity development team. Дата обращения: 13 сентября 2014.
↑ Audio Settings . www.image-line.com. Дата обращения: 12 февраля 2019.
↑ Sample Rate, Bit-Depth & Bitrate | Exclusivemusicplus. Exclusivemusicplus (амер. англ.). 26 октября 2018. Дата обращения: 30 ноября 2018.

Литература

Ken C. Pohlmann. Principles of Digital Audio. — 4th. — McGraw-Hill Professional, 2000. — ISBN 978-0-07-134819-5.
Robert Campbell. Pro Tools 10 Advanced Music Production Techniques, pg. 247. — =Cengage Learning, 2013. — ISBN 978-1133728016.
Dan Thompson. Understanding Audio. — Berklee Press, 2005. — ISBN 978-0-634-00959-4.
Lakis Christodoulou, John Lane, Takis Kasparis. Dynamic range extension using multiple A/D converters // 2010 4th International Symposium on Communications, Control and Signal Processing (ISCCSP). — 2010. — ISBN 978-1-4244-6285-8. — doi:10.1109/ISCCSP.2010.5463427.
Joan Carletta. Determining appropriate precisions for signals in fixed-point IIR filters // Proceedings of the 40th annual Design Automation Conference. — 2003. — ISBN 1581136889. — doi:10.1145/775832.775998.

[43] DVD-Audio также поддерживает опциональное сжатие Meridian Lossless Packing, схему сжатия без потерь.

[46] Blu-ray поддерживает различные форматы, отличные от LPCM, но все они соответствуют некоторой комбинации 16, 20 или 24 бит на сэмпл.

[49] ITU-T определяет алгоритмы компадирования A-закон и Мю-закон, сжимая данные с 13 и 14 бит соответственно.

[51] Системы NICAM 1, 2 и 3 сжимаются с 13, 14 и 14 битами соответственно.

[1] Например, в MP3 квантование выполняется над представлением сигнала в частотной области, а не над сэмплами во временно́й области, связанными с разрядностью.

[18] Хотя существуют 32-битные преобразователи, они служат исключительно маркетинговым целям и не дают практических преимуществ перед 24-битными. Дополнительные биты либо нулевые, либо кодируют только шум^[15]^[16].

[25] Аппаратное обеспечение AMD x86 может обрабатывать более высокую точность, чем 64 бита, или даже произвольно большие числа с плавающей запятой или целые числа, но обработка занимает гораздо больше времени, чем для нативных типов.

[_0b4231fb134bc3ba-2] Thompson, 2005.

[Ju-3] Smith, Julius. Pulse Code Modulation (PCM) . Mathematics of the Discrete Fourier Transform (DFT) with Audio Applications, Second Edition, online book (2007). Дата обращения: 22 октября 2012.

[_991157a3c82a4a43-4] Campbell, 2013.

[PF-5] Wherry, Mark. Avid Pro Tools 10 . Sound On Sound (март 2012). Дата обращения: 10 августа 2013.

[RF-6] Price, Simon. Reason Mixing Masterclass . Sound On Sound (октябрь 2005). Дата обращения: 10 августа 2013.

[L0-7] ¹ ² Ableton Reference Manual Version 10, 32. Audio Fact Sheet . Ableton (2019). Дата обращения: 3 сентября 2019.

[WR-8] Kabal, Peter. Audio File Format Specifications, WAVE Specifications . McGill University (3 января 2011). Дата обращения: 10 августа 2013.

[AR-9] Kabal, Peter. Audio File Format Specifications, AIFF / AIFF-C Specifications . McGill University (3 января 2011). Дата обращения: 10 августа 2013.

[D4-10] Smith, Steven. The Scientist and Engineer's Guide to Digital Signal Processing, Chapter 4 – DSP Software / Floating Point (Real Numbers) . www.dspguide.com (1997–1998). Дата обращения: 10 августа 2013.

[WK-11] ¹ ² Kester, Walt. Taking the Mystery out of the Infamous Formula, "SNR = 6.02N + 1.76dB," and Why You Should Care . Analog Devices (2007). Дата обращения: 26 июля 2011.

[WA-12] Kester, Walt. Oversampling Interpolating DACs . Analog Devices. Дата обращения: 19 августа 2013. Архивировано из оригинала 19 мая 2012 года.

[Nw-13] Nwavguy. NwAvGuy: Noise & Dynamic Range . NwAvGuy (6 сентября 2011). — «24-битные DAC часто достигают лишь примерно 16-bit performance and the very best reach 21-bit (ENOB) performance». Дата обращения: 2 декабря 2016.

[DR-14] PCM4222 . — «Динамический диапазон (−60 дБ вход, A-взвешенный): 124 дБ (типичное значение) динамичный диапазон (−60 dB вход, полоса пропускания 20 kHz): 122 дБ (типичное значение)». Дата обращения: 21 апреля 2011.

[CL-15] WM8741 : High-Performance Stereo DAC . Cirrus Logic. — «отношение сигнал/шум 128dB (‘A’-вх\звешенное моно @ 48 kHz) отношение сигнал/шум 123 дБ SNR (невзвешенное стерео @ 48 kHz)». Дата обращения: 2 декабря 2016.

[AA-16] The great audio myth: why you don't need that 32-bit DAC (амер. англ.). Android Authority (19 января 2016). — «Таким образом, ваш 32-битный цифро-аналоговый преобразователь сможет выдавать максимум 21 бит полезных данных, а остальные биты будут маскироваться шумом схемы.» Дата обращения: 2 декабря 2016.

[HG-17] 32-bit capable DACs . hydrogenaud.io. — «все существующие сейчас '32-битные' DAC микросхемы имеют реальное разрешение меньше 24 бит.» Дата обращения: 2 декабря 2016.

[HH-19] D. R. Campbell. Aspects of Human Hearing . — «Динамический диапазон человеческого слуха [приемерно] равен 120 дБ». Дата обращения: 21 апреля 2011. Архивировано из оригинала 21 августа 2011 года.

[HE-20] Sensitivity of Human Ear . — «Практический динамический диапазон можно определить как диапазон от порога слышимости до порога боли [130 dB]». Дата обращения: 21 апреля 2011. Архивировано 4 июня 2011 года.

[P1-21] , "Multiple A to D converters for enhanced dynamic range", US6317065B1

[_5f0400616275445c-22] Christodoulou, Lane, Kasparis, 2010, с. 1–4.

[SS-23] Smith, Steven. The Scientist and Engineer's Guide to Digital Signal Processing, Chapter 28 – Digital Signal Processors / Fixed versus Floating Point . www.dspguide.com (1997–1998). Дата обращения: 10 августа 2013.

[JM-24] Moorer, James. 48-Bit Integer Processing Beats 32-Bit Floating-Point for Professional Audio Applications . www.jamminpower.com (сентябрь 1999). Дата обращения: 12 августа 2013. Архивировано из оригинала 14 февраля 2019 года.

[FS-26] DSP56001A . Freescale. Дата обращения: 15 августа 2013.

[SM-27] Smith, Steven. The Scientist and Engineer's Guide to Digital Signal Processing, Chapter 4 – DSP Software / Number Precision (1997–1998). Дата обращения: 19 августа 2013.

[JT-28] ¹ ² Tomarakos, John. Relationship of Data Word Size to Dynamic Range and Signal Quality in Digital Audio Processing Applications . www.analog.com. Analog Devices. Дата обращения: 16 августа 2013.

[_30b6a57b6ad84999-29] Carletta, 2003, с. 656–661.

[УС-30] Регулировка уровня сигнала в записи и вещании . Дата обращения: 28 декабря 2025.

[SK-31] Choosing a high-performance audio ADC, 14 сентября 2011, Дата обращения: 7 мая 2019

[CM-32] Montgomery, Chris. 24/192 Music Downloads ...and why they make no sense . xiph.org (25 марта 2012). — «Благодаря использованию формирующего дизеринга, который перемещает энергию шума квантования на частоты, где ее труднее услышать, эффективный динамический диапазон 16-битного аудио на практике достигает 120 дБ, что более чем в пятнадцать раз превышает заявленные 96 дБ. 120 дБ — это больше, чем разница между комаром где-то в той же комнате и отбойным молотком в футе от вас... или разница между пустой "звукоизолированной" комнатой и звуком, достаточно громким, чтобы за несколько секунд повредить слух. 16 бит достаточно, чтобы сохранить все, что мы можем услышать, и этого будет достаточно навсегда.» Дата обращения: 26 мая 2013. Архивировано из оригинала 7 июля 2013 года.

[RS-33] Stuart, J. Robert. Coding High Quality Digital Audio . Meridian Audio Ltd (1997). — «Одно из величайших открытий в импульсно-кодовой модуляции заключалось в том, что добавление небольшого случайного шума, который мы называем дизерингом, позволяет устранить эффект усечения. Еще более важным стало осознание того, что существует "правильный" вид случайного шума для добавления, и когда используется правильный дизеринг, разрешение цифровой системы становится «бесконечным».» Дата обращения: 25 февраля 2016. Архивировано из оригинала 7 апреля 2016 года.

[E2-34] Dithering in Analog-to-Digital Conversion . e2v Semiconductors (2007). Дата обращения: 201107-26. Архивировано из оригинала 4 октября 2011 года.

[УЗ-35] Владимир Лакодин. Громкость, гейн и уровень в звукозаписи: понятный гайд для музыкантов (без формул) (15 декабря 2023). Дата обращения: 28 декабря 2025.

[HR-36] Словарь звукорежиссера . Дата обращения: 28 декабря 2025.

[PH-37] The history of the CD . philips.com. Дата обращения: 7 октября 2020.

[HP-38] Philips CD100 . hifiengine.

[HF-39] Sony CDP-101 . hifiengine.

[B1-40] B.1 First and Second-Order Noise Shaping Loops . Дата обращения: 19 августа 2013.

[DA-41] Sweetwater Knowledge Base, Masterlink: What is a "Red Book" CD? www.sweetwater.com. Sweetwater (27 апреля 2007). Дата обращения: 25 августа 2013.

[A2-42] Understanding DVD-Audio . Sonic Solutions. Дата обращения: 25 августа 2013. Архивировано из оригинала 4 марта 2012 года.

[LS-44] Shapiro, L. Surround Sound, Page 10 . ExtremeTech (2 июля 2001). Дата обращения: 26 августа 2013.

[BR-45] White paper Blu-ray Disc Format, 2.B Audio Visual Application Format Specifications for BD-ROM Version 2.4 . Blu-ray Disc Association (апрель 2010). Дата обращения: 25 августа 2013. Архивировано из оригинала 8 июля 2011 года.

[A3-47] Puhovski, Nenad. DV – A SUCCESS STORY . www.stanford.edu (апрель 2000). Дата обращения: 26 августа 2013. Архивировано из оригинала 27 октября 2004 года.

[G7-48] G.711 : Pulse code modulation (PCM) of voice frequencies (PDF). International Telecommunication Union. Дата обращения: 25 августа 2013.

[NC-50] DIGITAL SOUND SIGNALS: tests to compare the performance of five companding systems for high-quality sound signals . BBC Research Department (август 1978). Дата обращения: 26 августа 2013. Архивировано 8 ноября 2012 года.

[AF-52] Ardour Key Features . Ardour Community (2014). Дата обращения: 8 апреля 2014. Архивировано из оригинала 8 апреля 2014 года.

[PD-53] Pro Tools Documentation, Pro Tools Reference Guide (ZIP/PDF). Avid (2013). Дата обращения: 26 августа 2013.

[LG-54] Logic Pro X: User Guide . Apple (январь 2010). Дата обращения: 26 августа 2013.

[SB-55] Cubase Pro 10.5 Manual . Steinberg (2020). Дата обращения: 2 сентября 2020.

[RM-56] Reason 7 Operation Manual . Propellerhead Software (2013). Дата обращения: 26 августа 2013. Архивировано из оригинала 24 мая 2013 года.

[GG-57] GarageBand '11: Set the audio resolution . Apple (13 марта 2012). Дата обращения: 26 августа 2013.

[AC-58] Audacity: Features . wiki.audacityteam.com. Audacity development team. Дата обращения: 13 сентября 2014.

[AS-59] Audio Settings . www.image-line.com. Дата обращения: 12 февраля 2019.

[BD-60] Sample Rate, Bit-Depth & Bitrate | Exclusivemusicplus. Exclusivemusicplus (амер. англ.). 26 октября 2018. Дата обращения: 30 ноября 2018.

[a]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[b]

[17]

[18]

[19]

[20]

[21]

[22]

[c]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[A]

[40]

[41]

[B]

[42]

[43]

[C]

[44]

[D]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[15]

[16]