Как выбрать частоту дискретизации


Проверяем на практике бессмысленность высоких частот дискретизации / Habr

Много чего написано про ненужность частоты дискретизации 192000 Гц в звуковых файлах, предназначенных для прослушивания. Но аргументы обычно ссылаются на теоремы, для правильного понимания которых нужно довольно хорошо разбираться в математике. Но есть другой способ проверки некоторых утверждений — провести соответствующие эксперименты много раз.


Для начала необходимо сформулировать утверждение, которое будет проверяться в дальнейшем. Если частота 192000 Гц избыточна, то должна существовать более низкая частота дискретизации, при которой происходит корректное восстановление звукового сигнала. Предположим, что это частота 44100 Гц. Если при 192000 Гц происходит корректное восстановление, и при 44100 Гц происходит корректное восстановление, то в обоих случаях результат на выходе должен быть одинаковым. Чтобы проверить это на практике, нужно дорогое оборудование, которое есть далеко не у каждого. Поэтому пойдём немного другим путём. Если в файлах 44100 Гц и 192000 Гц содержится одинаковое количество информации о звуке, то это означает, что преобразование из 192000 Гц в 44100 Гц является сжатием без потерь, следовательно, должен существовать способ восстановления из файла 44100 Гц исходного файла 192000 Гц. Вот это уже может проверить каждый на любом современном компьютере.

В качестве исходника я выбрал музыкальный фрагмент с частотой дискретизации 192000 Гц. Если мне попался какой-то неправильный материал, в котором изначально не было чего-то важного, что должно потеряться при преобразовании из 192000 Гц в 44100 Гц, то любой желающий может проделать описанное в этой статье с любым другим файлом. Все действия будут производиться в свободном редакторе Audacity со стандартными эффектами. Все получаемые в процессе файлы будут сохраняться в формате FLAC с разрядностью 24 бит.

Исходный файл хранится в файле «A.FLAC» и выглядит вот так:

А вот так выглядит его спектр:

Нас интересует только звуковая информация, поэтому ультразвук удалим с помощью эквалайзера.

И получим такой спектр:

Экспортируем результат в файл «B.FLAC» — именно с ним мы будем сравнивать файл, который получится в конце всех преобразований.

Перед преобразованием частоты дискретизации убедимся, что в настройках выставлено максимальное качество:

Далее выбираем новую частоту дискретизации проекта и его экспортируем в файл «C.FLAC»

Затем открываем файл «C.FLAC», устанавливаем частоту дискретизации проекта 192000 Гц и экспортируем в файл «D.FLAC».

И остался самый главный этап: открыть файлы «B.FLAC», «D.FLAC» и сравнить их:

Посмотрим поближе:

Разницы нет. Сравним получше — инвертируем одну из дорожек

И сведём всё в одну дорожку:

Тишина! Полная тишина!

А чтобы всё же увидеть разницу, надо увеличить амплитуду на 96 дБ!

Разница настолько тихая, что её невозможно услышать, а это значит, что при преобразовании из 192000 Гц в 44100 Гц в звуковом диапазоне информация не теряется. Вот так без глубоких познаний в математике с помощью доступного каждому программного обеспечения можно проверить достаточность частоты дискретизации 44100 Гц для хранения музыкальных файлов.

habr.com

Записывая звук, выбираем оптимальную частоту. Полезная информация

Не только новичкам, но и некоторым энтузиастам, занимающихся звуком много лет, покажется откровением тот факт, что банальный процесс записи сопровождается сложнейшими физическими явлениями. Одним из таковых называют дискретизацию. Согласно определению, она представляет собой процесс преобразования непрерывной функции в дискретную. Людям, далёким от науки, это понять сложно, тем более, здесь задействована квантовая физика – самая сложная из существующих на сегодняшний день. Но профессиональные звукорежиссёры, например, работающие в московской студии звукозаписи «Интервал», знают, что такое частота дискретизации звука, какая лучше применима в тех или иных случаях. Почему? Потому что от этого явления зависит конечное качество записываемой музыки. В кассетно-плёночный период эти нюансы, ввиду ограниченной технической оснащённости, опускались. Но в современном высокотехнологичном цифровом мире частота дискретизации звука имеет значение при создании музыки и демонстрации её слушателям.

Детализация понятий

Что такое разрядность и частота дискретизации, какая лучше? Ответ на данный вопрос, несмотря на сложность природы этих явлений, получить можно. При этом нет необходимости штудировать учебники по физике. Достаточно вспомнить, что советскими полуподпольными звукорежиссёрами, записывающими рок и другую музыку, эти показатели определялись на интуитивном уровне. Дискретизацию ещё называют сэмплированием. Это определение более понятно для музыкантов. Её частота подразумевает интенсивность процессов в тот момент, когда аналоговый сигнал преобразуется в цифровой. Среди них хранение данных, конвертация, и непосредственно оцифровка.

Частота дискретизации измеряется в герцах. Ориентиром в её изучении является теорема Котельникова. Её автор раскрывает суть дискретизации. Согласно теореме, она ограничивает интенсивность оцифрованного сигнала до половины собственной величины.

Частота дискретизации. В чём её значение для звукозаписи

Дискретизация по времени – это процесс, который непосредственно связан преобразованием аналогового сигнала в цифровой. Наряду с ней происходит квантование данных по амплитуде. Дискретизация по времени означает измерение сигнала в момент всей его передачи. В качестве единицы берётся один сэмпл. Если на словах это не совсем понятно, то на примере выглядит более убедительно. Допустим, частота дискредитации равняется 44100 Гц – та самая, которая применялась на аудио-CD. Это означает, что сигнал измеряется 44100 раз в течение одной секунды.

Аналоговый сигнал по своей насыщенности всегда превосходит цифровой. И его преобразование – это неизбежная потеря в качестве. Частота дискретизации служит своеобразным ориентиром: чем она выше, тем ближе качество цифрового звука к аналоговому. Это явственно просматривается в списке ниже. Он показывает, какая частота звука лучше. Изучая его, вы увидите непосредственную взаимосвязь дискретизации и качества трека:

  • 1. 8000 Гц. Данная частота характерна для телефонных разговоров и записи речи на простой по набору функций диктофон. Используется на звуке, преобразовываемом через кодек Nellymoser.
  • 2. 22050 Гц применяется в радиовещании.
  • 3. 44100Гц. Как уже упоминалось выше, данная частота характерна для Audio CD, и этот показатель долгое время отождествлялся с наиболее высоким уровнем качества. И сегодня формат не утрачивает своих позиций.
  • 4. 48000 Гц. Это форматы DAT и DVD, пришедшие на смену AUDIO.
  • 5. 96000 – DVD-аудио MLP-5,1.
  • 6. 2822 400 ГЦ – высокотехнологичный формат SACD Super Audio.

Список чётко указывает на то, какая частота звука лучше. К тому же технологии на месте не стоят, и появляются новейшие форматы. Но прежде чем строить далеко идущие планы, следует учесть один очень весомый нюанс. Его суть проста: чем выше частота дискретизации, тем сложнее её достичь технологически. Для этого необходимо:

  • обеспечить высокую интенсивность передачи цифровых потоков. А это возможно далеко не на каждом интерфейсе. И чем больше каналов задействовано в записи (а это характерно для музыкальных ансамблей), тем процесс сложнее;
  • иметь на вооружении процессор, способный производить мощные вычислительные операции. Но даже в самых современных образцах возможности для получения звука сверхвысокого качества ограничены;
  • использовать для записи компьютерную технику, обладающую большим объёмом оперативной памяти.

Учитывая вышеизложенную информацию, неудивительным является тот факт, что частота звука, равная 44100 Гц, продолжает оставаться наиболее востребованной и сегодня. Она десятилетиями удовлетворяет даже самые взыскательные запросы к качеству, и вместе с тем имеются все технические возможности для её достижения. Последний фактор является определяющим как для рядовых пользователей, так и для большинства звукозаписывающих студий. Даже зная, какая частота звука лучше, чтобы достигнуть её, необходимо позаботиться о технической оснащённости.

studiointerval.ru

Частота дискретизации и теорема Котельникова

Часто производители аудио аппаратуры, особено наушников, в процессе пиара своей продукции активно продвигают “кристальную чистоту” звука и широчайший частотный диапазон, который не только за 20 кГц переваливает, но и в некоторых случаях доходит даже до 100 кГц. Конечно это имеет свои плюсы, даже не смотря на то, что выше 20кГц мы не слышим, а то и еще меньше. Но есть определенные проблемы, которые связанны с понятием частота дискретизации и вытекающие из теоремы Котельникова. Они в одночасье поставили жирный крест на применении слова “качественно” для большинства аудио-форматов и аудио устройств в моих глазах.

Любой процесс в природе является непрерывным. Например звуковой сигнал принятый микрофоном и преобразованный в электрический (аналоговый) сигнал — непрерывен.

Термин “Аналоговый сигнал” подчеркивает, что такой сигнал “аналогичен”, т.е. полностью подобен порождающему его процессу, или в данном случае звуку.

И непрерывный он не потому что будет длиться вечно, а потому, что его значение можно измерять в любые моменты времени. А между этими моментами сигнал будет продолжать непрерывно меняться.

Что такое частота дискретизации?

Как только встает вопрос о переводе аналогового сигнала в цифровой, сразу возникает понятие дискретизации, т.е. разбиение непрерывного сигнала на кусочки по времени. Делается это непосредственно в процессе преобразования.

audiogeek.ru

Аудио-кодирование: секреты раскрыты | Статьи

Аудио-кодирование: секреты раскрыты

Настройка аудио для видеозахвата и трансляции.

Как люди, непосредственно связанные с AV сферой, мы постоянно говорим об аудио-кодировании и аудиокодеках, а что же это такое? Аудиокодек – это, по сути, устройство или алгоритм, способный кодировать и декодировать цифровой аудиосигнал.

На практике аудиоволны, которые передаются по воздуху, являются продолжительными аналоговыми сигналами. Сигналы преобразуются в цифровой формат устройством, которое называется аналого-цифровой преобразователь (АЦП), а устройство обратного преобразования – цифро-аналоговый преобразователь (ЦАП). Кодек находится между этими двумя функциями и именно он позволяет откорректировать некоторые важные параметры для успешного захвата, записи и трансляции звукового сигнала: алгоритм кодека, частота дискретизации, разрядность и скорость передачи данных.

Три наиболее популярных аудиокодека: Pulse-Code Modulation (PCM), MP3 и Advanced Audio Coding (AAC). Выбор кодека определяет степень сжатия и качество записи. PCM – кодек, который используется компьютерами, CD-дисками, цифровыми телефонами и иногда SACD-дисками. Источник сигнала для PCM сэмплируется через равные интервалы, и каждый сэмпл представляет собой амплитуду аналогового сигнала в цифровом значении. PCM – это наиболее простой вариант для оцифровки аналогового сигнала.

При наличии правильных параметров этот оцифрованный сигнал может быть полностью реконструирован обратно в аналоговый без каких-либо потерь. Но этот кодек, обеспечивающий практически полную идентичность оригинальному аудио, к сожалению, не очень экономичен, что выражается в очень больших объемах файлов, а такие файлы не подходят для потокового вещания. Мы рекомендуем использовать PCM для записи цифровых образов для ваших источников или когда вы занимаетесь постобработкой аудио.

К счастью, у нас всегда есть возможность выбрать другой кодек, который может сжимать цифровые данные (по сравнению с PCM) на основании некоторых полезных наблюдений о поведении звуковых волн. Но в этом случае приходится идти на компромисс: все альтернативные алгоритмы сопряжены с «потерями», так как невозможно полностью восстановить исходный сигнал, но, тем не менее, результат всё равно хорош настолько, что большинство пользователей не смогут уловить разницу.

MP3 – это формат аудио-кодирования с использованием как раз такого алгоритма сжатия цифровых данных, который позволяет сохранять аудиосигнал в меньшие по объему файлы. Кодек MP3 чаще всего используется пользователями для записи и хранения музыкальных файлов. Мы рекомендуем применять MP3 для трансляций аудио-контента, так как ему требуется меньшая пропускная способность сети.

AAC – это более новый алгоритм кодирования аудиосигнала, ставший «преемником» MP3. AAC стал стандартом для форматов MPEG-2 и MPEG-4. По сути это тоже кодек сжатия цифровых данных, но с меньшей, чем у MP3, потерей качества при кодировании с одинаковыми битрейтами. Мы рекомендуем использовать этот кодек для онлайн трансляций.

Частота дискретизации (кГц, kHz)

Частота дискретизации (или частота сэмплирования) - частота, с которой происходит оцифровка, хранение, обработка или конвертация сигнала из аналога в цифру. Дискретизация по времени означает, что сигнал представляется рядом своих отсчетов (сэмплов), взятых через равные промежутки времени.

Измеряется в герцах (Гц, Hz) или килогерцах (кГц, kHz,) 1 кГц равен 1000 Гц. Например, 44 100 сэмплов в секунду можно обозначить как 44 100 Гц или 44,1 кГц. Выбранная частота дискретизации будет определять максимальную частоту воспроизведения, и, как следует из теоремы Котельникова, для того, чтобы полностью восстановить исходный сигнал, частота дискретизации должна в два раза превышать наибольшую частоту в спектре сигнала.

Как известно, человеческое ухо способно улавливать частоты между 20 Гц и 20 кГц. Учитывая эти параметры и значения, показанные в таблице ниже, можно понять, почему именно частота 44,1 кГц была выбрана в качестве частоты дискретизации для CD и до сих пор считается очень хорошей частотой для записи.

Есть ряд причин для выбора более высокой частоты дискретизации, хотя может показаться, что воспроизводить звук вне диапазона человеческого слуха – пустая трата сил и времени. При этом среднестатистическому слушателю будет вполне достаточно 44,1 – 48 кГц для качественного решения большинства задач.

Разрядность

Наряду с частотой дискретизации есть такое понятие как разрядность или глубина звука. Разрядность – это количество бит цифровой информации для кодирования каждого сэмпла. Проще говоря, разрядность определяет «точность» измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. С минимальной возможной разрядностью есть только два варианта измерения точности звука: 0 для полной тишины и 1 для звучания в полном объеме. Если разрядность равна 8 (16), то при измерении входного сигнала может быть получено 28= 256 (216= 65 536) различных значений.

Разрядность закреплена в кодеке PCM, но для кодеков, которые предполагают сжатие (например, MP3 и AAC) этот параметр рассчитывается при кодировании и может меняться от сэмпла к сэмплу.

Битрейт

Битрейт - это показатель количества информации, которым кодируется одна секунда звучания. Чем он выше, тем меньше искажений и тем ближе закодированная композиция к оригиналу. Для линейного PCM битрейт рассчитывается очень просто.

битрейт = частота дискретизации × разрядность × каналы

Для таких систем как Epiphan Pearl, которые кодируют линейный PCM 16-бит (разрядность 16), этот расчет может быть использован для определения, сколько дополнительных полос пропускания может потребоваться для PCM аудио. Например, для стерео (два канала) оцифровка сигнала производится с частотой 44,1 кГц на 16-бит, а битрейт при этом рассчитывается таким образом:

44,1 кГц × 16 бит × 2 = 1 411,2 кбит/с

Между тем алгоритмы сжатия аудиосигнала, такие как AAC и MP3, имеют меньшее количество бит для передачи сигнала (в этом и заключается их цель), поэтому они используют небольшие битрейты. Обычно значения находятся в диапазоне от 96 кбит/с до 320 кбит/с. Для этих кодеков чем выше битрейт вы выбираете, тем больше аудио бит вы получаете на сэмпл, и тем выше будет качество звучания.

Частота дискретизации, разрядность и битрейты в реальной жизни.

Аудио CD-диски, одни из первых наиболее популярных изобретений для простых пользователей для хранения цифрового аудио, использовали частоту 44,1 кГц (20 Гц – 20 кГц, диапазон человеческого уха) и разрядность 16-бит. Данные значения были выбраны, чтобы при хорошем качестве звука иметь возможность сохранять как можно больше аудио на диске.

Когда к аудио добавилось видео и появились DVD, а позднее Blu-Ray диски, был создан новый стандарт. Записи для DVD и Blu-Rays обычно используют линейный формат PCM с частотой 48 кГц (стерео) или 96 кГц (звук 5.1 Surround) и разрядность 24. Эти значения были выбраны в качестве идеального варианта, чтобы сохранять аудио с синхронизацией с видео и при этом получать максимально возможное качество с использованием дополнительного доступного дискового пространства.

Наши рекомендации

CD, DVD и Blu-Ray диски преследовали одну цель – дать потребителю высококачественный механизм воспроизведения. Задачей всех разработок было предоставить высокое качество аудио и видео, не заботясь о величине файла (лишь бы он умещался на диск). Такое качество мог обеспечить линейный PCM.

Напротив, у мобильных средств информации и потокового медиа совсем другая цель – использовать максимально низкий битрейт, при этом достаточный для поддержания приемлемого для слушателя качества. Для этой задачи лучше всего подходят алгоритмы сжатия. Теми же принципами вы можете руководствоваться для своих записей.

При записи аудио с видео…

В случае если запись будет использоваться для последующей обработки, выбирайте кодек PCM с частотой 48 кГц и максимальной разрядностью (16 или 24), чтобы обеспечить наилучшее качество аудио. Мы рекомендуем данные параметры для Epiphan Pearl.

При потоковой передаче аудио с видео…

При потоковой передаче или записи для последующей трансляции можно получить хорошее звучание аудио при меньшей полосе пропускания, используя кодеки AAC или MP3 с частотой 44,1 кГц и битрейт 128 кбит/с или выше. Такие параметры гарантируют, что звук будет достаточно хорош и не скажется на качестве трансляции.

www.epiphan.ru

мифы и реальность — Ferra.ru

Экспертное прослушивание

В качестве «референсных» устройств использовались:

  • наушники типа «бутоны» (со сменными силиконовыми вкладышами) Sharp HP-MD33-S, номинальный импеданс 16 Ом
  • Мониторные наушники Sennheiser 265 Linear (150 Ом)

Задействованные акустические системы:

Прослушивание показало, что наушники с номиналом 16 Ом категорически противопоказаны. Система прекрасно распознает их подключение, но бас куда то исчезает, а все фоновые шумы (в том числе от работающих дисков) как будто избирательно усиливаются. Наушники сопротивлением 150 Ом озвучиваются с полноценным басом, но система автоматически не распознала подключение профессионального номинала.

Нелинейные искажения на хороших колонках становятся слишком заметны. Подключение «хайфайной» многоканальной акустики лишено смысла при наличии только стерео записей. Хвала Всевышнему, программное (WinDVD 5.0 Platinum) воспроизведение шестиканального DVD - audio 24 бит 96 кГц идет без коверканного ресэмплирования звукового сигнала в 16 бит. Вот если бы Azalia еще и поддерживала многоканальный SACD! Тогда компьютерное аудио можно было бы рассматривать как резерв Hi-Fi аппаратуре.

Искусственная виртуализация даже на крутом шестиканальном акустическом комплекте вряд ли произведет должное впечатление. Кодек здесь ни при чем: просто в алгоритмах извлечения дополнительных каналов из обычного стерео о революционных достижениях говорить не приходится.

На панели настроек программного обеспечения кодека C-Media имеется занятная кнопочка под названием Dolby Digital Live. Неужто режим кодирования «живет»? Вынужден вас огорчить: в рамках нашего тестирования этот режим не исследовался – какие либо настройки качества кодирования в текущей версии программного обеспечения не доступны. Хотя кодек C-Media 9880 такую экзотику поддерживает, но все «штучки» от Dolby ® Laboratory, включая DDICE-DolbyR Digital Interactive Content Encoder, являются опциональными «софтовыми».

Возможно, использование более удачного аудио кодека и обвешивание его всякими фильтрами при встраивании в материнскую плату улучшит ситуацию, однако 32 бит 192 кГц звука нужны здесь как «в бане лыжи». Тем более миниатюризация материнок и корпусов входит в моду, и впихивать громоздкие «хай-файные» аудио железяки будет попросту некуда.

Заключение

Интегрированное аудио снова, мягко говоря, не блеснуло. Налицо «дебилизация» массового компьютерного звука. Алгоритмические примочки и прочие искусственные эффекты берут верх (за счет дешевизны размножения?).

Как выяснилось, технология High Definition Audio, реализованная в нынешнем виде, ничего общего не имеет с действительно высококачественным звуком (представленным в форматах DVD-audio и SACD). Просто очередная завлекалочка для покупателей, любителей всего новенького, обладающих дешевенькой многоканальной акустикой. Да, удобство эксплуатации впечатляюще улучшилось,а количество цифровых обработок значительно возросло и интерфейс приосанился. Но качество воспроизведения аналогового звука не улучшилось, а на некоторых материнских платах даже упало (по сравнению с добротными 16 битными аудио устройствами). Вот тебе и Azalia: реальная полоса частот не выше 20 кГц, хиловатый динамический диапазон 85 дБА, куча нелинейных искажений, пролезание импульсных помех, смехотворная разница между 16 и 24 бит. И это только воспроизведение. Запись на протестированной Azalia оказалась откровенно посредственной. При задействовании виртуальной многоканальности ключевые показатели еще хуже (вдобавок искажается частотный отклик). Отговорка вроде той, что драйверы-алгоритмы еще совершенствуются, спустя год, не убеждает.

Следует признать, что использование дорогого супер кодека с выделением обширного места на материнской плате под обвязку и частокола фильтров способно существенно улучшить ситуацию. Однако подозреваю, что популярным такое решение не станет. Если появится хотя бы одна реально продвинутая модель, то это уже станет событием из ряда вон. Поэтому истинным ценителям качественного звука от внешних саунд-карт отказаться не удастся и во времена High Definition Audio.

Ну а что творится со звуком на цифровых выходах сегодняшней (и завтрашней) Azalia – отдельная тема.

PS

Нынешние заправилы компьютерного аудио забывают прописную истину: главное – качество исходного сигнала и его воплощения в звук, а все остальное – вторично.

www.ferra.ru

частота дискретизации - sound_tips_ru — LiveJournal

частота дискретизации тоже бывает разной (как и в случае с глубиной квантования). но если битность отвечает за точность передачи низкоуровневых сигналов, то частота дискретизации определяет точность передачи высокочастотных составляющих.

частота дискретизации это, в общем, частота, с которой происходит обработка цифрового аудио. лучше всего выбрать частоту дискретизации до записи и не менять ее посреди проекта.

44.1 кГц
это самая распространенная частота дискретизации, т.к. используется на CD. грубо говоря, самая высокая частота, которая может быть воспроизведена, это половина частоты дискретизации, т.е. при 44.1 она равняется 22.05 кГц. с той точки зрения, что большинство людей не слышит ничего выше 20 кГц, это может казаться отличным выбором. проблема в том, что, однако, точность передачи этих высоких частот достаточно низкая. чем ближе вы к возможной высокой частоте, тем ниже падает точность. в результате неточность может быт слышна даже ниже возможной высокой частоты. по этой причине многие плагины делают ресемплинг - аудио конвертируется с более высокой частотой дискретизации, таким образом высокие частоты могут быть обработы с большей точностью.

48 кГц
эта частота дискретизации имеет, по сути, те же ограничения, что и 44.1 кГц. единственное - она чаще используется в фильмах и т.п. это потому, что она лучше синхронизируется с частотой кадров (44.1 не делится ровно на 24 кадра).

96 кГц, 192 кГц
в современном мире можно использовать более высокую частоту дискретизации. это позволяет более точно обрабатывать аудио, особенно на высоких частотах. это приводит к более качественному и естественному звучанию. обратная сторона медали - требуется больше компьютерной мощности при обработке. при работе 96 кГц затраты на ресурсы увеличиваются в 2 раза (если сравнить с 48 кГц). сюда входит место на диске (скорость записи), пропускная способность диска (количество одновременно записываемых дорожек) и CPU/DSP мощность (количество обработок: компрессор, эквалайзер и т.п.). и снова ресурсов нужно в 2 раза больше. если вам нужно записать самый чистый и ясный звук с минимальным количеством обработки, высокая частота дискретизации может быть уместна. с другой стороны, если вы хотите использовать много обработки (особенно если до такой степени, что ресуры компьютера заканчиваются), то, скорее всего, вы предпочтете работать с обычной частотой дискретизации.

если вы работаете с 96 и 192 кГц, возможно, вам придется сделать ресемплинг в 44.1 и 48 кГц при подготовке аудио к распространению

(автор: Kim Lajoie)

sound-tips-ru.livejournal.com

К вопросу о выборе частоты дискретизации при сэмплировании аудио. – Radana

Статья взята из открытых источников. Интересны ваши мнения!

К вопросу о выборе частоты дискретизации при сэмплировании аудио.

 К вопросу о выборе частоты дискретизации при сэмплировании аудио. Конечно, ничего нового и неизведанного в этом нет, какой частотой дискретизации пользоваться при записи музыкальной композиции (подразумеваем, что стремимся мы что-то записать как можно качественней, а не только для информационной наполненности).

Конечно, здесь немалое значение будет иметь  сама, на то компьютера способность своевременно обрабатывать входящий аудиопоток, а также свойства аудиокарты.

Но суть, наверное, не в том, «хорошо ли курить или нет», а в самом «виде вывернутых лёгких» —  недолгом и наглядном исследовании формы волны, после того, когда возникла полемика насчёт того, насколько лучше качество оцифровки в 96 кГц относительно стандартных 44-х…

После этого приятель «закачал» файл формата DVD-AUDIO на мой компьютер, а я сделал экстракт в «wave» и поместил полученный файл  под микроскоп, с названием «Adobe Audition»,
Но об этом чуть позже…

До визуального исследования я полагал (предвзято), что если и будет наблюдаться какое-либо улучшение восприятия подобного звучания, то совсем незначительное, ввиду того, что с увеличением частоты за гранью восприятия звука она (частота) будет почти недосягаемой для «фиксации» мозгом и одел предложенные приятелем наушники (Zennheiser PMX 100) подключенные просто к выходу “дефолтной” звуковой карты компьютера.

Так вот я слушал и слушал, и убеждался в том, что разницу ещё нужно постараться поймать и пошёл к своему компьютеру загружать принятый недавно по «локале» файл. Преобразовал исходный файл в стандарт «wav», сохранив исходные 96 кГц.  Теперь сигнал был подан уже через усилитель Pioneer и такие же Zennheiser PMX 100.

…И вот тут-то почувствовал, как преобразился звук, (а ещё я любитель приподнять немного высоких и низких частот…) звук казался «аналоговым». Сразу после этого включаю конвертированный до 44 кГц тот же файл, и… четко понимаю, что это не MP3, а «wave», причём стандарта качества CD-AUDIO, и, тем не менее, контрастом стало ощущение 44 кГц относительно 96-ти. Причём  напоминало звучание MP3. И это даже не через высококлассные студийные мониторы и усилители…

А вот и сами «вывернутые лёгкие», загруженные в Аудишн:

Пример 44 кГц. Скачать (4,5 мег.)

Исследование преимуществ-недостатков пр оцифровке в 44 кГц

Пример 96 кГц. Скачать (14,5 мег.)

Исследование преимуществ-недостатков при сэмплировании с 96 кHz

Видим чётко, что попадает к нам в уши в обоих вариантах. Сколько нюансов теряется («домысливается», «дорисовывается (кротчайший, вероятный) путь» между соседними сэмплами) и упрощается по известным алгоритмам звуковой волны, где «были» те нюансы, которых мы теперь не слышим… (я про 44..).

Ещё важный момент: не обязательно впадать в фанатизм по поводу качества исходников. Хотя, это безусловно важно, но Оцифрована должна быть прежде всего Ваша идея… я о золотой середине… во всяком случае исходники (например в работе с мультитреком) ниже 48 кГц нежелательны. Если мощность компьютера заведомо недостаточна, то и устанавивать, к примеру, 192 кГц в новой сессии, конечно же неразумно.

Наш сегодняшний пример пришёл на исследование после оцифровки виниловой грамзаписи в формат DVD-AUDIO (понятно, что звуковой картой, «что надо» и «головой» соответствующей) и переконвертированный из этого формата в формат WAV.

Источник статьи

Ещё одно мнение на эту тему - отрывок из этой статьи:

Частота дискретизации

На сегодняшний день даже бюджетные аудио интерфейсы поддерживают частоту дискретизации 192 кГц. Но на различных музыкальных форумах по прежнему ведутся споры о том, стоит ли переходить с частоты дискретизации 44.1 кГц на 48, 88.2 или 96 кГц. Многие музыканты придерживаются комбинации 24-бит/44.1 кГц, потому как продолжают создавать музыку в основном с помощью внешних MIDI клавиатур и программных семплеров, которые работают с семплами 44.1 кГц. Так что они не видят никакого смысла в увеличении частоты дискретизации, тем более что окончательным носителем музыки все равно становится 16-бит/44.1 кГц аудио диск. Однако даже те, кто используют электронные инструменты, оценят более аккуратную компрессию и ограничение пиков на повышенной частоте дискретизации, да и эквалайзер будет работать более точно и звучать приближеннее к аналогу. Музыканты, использующие программные синтезаторы и генераторы формы волны также отметят более чистое звучание.

Для записи живой классической и любой другой акустической музыки большинство серьезных звукоинженеров используют режим 24-бит/96 кГц. В этом особенно есть смысл, если конечным носителем музыки оказывается DVD релиз с частотой дискретизации 48 или 96 кГц (в зависимости от количества каналов). Высокая частота дискретизации гарантирует Вам отличное качество записи на высоких частотах, детали звучания инструментов и пространственную локализацию (возможность различать на записи положение в пространстве каждого инструмента), чем при частоте дискретизации 44.1 кГц или 48 кГц. Также при большой частоте дискретизации высокочастотные сигналы выше 20 кГц делают звучание более натуральным. Однако помните, что качество звука определяется самым худшим звеном в цепи, так что если остальные устройства у Вас не высшего класса, то увеличение частоты дискретизации может Вам абсолютно ничего не дать.

Также стоит помнить, что при использовании частоты дискретизации, например, 192 кГц все плагины и программные синтезаторы будут потреблять в 4 раза больше ресурсов компьютера, занимать в 4 раза больше места на диске и в 4 раза уменьшать возможное время записи в отличие от использования частоты дискретизации 44.1 кГц.

promodj.com

Частота Дискретизации Звука Какая Лучше

Студийные микрофоны

ОКТАВА

  • Валерий Меладзе интересуется микрофонами "Октава"

  • Музыканты группы "Мастер" представляют ламповый студийный микрофон Октава МКЛ-100

  • Дмитрий Маликов подтверждает качество микрофонов "Октава"

  • На фото Алексей Белов поёт в ламповый студийный микрофон "Октава" МКЛ-5000

  • Cолист группы "Ария" Артур Беркут поёт в ламповый студийный микрофон "Октава" МКЛ-5000

  • Тестовые записи сравнения микрофонов Октава с микрофонами других брендов

Хотите выбрать микрофон для студии звукозаписи?
Вам нужен чистый и прозрачный звук?
Желаете студийный микрофон, вокальный или инструментальный, качество которого превосходило бы качество именитых брендов, а цена была бы гораздо ниже?

Добро пожаловать!

Вы находитесь на сайте, посвященном студийным микрофонам "Oktava".
Качество этих микрофонов признано во всем мире! За рубежом микрофоны "Oktava" популярны не мене, чем микрофоны фирм: Rode, AKG, Neumann, Shure...

www.oktava-studio.ru

Частота дискретизации и разрядность

При описании цифровых записывающих устройств используют два фундаментальных понятия: частота дискретизации и разрядность. В этой статье мы рассмотрим, что это такое.

Частота дискретизации

Частота дискретизации — это частота, с которой записывающим устройством фиксируются отсчеты входного сигнала. При записи звука в цифровом виде фактически записываются отдельные отсчеты или, иными словами, значения интенсивности звука в отдельные моменты времени.

Частота дискретизации для записывающих устройств имеет обычно следующие стандартные значения: 44,1 кГц; 48 кГц и 96 кГц. Чем большая величина частоты дискретизации, тем большее количество отсчетов делается за 1 секунду и тем лучше качество цифрового звука мы имеет в результате.

Каково значение этих чисел? Они подразумевают количество раз снятия за секунду записывающим устройством значения интенсивности звука входного сигнала. Для измерения частоты дискретизации используются килогерцы (кГц), 1 кГц = 1 000 отсчетам в секунду.

К примеру, если запись осуществляется с частотой дискретизации 48 кГц, то это означает, что значение интенсивности звука звукозаписывающее устройство измеряет и фиксирует 48 000 раз в секунду.

Такое количество может показаться невообразимо огромным, но здесь стоит вспомнить о явлении, называемом частотой Никвиста. Частота Никвиста названа так в честь человека, который первым ее обнаружил. Она определяет наивысшую частоту звука, которую возможно записать при данной частоте дискретизации.

Если говорить вкратце, то максимальное значение высоты звука, которое может быть подано в цифровом виде, равно примерно половине частоты дискретизации.

Поэтому, при проведении записи с частотой дискретизации 48 кГц максимальная частота звука, которая может быть записана, равна 24 кГц. Этого вполне достаточно, если учесть, что человеческое ухо слышит частоты в среднем от 20 Гц до 20 кГц.

Разрядность

В разговоре о цифровых записывающих устройствах часто можно услышать слова «16 бит», «24 бита» и т. д. Одни означают количество единиц информации, с помощью которых можно представить значение каждого отсчета, получаемого при цифровой записи.

Чем большая величина этого числа, тем точнее можно записать значение каждого отсчета и тем более высокое качество звука можно получить в итоге.

Не стоит думать, что чем больше количество бит, то есть чем выше величина разрядности, тем большее значение интенсивности можно зафиксировать. Здесь имеется в виду именно точность представления.

В современных записывающих устройствах обычно реализована разрядность 24 бита. Стоит учитывать, что запись с большой разрядностью занимает много места на устройстве хранения, но это не так уж важно, ибо современные носители отличаются огромными объемами и постоянно стают более и более доступными в финансовом плане.

______________________

Автор: Ирина Кипаренко
При копировании материала ссылка на сайт www.as-workshop.ru обязательна!

www.as-workshop.ru

Частота дискретизации и разрядность | Алексей Данилов


Когда сигнал поступает на АЦП с предусилителя, компрессора, выхода пульта, синтезатора, — он представляет собой электромагнитные колебания. То есть на вход АЦП приходит некая волна с изменяющимся напряжением (очень маленьких величин). Для сохранения сигнала в файл его нужно «оцифровать», то есть закодировать с помощью единиц и нулей. В результате получается график волны на экране компьютера.

Даже самый лучший преобразователь имеет погрешность, ведь между нулем и единицей нет промежуточных значений, и график волны будет состоять только из вертикальных и горизонтальных отрезков, без наклонных линий. На графическую прорисовку волны будут влиять высота звука (частота колебаний), его тембр (форма волны) и громкость (амплитуда). Качественный АЦП должен корректно передать системе записи все эти параметры.

Итак, звук поступает в систему дискретно, то есть разделенным мелкие отрезки. От величины этих отрезков зависит точность кодирования аналогового сигнала в цифровой среде. Чем мельче горизонтальная и вертикальная дискретные единицы, тем точнее оцифровка.

Частота дискретизации

Горизонтальное дробление волны дает нам представление о частоте дискретизации, или частоте семплирования. Чем чаще АЦП фиксирует изменения значений графика волны, тем выше частота семплирования. Собственно, один семпл — это дискретный единичный отрезок, минимальная единица звука. Чем он короче, тем выше частота дискретизации.

К примеру, значение частоты дискретизации в 44.1 кГц показывает, что в одной секунде записи содержится 44100 семплов. Мы можем редактировать волну, принимая за минимальный элемент редактирования отрезок длительностью 1/44100 секунды. При увеличении частоты семплирования до 48 кГц этот отрезок уменьшается до 1/48000 доли секунды, давая возможность более точного воздействия.

Согласование частот дискретизации

Каждый семпл по продолжительности равен предыдущему. Для корректного воспроизведения звука частоты дискретизации файла и системы должны быть идентичны. При добавлении в проект звуковой дорожки с частотой дискретизации, отличной от дискретизации хоста (программы), она должна быть сконвертирована.

Если воспроизводить файл более высокой частоты в системе с более низкой, он будет звучать медленнее, чем должен, и наоборот. Конвертирование сигнала из одной частоты в другую всегда приводит к появлению искажений. Чтобы «перекроить» звук под новую частоту дискретизации, система должна разбить семплы на более мелкие куски и снова собрать их в единую волну. Такой процесс может привести в лучшем случае просто к замыливанию звука, в худшем — к появлению щелчков.

Конечно, на встроенных колонках домашнего ноутбука разница будет незаметна. Но если речь идет о работе со звуком на профессиональном уровне, согласование частот дискретизации необходимо.

Не рекомендуется изменять частоту дискретизации в рамках одного проекта. Оправданием повышению дискретизации может быть, например, необходимость обработки файла алгоритмами или плагинами, лучше работающими на высоких частотах. Поскольку более высокая дискретность предполагает разбиение на более мелкие семплы, точность обработки будет выше, а качество в результате лучше. Но гарантировать эффективность этого метода тоже невозможно: в каждом случае результат будет индивидуальным. Необходимо каждый раз оценивать, что важнее — эффект от обработки на более высокой дискретности или негативное влияние конвертации.

Если по какой-то причине после завершения работы на частоте 48 кГц вам потребовалось конвертировать сигнал в 44.1 кГц, сохраните исходный файл на тот случай, если придется повторно вмешиваться в материал (например, для альтернативного мастеринга). Обработка на более высокой частоте дискретизации даст лучший эффект, чем на низкой.

Разрядность звука

Если горизонтальное дробление волны дает нам представление о частоте дискретизации, то вертикальная дискретизация – это разрядность, отвечающая за достоверную передачу динамических элементов записи. Чем большее количество «ступенек» может зафиксировать преобразователь, тем выше разрядность записанного звукового файла.

Например, волна за отрезок времени может совершить движение одной ступенькой от 0 до 16, а может четырьмя — по 4 единицы за шаг. Более точным представлением будет 16 шагов по единице. Количество ступенек, на которые волна дробится по вертикали, — это и есть разрядность.

Чем выше разрядность конвертора, тем достовернее он передаст сигналы разного уровня громкости. Если мы движемся большими шагами, каждый из которых равен 16 единицам (низкая разрядность), то при громкости входящей волны на уровне 4 график ее будет округлять до нуля. А если каждая ступенька разрядности равна 4 единицам (средняя разрядность), значение 4 будет зафиксировано на своем уровне, а значения 3 и 5 округлятся до 4. При единичном шаге все эти значения будут находиться на своих ступеньках — 3, 4, 5 (высокая разрядность).

Таким образом, более высокая разрядность АЦП дает возможность детальнее интерпретировать различные значения громкости звука и максимально приблизиться к форме реальной волны.

Разбиение волны на «ступеньки» по вертикали и горизонтали называется квантованием. Иногда частоту дискретизации называют частотой квантования, а разрядность динамическим квантованием, то есть разделением по уровням громкости (динамика).

Естественно, пример с 16 единицами — условность. Конверторы работают на гораздо более высоких значениях. Например, при разрядности 16 бит система может передать 65536 уровней громкости (2 в степени 16). А при 24 битах — 16777216 уровней (2 в степени 24).

Казалось бы, зачем столько? Неужели наше ухо способно различить хотя бы десять тысяч уровней громкости? Напрямую — не может. Скажем, два сигнала с «соседними» значениями даже при разрядности 16 бит мы различить не в состоянии. Но работа в студии ведется с разнообразными звуками, и некоторые из них имеют значительные перепады по громкости (к примеру, реверберация). Многие процессы требуют тонкой работы с громкостями (например, едва заметное воздействие эквалайзером на спектр). Для корректной работы нужна система с хорошей разрешающей способностью и по горизонтали, и по вертикали.

Но есть и обратная сторона медали. Высокие значения дискретизации и разрядности делают файлы более объемными, и для их обработки системе требуется больше ресурсов. Здесь самое время вспомнить про различия между ресурсонезависимыми и нативными системами. Чем выше квантование, тем сильнее загружается компьютер. Этот фактор более критичен для нативной системы, обремененной обслуживанием операционки и фоновых процессов.

Всегда нужно искать баланс между значениями дискретизации и разрядности и реальными возможностями системы. Не заставляйте ее работать на пределе, оставляйте резерв мощности.

Мы приближаемся к очень важной и мало кому понятной теме, связанной с музыкальным производством. Речь о так называемых шумах квантования. В ближайшее время этому явлению будет посвящен отдельный материал. Понимание природы шумов квантования дает возможность музыканту и звукорежиссеру разобраться в некоторых непростых вопросах, связанных с записью музыки в цифровой среде. Поскольку ввиду дороговизны и сложности в обслуживании аналогового оборудования подавляющее большинство музыкантов работает прежде всего именно в цифровых системах записи, эта тема так или иначе затрагивает всех.

Следите за обновлениями блога, подписывайтесь на новые статьи, чтобы совершенно бесплатно получать их на электронную почту. Также хочу напомнить, что очень много познавательной практической и теоретической информации содержится в моей книге «Академия Мюзикмейкера», которую без посредников можно приобрести на сайте MusicMaker.Pro.

Остались вопросы? Не стесняйтесь задавать их в комментариях под статьей или присоединяйтесь к обсуждениям в этой группе ВКонтакте, посвященной синтезаторам, музыкальному оборудованию и звукозаписи.

© Алексей ДаниловИллюстрации: А. РублевскийПри перепечатывании ссылка на источник обязательна

Хотите получать новые статьи
прямо на почту?

Подпишитесь на обновления блога А. Данилова

Интересное:

danalex.ru

Тема 1.1.2.

Тема 1.1.2.
[Список тем] страницы темы: [1][2][?]

Тема 1.1.2. Выбор частоты дискретизации аналоговых сигналов.

Согласно теореме Котельникова непрерывный сигнал с ограниченным спектром частот может быть полностью восстановлен, если передавать отсчеты сигнала с частотой следования (частотой дискретизации Fд), не менее чем в два раза превышающей верхнюю частоту спектра сигнала Fв. Fд > 2Fв.

При передаче сигналов, занимающих диапазон частот 0.3 - 3.4 кГц, частота дискретизации не должна быть менее 6.8 кГц, т.е. в одну секунду должно передаваться 6.8 тысяч отсчетов. Качество передачи речи при этом оказывается вполне удовлетворительным. Увеличение частоты дискретизации сверх указанного значения допустимо, и приводит к незначительному повышению точности восстановления телефонного сигнала.

Чтобы получить возможность практически реализовать и упростить фильтры нижних частот, используемых на передающей станции для ограничения спектра передаваемых сигналов, а па приемной станции для выделения сигналов из последовательности отсчетов, дискретизацию осуществляют с частотой 8 кГц. Обычно Fд = (2.3 ... 2.4) Fв.

На Рис. 6. в показана полоса частот подлежащая передаче, на Рис. 6. г - спектр последовательности отсчетов этого сигнала; здесь же пунктиром изображена частотная характеристика затухания фильтра, при помощи которого осуществляется демодуляция дискретизированного сигнала.

Спектр последовательности отсчетов значительно шире спектра исходного сигнала, т.к. дискретизация приводит к появлению боковых полос частоты дискретизации и ее гармоник. Нарушение условия теоремы Котельникова приводит к неустранимым искажениям передаваемых сигналов. Из графика Рис. 6. д видно, что при чистоте дискретизации рампой например 5 кГц, в полосу пропускания фильтра попадают составляющие нижней боковой полосы частот дискретизации, отмеченные на рисунке штрихами.

Рис. 6. Дискретизация непрерывного сигнала по времени (а, б) и спектры непрерывного (в) и дискретизированного (г, д) сигналов.

Как видно из Рис 6. г. и данном случае упрощают, и требования к параметрам ФНЧ, т.к. при этом образуется достаточно широкая переходная полоса частот для расфильтровки

ΔFппч = 4.6-1А = 1.2 кГц, которая позволяет использовать простые ФНЧ на приеме для восстановления непрерывного сигнала из последовательности его дискретных отчетов.

Выбор частоты дискретизации сигналов звукового вещания (ЗВ) производится в зависимости от класса канала вещания и аппаратуры образования междугородного канала ЗВ (аналоговая или цифровая). Для сигналов с бесконечным спектром, к которым относятся и сигналы вещания, за ширину спектра применяют такой интервал частот, для которого суммарная энергия содержащихся в нем гармоник составляет 95% - 99% полной энергии сигнала Таким образом, согласно международным стандартам, диапазоны частот каналов звуковою вещания для:

Высшего класса - 0.03 кГц ... 15 кГц.

Первого класса - 0.05 кГц ... 10 кГц.

Второго класса - 0.1 кГц ... 6 кГц.

Стереофонический канал должен состоять из двух монофонических каналов высшего класса, имеющих малые рассогласования амплитудно - и фазочастотных характеристик.

Так например, для канала звукового вещания первого класса, частота дискретизации согласно теореме Котельникова Fд > 20 кГц. При организации канала вещания (вместо трех телефонных каналов) частота дискретизации сигналов вещания должна быть, кратна частоте дискретизации телефонного канала. Для телефонного канала ТЧ Fд = 8 кГц. Для канала ЗВ первого класса

Fд = 8x 3 = 24 кГц.

Выбор частоты дискретизации группового сигнала при построении систем ИКМ-ЧРК рассмотрим на примере выбора частоты дискретизации стандартной первичной группы со спектром частот 60 ... 108 кГц. Диапазон частот группы ограничен не только сверху но и снизу. Поэтому частоту дискретизации выбирают таким образом чтобы в спектре АИМ сигнала спектр дискретизируемого сигнала не перекрывался с боковыми спектрами частоты дискретизации и ее гармоник.

При дискретизации групповых сигналов, ширина спектра (DF) которых меньше нижней граничной частоты (Гц) стандартной группы, частота дискретизации выбирается из условия:

Для сигнала первичной стандартной 12 канальной группы при Fд - 110 кГц (Рис. 7.) спектр полезного сигнала не перекрывается с боковыми спектрами частоты дискретизации и ее второй гармоники 2Fд = 220 кГц.

Рис. 7. Составляющие спектра сигнала при дискретизации первичной 12-канальной группы.

Если ширина спектра группового сигнала ΔF > Fн, как например для третичной стандартной 300 канальной группы со спектром частот 812 ... 2044 кГц, то частота дискретизации выбирается из условия: Fд > 2Fв, однако при этом не используется нижняя часть полосы частот до 812 кГц, что приводит к дополнительному расширению спектра АИМ сигнала. Для того чтобы исключить такое расширение спектра вводят дополнительную ступень преобразования, с помощью которой спектр сигнала 300 канальной группы смещается вниз по оси частот в диапазон 60 ... 1292 кГц. Это дает возможность снизить частоту дискретизации и выбрать ее из условия Fд > 2584 кГц. Например: Рассчитать частоту дискретизации группового сигнала вторичной стандартной 60 канальной группы. Ширина спектра частот группы 312 ... 552 кГц, ΔF = 240 кГц, FH = 312 кГц, FB = 552 кГц. Из условия Fв


[Список тем] страницы темы: [1][2][?]

tss-vosp.narod.ru


Смотрите также