Лучше 16 бит 24 бита. Аудио и видео. Тесты в играх

бюджетная карта нового поколения: низкопрофильная, с поддержкой 7.1, ЦАПы от Audigy2ZS (!!!), программный EAX3

Автору данного материала захотелось услышать качественный 3D-звук в играх. Имея в компьютере полупрофессиональную карту Terratec Aureon Space 7.1 с отличным аудиотрактом (перепрошитую для получения дополнительных фич в Prodigy7.1), поиграть ему удавалось, но счастья было мало. С разными драйверами поддержка 3D-звука у Aureon Space 7.1 была либо на базе Sensaura, либо на базе QSound. К большому сожалению, качество обработки звука никуда не годится (хотя, Sensaur-у слушать и приятнее, чем QSound). В любом случае, звук низкокачественный, а из поддержки EAX - только 1-я и 2-я версии многолетней давности…

Возник вопрос: если к качественной аудиофильской взять "дополнительную" звуковую карту исключительно для игр, то какую? От Сreative у нас на выбор несколько моделей:

Сразу ясно, что нет смысла брать снятые с производства модели многолетней давности - Live!1024 и Live!5.1. Ведь даже сделав перепрошивку и заставив карты работать с драйверами от Audigy2ZS, ничего хорошего мы не получим. Большая часть настроек будет неактивной. Кодек (ЦАП-АЦП) у карты слабенький. Поддержка EAX3/4 отсутствует. Пропускаем их.

Audigy - хороший 5.1-вариант, можно поставить драйвера от старших Audigy2 и Audigy2 ZS. Недостатки: ЦАП-ы карты значительно уступают ЦАП-ам старших моделей.

Audigy2 (6.1) - 6.1-вариант Audigy2ZS. Цена от Audigy2 ZS не слишком отличается.

Audigy2 ZS - топовый продукт, самый оптимальный вариант. Хорошие ЦАПы, полностью работающие фичи. Если у вас в компьютере только интегрированный звук, то сомнения по поводу цены вам в голову вряд ли придут, и вы возьмете Audigy2 ZS. Но вот если у вас уже есть полупрофессиональная карта с зачатками игровой (а то и без них) за $100-$300, то покупать самый дорогой вариант только для игр - вряд ли захочется. Зачем переплачивать за ЦАП, АЦП, дополнительные разъемы, если все это у вас уже есть?

Итак, осталось еще две карты:

Audigy LS - по сравнению с остальными картами не обладает мощным DSP, но стоит достаточно больших денег. Вердикт для этой карты был вынесен в обзоре Audigy2 ZS , где на нее мельком взглянули, не очень задумываясь о причине высокой стоимости. Что и неудивительно, ведь вышла она в свет одновременно с Audigy2 ZS, топовым продуктом. Я, наверно, тоже в этот момент любовался бы и слушал Audigy2 ZS, а в сторону LS сделал неутешительный вывод: маркетологи Creative ошиблись.

И, наконец, Live! 24-bit, на том же самом чипе CA0106DAT, как и в Audigy LS, но с более качественными ЦАПами от топовых Audigy2/Audigy2ZS. Также есть поддержка 7.1 и EAX3.0, и всё это при весьма привлекательной стоимости карты.

Кстати, в последнее время растет популярность тонких и компактных корпусов (баребонов), многие видеокарты имеют низкопрофильные размеры. А вот звуковых карт такого форм-фактора мало. На сегодняшний день можно вспомнить только Live! 24-bit и Prodigy 7.1 LT.

SoundBlaster® Live!™ 24-bit

Официальная информация с сайта ru.europe.creative.com : Звуковая карта Sound Blaster® Live!™ 24-bit - отличное и экономичное решение для тех, кто хочет получить объемный звук 7.1 на ПК. Обладая превосходными техническими характеристиками (качество записи 24бит/96кГц, соотношение сигнал/шум при воспроизведении 100дБ, наличие цифрового выхода), Sound Blaster® Live!™ 24-bit идеально подходит для создания объемного звука при прослушивании музыки и просмотре фильмов. Технология EAX® ADVANCED HD™ 3.0 обеспечивает высокую степень реализма в компьютерных играх, с поддержкой разнообразных акустических эффектов и объемным детализированным 7.1-канальным звуком. Звуковая карта поставляется в комплекте с ПО Creative Media Source™, с помощью которого вы можете оцифровывать и записывать диски и управлять вашей домашней фонотекой.

RETAIL упаковке содержится следующее:

  • Плата Creative Sound Blaster Live! 24-bit; Низкопрофильная планка (поставляется только с определенными моделями) Аналоговый кабель компакт-дисков (поставляется только с определенными моделями) Компакт-диск "Sound Blaster Live! 24-bit Installation and Applications" Краткая справочная инструкция Руководство пользователя (на компакт-диске) Гарантия (в печатном виде или на компакт-диске)
  • Сведения о технической поддержке (в печатном виде или на компакт-диске)

Кроме того, вместе с Sound Blaster Live! 24-bit Digital Audio поставляется:

  • Модуль цифровых входов/выходов

В пакете Sound Blaster Live! 24-bit в OEM упаковке (~$36, доступной в свободной продаже в России) содержится следующее:

  • Плата Creative Sound Blaster Live! 24-bit Компакт-диск "Sound Blaster Live! 24-bit Installation and Applications" Гарантия (на том же компакт-диске) Сведения о технической поддержке (на том же компакт-диске)
  • Наклейка на корпус с Advanced HD 24 bit

На установку ПО и драйверов рекомендуется 600 Мб свободного места на диске, на компакт диске заполнено около 230 Mb. Установка происходит достаточно долго, однако указывать файлы для установки вручную не надо, все делается автоматически. При установке под XP и Me осложнений не возникло.

Посмотрим на карту Live! 24-bit поближе.


Звуковая карта Creative SoundBlaster® Live!™ 24-bit

1. Гнездо линейного входа/микрофонного + входа/цифрового ввода-вывода (DIGITAL_IO). Хитрый нестандартный четырехконтактный разъем - очередная мелкая гадость в стиле Creative. Для цифры предлагается использовать модуль цифровых входов/выходов (номер модели SB002).

По официальной информации Creative планирует начать продажу модуля в ближайшее время. Увы, есть подозрение, что стоимость его будет порядка $20-$30, а это сравнимо со стоимостью самой карты.

2. Гнездо Line Out 1 (Линейный выход 1). Также можно подключить наушники, операционный усилитель на данном выходе мощнее, чем на другие каналы.

3, 4. Гнездо Line Out 2, Line Out 3. Два четырехконтактных выхода в фирменной распайке Creative - очень неудобное решение. Попробуйте найти такие переходники за разумную цену или спаять сами. Как вы догадались, 2-е гнездо отвечает за фронтальные, а 3+4 за остальные шесть каналов. При этом для режимов 6.1, 7.1 переходники обязательны. Для 5.1 режима подойдут стандартные стерео-миниджеки.

5. Разъем Auxliary.

6. Разъем Creative Proprietary. Как сказано в документации: "Разъем для подключения других устройств. Не подключайте к этому разъему другие устройства без специальных на то указаний ". Остается только гадать, о каких устройствах идёт речь. В одном из источников указывалось, что к нему подключается разъем под джойстик.

Стоит отметить максимальную компактность и плотность монтажа элементов: на карте нет мест, свободных и пустых от деталей. Но самое интересное заключается в том, что карта имеет более качественные ЦАП, чем у Audigy LS, и два дополнительных канала - 7.1 вместо 5.1, а также вдвое меньшую стоимость.


Карта может записывать в 96/24 и воспроизводить в 96/24. Режим 192 не поддерживается. Однако, имея ЦАП CS4382-KQ , как у Audigy 2ZS, и DSP, как у Audigy LS, можно сделать вывод, что все решаемо драйверами. Подробнее об этом кодеке можно прочитать в обзоре .АЦП - Wolfson WM8775 24 бит 96 кГц. Паспортные данные с сайта :

102dB SNR (‘A’ weighted @ 48kHz)
-90dB THD
ADC Sampling Frequency: 32kHz – 96kHz
Four Stereo ADC Inputs with Analogue Gain Adjust from +24dB to –21dB in 0.5dB Steps
Digital Gain Adjust from -21.5dB to -103dB.
I2S, Left, Right Justified or DSP
16/20/24/32 bit Word Lengths


Структурная схема Wolfson WM8775

Софт SoundBlaster® Live!™ 24-bit

Creative Audio Converter
Creative MediaSource Go!
Creative MediaSourse Organizer
Creative MediaSourse Player
Creative WaveStudio
Creative MiniDisc Center

Панели настроек драйвера

Creative Surround Mixer
EAX Console
Creative Speaker Settings
Creative Graphic Equalizer
SoundFont Bank Manager
Device Control

Утилиты

Creative Restore Defaults
Creative Diagnostics Посмотрим на панели настроек драйвера:


Creative Surround Mixer - Basic

Creative Surround Mixer - стандартный микшер, в котором заблокированы и не работают тембры высоких и низких частот. Крайне необдуманно сделаны громкости линейных и цифрового входов - всего 3 ползунка, один под Line-in, а два под Mic, S/PDIF-in и Auxliary. Из них одного никогда не видно, его нужно менять с каким-нибудь другим, что очень неудобно. Так сделано, скорее всего, из-за ограничения конструкции АЦП. Похоже, аналоговый микшер АЦП может выбирать только один источник, но не может менять и смешивать уровни сигнала. Возможно, для скрытия этого недостатка и сделана путаница с выбором линейных входов, реально только один из них можно включить на прослушивание. Помимо этого микшера есть два дополнительных аналоговых входа. В схеме сначала идет Input Mixer переключающий аналоговые входы, один из дополнительных входов отдан под LinE-in, а другой - под Wave для записи What U hear. Также есть отдельный моно-вход от микрофона. В разделе Запись (REC) присутствует полезная функция "Do not monitor".



Creative Surround Mixer - Advanced


Advanced вкладка микшера позволяет выставить громкость каналов по отдельности. Громкость саба можно выставлять, начиная с 5.1-конфигурации. На скриншоте показаны настройки на 7.1 и 2 канала.


EAX Console - Effects

EAX Console. Из EAX эффектов - софтверные настройки различных звучаний. В панели также есть встроенный плеер. Впрочем, если мы запустим другой плеер, настройки EAX мы также услышим (проверено в JetAudio5). А вот с линейных входов EAX не обрабатывает, что уже неприятно. Это относится ко всем вкладкам в EAX. Включение/отключение данного эффекта мгновенно без задержек. Если честно, то для игровой карты такая вкладка эффектов не обязательна. На том же Prodigy7.1 через NSP можно также запустить множество VST-плагинов, которые будут выше качеством (впрочем, как и стоимостью). Не зря они предназначены для профессиональных ASIO-секвенсоров, таких, как Cubase. Причем, на обработку всегда можно поставить любой линейный вход, и делать запись в реальном времени с уже наложенным эффектом. Кстати, есть облегченная версия NSP по отношению к количеству накладываемых VST эффектов - ASIO FX Processor LE, которая теоретически работает с любой картой, поддерживающей ASIO. Native Sound Processor - специальная версия ASIO FX Processor ME, работающая только с продуктами ESI, между ними есть еще некоторые различия, но для данной статьи это непринципиально. Количество стерео эффектов в ASIO FX Processor LE - 1, против 8 в NSP. Пожимаем плечами - ничего удивительного…



EAX Console - Karaoke

Караоке - дань моде… Эта функция есть и на встроенной Realtek ALC650. Хотя здесь настроек больше, плюс можно наложить эффект на микрофон. Работает несколько ущербно. Левая часть Voice Suppression amount и Pitch работают только с Creative MediaSourse Player. Включение/отключение эффекта требует примерно 5 секунд задержки. На голосовое подавление - 3 разных режима, из них два с регулировкой. Pitch меняет тон мелодии. На ревербацию, накладываемую на микрофон, доступно огромное количество пресетов. Для того чтобы ее услышать, нужно выбрать микрофон на запись (что панель делает автоматически), а в source микрофон отключить. Включение/отключение эффекта мгновенно. Вместо микрофона Line-in или Auxliary подставить не удалось.


EAX Console - CMSS 3D

CMSS 3D - разложение стерео на все каналы. То же самое, что и QMSS, вшитая в последние дрова Prodigy7.1, или QMSS в программе , которая стоит $25 и ставится на любую карту. CMSS работает под любым плеером. На линейные входы не распространяется. В режиме стерео (2.0) этот эффект работает как расширитель стереобазы. На обычной акустике звучит неплохо, а вот звучание в наушниках в одноимённом режиме мне не понравилось. Ощущение, что слушаешь в бочке. Так же добавляется слабый эффект ревербации, что иногда приводит к искажениям голосов. В многоканальном режиме доступен баланс "фронт-тыл".

Также есть честная раскладка стерео на все стереопары, кроме саб/центр, с регулировкой фронт-тыл или стереорасширением в режиме 2.0. Жаль, что на линейные входы это не распространяется. К слову, в Prodigy7.1+NSP можно легко получить 5.1 звук со стереовходов.

При включении CMSS саб будет молчать, пока не будет поставлена галочка Bass Reduirection в Bass Managment(Speaker settings). При этом даже без включения CMSS, саб будет работать. Из чего следует, что CMSS к сабу никакого отношения не имеет, как и саб к CMSS. CMSS 2 отсутствует, так карта не поддерживает 192 kHz.

Следует отметить одну особенность драйверов. JetAudio5 при включении автоматически подстраивает звук, сверяясь с "Звуки и аудиоустройстваконфигурация динамиков" из панели управления. Если в панели управления будет настройка 5.1 - раскладкой каналов будет заниматься JetAudio5, а CMSS работать не будет. Если в настройках поставить 2 канала, JetAudio5 будет воспроизводить 2 канала, CMSS тоже будет молчать. Для использования CMSS в таких программах, как JetAudio5 нужно перед запуском поставить настройку 2 канала, а после запуска поставить настройку 5.1. Тогда за раскладку возьмется CMSS.

Разница между раскладками многоканального звука CMSS, QMSS, JetAudio5:

  • CMSS
    На большинстве композиций возникло ощущение, что центральный канал просто микшируется из правого и левого и тихо пускается в центр. Обрезки низких частот для центра нет. Разницы между звучанием фронтальных каналов с СMSS и без не было. А ведь в идеале, из фронтального левого и правого должна убраться середина, и воспроизводиться должна через центральный канал. Такой эффект должен быть аналогичен эффекту в караоке. Обрезки низких частот для остальных каналов тоже нет.
  • QMSS
    Центральный канал вырезается из фронтальных, разделение не слишком сильное, но лучше, чем в CMSS. Частота среза для саба регулируется через Q-Rumble. Настройки Q-Rumble распространяются и на остальные каналы.
  • JetAudio5
    Центральный канал вырезается, качество разделения примерно то же, что и в QMSS. Среза низких частот нет ни для каналов, ни для саба. Впрочем, если в драйверах Live!24 bit включить саб, то поток на саб пойдет не с JetAudio5, а с дров креатива со срезом высоких частот.


EAX Console - Clean-up

А вот что по настоящему интересно - Clean-up. Убираем шумы и щелчки с аудио записи. Изначально это предлагается использовать для винила, но дома это пригодится для FM-тюнера. Включение/отключение эффекта требует примерно 7 секунд задержки. Работает под любым плеером. В теории можно это накладывать на Media Files и на линейные входы. На практике - микрофон и Line-in, а Auxiliary, несмотря на возможность выбора, не обрабатывался. Работает очень эффективно. Это единственное, что переплюнуло NSP. Конечно, если поднапрячься, и поискать по интернету, то можно достать необходимый VST-плагин, но на данный момент у меня такого нет. И за Clean-up поставим карточке большой плюс!


EAX Console - Time Scaling

Последняя вкладка панели EAX - Time Scaling. Убыстрение и замедление звука. Качество, на мой взгляд, очень низкое… Работает только под Creative MediaSourse Player. А теперь о веселом - ставим по умолчанию звуковую карту Prodigy7.1, запускаем фирменный проигрыватель от Creative MediaSourse Player и музыку, включив настройки EAX. Эффекты реверберации EAX не работают. А вот CMSS, Clean-up, Караоке (Voice Suppression amount и Pitch) и Time Scaling под Prodigy7.1 исправно работает. Делаем вывод - Караоке (Voice Suppression amount и Pitch) и Time Scaling - программные плагины исключительно Creative MediaSourse Player и к карте отношения не имеют. Однако если вынуть из компа Live! 24-bit, то Windows начнет ругаться, что не может найти EAX, какие-то библиотеки работать не хотят, а в Creative MediaSourse Player пропадут кнопочки для EAX, EQ и многое другое.

Еще одна особенность: если включить на проигрывание компакт-диск, то стоит только вызвать панель EAX, как трек автоматом переключается на следующий.


Панель конфигурации динамиков Speaker Settings - Speaker Selections

Speaker Selections: только выбор количества каналов и опция включения/выключения цифрового выхода.


Панель конфигурации динамиков Speaker Settings - Bass management

Очень неудобно показана настройка частоты: чтобы ее увидеть, надо поднести курсор к ползунку, и тогда на всплывающем окне-подсказке мы увидим значение. Когда двигаем ползунок, частота не отображается. Активна в режимах 5.1, 6.1, 7.1.


Панель конфигурации динамиков Speaker Settings - Bass Boost

Аналогичная панель, также работающая в режимах Headphones, 2, 4.


Панель Graphic Equalizer


Десятиполосный эквалайзер. Этот эквалайзер не удастся использовать для инсталляции домашнего кинотеатра, так как он работает с одинаковым пресетом на все каналы. После параметрических поканальных (а также линейных с большим количеством полос) эквалайзеров NSP, этот смотрится бедно, но дизайн очень хорош. К слову, дизайн драйверов от Creative никогда не выглядел профессионально. Так, настройки в очередной игрушке с игрушечным курсором. Эквалайзер - приятное исключение. Впрочем, предъявлять претензии игровому дизайну игровой звуковой карты - смешно.



Все выше рассмотренные панели загружаются с заметной задержкой, такое ощущение, что через силу. Возможно, каждая из них пытается понять, есть ли в системе творение Creative, и стоит ли вообще работать? Вот такие ленивые и требовательные утилиты…

А теперь подойдем к самому интересному. Есть у карты еще одна любопытная настройка, которая стала возможным благодаря более гибкой архитектуре основного чипа CA0106DAT.


Панель управления Device Control

Настраиваемые частоты на выход S/PDIF 44.1, 48 и 96.


В настройках выставляется опорная частоты дискретизации, 48 и 96 кГц, а также разрядность (bit depth) - 16 и 24 бита, на которых работает вся карта, и кодеки, и, предположительно, алгоритмы DSP. В отличие от карт на Envy здесь нет автоматического выбора частоты. Соответственно, интересно будет выяснить, честные ли это режимы, или, как и в прошлом поколении карт, частота обработки сигналов фиксирована, с последующим достаточно бестолковым и некачественным ресемплингом в любую другую частоту. Если в контрольной панели системы поставить устройством на воспроизведение по умолчанию не Live! 24-bit, а другую карту, то эту панель вызвать нельзя, выскакивает сообщение об ошибке.

Вспомним, на игровых картах с одним кварцем эффект-процессор EMU10K2 не умеет работать с данными, отличными от 48 кГц. На любых других частотах будет всегда передискретизация в 48 кГц. Это аппаратное ограничение. В профессиональных картах EMU 0404/1212/1820 на том же чипе стоит второй опорный кварц для 44.1 кГц, поэтому там, при ручном переключении в панели, эффект-процессор EMU10K2 может ещё работать в 44 кГц. В 96 даже в проф.карте аппаратный ревер не работает. Здесь мы имеем совсем другой чип DSP, поэтому будем дальше проверять, свободен ли он от аналогичных ограничений.


В Creative MediaSourse Player в параметрах записи можно выбрать частоту дискретизации и битрейт

Битность можно проверить, например, тестом S/PDIF in-out. Из-за фирменного миниджека Creative это проблематично сделать. Так как штекер изначально найти не удалось, пришлось немного попаять (за это автору полагается медаль за отвагу: во-первых, теряется гарантия, во-вторых, легко нарваться на заземляющий контакт и подпалить карту, как это однажды произошло с Terratec, там все исправить паяльником удалось, но пережить такое еще раз не хочется). Контакты в гнезде сделаны так, что если в них не воткнуть штекер, то они друг друга заземляют и сигнал вытащить через припаянный провод невозможно.

После долгих размышлений в голову пришла простая идея: взял скотч, обмотал одним слоем на штекер и воткнул. А звука нет… Обидно, и ничего не поделаешь. Вспомнив, что некоторые вещи иногда называются не своими именами, и делаются через зад…нюю панель, заходим в панель конфигурации динамиков и ставим галочку Digital Output Only. Аналоговый звук пропадает, а цифровой появляется! Хотя по идее, Only означает, что без галочки цифра тоже должна идти… Землю искать не пришлось, работает без нее по общему заземлению.


Распайка контакта со стороны платы была установлена опытным путем.

Позже удалось найти в продаже такой миниджек за 50 руб. Получив цифровой вход и выход через 4-х контактный миниджек, обнаружилось, что для получения S/PDIF out хватит и 3-х контактного стандартного стереоминиджека. А столько мороки было из выключенной галочки Digital Output Only во время испытания обычным 3-контактным миниджеком. Впрочем, для аналогового подключения 6.1 и 7.1 без такого 4-контактного миниджека не обойтись. Также в продаже есть кабели от LuxMann, где с такого миниджека имеется выход на три кабеля: видео, аудио-правый, аудио-левый на RCA. Но вот толщина пластмассового входа такого провода не вписывается в звуковую карту - в соседние гнезда ничего подключить не получится. На данный момент такой разъем используют видекамеры SONY и JVC, фирмы, которые не балуют покупателей наличием или стоимостью таких кабелей. Так что, придется, как всегда, все делать самим.RMAA5.4

Тестирование 16-битных режимов

Тестируемая цепь: Live! 24-bit линейный выход -> LynxTwo линейный вход
Режим работы: 16 бит, 44 кГц

Общая оценка: Очень хорошо ()

Тестируемая цепь: Live! 24-bit линейный выход -> LynxTwo линейный вход
Режим работы: 16 бит, 48 кГц

Общая оценка: Очень хорошо ()



Сравнение спектров теста IMD в режиме 44 кГц (верхний график) против 48 кГц (нижний график) хорошо показывает наличие пересчёта 44->48 кГц.



Интермодуляционные искажения от частоты в режиме 44 кГц (верхний график) наблюдаются равномерно во всей полосе частот с ростом ближе к 16 кГц. В режиме 48 кГц (нижний график) интермодуляция практически отсутствует. Обратите внимание на различные значения IMD в равномерной части графика для обоих режимов: -78 дБ (0.014%) в режиме 44 кГц против -84 дБ (0.0052%) в режиме 48 кГц. На основе измерений, карте Live!24 для качественного воспроизведения 44 кГц показан программный пересчёт частоты семплирования, SSRC (software sample rate conversion):

Тестируемая цепь: Live! 24-bit линейный выхо д -> LynxTwo линейный вход
Режим работы: 16-bit, SSRC 44->48 kHz

Общая оценка: Отлично ()



Как мы видим, SSRC полностью устраняет проблему передискретизации, даже позволяя карте получить в RMAA оценку «Отлично», вместо «Очень хорошо».

Тестируемая цепь: Live! 24-bit цифровой S/PDIF выход
Режим работы: 16 бит, 44 кГц

Общая оценка: Очень хорошо ()

Несмотря на наличие специального режима 44.1 кГц для S/PDIF выхода в настройках карты, для Creative традиционно имеется пересчёт 44->48, а потом ещё раз в 44 кГц. Таким образом, несмотря на наличие режима 44.1 кГц, даже по цифре рекомендуется использовать SSRC плагин.

Тестирование режимов повышенного разрешения

В режимах повышенного разрешения нас ждёт сенсация! Карта демонстрирует динамический диапазон более 106 дБА, а уровень шума менее -107 дБА! Сравните с заявленными параметрами в спецификации карты SNR = 100 дБА.

Мы обратились за официальными комментариями к руководству центрального европейского отделения Creative. Официальные лица были несколько удивлены ситуацией, но объясняют низкие паспортные параметры карты тем, что они были получены и усреднены в нескольких типичных компьютерах. От себя добавим, видимо, посчитав Live! 24-bit картой low-end, измерения инженеров Creative производились с использованием дешевых компьютеров с не очень качественными блоками питания и наводками внутри корпусов.

Устанавливая карту в разные компьютеры и производя наши собственные измерения, мы подтверждаем, что в RMAA получаются как чуть лучшие параметры, так и намного худшие. Мы приводим измерения в достаточно типичном компьютере с безвентиляторной материнской платой ASUS P5P800, видеокартой Sapphire X800Pro, блоком питания .

Тестируемая цепь: Live! 24-bit линейный выход -> LynxTwo линейный вход
Режим работы: 24 бит, 44 кГц

Общая оценка: Очень хорошо ()

Тестируемая цепь: Live! 24-bit линейный выход -> LynxTwo линейный вход
Режим работы: 24 бит, 48 кГц

Общая оценка: Отлично ()

Тестируемая цепь: Live! 24-bit линейный выход -> LynxTwo линейный вход
Режим работы: 24 бит, 96 кГц

Общая оценка: Отлично ()

Путём установки в дальний PCI-слот и некоторыми другими попытками можно уменьшить помехи на спектре в НЧ-области и получить немного лучшие результаты измерений:

Правда, остаётся открытым вопрос: зачем карте честная поддержка 24 бит, если в комплекте отсутствует проигрыватель DVD-Audio дисков, а сама карта не является профессиональной?

Работа цифрового выхода

Перейдем к S/PDIF, на нем узнаем, работает ли карта на 24 бита? Ведь у нас все эффекты программные и ограничений, по идее, быть не должно. Live! 24 bit S/PDIF out на частоте 48 kHz


Dynamic Range

Live! 24 bit S/PDIF out 24 bit stereo 2 16 bit HeadPhones 32 bit HeadPhones 24 bit HeadPhones
+0.00, -0.00 +0.00, -0.00 +0.00, -0.00 +0.00, -0.00
Уровень шума, дБ (А): -146.2 -95.0 -101.3 -101.4
133.1 95.0 101.2 101.2
Гармонические искажения, %: 0.0000 0.0005 0.0002 0.0002
0.0002 0.0053 0.0025 0.0025
-147.2 -95.1 -100.0 -100.9

Первые три графика показывают, что идет программный пересчет с потерей преимуществ 24-битного динамического диапазона. Но стоило в конфигурации динамиков поменять наушники на стереоколонки, как получились истинные 24 бит.Live! 24 bit S/PDIF out на частоте 44,1 кГц



Как и было сказано выше, мы имеем передискретизацию из 48 в 44.1 кГц. При этом, исходя из незначительной разницы между графиками 16 и 24 бита, можно сделать предположение, что в режиме 24 бит 44 кГц сигнал претерпевает дополнительную обработку с потерей битности. Live! 24 bit S/PDIF out на частоте 96 kHz

Sound Blaster Live! 24-bit 48/24 96/24 96/16 48/16
Неравномерность АЧХ (от 40 Гц до 15 кГц), дБ: +0.08, -0.11 +0.00, -0.00 +0.00, -0.00 +0.08, -0.11
Уровень шума, дБ (А): -128.5 -149.2 -400.0 -400.0
Динамический диапазон, дБ (А): 130.7 133.3 102.1 102.3
Гармонические искажения, %: 0.0000 0.0000 0.0015 0.0022
Интермодуляционные искажения, %: 0.0003 0.0002 0.0027 0.0028
Взаимопроникновение каналов, дБ: -124.7 -149.7 -364.0 -364.0


Низкий уровень шума для 16 бит можно объяснить срабатыванием во время теста уровня шума automute.

Тесты цифрового входа

Посмотрим, что у нас на вход по S/PDIF.Live! 24 bit S/PDIF in в режиме 44.1 кГц, 16 и 32 (float) бит

На 24 битах драйвер приводит к вылету RMAA, а режим 32 бит не поддерживается. Эти ограничения на всех режимах частот для S/PDIF in.


Live! 24 bit S/PDIF в режиме 48 кГц, 16 и 32 (float) бит



Live! 24 bit S/PDIF in в режиме 96 кГц, 16 и 32 (float) бит

Проведем еще один любопытный тест. Заставим записывать Live! 24 bit в режимах loopback (вход на выход).

Loop на 96kHz
1. Опорная частота 48/24 Line in-out
2. Опорная частота 96/24 Line in-out
3. What U Hear ("что слышу, то и записываю") 96/24
с отключенными линейными входами

Sound Blaster Live! 24-bit What U Hear 96->48 96
Неравномерность АЧХ (от 40 Гц до 15 кГц), дБ: +0.00, -0.00 +0.10, -0.20 +0.03, -0.12
Уровень шума, дБ (А): -152.8 -86.8 -99.0
Динамический диапазон, дБ (А): 132.9 85.1 99.1
Гармонические искажения, %: 0.0000 0.0044 0.0020
Интермодуляционные искажения, %: 0.0002 0.016 0.0084
Взаимопроникновение каналов, дБ: -152.2 -81.7 -95.7

В режиме What U Hear цифровой loop почти как в DirectWire у Prodigy7.1, хотя запись идет и не бит-в-бит. Audigy LS - первая пробная карта принципиально нового поколения игровых карт на софтовом алгоритме. Live! 24 bit - младшая сугубо игровая карта, где все по минимуму, но на достаточном уровне качества, сравнимом с топовой Audigy2 ZS.

Работа в наушниках

Тестирование пришлось проводить в Philips HP195 (32 Ом, 100 дБ чувствительность, и не очень высокое качество звучания). Качество наушников типично для большинства пользователей, покупающих карты low-end. Низкоомную нагрузку карта держит великолепно. Затруднений с недостатком громкости нет. Единственная программа, которая может вам дать недостаток громкости, - PowerDVD XP, в режиме - полный спектр частот - тихая обстановка она воспроизводит тихо.

В сравнении с Terratec с дровами от Prodigy7.1 v1.994 громкость Live! 24-bit соответствует 66% с включенным усилителем в Prodigy7.1. Здесь нужно учесть, что громкость в Prodigy7.1 нарастает нелинейно. Чем выше, тем круче график (предположительно, из-за отсутствующего регулятора Wave Master), поэтому оценим наоборот. В обычном режиме без усилителя Prodigy7.1 100% равна 72% Creative. У Live! 24-bit достаточно линейно и плавно регулируется громкость. Более мощный линейный выход порадует и усилитель. Только отметим, что на остальные каналы (2,3,4 стереопара) идут операционные усилители слабее, надо это учесть при регулировке громкости каналов в многоканальном режиме и характере звучания на дорогой акустике.

Звучание музыки оценивалось в наушниках Philips HP195 и двух маленьких чебурашках от Polk Audio (серия неизвестна, но конструкция от прославленного крупного Hi-Fi внушает уважение). В качестве музыкального материала на 44.1 kHz выступили записи тест-диск "Multimedia FSQ". Лицензионный диск Rammsten "Riese, riese" трек Oomph - Willst Du Noffnung, разные треки электронной музыки, разные треки записей с fm-тюнера, записанные на Prodigy7.1.

На рок-композициях со сложной пространственной сценой, инструменты теряли четкую локализацию и размывались. В то же время по сравнению с Realtek ALC650 тихие звуки не забивались громкими. Диск Multimedia FSQ только подчеркнул недостаток передискретизации на соответствующих треках. В электронной музыке лишь незначительно изменился тембр. Те же замечания и к современной поп-музыке. На записях с fm-тюнера шум стал плотнее и чуть громче, а локализация инструментов (которая и до этого не сильно прослеживалась) ухудшилась. В режиме 44.1 кГц тестируемая карта не смогла заменить полупрофессиональную.

В режиме 48 кГц разница между Prodigy7.1 и Live! 24 bit практически не ощущалась. Единственное, звук на Live! 24 bit имел чуть более яркое и металлическое звучание. На DVD-Video диске Pink Floyd "Roger Waters in the flesh live" была также слышна недоработка звукорежиссера, как и на Prodigy7.1 в 20-м треке (перегрузка на тихом звуке от синтезатора, добавившая скрип в левом канале).

Уникальный тест

А теперь уникальный тест, не проводимый ранее на других звуковых картах.

В поисках фирменного штекера Сreative во всех магазинах выглядел полным идиотом. Штекер "миниджек на четыре контакта"… Какой умник мог такое придумать… И вот, набрел на очередной магазин и увидел там залежи разнообразных радиаторов. Как правило, толку от них нет, крайне сложно прикручивать их к видеоплатам, звуковым и другим девайсам. Давным-давно мне попался радиатор с клейкой нижней частью, содранный с нерабочей материнской платы, он долго кочевал с девайса на девайс… Со временем он пришел в негодность (перестал приклеиваться). И вот мне попались именно такие радиаторы. Стоят всего 19 рублей. По сравнению с оверклокерскими наборами для видеокарт, цена ниже на порядок. Вспоминаем матчасть: чем сильнее нагревается полупроводник, тем хуже он работает. Если это усилитель, то ждите искажений, а если логика, - ждите ошибок и глюков. (Вспоминаем разогнанные видеокарты и процессоры). Как правило, в алгоритмах есть коррекция ошибок нескольких уровней, иногда ошибка исправляется автоматически, а иногда действия повторяются, как при считывании потрепанного CD в CD-ROM (на очень медленной скорости подвешивая систему). При разгоне глюки появляются не только от перегрева, но и от неспособности транзисторов во-время переключатся при завышенных тактовых частотах

В звуковых картах это тоже критично: тут ждите неправильной записи или воспроизведения. Кстати, операционники ЦАП и АЦП ВСЕГДА! сильно разогреваются, мне еще не встречалась звуковушка с холодными ЦАП или АЦП. То же можно сказать и об операционных усилителях. Кстати, у Live! 24-bit греется всё и, причем, сильно. У терратека основной чип обычно теплый, но я не припомню, чтоб я его заставлял делать что-то сложное на 192 кГц в 24 бит. Чем выше частота обработки, тем больше микросхема нагревается, возможно, поэтому в режимах высоких частот и бит мы получаем часто низкие результаты. С другой стороны все это предположения, и на качество звучания может больше повлиять питание и электромагнитные наводки от высокочастотных цифровых схем.

Некоторые причины, по которым подозреваюся ошибки связанные с температурой.

Для того, что бы было более понятно, описание не как в справочнике или учебнике (будет желание, туда сами заглянете), а более образными сравнениями.

Только в теории транзистор работает как ключ, на практике, это всегда усилитель, который на выходе дает или малый ток (логический 0), или большой ток (логический 1). Если ток близок к "логической середине 0.5", то здесь и возникают ошибки. Малый или большой ток транзистор дает за счет своего переменного сопротивления.

1. Питание для каждого транзистора в разный такт - разное. Микросхема состоит из большого количества транзисторов, и когда в общей схеме получается разное сопротивление (разное количестово 0 и 1 в разной схеме подключения) - получаем разный ток в питании. И разное значение 0.5 для каждого транзистора.

2. При нагреве у полупроводника сопротивление уменьшается, а у резистров оно увеличивается, это дает больший разброс общего сопротивления.

3. Помехи по питанию и наводкам из-за конденсаторов дают некоторую инертность на участках цепи, из-за чего "середина 0.5" увеличивется или уменьшается не пропорционально на разных на разных участках цепи.

4. Невозможно сделать два абсолютно одинаковых транзистора (или других элементов), из-за этого получаем изначальный разброс параметров для каждого элемента.

По этому производитель всегда указывает штатные требования к эксплуатации, в которых при проверке (отбраковке) были получены нужные характеристики, приводя параметры питания, температуры…

Итак, берем радиаторы, с помощью пассатижей или ножовки разделяем их на несколько кусочков и покрываем ими плату, стараясь, что бы они не замкнули конденсаторы и резисторы, так как являются хорошими проводниками.


Настоящий звуковой АКСЕЛЛЕРАТОР

Согласитесь, выглядит эффектно! Зеленый цвет не слишком хорошо смотрелся на черном текстолите, поэтому пришлось взять черный маркер. Terratec, правда, смотрится еще мощнее, на нем микросхем больше… нашлись даже радиаторы под полевики по 6 руб.

Вставляем карту в компьютер с неблагополучным спектром при тестах аналоговых интерфейсов и смотрим на результат.

Не забываем, улучшения от применения радиаторов могли получиться и из-за экранирования, которое могли дать радиаторы. По этому был проведен еще один тест с полным экранированием Live! 24-bit. Для этого был взят антистатический пакет, на него с помощью скотча была наклеена фольга, и поверх фольги снова наклеен скотч, как диэлектрик. Коротким медным проводом соединялась фольга и корпус.

0.021 0.021 0.021 Взаимопроникновение каналов, дБ: -90.2 -93.3 -92.7

Наибольшие улучшения нам дали радиаторы, чуть меньшие - экранирование. Лишь только в Stereo crosstalk экранирование обошло радиаторы. Хотя, если честно, - улучшения не слишком большие. Без радиаторов и экранирования можно прожить.

Очень важно отметить один серьезный недостаток подобного экранирования: любая плата в нем чувствует себя в как в парилке. Пакет с фольгой нагрелся так, что я стал опасаться за жизнь Live! 24-bit. И это притом, что кроме теста звуковая карта больше ничего не воспроизводила и регуляторы во время теста не ставились на максимум.

С радиаторами за жизнь карты могут не беспокоится те, кто у себя что-то разгоняет, но не может справиться с повышенной температурой внутри корпуса. Или владельцы малых корпусов (miniATX и баребонов), забитых устройствами "по самое нехочу".

Тесты в играх

Сначала об особенностях данной карточки. Сперва Creative выпускает EAX4 под игровые EMUK карты, теперь обещает, что EAX4 будет и в Audigy LS. А вот поддержки EAX4 на карте Live! 24-bit по официальным данным не планируется. Хотя есть мнение, что руководство Creative передумает, когда начнет массовую рекламу этого поколения карт. Кстати Audigy LS тоже не светила EAX4, но недавно в Creative поправили списки. Что же, подождем… Или не дождемся, и сами поменяем библиотеки.

Недавно на сайте Creative поправили списки и отметили, что данный чип поддерживает EAX. Стоит отметить: обновления драйверов с поддержкой новых алгоритмов всегда первоначально выходили для карт на EMU10K, а потом для Audigy LS. Быть может, новые DSP-ы имеют другой набор команд, и под них драйверы пока что в разработке, ведь по сути EMU10K разрабатывался изначально не под игры, и большая часть эффектов и фильтров там для игр не нужна. Но на данный момент загрузка процессора показывает, что алгоритмы EAX сильно загружают процессор.

RightMark 3DSound показал наличие 64 аппаратных буферов DirectSound и поддержку EAX вплоть до 3-й версии:

Device: Sound Blaster Live! 24-bit (P17.sys)

Features:
DirectSound 3D Hardware: Yes
DirectSound 2D Hardware: Yes
EAX 1: Available
EAX 2: Available
EAX 3: Available
EAX4 Advanced HD: N/A

Rates:
dwMinSecondarySampleRate 4000
dwMaxSecondarySampleRate 96000

Free buffers stats:
dwFreeHw3DAllBuffers 63
dwFreeHw3DStaticBuffers 63
dwFreeHw3DStreamingBuffers 63
dwFreeHwMixingAllBuffers 63
dwFreeHwMixingStaticBuffers 63
dwFreeHwMixingStreamingBuffers 63

Max buffers stats:
dwMaxHwMixingAllBuffers 64
dwMaxHwMixingStaticBuffers 64
dwMaxHwMixingStreamingBuffers 64
dwMaxHw3DAllBuffers 64
dwMaxHw3DStaticBuffers 64
dwMaxHw3DStreamingBuffers 64

Misc stats:
dwFreeHwMemBytes 0
dwTotalHwMemBytes 0
dwMaxContigFreeHwMemBytes 0
dwUnlockTransferRateHwBuffers 0
dwPlayCpuOverheadSwBuffers 0

Audio transfer speed (hardware): 9.615 Mb/sec.

Загрузка процессора на карте Live! 24-bit сравнивалась с загрузкой на Prodigy7.1 с драйверами Sensaura (1994_s3514) и QSound (1996d rev9). Тесты были проведены в Windows XP SP1. Система Cell 2667/533 (2000/400) 256 DDR333.

Live! 24 bit (48-16) 0 2D 3D 3D+EAX
8 0,96 4,6 6,75 9,6
16 0,9 6,4 9,7 13,6
24 0,96 8,2 12,7 17,5
32 0,98 10,1 15,6 21,71
63 0,98 16,6 28 37,8
Live! 24 bit (48-24) 0 2D 3D 3D+EAX
8 0,99 5,23 7,4 10,3
16 0,96 7,3 10,7 14,5
24 0,98 9,5 13,8 18,7
32 0,98 11,3 17,2 22,8
63 0,98 19 29,8 40,4
Live! 24 bit (96-16) 0 2D 3D 3D+EAX
8 0,99 6,56 11 14,2
16 0,98 8,7 14,4 18,4
24 0,99 10,7 17,5 22,5
32 0,98 12,5 20,9 26,6
63 0,98 20,7 33,2 45,3
Live! 24 bit (96-24) 0 2D 3D 3D+EAX
8 0,97 7,46 12,4 15,5
16 0,98 10,2 16 19,9
24 0,98 12,7 19,7 24,3
32 0,98 14,8 23 29
63 0,98 24,6 37,3 47,45
Qsound (44.1-16) 0 2D 3D 3D+EAX
8 0,93 6,6 8,6 9,21
16 0,98 7,1 10,3 11,1
24 0,98 7,9 12,5 13,9
32 0,98 8,6 14,6 16,1
63 0,99 11,5 22,3 26,7
Sensaura3D (48-16) 0 2D 3D 3D+EAX
8 0,99 6 8,4 12,9
16 0,98 6,9 10,2 15,1
24 0,96 8,1 12,6 18
32 0,96 9,4 15,1 20,8
64 0,96 13,7 24 36,6

Как видно, качество обработки пропорционально загрузке процессора. Отметим, что QSound в тесте работал в 44.1, в отличие от остальных в 48.

Тесты в играх

Тестовыми играми являлись, Call of Duty, NFS underground, Hevy Metall, Thief 3. Сравнивалось звучание с Sensaura3D и QSound. Игры оценивались в наушниках Philips HP195. Локализация у Live! 24-bit на порядок выше, чем у остальных. Особенно порадовал Thief 3. Факелы четко потрескивали, при этом ревербация от них чувствовалась, но не была осязаема. В то время как в QSound ревербация слышалась скрежетом посередине. Звук у Live! 24-bit по сравнению с Sensaura четче по локализации и звучит мягче.

NFS Underground показала, что игра сильна не только графикой. Было приятно слышать машины и точно знать, на каком расстоянии они находятся сзади и с какой стороны. Но больший сюрприз - звучание треков. Слушая их под Sensaura было подозрение, что или большой уровень искажений передискретизации, или запись была сделана в 8/22. При запуске в QSound в 44.1 без передискретизации наблюдался такой же безжизненный звук. А вот на Live! 24-bit звук звучал как с CD! После долгого и упорного прослушивания музыки стало слышно, что до CD не дотягивает, но по сравнению с Sensaura и QSound качество подскочило. Это приятно удивило.

Далее трэки из игры были выдраны с помощью утилиты и проиграны сначала на Prodigy 7.1, а потом на Live! 24-bit. После этого планировалось по S/PDIF и DirectWire выдрать треки из игры, но до этого не дошло. Prodigy7.1 ясно дала понять - формат 22 kHz с металлическим звучанием, скрипучестью и свистом на высоких немедленно требует доктора NSP с соответствующим плагином обработки VST. На тест была выбрана Overseer - Doomsday, а дальше эта мелодия запустилась через Live! 24-bit. Тут же исчезла скрипучесть, а металлический призвук превратился в плавный завал высоких частот. Качество не CD, но разница на слух ощутима сразу. Из чего делаем вывод: в передискретизатор 22->48, 22->96 добавлен дополнительный фильтр, улучшающий восприятие звука.

BassBoost во время игры работал, но ему не хватало динамики, при сквозном запуске через Prodigy с NSP звук стал еще динамичнее и интереснее. Все-таки в NSP возможностей больше, с большей загрузкой процессора…

Посмотрим, реально ли на карту поставить другие драйвера. Драйвер kxproject - страшно ругался, та же ситуация что и с Audigy LS. Драйвер от Audigy LS на половине распаковки заявил, что Audigy LS он не видит, и запаковался обратно.

MIDI меня совершенно не впечатлило. То же что и на остальных Creative ("вырубите пиликающий мобильник!") Минимум эффектов и отсутствие XG. Лечится софтовым синтезатором от Ямахи.

Отсутствие родного драйвера ASIO можно компенсировать установкой бесплатного драйвера . На момент публикации Live! 24-bit был протестирован с версией 2.2.

Минимальный размер буфера, с которым исправно работали ASIO программы - 192 сэмплов 4,9 миллисекунд. Некоторые ASIO программы требуют стандартных значей буфера - 128, 256, 512, 1024. При размере буфера 256 задержка у Live! 24-bit - 5,8 миллисекунд.

Выводы

Карточка практически идеальна в качестве дополнительной игровой карты, за низкую стоимость мы получаем полнофункциональный и качественный продукт. Я не думаю, что кого-то будет волновать наличие в драйверах некачественной передискретизации 44.1->48 или нечестные 44.1 на S/PDIF выходе. Тем более, что в MP3-плеерах Winamp и foobar всегда можно использовать программный real-time передискретизатор в 48 кГц.

Кому-то пригодится дополнительный качественный линейный вход (а он лучше, чем в Terratec Aureon Space в режимах 48 и 96). Также карточка будет интересна тем, у кого денег мало, а поиграть хочется в более качественном звуке, чем у Sensaura3D.

Загрузка процессора в EAX не радует, но и не огорчает: последнее время игры более критичны к видеокарте, а процессор не загружается полностью. Владельцы карт на Sensaure получат более качественный звук при тех же FPS, что и раньше.

Я подумал о том, что неплохо поставить карту на работу, - дешево и сердито. Будет отдельный кабинет - буду в игрушки играть, конфигурация там по мощности на порядок выше. А заодно не буду думать, как бы выжать больше громкости из встроенной звуковушки AD1981A.

Плюсы

  • прорыв по качеству АЦП и ЦАП в диапазоне $30 (конкурентов попросту нет и за чуть большую цену);
  • качественная разводка и низкий уровень шумов по всем частотам, а также великолепные результаты "What U Hear";
  • наличие S/PDIF in-out;
  • полная поддержка 7.1 (пусть, на сегодняшний день и не очень нужная);
  • честные 96 кГц и 24 бит;
  • великолепный звук в 3D;
  • компактные размеры;
  • мощный усилитель для наушников;
  • минимализм входов-выходов приятно снижает стоимость продукта (который берется из расчета прибавкой к другой звуковой плате или как экономичный вариант);
  • хороший передискретизатор с частоты 22 кГц в играх.

Минусы

  • крайне неудобные четырехконтактные миниджеки (в случае 7.1 подключения);
  • наличие передискретизации 44.1->48 или 44.1->96 как по аналогу, так и по цифре;
  • отсутствие автомата опорных режимов семплирования;
  • неизвестно, будет ли карта поддерживать новые алгоритмы EAX4;
  • отсутствие поддержки DVD-Audio;
  • совмещение входа Line-Mic-S/PDIF;
  • в отличие от карт Live!5.1/Audigy/Audigy2 с аппаратным DSP на порядок большая загрузка процессора в играх;
  • не все, что показано в драйверах - работает, а некоторые функции полностью программные (привязаны к Creative MediaPlayer и не распространяются альтернативные плееры).
Нет, честно говоря, никаких вводных слов не будет. Чтобы было сразу понятно, к чему клонит вся эта статья, сразу сформулирую её основной вывод: нет смысла распространять музыку в формате 24 бита и 192 кГц, потому что его качество редко лучше 16/44.1 или 16/48, а занимает он в 6 раз больше места.

Кое-что о человеческой психологии

В прошлом году Нил Янг* и Стив Джобс обсуждали создание сервиса для скачивания аудио в «бескомпромиссном студийном качестве», а спустя некоторое время , который должен будет использоваться для воспроизведения этого аудио. В общем, эта идея нравится инвесторам, и они совсем недавно выделили $500,000 на популяризацию этого формата. По-сути, на что выделены эти деньги? На одурачивающий маркетинг. Почему этот маркетинг работает ? Ну, он работает из-за существования парочки факторов .

Во-первых , при восприятии таких новостей люди зачастую основываются на догадках о том, как работает цифровое аудио, а не на том, как на самом деле оно работает: они предполагают, что увеличение частоты дискретизации аналогично увеличению количества кадров в секунду в видео. На самом деле такое увеличение аналогично добавлению инфракрасных и ультрафиолетовых цветов, которые мы никогда не увидим и видеть не можем в принципе. (Об этом повествует центральная часть статьи, но она будет чуть-чуть дальше.)

Во-вторых , люди могут считать, что слышат разницу в звуке, когда её на самом деле нет. Допускать такие ошибки мышления — это нормально для человека. Ошибки эти называются когнитивными искажениями. Подтверждение предубеждения, стадный инстинкт, эффект плацебо, доверие авторитету — это лишь некоторые когнитивные искажения, могущие заставить человека поверить в то, что он слышит разницу. Подтверждение предубеждения: «В 24/192 больше информации, значит я её должен слышать; о, слышу!» Стадный инстинкт вообще каким-то магическим образом заставляет людей верить в то, чего нет и быть не может. Доверие авторитету либо заставляет совершенно не критично относиться к информации, либо при сравнении со своим честным мнением отдавать предпочтение чужому мнению. В советском научно-популярном фильме «Я и другие» наглядно показываются некоторые социальные когнитивные искажения. Например, в фильме показывается следующий эксперимент: группе студентов показывают несколько портретов людей, и они должны сказать, на каких из двух портретов изображён один и тот же человек. Все студенты, кроме одного, — подставные и указывают на два портрета совершенно непохожих людей, а испытуемый, хоть изначально и не думал о таком варианте, зачастую соглашается с мнением большинства. Вы скажете: «Нет, ну я-то не такой». Вообще, вряд ли. Все мы люди, просто отличаемся тем, что в разной степени в чём-либо осведомлены. В любом случае, если бы люди не были подвластны таким когнитивным искажениям, то уже давно не работал бы маркетинг. Посмотрите кругом: люди покупают необоснованно дорогие товары и радуются этому.

Итак, 24/192 обычно не улучшает качество и это звучит как плохая новость. Хорошая новость заключается в том, что качество звучания улучшить несложно — достаточно просто купить хорошие наушники** . В конце концов улучшение качества звучания от них заметно сразу, оно не иллюзорно и радует. По крайней мере взяв наушники хотя бы в ценовом диапазоне от $100 до $200, вы будете радоваться и скажете мне спасибо за мой совет купить хорошие наушники, если, конечно, вы не купите красивые и дорогие имиджевые наушники, предназначенные совсем не для качественного воспроизведения аудио. А теперь давайте перейдём к самому интересному.

* Да, я тоже понятия не имел, кто такой Нил Янг. Оказывается, это известный канадский музыкант... уже 50 лет как известный.
** Это моё личное мнение, я не являюсь представителем каких-либо магазинов и не преследую никакой коммерческой цели.

Теорема Найквиста-Шеннона

Для того, чтобы не оказаться в ловушке мышления, попробуем с самых азов понять, из-за чего работает цифровое аудио.

Сначала чётко уясним термины (будем формулировать их так, будто они применяются только при анализе звуков).
Сигнал — функция, зависящая от времени. Например, как сигнал можно выразить электрическое напряжение в проводах аудиоаппаратуры или, скажем, давление звука на барабанную перепонку (в зависимости от момента времени).

Спектр — представление сигнала в зависимости от частоты, а не времени. Это означает, что функция выражается не как «громкость», записанная во времени, а как набор громкостей бесконечного количества гармоник (косинусоид), включенных в один и тот же момент времени. То есть изначальный сигнал может быть представлен как набор гармонических сигналов разных частот и амплитуд («громкостей»). Да, физические величины зачастую (на деле почти всегда) можно представлять таким «странным» образом (проведя преобразование Фурье над изначальной функцией). (Отображение значения спектра в произвольный момент времени — это один из самых наглядных способов изобразить визуально музыку в аудиоплеере . Замечу, что тот спектр, о котором я говорю, содержит информацию о всем промежутке времени, а не о каком-то мгновенном значении, т.к. по набору гармоник (спектру) можно воссоздать весь звуковой отрывок.)

Теорема Найквиста-Шеннона утверждает, что если сигнал имеет ограниченный спектр, то он может быть восстановлен по своим отсчётам, взятым с частотой, строго большей удвоенной верхней частоты f c : f > 2 f c . Если мы будем увеличивать частоту отсчётов, то это повлияет лишь на то, что формат цифрового аудио начнёт позволять записывать более высокие частоты — те, которые мы никак не воспринимаем. Кстати, в этой теореме говорится о сигнале, состоящем не из конечного набора частот, а из бесконечного, как в реальном звуке. Если говорить простым языком, то смысл теоремы заключается в том, что если мы возьмём какой-нибудь звуковой сигнал, содержащий только частоты, меньшие f c , и запишем (в файл) его значения через каждые 1/f секунды, то мы сможем потом воссоздать изначальный звуковой сигнал по этим значениям. Да-да, воссоздать полностью, без потери какого-либо качества вообще. Но формулировка не объясняет, как воссоздать этот звук. Вообще, это теорема из работы Найквиста «Certain topics in telegraph transmission theory» за 1928 год, в этой работе ничего не сказано про то, как воссоздать звук. А вот теорема Котельникова, предложенная и доказанная В.А. Котельниковым в 1933 году, объясняет это довольно чётко.


Что же это означает? Во-первых, обратим внимание на функцию sinc(t) = sin(t)/t. Наглядно это просто мексиканская шляпа:



Вычитание k /(2f 1 ) из t означает сдвиг шляпы в нужное место (в то самое место, где был записан отсчёт), а умножение на D k означает растягивание этой шляпы по вертикали так, чтобы её макушка совпадала с точкой отсчёта. То есть теорема утверждает, что для воссоздания звука достаточно собрать шляпы в точках, соответствующих отсчётам, причём таким образом, чтобы вершины шляп совпадали с измерениями в отсчётах. Теорему оставим без доказательства — его можно найти в почти любой литературе по обработке сигналов. Однако обращу внимание на то, что воссоздание функции по теореме Котельникова не является просто сглаживанием. Да, шляпа не влияет на значения в соседних отсчётах, но влияет на значения между ними. И когда мы имеет низкочастотный сигнал, это может выглядеть как сглаживание, но если мы имеем, скажем высокочастотный косинус, то при его изображении в виде ступенек, мы даже не поймём, что это косинус — он будет казаться просто хаотичным набором отсчётов, однако, при восстановлении получится самый настоящий и идеально гладенький косинус.



Ну что же, математически понятно, что восстановить звук возможно. Чисто теоретически. И это не значит, что устройства воспроизведения цифрового звука воссоздают звук неотличимым от оригинального, это лишь значит, что аудиоформат позволяет такое сделать. А вот как правильно подкидывать мексиканские шляпы на выход цифро-аналогового преобразователя и как донести полученный звук до уха с минимальными искажениями — это уже совсем другая магия, не имеющая отношения к данной статье. К счастью для нас, добрые инженеры уже тысячу раз подумали над тем, как им решить для нас эту задачу.

Что дают 24 бита

При обсуждении применения теоремы Котельникова к цифровому аудио мы для простоты забыли, что при квантовании (оцифровке) числа D k — это числа, записанные на компьютере, а, значит, это числа не любой точности, а какой-то определённой — той, что мы выберем для нашего аудиоформата. Это означает, что значения изначального сигнала записываются не точно, и это приводит к, вообще говоря, невозможности воссоздать оригинальный сигнал. Но как в реальности это влияет на воспринимаемый человеком звук при честном сравнении 16 и 24 битных сигналов? Проводились исследования, что лучше, 24/44 или 16/88 (да-да, именно так!), удвоение частоты качества не прибавило, а вот увеличение разрядности испытуемые определяли без проблем. В сторону 32 и 64 бит пока никто не смотрит, нет в природе устройств, которые бы могли реализовать потенциал 64-битного звука. А вот при внутренней обработке звука в музыкальных редакторах используют высокую разрядность под 64 бит и выше.

Давайте поговорим о громкости звука. Громкость звука — это субъективная величина, возрастающая очень медленно при увеличении звукового давления и зависит от него, амплитуды и частоты звука.Уровень громкости звука — это относительная величина, которая выражается в фонах и численно равна уровню звукового давления , создаваемого синусоидальным тоном частотой 1 кГц такой же громкости, как и измеряемый звук. Уровень звукового давления (sound pressure level, SPL) измеряется в дБ относительно порога слышимости синусоидальной волны в 1 кГц для человеческого уха, а при возрастании звукового давления в 2 раза, уровень звукового давления увеличивается на 6 дБ. Приведу несколько значений звукового давления:

  • 20-30 дБ SPL - очень тихая комната (да-да, комната, в которой ничего не происходит).
  • 40-50 дБ SPL - обычный разговор.
  • 75 дБ SPL - крик, смех на расстоянии 1 метр.
  • 85 дБ SPL - опасная для слуха громкость — повреждение при длительном воздействии 8 часов в день, для некоторых людей эта величина может быть меньше [Hearing damage ]. Примерно такая громкость на автостраде в час пик [Sound pressure levels ]. Не знаю как вы, но я на такой громкости никогда не слушаю музыку — это становится понятно, когда иду в закрытых накладных/охватывающих наушниках мимо шоссе и пытаюсь слушать музыку.
  • 91 дБ SPL - повреждение слуха при воздействии 2 часа в день.
  • 100 дБ SPL - это максимальное допустимое звуковое давление для наушников по нормам Евросоюза.
  • 120 дБ SPL - почти невыносимо — болевой порог.
  • 140 дБ SPL и выше — разрыв барабанной перепонки, баротравма или даже смерть.
Эта сводная таблица уровней громкости рассчитана на воспроизведение с акустических систем, где негативное влияние оказывает высокое звуковое давление на все тело.

В наушниках без особых проблем многие слушают под 130-140 дБ и никакого разрыва перепонки не случается. Слух попортить безусловно можно. Основные данные по болевым порогам получены от колонок, где наибольший вред наносят низкие частоты, которые действуют не столько на ухо, сколько на все тело, вводя в резонанс внутренние органы и разрушая их. Повредить грудную клетку от низких частот из наушников просто не реально. А вот в автомобиле от сабвуфера - в самый раз. Но более важно то, что таблица создавалась изначально под производственный шум на заводах. Ухо от наушников повредить можно на высокой громкости только в области верхних средних частот, где у уха есть собственный резонанс.

Эффективный же динамический диапазон 16-битного аудио — 96 дБ. Сравнивая 130 и 96 дБ становится понятно, что разницу в звуке мы услышать можем. Но чисто теоретически. Во-первых, 96 дБ — это величина отношения сигнал/шум в типичных источниках звука. Во-вторых, для популяризации форматов высокого разрешения на студиях часто сводят звук для CD и DVD-Audio с несколько разным усердием и в итоге покупатель может слышать посредственно сведённый материал в первом случае и хорошо сведенный во втором.

Последнее время стало модным выпускать ремастеры различных альбомов исполнителей. Но при этом большая часть таких ремастеров, сделанных на более новом оборудовании и в тяжеловесных форматах звучит существенно хуже, чем старые записи... Здесь возникает подозрение, что вместо качественного сведения талантливым звукорежиссером, все заменяется просто качественным оборудованием и уверенности, что это даст лучший результат, а если нет, то и так все раскупят.

Получается, что с позиции технических параметров 24 бит всегда будут лучше, чем 16, но услышать это можно на качественно сделанных записях, если сделать запись с радио, то там различить 16 и 24 бита будет очень сложно. Таким образом стоит гнаться не за высокими форматами, а за качественно записанными и сведенными записями и стремится к повышению качества аппаратуры.

Гонка к тяжеловесным форматам сопоставима с гонкой за мегапикселями фотоаппаратов, где любой профессионал знает, что итоговое качество от этого зависит довольно слабо.

В дорогих системах порой используют отдельную обработку в виде SRC как в , что при переводе 44.1/16>192/24 позволяет перевести ЦАП в другой режим работы и заменить его блок цифровой фильтрации сигнала (от альязинга) более совершенным внешним SRC конвертером. Так же отдельно сконвертированные файлы из 44.1/16 в 192/24 порой могут звучать лучше, но именно из-за особенностей используемого ЦАП и это дает повод задуматься над апгрейдом системы в целом.

Надо отметить, что проверка различных DVD-Audio дисков порой выдавала удручающий результат, т.к. изначальный исходник для тяжеловесного формата был взят из стандартного CD-Audio.

Дополнительно

Ну что же, если наша цель заключается в том, чтобы наслаждаться звучанием, то осталось понять, что новость про бессмысленность 24/192 даже и не плохая вовсе — она, на самом деле говорит о том, что качество звука улучшить можно, но для этого не надо гнаться за тяжеловесными форматами.

Но раз существует как минимум два мнения по поводу «16/44.1 против 24/192», то, может быть есть и ещё какие-то иные и интересные мнения? Да, есть. Как минимум есть ещё две интересные статьи с неожиданными выводами: «Coding High Quality Digital Audio » от J. Robert Stuart (статья на английском) и «24/192 Music Downloads... and why they make no sense » от Monty, разработчика формата OGG (эта статья тоже на английском, она утверждает, что 24 бита тоже бессмысленны).

Резюме

  • Нет смысла хранить аудио в 24/192, поскольку это не улучшит качество звука просто так.
  • 192 кГц бессмысленны потому, что позволяют записывать звуки с частотами, которые мы не слышим, а все слышимые звуки есть в 44.1 кГц.
  • Кстати, если бы на этих частотах содержалась какая-нибудь информация, и если бы она воспроизводилась цифро-аналоговым преобразователем, то она бы вносила дополнительные искажения (шумы) в слышимом диапазоне частот. А вы знаете причины такого поведения аудиосистемы?
  • 24 бита позволяют записывать звуки такой громкости, какую мы не можем слышать на обычной аппаратуре (или позволяет записывать громкость слышимых звуков с такой точностью, которая неотличима от 16 бит).
  • Из-за когнитивных искажений мы можем считать, что разница между 16/44.1 и 24/192 существует и заметна.
  • Многие маркетинговые ходы и стратегии основываются на когнитивных искажениях и незнании.
  • Качество звучания можно улучшить, но другими способами.

Нашли опечатку в тексте? Выделите и нажмите Ctrl+Enter . Это не требует регистрации. Спасибо.

Что является одним из наиболее распространенных и глубоко укоренившихся заблуждений в мире меломанов?

Сохранить и прочитать потом -

Прим. перев.: Это перевод второй (из четырех) частей развернутой статьи Кристофера «Монти» Монтгомери (создателя Ogg Free Software и Vorbis) о том, что, по его мнению, является одним из наиболее распространенных и глубоко укоренившихся заблуждений в мире меломанов.

Частота 192 кГц считается вредной

Музыкальные цифровые файлы с частотой 192 кГц не приносят никакой выгоды, но всё же оказывают кое-какое влияние. На практике оказывается, что их качество воспроизведения немного хуже, а во время воспроизведения возникают ультразвуковые волны.

И аудиопреобразователи, и усилители мощности подвержены влиянию искажений, а искажения, как правило, быстро нарастают на высоких и низких частотах. Если один и тот же динамик воспроизводит ультразвук наряду с частотами из слышимого диапазона, то любая нелинейная характеристика будет сдвигать часть ультразвукового диапазона в слышимый спектр в виде неупорядоченных неконтролируемых нелинейных искажений, охватывающих весь слышимый звуковой диапазон. Нелинейность в усилителе мощности приведет к такому же эффекту. Эти эффекты трудно заметить, но тесты подтвердили, что оба вида искажений можно расслышать.

График выше показывает искажения, полученные в результате интермодуляции звука частотой 30 кГц и 33 кГц в теоретическом усилителе с неизменным коэффициентом нелинейных искажений (КНИ) около 0.09%. Искажения видны на протяжении всего спектра, даже на меньших частотах.

Неслышимые ультразвуковые волны способствуют интермодуляционным искажениям в слышимом диапазоне (светло-синяя зона). Системы, не предназначенные для воспроизведения ультразвука, обычно имеют более высокие уровни искажений, около 20 кГц, дополнительно внося вклад в интермодуляцию. Расширение диапазона частот для включения в него ультразвука требует компромиссов, которые уменьшат шум и активность искажений в пределах слышимого спектра, но в любом случае ненужное воспроизведение ультразвуковой составляющей ухудшит качество воспроизведения.

Есть несколько способов избежать дополнительных искажений:

  1. Динамик, предназначенный только для воспроизведения ультразвука, усилитель и разделитель спектра сигнала, чтобы разделить и независимо воспроизводить ультразвук, который вы не можете слышать, чтобы он не влиял на другие звуки.
  2. Усилители и преобразователи, спроектированные для воспроизведения более широкого спектра частот так, чтобы ультразвук не вызывал слышимых нелинейных искажений. Из-за дополнительных затрат и сложности исполнения, дополнительный частотный диапазон будет уменьшать качество воспроизведения в слышимой части спектра.
  3. Качественно спроектированные динамики и усилители, которые совсем не воспроизводят ультразвук.
  4. Для начала можно не кодировать такой широкий диапазон частот. Вы не можете (и не должны) слышать ультразвуковые нелинейные искажения в слышимой полосе частот, если в ней нет ультразвуковой составляющей.

Все эти способы нацелены на решение одной проблемы, но только 4 способ имеет какой-то смысл.

Если вам интересны возможности вашей собственной системы, то нижеследующие сэмплы содержат: звук частотой 30 кГц и 33 кГц в формате 24/96 WAV, более длинную версию в формате FLAC, несколько мелодий и нарезку обычных песен с частотой, приведенной к 24 кГц так, что они полностью попадают в ультразвуковой диапазон от 24 кГц до 46 кГц.

Тесты для измерения нелинейных искажений:

  • Звук 30 кГц + звук 33 кГц (24 бит / 96 кГц)
  • Мелодии 26 кГц – 48 кГц (24 бит / 96 кГц)
  • Мелодии 26 кГц – 96 кГц (24 бит / 192 кГц)
  • Нарезка из песен, приведенных к 24 кГц (24 бит / 96 кГц WAV) (оригинальная версия нарезки) (16 бит / 44.1 кГц WAV)

Предположим, что ваша система способна воспроизводить все форматы с частотами дискретизации 96 кГц . При воспроизведении вышеуказанных файлов, вы не должны слышать ничего, ни шума, ни свиста, ни щелчков или каких других звуков. Если вы слышите что-то, то ваша система имеет нелинейную характеристику и вызывает слышимые нелинейные искажения ультразвука. Будьте осторожны при увеличении громкости, если вы попадете в зону цифрового или аналогового ограничения уровня сигнала, даже мягкого, то это может вызвать громкий интермодуляционный шум.

В целом, не факт, что нелинейные искажения от ультразвука будут слышимы на конкретной системе. Вносимые искажения могут быть как незначительны, так и довольно заметны. В любом случае, ультразвуковая составляющая никогда не является достоинством, и во множестве аудиосистем приведет к сильному снижению качества воспроизведения звука. В системах, которым она не вредит, возможность обработки ультразвука можно сохранить, а можно вместо этого пустить ресурс на улучшение качества звучания слышимого диапазона.

Недопонимание процесса дискретизации

Теория дискретизации часто непонятна без контекста обработки сигналов. И неудивительно, что большинство людей, даже гениальные доктора наук в других областях, обычно не понимают её. Также неудивительно, что множество людей даже не осознают, что понимают её неправильно.

Дискретизированные сигналы часто изображают в виде неровной лесенки, как на рисунке выше (красным цветом), которая выглядит как грубое приближение к оригинальному сигналу. Однако такое представление является математически точным, и когда происходит преобразование в аналоговый сигнал, его график становится гладким (голубая линия на рисунке).

Наиболее распространенное заблуждение заключается в том, что, якобы, дискретизация – процесс грубый и приводит к потерям информации. Дискретный сигнал часто изображается как зубчатая, угловатая ступенчатая копия оригинальной идеально гладкой волны. Если вы так считаете, то можете считать, что чем больше частота дискретизации (и чем больше бит на отсчет), тем меньше будут ступеньки и тем точнее будет приближение. Цифровой сигнал будет все больше напоминать по форме аналоговый, пока не примет его форму при частоте дискретизации, стремящейся к бесконечности.

По аналогии, множество людей, не имеющих отношения к цифровой обработке сигналов, взглянув на изображение ниже, скажут: «Фу!» Может показаться, что дискретный сигнал плохо представляет высокие частоты аналоговой волны, или, другими словами, при увеличении частоты звука, качество дискретизации падает, и частотная характеристика ухудшается или становится чувствительной к фазе входного сигнала.

Это только так выглядит. Эти убеждения неверны!

Комментарий от 04.04.2013: В качестве ответа на всю почту, касательно цифровых сигналов и ступенек, которую я получил, покажу реальное поведение цифрового сигнала на реальном оборудовании в нашем видео Digital Show & Tell , поэтому можете не верить мне на слово.

Все сигналы частотой ниже частоты Найквиста (половина частоты дискретизации) в ходе дискретизации будут захвачены идеально и полностью, и бесконечно высокая частота дискретизации для этого не нужна. Дискретизация не влияет на частотную характеристику или фазу. Аналоговый сигнал может быть восстановлен без потерь – таким же гладким и синхронным как оригинальный.

С математикой не поспоришь, но в чем же сложности? Наиболее известной является требование ограничения полосы. Сигналы с частотами выше частоты Найквиста должны быть отфильтрованы перед дискретизацией, чтобы избежать искажения из-за наложения спектров. В роли этого фильтра выступает печально известный сглаживающий фильтр. Подавление помехи дискретизации, на практике, не может пройти идеально, но современные технологии позволяют подойти к идеальному результату очень близко. А мы подошли к избыточной дискретизации.

Избыточная дискретизация

Частоты дискретизации свыше 48 кГц не имеют отношения к высокой точности воспроизведения аудио, но они необходимы для некоторых современных технологий. Избыточная дискретизация (передискретизация) – наиболее значимая из них .

Идея передискретизации проста и изящна. Вы можете помнить из моего видео «Цифровое мультимедиа. Пособие для начинающих гиков», что высокие частоты дискретизации обеспечивают гораздо больший разрыв между высшей частотой, которая нас волнует (20 кГц) и частотой Найквиста (половина частоты дискретизации). Это позволяет пользоваться более простыми и более надежными фильтрами сглаживания и увеличить точность воспроизведения. Это дополнительное пространство между 20 кГц и частотой Найквиста, по существу, просто амортизатор для аналогового фильтра.

На рисунке выше представлены диаграммы из видео «Цифровое мультимедиа. Пособие для начинающих гиков», иллюстрирующие ширину переходной полосы для ЦАП или АЦП при частоте 48 кГц (слева) и 96 кГц (справа).

Это только половина дела, потому что цифровые фильтры имеют меньше практических ограничений в отличие от аналоговых, и мы можем завершить сглаживание с большей точностью и эффективностью. Высокочастотный необработанный сигнал проходит сквозь цифровой сглаживающий фильтр, который не испытывает проблем с размещением переходной полосы фильтра в ограниченном пространстве. После того, как сглаживание завершено, дополнительные дискретные отрезки в амортизирующем пространстве просто откидываются. Воспроизведение передискретизированного сигнала проходит в обратном порядке.

Это означает, что сигналы с низкой частотой дискретизации (44.1 кГц или 48 кГц) могут обладать такой же точностью воспроизведения, гладкостью АЧХ и низким уровнем наложений, как сигналы с частотой дискретизации 192 кГц или выше, но при этом не будет проявляться ни один из их недостатков (ультразвуковые волны, вызывающие интермодуляционные искажения, увеличенный размер файлов). Почти все современные ЦАП и АЦП производят избыточную дискретизацию на очень высоких скоростях, и мало кто об этом знает, потому что это происходит автоматически внутри устройства.

ЦАП и АЦП не всегда умели передискретизировать. Тридцать лет назад некоторые звукозаписывающие консоли использовали для звукозаписи высокие частоты дискретизации, используя только аналоговые фильтры. Этот высокочастотный сигнал потом использовался для создания мастер-дисков. Цифровое сглаживание и децимация (повторная дискретизация с более низкой частотой для CD и DAT) происходили на последнем этапе создания записи. Это могло стать одной из ранних причин, почему частоты дискретизации 96 кГц и 192 кГц стали ассоциироваться с производством профессиональных звукозаписей.

16 бит против 24 бит

Хорошо, теперь мы знаем, что сохранять музыку в формате 192 кГц не имеет смысла. Тема закрыта. Но что насчет 16-битного и 24-битного аудио? Что же лучше?

16-битное аудио с импульсно-кодовой модуляцией действительно не полностью покрывает теоретический динамический звуковой диапазон, который способен слышать человек в идеальных условиях. Также есть (и будут всегда) причины использовать больше 16 бит для записи аудио.

Ни одна из этих причин не имеет отношения к воспроизведению звука – в этой ситуации 24-битное аудио настолько же бесполезно, как и дискретизация на 192 кГц. Хорошей новостью является тот факт, что использование 24-битного квантования не вредит качеству звучания, а просто не делает его хуже и занимает лишнее место.

Примечания к Части 2

6. Многие из систем, которые неспособны воспроизводить сэмплы 96 кГц, не будут отказываться их воспроизводить, а будут незаметно субдискретизировать их до частоты 48 кГц. В этом случае звук не будет воспроизводиться совсем, и на записи ничего не будет, вне зависимости от степени нелинейности системы.

7. Передискретизация – не единственный способ работы с высокими частотами дискретизации в обработке сигналов. Есть несколько теоретических способов получить ограниченный по полосе звук с высокой частотой дискретизации и избежать децимации, даже если позже он будет субдискретизирован для записи на диски. Пока неясно, используются ли такие способы на практике, поскольку разработки большинства профессиональных установок держатся в секрете.

8. Неважно, исторически так сложилось или нет, но многие специалисты сегодня используют высокие разрешения, потому что ошибочно полагают, что звук с сохраненным содержимым за пределами 20 кГц звучит лучше. Прямо как потребители.

  • Sergey B

    Доброго времени суток. Прошёл год со времени написания Вами этой статьи, а я только ещё наткнулся на неё. Если сможете, то подскажите пожалуйста. Дело в том, что версия AIMP за это время тоже изменилась и сейчас она “v.4.13 (build 1895)”. Но, в принципе, мой вопрос подойдёт и под прежние версии (не ниже версии 3.5). Прочитав Вашу статью, у меня возник вопрос. Дело в том, что я использую в AIMP “DirectSound”, который позволяет сделать вывод с разрядностью 32 bit float. Меня интересует именно разрядность. То – есть, если я воспроизвожу МР3 файл (44.1 Hz / 16 bit) то вижу, что AIMP – е прописывается “INPUT 44.1 Hz / 32 bit float. А для выхода из AIMP я установил тоже значение 32 bit float (частоту дискретизации не будем обсуждать), потому – что, почитав многочисленные статьи, я сделал вывод, что если на выходе из AIMP установить разрядность 32 bit float, то все последующие, возможные, обработки звука (например в настройках звука Windows) будут происходить в 32 bit float и благодаря этому, качество обработки в настройках звука Windows (эквалайзеры, громкость и т.д.) будут применены более качественно, чем если вывод из AIMP установить на максимальное значение с которым может работать моя звуковая карта, то – есть 24 bit. Моя встроенная звуковая карта имеет максимальное значение (24 bit). Правильно я поступил, установив в AIMP значение вывода 32 bit float, при том, что моя звуковая карта имеет максимальные значение 24 bit?

    1. Soolo Post author

      Windows в любом случае будет обрабатывать звук в разрядности 32 bit float. Только в вашем случае она их получит от АИМПа сразу в требуемом виде, а в другом случае Винда сама преобразует данные из более низкой разрядности (такое преобразование без потерь качества).
      Единственное отличие вашего выбора от обычных 32 бит в режиме WASAPI – это возможность использовать встроенный виндовый лимитер (для предотвращения клиппинга, т.е. хрипов). Для этого нужно предварительно отключить соответствующую опцию антиклиппинга в самом АИМПе. Впрочем отличия в звуке едва ли будут заметны. Гораздо правильнее, для того, чтобы избежать клиппинга, не перекручивать эквалайзер и не выставлять 100% громкость в плеере.
      Что касается встроенных Реалтеков и других карт подобного класса, я всегда говорил и говорю, что никакие манипуляции с настройками не улучшат звук, можно использовать настройки АИМПа и Windows по умолчанию: а именно WASAPI 32 bit 44.1 kHz (48 kHz).

      1. Sergey B

        Здравствуйте! Большое спасибо за то, что откликнулись и за ответ! Теперь я точно убедился в том, что лучше использовать «DirectSound», потому – что появляется возможность выбора значения вывода звука 32 bit float. Кстати, я понимаю то, что желательно не использовать эквалайзеры и всевозможные “улучшайзеры”. «DirectSound» я решил использовать именно потому, что при его выборе, в настройках вывода AIMP можно задать значение 32 bit float, а используя “WASAPI” разработчик жёстко прописал значение 32 bit. Да, Вы правы, преимущества от выбора вывода 32 bit float очевидны - при таком формате исключается клиппинг на этапе вывода звука плеером. Для случаев, когда сигнал превышает допустимый уровень, Windows применяет специальный лимитер (limiter APO) и так-как входящий в AIMP звук декодируется в 32 bit float и выводится из AIMP тоже в формате 32-bit floating point, то это является очень большим преимуществом, именно поэтому я и решил использовать «DirectSound» (хотя “WASAPI”, вроде как более новый). Будьте добры, объясните мне немного поподробнее следующее:
        При использовании (в AIMP-е) вывода «DirectSound» 32 bit float, Вы пишете выше, что нужно отключить в AIMP-е “Антиклиппинг”, потому – что используется лимитер Windows. А что происходит если (повторюсь, используя в AIMP-е вывод «DirectSound» 32 bit float) НЕ выключить “Антиклиппинг” в AIMP-е? Будет использоваться “Аниклиппинг” AIMP или “Антиклиппинг” Windows или и тот и другой (хотя, скорее всего, наверно, должен будет использоваться какой – то один)? Забегая вперёд предположим, что если, НЕ отключать “Антиклиппинг” в AIMP то использоваться будет именно он (“Антиклиппинг” AIMP) , а “Антиклиппинг” Windows в этом случае не будет использоваться (это предположение), то какой “Антиклиппинг” лучше? Если “Антиклиппинг” Windows лучше “Антиклиппинга” встроенного в AIMP, то может лучше Выключить “Антиклиппинг” встроенный в AIMP и в этом случае будет срабатывать “Антиклиппинг” Windows?
        И ещё скажите пожалуйста: Если я использую в AIMP-е «DirectSound», то появляется возможность выбора числа каналов. Я выбрал значение “Stereo”, потому – что слушаю stereo музыку через две встроенные в ноутбук муз.колонки. А если, предположим, я начну слушать музыку 5.1, через встроенные в ноутбук две муз.колонки, то нужно установить галочку “Разрешить микширование каналов”? И в этом случае, при несоответствии количества каналов источника и устройства, плеер выполняет микширование? А если (используя AIMP и ноутбук с двумя встроенными муз.колонками) при прослушивании 5.1 музыки НЕ поставить галочку в “Разрешить микширование каналов”, то AIMP будет воспроизводить только два канала из звука 5.1? То – есть AIMP НЕ будет микшировать все каналы в стерео?

        1. Soolo Post author

          преимущества от выбора вывода 32 bit float очевидны - при таком формате исключается клиппинг на этапе вывода звука плеером

          Если используется антиклиппинг АИМПа, то нужды в Limitet APO нет, соответственно, преимущество float пропадает.

          А что происходит если НЕ выключить «Антиклиппинг» в AIMP-е?

          Будет работать антиклиппинг АИМПа, Limiter APO останется незадействованным, т.к. к нему будет приходить не превышающий уровня сигнал.

          Если «Антиклиппинг» Windows лучше «Антиклиппинга» встроенного в AIMP, то может лучше Выключить «Антиклиппинг» встроенный в AIMP

          Они примерно одинаковы, если судить по тесту из этой стьи .
          Повторюсь, лучше не допускать клиппинга, чем потом его исправлять лимитерами.

          при прослушивании 5.1 музыки НЕ поставить галочку в «Разрешить микширование каналов», то AIMP будет воспроизводить только два канала из звука 5.1?

          Всё верно. Если не стоит галочка микширования, то алгоритм очень прост: лишние каналы отсекаются, а недостающие дублируются.

          1. Sergey B

            Громадное Вам спасибо за оперативные ответы! Поинтересуюсь у Вас ещё немного по поводу микширования каналов: Предположим, что я, прослушиваю 5.1 музыку через AIMP (на ноутбуке с двумя встроенными динамиками). В настройках AIMP я выбрал «DirectSound» благодаря чему появилась возможность выбора каналов и я установил “5.1 Surround”. Галочку “Разрешить микширование каналов сниму”. После этого, получается, что 5.1 звук воспроизводится AIMP-ом (5.1 каналы не микшируются), далее выходит из AIMP-а в таком – же виде (то – есть 5.1) идёт на звуковую карту. Но, так – как в ноутбуке всего два динамика, то в настройках звуковой карты, автоматически устанавливается значение “Стерео”. В этом случае получается, что так – как из AIMP-а звук пришёл 5.1, то сама звуковая карта преобразует его в стерео?

          2. Soolo Post author

            Я не исследовал этот вопрос. Думаю, что в этом случае микширование из 5.1 в 2.0 будет производить сама Windows.

  • Sergey B

    Всё понял! Спасибо! Ещё вопросик, довольно простой, ОЧЕНЬ для меня важный, но долго описывать. Итак, хочу у Вас уточнить по поводу ресемплирования не совпадающих входных и выходных частот (битность и количество каналов не будем обсуждать). Насколько я знаю, в AIMP, начиная с версии 3.5 встроен качественный ресемплер (SoX). Надеюсь, это так? Поэтому, предполагаю, лучше использовать его, чем неизвестный ресемплер Windows. У меня на ноутбуке “Sony” установлен “AIMP «v.4.13 (build 1895)»” и выбран «DirectSound». В AIMP-е в настройках вывода звука я, предположим, установил значение 48кГц. В звуковых настройках Windows установил значение 96кГц (всё это только для вопроса). Далее, используя AIMP воспроизвожу, например, “МР3 44.1кГц”. Я предполагаю, что происходит двойное ресемплирование. То – есть, сначала входящий в AIMP звук (44.1кГц) преобразуется при выходе из AIMP в 48кГц SoX ресемплером встроенным в AIMP (потому – что на выходе из AIMP я установил значение 48кГц), а потом этот звук (48кГц) ещё раз преобразуется ресемплером Windows в 96кГц (потому – что в настройках звука Windows установлено значение 96кГц). Правильно ли я рассуждаю? И если я рассуждаю правильно, то, что – бы избежать двойного ресемплирования, предполагаю, лучше использовать только SoX ресемплер AIMP (потому – что он, вроде как более качественный, чем ресемплер Windows) и в этом случае, в настройках вывода звука в AIMP-е нужно установить значение соответствующее значению заданному в настройках звука Windows (то – есть, например 96кГц установить на выходе из AIMP-е и 96кГц в настройках звука Windows). И в этом случае, ресемплирование будет происходить только в AIMP-е, а ресемлпер Windows не включится? Это очень важный для меня вопрос. Объясните пожалуйста!

    1. Soolo Post author

      Надеюсь, это так?

      выбран «DirectSound». В AIMP-е в настройках вывода звука я, предположим, установил значение 48кГц. В звуковых настройках Windows установил значение 96кГц (всё это только для вопроса). Далее, используя AIMP воспроизвожу, например, «МР3 44.1кГц».

      Да, будет двойное преобразование 44,1 >> 48 АИМПом и 48 >> 96 Виндой. В худшем случае ещё драйвер может преобразовать в третью родную для звуковой карты частоту, например, 192.
      Именно поэтому я советую всегда использовать WASAPI, что гарантированно исключит ресемплер Винды. Ну или ваш вариант: в АИМПе и в Windows установить одинаковые частоты, так же ресемплер Винды будет исключен.

  • Sergey B

    Я – бы может и стал использовать “WASAPI”, но, как уже писал, при выборе “WASAPI” автоматически устанавливается значение выхода 32 bit, а при выборе «DirectSound» можно установить значение 32 bit float.
    В AIMP – е, в директории “Параметры преобразования” есть “Передискритизация”. Так – вот ползунок у меня сдвинут полностью вправо (качество). Правильно ли я понимаю, что этот ползунок регулирует качество работы SoX ресемплера? То – есть, если установить так, как установлено у меня, то – есть до упора вправо (максимальное качество), то ресемплер будет работать на полную мощность, но медленнее и больше нагружать компьютер? И если это так, то что будет если ползунок сдвинуть полностью влево (предпочтение отдаётся скорости, а не качеству ресемплирования), то в этом случае ресемплер всё – равно будет работать, только менее качественно? На каком положении лучше оставить (учитывая, что мощности компьютера достаточно)?

    1. Soolo Post author

      Мои исследования не выявили зависимости загруженности пооцессора от уровня качества ресемплера. Возможно, на более слабых машинах будет чувствоваться разница. А качество ресемплирования да, меняется, максимальное, естественно, справа.

  • Sergey B

    Здравствуйте! Ещё раз более внимательно прочитал Вашу статью (находящуюся выше этих комментариев) и засомневался в правильности мною установленных значений частоты дискретизации и разрядности в настройках звука Windows 7. Итак, я зашёл в настройки звука Windows и увидел, что максимальные значения, которые можно выбрать это 192 Hz/24 bit. Не являюсь специалистом в этих показателях, но предполагаю, что это максимальные значения моей звуковой карты. Может коротко подскажете мне так это или нет?
    Как я писал выше, в настройках AIMP выбрал «DirectSound», установил вывод 32 bit float/96 Hz. Выключил в AIMP-е “Антиклиппинг” (пусть используется “Антиклиппинг” Windows). В настройках вывода AIMP я решил установить значение 96 Hz потому, что это число является неким промежуточным кратным значением, ведь если я буду слушать музыку 44.1 или 48 Hz, то ресемплингом AIMP она (перед выходом из AIMP) преобразуется в заданные мной 96 Hz и если мною прослушиваемая музыка будет 192 Hz, то она так же преобразуется в 96 Hz. Поэтому, 96 Hz – это некое универсальное значение. Для того, что-бы использовался только ресемплер AIMP, я и в настройках звуковой карты выбрал 96 Hz.
    Мне не понятно следующее:
    Так-как, в настройках звука Windows (звуковой карты) можно выбрать максимальное значение 192 Hz, то при поступлении (на звуковую карту) звука имеющего 96 Hz, не преобразует ли она (звуковая карта) этот звук (с помощью ресемплера Windows) в максимальный (192 Hz), с которым она может работать? Я предполагаю, что не преобразует, а отправляет на ЦАП именно с заданным в ней значением, то-есть в моём случае это 96 Hz. Подскажите пожалуйста!

    1. Soolo Post author

      Так-как, в настройках звука Windows (звуковой карты) можно выбрать максимальное значение 192 Hz, то при поступлении (на звуковую карту) звука имеющего 96 Hz, не преобразует ли она (звуковая карта) этот звук (с помощью ресемплера Windows) в максимальный (192 Hz), с которым она может работать?

      Это для меня такая же загадка. Разные карты ведут себя по-разному. Хорошие карты, скорее всего, работают именно с самой высокой частотой. Аудиофильские карты работают с той частотой, которая к ним поступает. Ну а встроенные карты, как в вашем случае, работают, я так думаю, на частоте 48 кГц 16 бит, а все эти мега цифры вроде 192 кГц 24 бит режутся драйвером. Ещё раз уточню: это только мои предположения, исследований я не проводил, т.к. не имею возможности.
      В который раз повторюсь: не парьтесь вы с настройками встроенной звуковухи, её собственные шумы и искажения сводят на нет любые попытки оптимизации.

  • Sergey B

    В AIMP-е есть возможность регулировки звука графическим эквалайзером. Но ещё присутствует отдельная регулировка низких частот (бас) в виде ползунка. Объясните пожалуйста для чего отдельная регулировка низких частот, ведь с помощью эквалайзеров можно более точно отрегулировать нужные частоты.

    1. Это пережиток прошлого.

      1. Sergey B

        Artem, не знаю являетесь ли Вы разработчиком AIMP, но выше определение того, что отдельная регулировка низких частот – это “Пережиток плошлого” совершенно не информативна и я не думаю, что в AIMP-е её оставили просто так! Отдельная регулировка высоких и низких частот называется темброблоками (в основном, используется в усилителях и является аналоговым, а не цифровым средством корректировки АЧХ). В основном ими пользуются в тех случаях, когда не хочется “заморачиваться” с эквалайзерами (если таковые имеют место быть). Поэтому, хотелось бы услышать мнение автора статьи.

        1. Soolo Post author

          Да, Артём разработчик, кстати, единственный.
          И да, отдельный бас – это тянется с первых версий АИМПа, а может ещё и с AIMP MMC PRO, просто разработчик решил не удалять фичу, т.к. пользователи к удалению функционала относятся негативно.

  • Sergey B

    И ещё вопросик! Как я писал выше, в настройках AIMP 4 выбрал «DirectSound», установил вывод “Stereo”. Слушаю стерео музыку. Вопрос: Если в настройках AIMP оставить включённой функцию “Разрешить микширование каналов” (на всякий случай, потому – что вдруг, когда – нибудь буду слушать 5.1 через две встроенные в ноутбук муз.колонки, но сейчас это не важно, потому – что я слушаю стерео и вопрос касается стерео), то прослушивая мной стереомузыка на выходе так и останется в оригинальном стерео, то – есть не будет – ли она как – нибудь обрабатываться средствами AIMP? Или, при прослушивании стерео музыки лучше выключить функцию “Разрешить микширование каналов”? Заранее благодарю!

    1. Soolo Post author

      Если количество каналов одинаковое – микширование не работает.

  • Sergey B

    Большое спасибо за информацию! Искренне прошу прощения, если обидел Артёма, дело в том, что во время общения на форумах, некоторые участники, частенько отвечают в виде коротких и малоинформативных фраз, поэтому я предположил, что Артём не является разработчиком. Ещё раз извиняюсь!

  • Sergey B

    Честно говоря, я понимаю, что одолел вас вопросами, но в основном, на интересующие меня вы ответили! Огромное вам спасибо! Но у меня осталось два вопроса:
    1.После установки «v.4.13 (build 1895)» несколько раз пробовал выбрать “WASAPI exclusive (Event или Push)”, далее сохранял, выходил из настроек AIMP, снова заходил в настройки AIMP и видел, что всё время слетает на «DirectSound»? Дело в том, что я начитался и узнал, что с помощью “WASAPI exclusive” звук с AIMP-а может идти напрямую в ЦАП, обходя настройки звуковой карты. Бывает ещё “ASIO”, но этого метода вывода вообще нет в AIMP. У меня ноутбук Sony/Windows 7/64bit. Подскажите, почему слетает “WASAPI exclusive?
    2.AIMP может воспроизводить шестиканальную музыку в формате АС-3. Если я в настройках AIMP выберу “DirectSound” 5.1 surround” и выключу функцию «Разрешить микширование каналов», то, что произойдёт с музыкальным файлом перед выходом из AIMP? Я предполагаю, что при запуске (входе) музыки через AIMP вся музыка декодируется в РСМ 32bt float (то-есть в Импульсно-Кодовую Модуляцию) и в случае 5.1 звука этот звуковой файл декодируется (раскладывается) из одного потока на отдельные звуковые каналы и получается шесть отдельных wav каналов, к которым можно применить корректировку (“Улучшайзеры” встроенные в AIMP). А что происходит с этими разложенными каналами на выходе из AIMP? Они, (будучи обработанными средствами AIMP), перед выходом из AIMP опять упаковываются в AC-3 формат и в виде одного АС-3 файла выходят из AIMP или выходят в декодированном (разложенном на отдельные wav каналы) виде? Заранее спасибо!

    1. Soolo Post author

      1. ASIO АИМП поддерживает, а вот ваша карта, по-видимому, нет. Почему слетает WASAPI exclusive – не могу знать. Нужно хотя бы видео, чтобы увидеть последовательность действий и выбираемые настройки.
      2. АИМП естественно отдаёт системе несжатые данные PCM.

  • netwixell

    Я все равно ничего не могу понять. Судя по ощущениям звук в режимах WSAPI и ASIO лучше. В режиме DirectSound звук какой то глухой, притупленный, менее звонкий, менее отчетливый, более басовый…. Я так понимаю что при определенных настройками еквалайзера в режиме DirectSound можно добиться звука как в режимах WSAPI и ASIO. Я имею ввиду если мы говорим про ноутбук или десктоп со встроеной звуковой картой. Я столкнулся с проблемой. Купил bluetooth наушники в режимах WSAPI и ASIO постоянно прерывается звук как будто идет буферизация. В режиме DirectSound наушники работают нормально.

    1. Soolo Post author

      Что за WSAPI ? Это WASAPI или WASAPI Exclusive?
      Если звук DirectSound значительно отличается (не на уровне ощущений, а когда с закрытыми глазами слышна разница) – проверьте настройки звуковой карты и настройки звука Виндовс: и там и там может быть включена обработка, которая меняет звук.

  • Sergey B

    Здравствуйте уважаемые разработчики! Вопрос по поводу дизеринга (дитеринг, dithering) в AIMP v.4.13 (build 1895). Использую метод вывода звука (из AIMP) «DirectSound», благодаря чему установил значение (вывода) битности “32 bit float”. Получается, что любой входящий в AIMP звук изначально преобразуется в “32 bit float”. Далее предоставляется возможность корректировки (эквалайзеры и т.д.) этого звука и из AIMP-а звук выходит тоже с разрядностью “32 bit float”. Объясните мне пожалуйста, нужно ли в моём случае в настройках AIMP оставлять включённой функцию “Дизеринг”, которая, как я понимаю, нужна для понижения (например из 24 bit в 16 bit) разрядности? Ведь, как я уже написал выше, изначально, AIMP весь входящий звук, преобразует в “32 bit float”, то – есть получается, что если звук изначально был например 16bit или 24 bit, то при входе в AIMP он преобразуется в “32 bit float”, а насколько я знаю (хотя, возможно ошибаюсь) “Dithering” не требуется при повышении разрядности. И, так – как звук на входе в AIMP преобразуется в “32 bit float” и на выходе я установил “32 bit float”, то при выходе из AIMP понижения разрядности не происходит и я предполагаю, что “Dithering” не нужен?
    Если вас не затруднит, может быть объясните мне, когда требуется “Dithering”, только для понижения разрядности или и для повышения?
    В каком именно месте требуется “Dithering”? А именно, при входе в AIMP (то – есть, если файл имеет разрядность например 16bit, а при входе в AIMP разрядность преобразуется в “32 bit float”)? Или после того, как звук уже вошёл в AIMP, преобразовался в “32 bit float” и если выходное значение не идентично входному (например вывод из AIMP установить не “32 bit float”, а, например, “24bit”), то именно в этом случае нужен “Dithering”?

    1. Soolo Post author

      32 bit float выдаёт декодер. Декодер стоит первым в цепочке обработки. Соответственно, ни одна обработка звука не может идти раньше, чем декодер.
      Дизеринг в АИМПе работает только при выводе звука с понижением разрядности до 24 или до 16 бит.
      Если вы выводите 32 float, то дизеринг работать не будет независимо от включения или выключения соответствующей опции.

  • Sergey B

    Спасибо! Объяснили коротко, но понятно. Читая в интернете всевозможные статьи связанные со звуком, частенько натыкаюсь на то, что при воспроизведении музыки тем или иным музыкальным плеером (например “foobar2000”) не вся входящая в него музыка преобразуется в 32bit float, а только lossy файлы, а lossless файлы якобы не нуждаются в этом преобразовании и после входа в муз.плеер остаются с той разрядностью с которой были изначально! Но я, для проверки, нашёл музыку в формате “FLAC 96kHz / 24bit”, открыл эту музыку с помощью AIMP и увидел то, что при входе в AIMP эта lossless музыка, так-же как и lossy, тоже преобразовалась в 32bit float. Объясните пожалуйста, прав ли я насчёт того, что при воспроизведении lossless музыки с помощью AIMP, она изначально (при входе в AIMP) преобразуется в 32bit float? И хорошо это или всё же было бы лучше, если бы lossless музыка при входе в AIMP оставалась бы с той битностью с которой была изначально (то-есть скорее всего 24bit)? Заранее спасибо!

    1. Sergey B

      Здравствуйте! В настройках AIMP-а, я установил режим вывода «DirectSound», благодаря чему предоставилась возможность выбора вывода звука 32 bit float, что я и выбрал. В настройках AIMP “Дизеринг” включен. Как вы мне ответили выше “Если вы выводите 32 float, то дизеринг работать не будет независимо от включения или выключения соответствующей опции”. Поэтому, я понял, что не смотря на включенный в AIMP-е “Дизеринг”, он (“Дизеринг”) всё – равно не включится, потому – что вывод в AIMP-е установлен 32 bit float. А где – же тогда будет происходить “Дизеринг” если в настройках звуковой карты выставить значение 16bit? В звуковой карте компьютера?

      1. Soolo Post author

        В случае DirectSound и 32 bit float дизеринг будет идти средствами звукового движка Windows.
        В статье я этот случай рассматривал (последний тест).

    2. Soolo Post author

      Да, все декодеры АИМПа по возможности расшифровывают файлы в 32 bit float, это нужно для более точной обработки звука в плеере: от эквалайзера или эффектов до банальной громкости.
      Думаю, любой нормальный плеер делает то же самое.
      И да, повышение битности – преобразование без потерь качества.

  • Sergey B

    Если в настройках звука Windows установить максимальное для звуковой карты значение 192 Hz/24 bit (и, соответственно, в настройках вывода AIMP тоже установить 192 Hz (что-бы использовался ресемплер AIMP, а не виндовый)), то, лично у меня нет уверенности в том, что это правильный выбор, потому-что нужно знать характеристики ЦАП-а, на который музыка поступает со звуковой карты с заданными значениями. А как их узнать (в ноутбуке Sony), я так и не понял. Читал, что в основном, стандартная частота у ЦАП-ов 48 Hz и кратные ей (96 Hz, 192 Hz), а глубина 24 bit. Но как точно узнать на что способен встроенный в ноутбук ЦАП, что-бы установить одинаковые значения частоты дискретизации и битности выводе из AIMP и настройках звука Windows ?! Может подскажете?

    1. Soolo Post author

      Оптимальные настройки определяются либо на слух либо с помощью измерений.
      Ну, либо из какого-либо надёжного источника узнать с какими цифрами работает ЦАП.
      Один из надёжных источников – даташит на микросхему ЦАПа. Имя микросхемы либо подсмотреть на корпусе микросхемы (нужно разбирать ноут), либо, как вариант, тестовая программа какая-нибудь подскажет. Ещё варианты: форумы, обзоры видео или в картинках.
      А проще всего забить, если на слух не слышно разницы.

  • Sergey B

    Здравствуйте! Выше я Вам писал, что после установки «v.4.13 (build 1895)» несколько раз пробовал выбрать «WASAPI exclusive (Event или Push)», далее сохранял, выходил из настроек AIMP, снова заходил в настройки AIMP и видел, что всё время слетает на «DirectSound»? Оказывается дело в том, что нужно было зайти в настройки звука Windows (настройки звуковой карты) и установить галочку в директории “Разрешить приложениям использовать устройство в монопольном режиме” и на всякий случай установил галочку в чуть ниже находящейся директории “Предоставить приоритет приложениям монопольного режима”. После этого, я в настройках AIMP выбрал “WASAPI Exclusive (Event): Громкоговоритель и наушники (Realtek High Definition Audio)” и всё заработало. Но, изначально мне было не понятно, почему ещё есть “WASAPI Exclusive (Event): Windows Default”.
    Подскажите, чем отличаются “WASAPI Exclusive (Event): Громкоговоритель и наушники (Realtek High Definition Audio)” от “WASAPI Exclusive (Event): Windows Default”? Кстати, это касается не только WASAPI Exclusive (Event), а так-же “DirectSound” и обычного “WASAPI”.
    При выборе “”WASAPI Exclusive (Event)” появилась возможность выбора разрядности “16bit” и “24 Bit (i32)”. Что обозначает “24 Bit (i32)”? Спасибо!

    1. Soolo Post author

      Windows Default – устройство, выбранное в Винде по умолчанию. АИМП позволяет пользоваться не только устройством по умолчанию, а любым звуковым устройством.
      24 Bit (i32) – точно не помню, что-то вроде эмуляции 24 бит, но передача данных идёт в 32 битном формате. Грубо говоря, сначала идёт понижение разрядности, затем повышение. Данные 32 бита, а параметры, как у 24 бит. Для чего нужно – не знаю. Предполагаю, это из-за неудобности 24 бит для языков программирования.

    2. 24 bit (i32) – означает, что формат сэмпла = 32 бита, но значащих из них 24

  • Sergey B

    То-есть, если я в AIMP-е использую вывод “WASAPI Exclusive” и в компьютере находится 24-ёх битный ЦАП, то в настройках AIMP стоит установить вывод 24 bit (i32)? Потому-что если в настройках AIMP установить вывод 16 bit, то весь выходящий из AIMP звук (даже 24-ёх битный) будет преобразовываться средствами AIMP в 16 bit, а это не очень хорошо, потому-что ЦАП 24-ёх битный и может работать с 24-ёх битным звуком. То-есть, я предполагаю, что вывод 24 bit (i32) более качественный чем 16 bit?

  • Sergey B

    Здравствуйте! У меня в ноутбуке установлен “AIMP v.4.13 (build 1895)», метод вывода (из AIMP-а) звука «WASAPI exclusive (Event)» на встроенные муз.колонки. Очень много читал о том, что (в отличие от методов “DirectSound” и “WASAPI shared”) используя в музыкальном плеере метод «WASAPI exclusive» обходятся стороной значения частоты дискретизации и разрядности заданные в системном микшере Windows (в настройках звука Windows в вкладке “Дополнительно”). Поэтому вопрос: Нужно устанавливать частоту дискретизации и разрядность непосредственно в AIMP-е, потому – что звук, минуя микшер звуковой карты (меня интересуют именно настройки частоты дискретизации и разрядности в настройках Windows) пойдёт сразу на ЦАП ноутбука?
    И ещё вопрос: В настройках AIMP-а, “Размер кэша” – это буфер на тот случай, если музыка начнёт заикаться?

    1. Soolo Post author

      При выводе WASAPI Exclusive звуковые данные обходят микшер и прочие обработчики. Частота, установленная в АИМПе, пойдёт на драйвер.
      Кэш нужен для случаев нагрузки на винчестер, когда плеер не может получать своевременно данные и начинает заикаться.

      1. Sergey B

        Спасибо за ответ! Вы написали: “При выводе WASAPI Exclusive звуковые данные обходят микшер и прочие обработчики. Частота, установленная в АИМПе, пойдёт на драйвер.”
        Если Вы имели в виду драйвер звуковой карты, то в моём понимании: в компьютере есть звуковая карта и пока не установишь для её звуковой драйвер, звука на компьютере не будет. А после установки звукового драйвера, появляется возможность зайти в “Свойства” любого устройства (в моём случае “Громкоговоритель и наушники”) и зайдя в его свойства и перейдя в директорию “Дополнительно” предоставляется возможность выбора частоты дискретизации и разрядности (то – есть, именно после установки звукового драйвера, предоставляется возможность выбора частоты дискретизации и разрядности). Поэтому, когда Вы пишете “Частота, установленная в АИМПе, пойдёт на драйвер” я не совсем понимаю, что Вы имеете в виду! Хотя, может я в чём – то не прав!
        Мне просто нужно знать: При использовании в AIMP-е вывода “WASAPI Exclusive”, точно ли вышедший из AIMP-а звук обходит значения не только частоты дискретизации, но и разрядности? Поэтому не имеет значения какие значения частоты дискретизации и разрядности выставлены в настройках звука Windows?

        Спасибо за ответ! Всё понял. Используя в AIMP-е “WASAPI Exclusive” и установив (в AIMP-е) разрядность именно 96kHz, обнаружил то, что при регулировке громкости в AIMP-е (то-есть используя громкость встроенную в AIMP), громкость проигрываемого AIMP-ом муз.файла регулируется без искажений. А если хоть чуть чуть сдвигаю ползунок громкости ноутбука (то-есть основную громкость ноутбука), то звук сразу искажается и становится каким-то странным, как-будто прибрали средние и низкие частоты, а высокие остались прежними. Но, после того, как я в AIMP-е переключаю разрядность с 96кГц на 48 или на 44.1кГц, то регулируя любую громкость (в AIMP-е или основную громкость Windows) искажения проигрываемой в этот момент музыки не образуются. Всё это происходит в ноутбуке с встроенной звуковой картой “Realtek alc275”, при прослушивании музыки через встроенные в ноутбук динамики. Размер кэша (в AIMP-е) пробовал увеличивать, но не помогает. Используя методы “DirectSound” и “WASAPI shared” (установив в AIMP-е разрядность 96кГц таких проблем нет). Может вам знакома причина?

        1. Soolo Post author

          Нет, не знакома

      2. MeloMan

        Здравствуйте. Очень интересная ветка! Спасибо. У меня К Вам вопрос Soolo (может и разработчик поможет). Использую версию AIMP 3.60 (билд 1603). Слушаю музыку на ноуте через Bluetooth. Вопрос как настроить Винду7 и Aimp на максимально качество вывода звука по блютузу. В свойствах самой Винды (звуковые устройтва) есть возможность выбора между моно или стерео с дискретизацией 48Khz. Читал что некратная передискретизация (то есть с 44100 на 48000) вносит существенные искажения и меломаны в целом рекомендуют избегать такой передискретизации и слушать в изначальной варианте. У меня вся музыка с частотой 44100 Гц, да и большинство интернет станций стримят с частотой 44100 Гц. В Аимпе в режиме DirectSound: Динамики(Аудио Bluetoth) есть возможность выбора частоты от 8 000 до 192 000 и разрядности от 16 до 32 Float . То есть для блютуз режима можно кратно повысить частоту до 172 000 и выбрать разрядность 32 Float. Не буду врать, разницы между 44100 и 172000 в своих наушниках не услышал, но чисто для теории. Действительно ли на выходе по блютуз каналу через AIMP можно получить звук с максимальным качеством. Просто есть подозрение, что звук в конечном итоге после AIMPA попадает на виндовый блютуз сток в котором тупо стоит 48Hz и 16 бит и чихал он (блютузсток) на кратную передискретизацию в 172000и разрядность 32 Floa, которые настроены в самом АИМПе? Что скажите?

        Как из ведра звук не будет. Реалтеки давно уже выдают приемлемый звук.
        Звуковая карта – это последнее, что нужно улучшать в звуковой системе.
        Наибольший вклад в звук даёт акустика / наушники. Всё остальное влияет на порядки меньше.

      3. aleksys

        Всё правильно он делает, что пытается разобраться в теории. Чтоб применить на практике.

    2. LongKick64

      “Как из ведра звук не будет. Реалтеки давно уже выдают приемлемый звук.”
      Это смотря куда они его выдают) Если на колонки того же ноутбука, то приемлемым такой звук я бы точно не назвал бы) Сужу исключительно по своему ноуту, который через колонки выдает вообще что-то непонятное. Если же подключить наушники к звуковухе ноута напрямую, то тогда да, можно, впринципе, слушать)

    3. biofibre

      Добрый день. Может быть нужно было где-то на форуме эти вопросы задать, а не в блоге, но тем не менее.
      1. При конвертировании файлов в Аимпе там в настройках конвертера в пункте “параметры преобразования” в окошке “общее” нужно ли снимать галочки с пунктов: микширование каналов, дизеринг и антиклиппинг? Я вроде бы понял, что не нужно (правда я конвертировал винил-рип 32-192 wavpack в те же 32-192 в wav), но тем не менее хотелось точно знать, влияют ли они на конвертацию все или по отдельности? Наверное это зависит от формата исходного файла и какой формат результирующего будет? Если битность и частота не меняется, включение или выключение дизеринга не будет влиять? А другие параметры при этом, микширование каналов и антиклиппинг? Если битность и частота уменьшаться будут, то понятное дело дизеринг включается. А в случае с сжатыми форматами? Если, напрмер, Flac 24-96 переводить в mp3 16-44 дизеринг включаем, а антиклиппинг? У меня такое ощущение, что я сам и оветил?))) или где-то не прав?

      2. Уже всем надоевший наверное вопрос. Встроенная звуковая на микросхеме Риалтек АLС887 аппаратно по даташиту поддерживает: Four stereo DACs (8 channels) support 16/20/24-bit PCM format for 7.1 sound playback и All DACs supports 16/20/24-bit, 44.1k/48k/96k/192kHz sample rate. Пользуюсь Аимпом чаще, и немного реже Фубаром. Из прочитанного мной понял, что в диспетчере Риалтек или в свойствах звука панели управления, на устройстве динамики, выставить нужно максимальные настройки битности и частоты (а это 24-192). А в Аимпе также максимально возможные, но не меньше чем в звуковухе? У меня в Аимпе сейчас стоит Direct Sound (Динамики Риалтек HDA или Windows Default – что возможно почти одинаково в моем случае) 32 бита floating – 192кГц, или нужно 24-192 оставить? Direct Sound нужен для других звуков, потому как и музыку слушаю и другие звуки необходимы. Фонотека на 75-80% лосслесс 16-44, процентов 10-15 Hi-Res и винил рипы, остальное Lossy. Или же правильно будет выставлять битность 24 в карте, а в плеере 24 и выше по возможности, а частоту 44,1 и в карте и в плеере из-за подавляющего количества фонограмм и радиофонограмм в этой частоте? А при прослушивании Hi-Res что тогда менять всё? Или оставить по максимуму, как у меня сейчас выше описано и включать в цепочку ресемплер SoX в Фубаре и в Аимпе, который по умолчанию включен? Что-то я уже запутался.)) Распутайте меня.)

      1. Soolo Post author

        1. Разве что дизеринг можно выключить, если нет понижения битности при конвертации.
        2. В AIMP достаточно выбрать WASAPI: Windows Default. В Винде (в диспетчере Реалтек) – максимальные реально работающие параметры.

    4. Serxio

      Здравствуйте. Вопрос: правильным решением для лучшего качества выводимого звука в настройках AIMP частоту дискретизации и разрядность выставлять как у прослушиваемых аудио-файлах или максимально возможное которое поддерживает мой AV-ресивер? (192kHz/24bit). Лично я полагаю что параметры должны быть синхронны с форматом аудио-файлов (что б избежать ресемплинга), но моя фонотека содержит музыку разной дискретизации и разрядности. Не буду ведь после каждого трека менять настройки плеера. Какое решение будет верным?

      1. Soolo Post author

        Честно говоря, меня замучили этим вопросом. Единственный верный вариант – определить с какой частотой реально на уровне железа ЦАПа работает ваше оборудование. Объективно это можно сделать с помощью измерений. Субъективно – на слух. Полагаться на маркетинговые цифры в 192kHz/24bit я бы не стал.
        Если нет возможности измерений, и на слух разницы нет – то выбирайте на своё усмотрение, либо маркетинговые 192kHz/24bit, либо параметры большинства ваших файлов 44,1kHz/24bit.
        Переключать каждый раз параметры, естественно, не нужно, ресемплинг в АИМПе работает очень качественно.

  • Начнем с магических «24 бит». Так уж устроен цифровой мир - чем больше бит, тем лучше. Для представления в цифровом виде звуковых, слышимых человеком сигналов 16 бит маловато было, а вот 24 бит уже более чем достаточно. Теперь как писк комара, так и рев реактивного авиалайнера будут сохраняться в цифровом сигнале одновременно практически без искажений. Тише звука комара ухо не слышит, а громче взлетающего самолета - не воспринимает по причине болевого порога.

    Чтобы отцифровать в 24 бит аналоговый сигнал, поступающий с микрофона или электроинструментов, применяют аналого-цифровой преобразователь (АЦП). А чтобы воспроизвести (по сути, озвучить) записанный ранее цифровой сигнал, используют цифро-аналоговый преобразователь (ЦАП). Современные АЦП и ЦАП могут быть размером 5х5 мм и иметь смешную цену. С возрастанием разрядности (числа бит) сложность, а следовательно и стоимость, преобразователей резко возрастает. И если низкочастотные преобразователи сделать сравнительно легко, то высокочастотные - архитрудно. Более того, например, при частоте дискретизации 48 кГц на период частоты звука в 24 кГц приходится всего лишь две точки. То емть волна с её гребнями и впадиной описывается двумя точками - фактически как получится. Ясно, что более точного описания надо бы хотя бы пять точек на период, а это в нашем примере составит частоту дискретизации 120 кГц.

    Точность воссоздания формы сигнала хорошо иллюстрируется на чистом тоне частотой 15 кГц. При частоте дискретизации 44,1 кГц получаем нечто отдаленно напоминающее синусоидальный сигнал (см верхнюю часть рис). Особенно неприятны биения амплитуды во времени. Тогда как при частоте дискретизации 192 кГц (см нижнюю часть) чистый тон воссоздается очень близко к требуемый синусоиде. По крайней мере а цифровом виде, а что уж сотворит ЦАП - будет на его совести.

    Звуковые волны, существующие в живой природе, имеют диапазон частот от нескольких герц до сотен килогерц. Механизм восприятия звука системой слуха человека изучен довольно поверхностно, наука во многом пока бессильна. Ранее считалось, что выше 20 кГц среднестатистический человек звук не воспринимает. На самом деле человек не слышит одиночный чистый тон, если его частота превышает примерно 20 кГц. Но это не значит, что человек не способен воспринимать и отличать звуки, состоящие из множества тонов, уходящих в ультравысокие частоты. Исследования показали, что многие музыкальные инструменты генерирует звуки в полосе частот вплоть до 50 кГц и выше. Для сохранения и воспроизведения таких звуков в цифровом виде используют частоту дискретизации либо 96 кГц, либо 192 кГц.

    АЦП конвертируют из аналогового сигнала в цифровой (ЦАП и обратно) не идеально, а превносит искажения. В реальных электротехнических устройствах к тому же добавляются разного рода шумы. Для сигнала 24 бит шум равен нулю при –144 дБ. На практике шум всегда отличен от нуля. За отметкой в –100 дБ борьба с шумом превращается в очень дорогое удовольствие. Представьте себе, для опорной амплитуды величиной 1 В (0 дБ) амплитуда, соответствующая –100 дБ, составит 10 мкВ (т. е. в 100000 раз меньше!). Мощность сигнала ограничена стандартом, иначе пожгем колонки-усилители. Поэтому в борьбе за каждый лишний децибел вынуждены в условиях помех оперировать с все более слабыми сигналами. Замечу, чем скромнее отношение сигнал шум (SNR), тем больше шансов, что звук будет лучше. Однако без всякой гарантии, что это будет именно так. Иногда довольно шумные электроакустические устройства звучат на удивление приятно на слух. К тому же, фоновый шум величиной –60 дБ в отсутствии музыки будет слышен даже при средней громкости, а величиной ниже –100 дБ, пожалуй, не обнаружить без слухового аппарата.

    Короче, недаром профессиональный формат цифрового звука это 24 бит 96/192 кГц. Стремление производителей в угоду профессионалам как можно сильнее задавить нежелательные шумы продиктовано особенностями процесса записи в студии, сведения-наложения при аранжировке и последующего создания мастер оригинала. Лично вам нужны дополнительные -10 дБ «шумоподавления»? Тогда копите денежки.

    DVD-audio - новый тип лазерных дисков, который в скором времени вытеснит нынешние CD аудио диски. Те, кто застал грампластинки, помнят, как быстро эти черные блины с разноцветными пятачками в бумажных конвертах исчезли из магазинов, уступя место серебристым сидючкам . DVD-audio создан для звука аудиофильского качества. Т.е. звук полностью сохраняется без каких либо потерь, вызванных сжатием, используемым для хранения звуковой дорожки на DVD-video дисках с фильмами, клипами и т.п.

    Что касается карманного звука, то на смену компакт кассетам несомненно придут носители на основе флэш памяти. В миниатюрные флэшки (не имеющие механических частей, и поэтому долговечные) будут закачиваться всякие там сжатые МР3, WMA, OGG аль ААС.

    Как видно из таблички (см ниже), по части HiFi звука ближайший конкурент DVD-audio это формат DTS, достаточно широко используемый в качестве звуковой дорожки к фильмам, в частности на DVD-video дисках (случается, на одном диске дублируют DolbyDigital и DTS дорожки).

    Частота дискретизации, кГц

    Число каналов

    Величина потока данных с диска, кбит/с

    Величина сжатия / упаковки

    ~11:1 (зависит от потока)
    с потерями

    1:1
    без потерь

    DolbyDigital 5.1

    ~12:1
    с потерями

    ~7:1
    с потерями

    2:1
    без потерь

    2:1
    без потерь

    Однако если в DTS используется сжатие с прорежениванием малозначещей звуковой информации (т.е. хоть и с крохотными, но неизбежными потерями качества), то в DVD-audio цифровые данные лишь уплотненно пакуются, как это делается в программах-архиваторах, и качество не теряется абсолютно. Алгоритм упаковки носит аббревиатуру «MLP» (Meridian Lossless Packing).

    Обратите внимание на высокую величину потока данных с диска для DVD-audio. Чтобы распаковывать в реальном времени такой поток, нужны адекватные вычислительные ресурсы: шестисотым пентюхом не отделаешься, особенно в прожорливой ХР.

    Предполагается записывать на DVD-audio дисках как 6 канальную дорожку (24 бит 96 кГц), так и 2х канальную с продвинутым частотным диапазоном (192 кГц). И та и другая имеют защиту от копирования цифрового контента. Вот тут то и выплывает главная тонкость. Обычные бытовые DVD проигрыватели не смогут воспроизводить супер звук с DVD-audio дисков. Специальный новейший DVD плеер баснословной цены, конечно, сможет, на то он и специальный. А вот компьютерные DVD-ROM со скоростями выше 5й (второе поколение) готовы полноценно воспроизводить DVD-audio, правда, при одном условии. Нужно к имеющемуся DVD-ROM прикупить соответствующую звуковую карту. На ноябрь 2002 года Audigy2 - единственная из звуковых карт, поддерживающая воспроизведение DVD-audio.

    Пока, увы, не столь велик, как хотелось бы. Что касается цены (в районе двух десятков уе), то вряд ли она отпугнет истинных меломанов. Как говорится, лиха беда начало…

    Покупая DVD-audio диск, уточните у продавца, в каких форматах на нем записан звук. Дело в том, что стандарт DVD-audio позволяет хранить на диске файлы в форматах, используемых в DVD-video. Упрощенно говоря, DVD-audio диск состоит из 2х областей. Из первой области хвидны файлы DVD-audio, а из второй, так называемой «DVD-video области» (если таковая присутствует на конкретном диске) - звуковые файлы в форматах DolbyDigital или DTS. Например, надпись на коробке «5.1 MLP for DVD-audio players» означает, что присутствует шестиканальный несжатый (но упакованный!) DVD-audio звук. Надпись «5.1 DTS for DTS-compatible systems» означает, что соотвествующую 6 канальную звуковую дорожку удастся воспроизвести на DVD-video плеерах, оборудованных декодером DTS. Надпись «2.0 PCM for all DVD-video players» свидетельствует о том, что имеет место 2х канальный несжатый неупакованный звук, воспроизводимый всеми DVD устройствами. Если на коробке DVD-audio диска красуется «DVD-video compatible DolbyDigital», то это означает наличие на этом диске области, видимой также любым DVD плеером и содержащей файл со звуковой дорожкой ставшего привычным DolbyDigital.

    К сожалению, на большинстве DVD-audio дисков производители не указывают количество бит и частоту дискретизации. Надписи типа «advanced resolution» ни о чем толком не говорят. Под ними может скрываться 48 кГц с 24 битами, или 98 кГц (или 88,2 кГц) с 16 битами, или 192 кГц с 24 битами. Узнать, что именно прячется под оберткой, возможно лишь поставив диск в DVD-audio плеер (или, конечно, в компьютерный DVD-ROM с Audigy2 с её софтовым плеером). При условии если плеер корректно высветит формат всех имеющихся на диске звуковых дорожек. Так что, если продавец не осведомлен из достоверных источников, с какими битами-частотами записан DVD-audio диск, то будет бессилен подсказать вам что либо вразумительное по этому поводу.

    Наконец, пару слов о птичках . Частенько за DVD-audio шустрые ребята выдают DVD-video диски, на которых звуковая дорожка записана в несжатом виде (например, стерео РСМ 24 бит 96 кГц), а видео картинка статична (например, маячит название проигрываемой песни и фото альбома).

    По сути сей ловкий трюк не столь чреват последствиями. Вы получаете высококачественный звук, воспроизводимый на любом DVD проигрывателе, в том числе и на компьютерном DVD-ROM (если, конечно, версия программного плеера и звуковая карта поддерживают воспроизведение продвинутого звука). Вдобавок, будет пахать цифровой выход аудиокарты (для DVDaudio дисков - нет, о чем подробнее далее). Единственное, придется забыть про многоканальность, поскольку нынешние программные плееры из PCM данных крутят лишь обычное стерео. Обратите внимание: подобные диски маркируются трейдмарком «DVD» без всяких приписычек. Ну а надписи где-нибудь внизу-сбоку навроде «96/24 SuperAudioDisk» теперь мы знаем, что означают.

    Статьи по теме: