Многоканальный окружающий звук

01.04.2024

6 комментариев

Антон БАЛАБАН
Музыкальное Оборудование
март 2002

История и современность.

Окружающий звук (он же объемный, он же surround) в настоящее время стремительно распространяется по планете. Он используется в кино, на видео и DVD, на презентациях, в просто музыкальных записях, и даже на телевидении. Слушателям он сулит новые ощущения, музыкальным лейблам — переиздание старых записей в новом формате, музыкантам — новые способы выразить себя, а звукозаписывающим студиям — переоборудование и приток клиентов. В общем, окружающий звук нужен и выгоден многим. Однако с его производством (особенно при ограниченном бюджете) все еще связано немало проблем, также ряд сложностей возникает на пути доставки многоканального звука слушателям. Форматы DVD Audio и Super Audio CD, которые позволяют записать шестиканальный (или более) звук в несжатом виде, пока еще не завоевали широкой популярности, так что сейчас неизбежным является использование одного из способов сжатия звуковых данных, адаптированных для surround-фонограмм. Все эти способы сжатия пришли к нам из кино, так что, предваряя рассказ о современных цифровых способах кодирования многоканального звука, хотелось бы немного отвлечься и рассказать об истории развития окружающего звука.

А начиналось все в 1941 году, когда вышел фильм студии Диснея «Fantasia». От моно создатели картины прыгнули сразу к трем каналам звука: левому, правому и центральному. Формат записи был назван «Fantasound», и по тем временам это было нечто невиданное — ведь и моно звук в кино появился совсем недавно, а тут сразу три независимых канала, которые записывались на кинопленку оптическим способом. Но трудности производства подобного рода фонограмм (тогда в Америке еще не было магнитофонов, да и другая звукозаписывающая техника была в зачаточном состоянии), сложная и дорогая система воспроизведения и начавшаяся Вторая Мировая война остановили проникновение многоканального звука в киноиндустрию более чем на десять лет.

Появление коммерчески успешных форматов стереозвука в кинопроизводстве было обусловлено развитием в США магнитной звукозаписи. Первые ленточные магнитофоны были привезены в качестве трофеев из побежденной Германии (в русском языке слово «магнитофон» также обязано своим появлением названию одной из немецких моделей этого устройства — Magnetofon), и вскоре фирма Ampex выпустила американский аппарат для записи на ленту Ampex Model 200, являвшийся копией немецкого AEG Model K-4 Magnetofon. Магнитная запись стремительно развивалась, вскоре появился многодорожечный магнитофон, изобретенный легендарным гитаристом Лес Полом (немного ранее этот разносторонний музыкант придумал электрогитару, да и использовать монофонические магнитофоны для записи музыки в США начал именно он). Первые форматы окружающего звука были основаны именно на магнитной записи (вместо старой оптической монодорожки) — прямо на кинопленку наносился магнитный слой, на который записывалось звуковое сопровождение к фильмам. Кинопроекторы оснащались магнитофонными головками для снятия этого звука. В те годы киноиндустрия США процветала, и публике был представлен новый широкоэкранный кинематограф (использовавший пленку шириной 70 мм вместо обычных 35), а в дополнение к громадным широким экранам требовалась соответствующая звуковая картина. Тогда существовали два основных формата: Cinemascope, разработанный компанией 20th Century Fox для 35-мм пленки (четыре канала — левый, центральный, правый и surround-канал, который воспроизводился с боков и позади зрителя, первый фильм — The Robe, 1953 год) и Todd-AO для широкоформатной 70-мм кинопленки (шесть каналов — левый, дополнительный левый, центральный, дополнительный правый, правый и surround-канал, первый фильм — Oklahoma!, 1955 год). Необходимость центрального канала обусловлена большими размерами киноэкрана и тем, что зрители сидят не только по центру зала, — если использовать только два громкоговорителя (левый и правый), то диалоги актеров для зрителя, сидящего в боковой части зала, будут звучать не посередине экрана, где обычно и происходит основное действие, а сбоку, так как ближайший громкоговоритель будет слышен лучше всего. Поэтому всю речь героев фильма обычно располагают в центральном канале, иногда его так и называют — канал диалогов. А для огромных широкоформатных (70 мм) кинотеатров потребовалось установить за экраном аж пять независимых громкоговорителей, чтобы обеспечить равномерное распределение звука для всех зрителей в зале.

Схема расположения громкоговорителей в кинотеатре, оборудованном для воспроизведения звука в формате Cinemascope, Dolby Stereo или Dolby SR.

Схема расположения громкоговорителей в кинотеатре, оборудованном для воспроизведения звука в формате ToddAO.

Параллельно возникали и другие форматы, не нашедшие широкого распространения. Например, VistaVision, в котором на монофоническую оптическую дорожку записывались специальные управляющие сигналы (30, 35 и 40 Гц), под воздействием которых декодер переключал монозвук на центральный, левый или правый громкоговорители. Это было, конечно, не стерео, но обеспечить, например, выстрел или взрыв справа от зрителя с помощью VistaVision было возможно.

Справедливости ради необходимо отметить, что звуковая картина и в системе Cinemascope, и в системе Todd-AO сильно отличалась от того, что мы слышим в современных фильмах (хотя количество звуковых каналов практически такое же). Дело в том, что звукозаписывающая техника тогда была на начальной стадии своего развития, многодорожечных магнитофонов и сложных микшерных пультов еще не было, да и магнитные дорожки на кинопленке ощутимо шипели, что сокращало доступный звукоинженерам динамический диапазон. Поэтому создание сложных спецэффектов было просто технически невозможным, к тому же «идеология» кинозвука была отличной от нынешней — головокружительные звуковые трюки не были тогда важной частью фильма, и их влияние на аудиторию еще не было оценено. Распространение этих форматов тоже не было повсеместным — оснащение кинотеатров нужным оборудованием стоило недешево, и его могли позволить себе только крупные, успешные залы.

Форматы с магнитной записью звука на пленку просуществовали до середины 70-х годов, когда на сцену вышла фирма Dolby. Dolby заработала известность своими системами шумопонижения, появившимся в 1970 году: Dolby B, которая используется в бытовых магнитофонах, и Dolby A — более сложная и эффективная система, применяющаяся и по сей день в профессиональной звукозаписи. Не удовлетворившись успехом в области обычной звукозаписи, основатель фирмы Рей Долби устремил свои взоры на звук для кинофильмов. Уже в 1971 году появился первый фильм (A Clockwork Orange — Заводной апельсин), звук для которого был записан с применением шумопонижения Dolby A, заметно расширившего динамический диапазон. А в 1974 году была представлена технология Dolby Stereo, использующаяся в большинстве фильмов и поныне. Взамен магнитных звуковых дорожек, которые довольно сильно шумели и со временем изнашивались, фирма Dolby предложила использовать старую добрую оптическую дорожку, но уже с двумя каналами звука. Эти две дорожки расположены там же, где и старая монодорожка (которую продолжали использовать для совместимости со старыми кинопроекторами), и поэтому фонограмма могла быть считана любым киноаппаратом если не в стерео, то хотя бы в моноварианте. Для уменьшения шумов на оптических дорожках использовалась система шумоподавления Dolby A.

Однако очевидно, что двух каналов звука для киноиндустрии было мало, поэтому в системе Dolby Stereo было применено матричное кодирование — четыре канала звука (левый, правый, центральный и surround-канал эффектов) «загонялись» в две аналоговые оптические дорожки. Левый и правый каналы (Lt и Rt, так принято обозначать два канала звука, закодированного матричным способом) подаются в финальную фонограмму Dolby Stereo неизменными. Канал эффектов делится на две части, одна часть поворачивается по фазе на +90 градусов, другая — на -90 градусов (или одна на 180 градусов, другая же не изменяется), и каждая из частей подмешивается в Lt и Rt соответственно. Перед этой операцией у канала эффектов отрезаются все частоты выше 7 кГц и ниже 100 Гц, также он обрабатывается системой шумопонижения. Центральный же канал с пониженным на 3 дБ уровнем в равной пропорции подмешивается в Lt и Rt. Таким образом, кодирование в Dolby Stereo — довольно простая операция, которую несложно провести даже на обычном микшерном пульте, а вот с обратным преобразованием в четыре канала звука дело обстоит несколько сложнее.

Стерео
Термин «стерео» (от греческого stereos — пространственный, объемный), в настоящее время ассоциирующийся с двумя каналами, изначально имел более широкий смысл. Например, первые эксперименты с объемным звучанием в Bell Labs в тридцатые годы прошлого столетия проводились с тремя каналами, окружающий звук в кино (даже если там использовалось шесть дорожек) тоже долгое время назывался стерео, в общем, стерео называли все, что обеспечивало пространственность воспроизводимой фонограмме (все, что не моно). Ассоциация слова «стерео» именно с двухканальными фонограммами была вызвана тем, что первые стереопластинки были именно с двумя каналами (больше просто не позволяла технология того времени), и появившееся в 1961 году стереофоническое FM-радиовещание также было двухканальным (впрочем, вещали они с тех же стереопластинок). Однако в кинопроизводстве еще долго пользовались термином «стерео» для названия многоканальной фонограммы к фильмам, даже четырехканальная система Dolby, вышедшая в 1976 году, называлась Dolby Stereo. Термин «surround sound» был придуман, когда многоканальные фонограммы к фильмам стали проигрываться в домашних условиях (с помощью стереофонических видеомагнитофонов и декодера Dolby Surround). Так как у широкой публики к тому времени слово «стерео» прочно ассоциировалось с двумя каналами, а для продвижения технологии на рынок уже в названии должно было быть нечто особенное, ранее не виданное, этим особенным и стало словосочетание «surround sound».

При декодировании Lt и Rt, как правило, подаются неизменными (почему «как правило» — см. далее) на левый и правый громкоговорители. Канал эффектов получается вычитанием (путем переворота фазы) Rt из Lt, такой же фильтрацией всего, что выше 7 кГц и ниже 100 Гц, обработкой системой шумопонижения, и после небольшой задержки (величина задержки настраивается для конкретного помещения, обычно составляет 20-100 мс) подается в surround-громкоговорители. Задержка нужна для того, чтобы добиться большего субъективного разделения между фронтальными и surround-каналом. Здесь используется эффект Хааса — если один сигнал приходит чуть позже и звучит чуть громче другого, то «другой» маскируется, и мы его практически не слышим. Поэтому, хотя звук из канала эффектов присутствует и в левом, и в правом громкоговорителях (хоть и с повернутой фазой), мы слышим эффекты именно сзади. Задержка также помогает в больших кинозалах. Часто эхо (или реверберация) от какого-то сигнала, записанного в одном из фронтальных каналов, находится в канале эффектов. Поэтому зрители на задних рядах из-за большого расстояния до экрана могут оказаться в такой ситуации, когда они слышат сначала эхо, а уже потом основной сигнал. Задержка в канале эффектов, настроенная на конкретную акустику помещения, позволяет решить эту проблему.

С центральным же каналом все не так просто. В принципе он получается из сложения Lt и Rt с последующим поднятием уровня на 3 дБ. Но при этом, например, когда звучат только диалоги, звук центрального канала будет раздаваться также и из левого и правого, причем всего на 3 дБ тише. Чтобы улучшить разделение каналов в Dolby Stereo применяются несколько логических схем — для разных звуковых ситуаций. Когда звучат только диалоги из центрального канала, декодер для улучшения локализации понижает уровень в левом и правом. Однако, если голоса звучат одновременно с музыкой, такая технология дает неудовлетворительный результат — во время диалога музыка слышна плохо и «выпрыгивает» в паузах между фразами. Для примирения диалогов и музыки декодер к левому каналу подмешивает правый в противофазе, и наоборот, к правому — левый; соответственно, звук, содержащийся в центральном канале, вычитается из левого и правого. Таким образом, получается, что во время диалогов музыка звучит практически в моноварианте (точнее, воспроизводится только S-составляющая стереосигнала), а левый и правый каналы находятся в противофазе. Техника заглушения соседних каналов применяется не только в работе с диалогами, но и в других случаях. Очень часто в фонограммах к фильмам бывает, что один из звуков является доминантным, то есть все внимание слушателя поглощается именно им, — например, это может быть взрыв, выстрел или другой спецэффект. Когда декодеру удается распознать такой доминантный сигнал (причем, он может быть не только жестко панорамирован в какой-то канал, но и находиться между громкоговорителями), он приглушает соседние каналы, чтобы усилить направленность эффекта. Иногда же, например, в сценах, когда вокруг идет дождь и четкая локализация источников не важна, декодер отключает свои хитроумные логические схемы и раскодирует звук пассивно.

Естественно, обеспечить правильное применение каждого из этих режимов довольно сложно, и Dolby не сразу удалось обеспечить должное разделение каналов. Но фирма постоянно совершенствовала алгоритмы и кинопроцессоры, так что довольно скоро качество кинозвука в новом формате достигло высокого уровня.

Из-за такой системы кодирования сведение фонограмм в Dolby Stereo невозможно без мониторинга через цепочку кодер-декодер. Если этого не сделать, то в кинотеатре (в домашнем, в частности) фонограмма будет звучать совершенно непохоже на то, что вы слышали в студии — некоторые инструменты в музыке могут «провалиться» или уйти в канал эффектов, а выразительные эффекты могут оказаться непонятным «побулькиванием». Матричную природу кодирования нужно учитывать и для моносовместимости фонограммы — например, канал эффектов в моно полностью пропадает (так как он находится в Lt и Rt в противофазе), поэтому в него не следует помещать какой-то важной для восприятия картины звуковой информации. Для мониторинга можно использовать внешний кодер и декодер (в настоящее время выпускаются кодер SEU 4 и декодер SDU 4) или подключаемые модули для Pro Tools производства Dolby.

После выхода в 1976 году фильма Джорджа Лукаса «Звездные войны», продемонстрировавшего потрясающие звуковые и визуальные эффекты, формат Dolby Stereo довольно быстро распространился, что было обусловлено, среди прочего, неважным состоянием киноиндустрии в то время. Телевидение уже пришло в каждый американский дом, и зрители не особенно ходили в кинотеатры, ведь все те же фильмы можно было увидеть через некоторое время у себя в гостиной. Соответственно, поток денег в кино постоянно снижался, при том, что производство прокатных копий фильмов по технологиям, использующим магнитную запись на кинопленке, было очень сложным и дорогим. Производство прокатных копий по старой технологии состояло из трех этапов: сначала пленку проявляли, затем на нее наносились магнитные дорожки, а уже потом на ленту записывался звук (в реальном времени). Все это стоило очень дорого — в 5-8 раз дороже простой печати фильма с монозвуком. Оптическая же дорожка Dolby Stereo упростила производство до предела — звук печатается вместе с изображением, и все.

Еще одна причина успеха — применение звукового кинопроцессора. Для переоборудования кинотеатра под Dolby Stereo, при условии наличия нужного количества громкоговорителей, требовалось лишь обеспечить считывание стереофонической оптической дорожки с кинопленки и подключить к выходу с этой дорожки процессор, а он уже выполнял все функции декодирования и управления звуком в кинотеатре. До появления таких кинопроцессоров для переоборудования кинотеатра под какой-либо новый звуковой формат требовалось приобретать множество разных приборов, дорогих, да к тому же сложных в установке и эксплуатации. Один из первых кинопроцессоров, Dolby CP 100, кроме звука Dolby Stereo мог еще работать и со старыми магнитными аудиоформатами, чем облегчал кинотеатрам переход на новый стандарт.

Чтобы обеспечить высокий уровень качества кинопродукции, выпускаемой с логотипом Dolby, фирма ввела строгую сертификацию кинотеатров, звукозаписывающих студий и собственно фильмов. Ведь даже двухканальная фонограмма, воспроизведенная в разных помещениях и с разных громкоговорителей, звучит по-разному (изменяется общий частотный баланс, а также положение кажущихся источников звука), что уж тут говорить о четырехканальном окружающем звуке, закодированном матричным способом. Поэтому сертификация, для получения которой кинотеатр должен был обеспечить достаточно высокое качество звуковоспроизводящей аппаратуры, нужное звуковое давление во всех точках зала и хорошую акустику помещения, помогла сделать звучание фильма примерно одинаковым во всех сертифицированных кинотеатрах. Сертификация студий звукозаписи необходима для того, чтобы звук, сделанный в этой студии и слышимый режиссером, был таким же, как и в кинотеатрах. Для студий требования примерно такие же, как и для кинотеатров — наличие микшерного пульта с surround-панорамированием, правильная акустика аппаратной, наличие кинопроектора и большого экрана (что автоматически требовало помещения соответствующих размеров), линейность звуковоспроизводящего тракта и обеспечение заданного уровня звукового давления в точке прослушивания. Такая сертификация и рекламная кампания сделали логотип Dolby приманкой для зрителя, который знал, что, придя в кинотеатр, носящий такой логотип, он услышит высокое качество окружающего звука и получит зрелище, недостижимое в домашних условиях. Именно с широким распространением Dolby Stereo связывают расцвет киноиндустрии, произошедший в начале восьмидесятых.

Наряду с внедрением Dolby Stereo компания усовершенствовала звук и для широкоэкранного кино. Способ записи был тот же, на магнитную полосу на 70-мм кинопленке, но теперь уже с шумопонижением Dolby A. Кроме того, шестиканальный формат Todd-AO был модифицирован: две из пяти фронтальных дорожек (а именно левая и правая дополнительные) были убраны, так как время гигантских киноэкранов уже прошло, и вполне хватало одного центрального канала, а место удаленных занимали теперь два канала низкочастотных эффектов. Применение низкочастотных каналов для специальных «громоподобных» эффектов было продемонстрировано впервые, такая инновация была хорошо воспринята индустрией и используется по сей день. С тех пор в обозначении формата канал LFE (Low Frequency Effects) из-за ограниченного частотного диапазона (не выше 300 Гц, обычно до 125 Гц) принято писать через точку, например, 5.1. В 1978 году формат был еще раз модифицирован: теперь surround-каналов стало два, левый и правый, и, таким образом, этот формат звука на 70-мм кинопленке стал предвестником современного окружающего звука, построенного по схеме 5.1. Первой картиной, выпущенной в этом обновленном звуковом формате (он был назван Dolby Stereo 70mm), стала Apocalypse Now (Апокалипсис сегодня) Френсиса Копполы, но, в связи с закатом популярности широкоэкранного кино, фильмов с новым типом фонограммы вышло немного.

Схема расположения громкоговорителей в кинотеатре, оборудованном для воспроизведения звука в формате Dolby Stereo 70mm.

В начале восьмидесятых стало бурно развиваться домашнее видео, сначала с моно-, а затем и со стереозвуком, в 1980-м появился лазерный видеодиск (Laser Disc). К тому времени уже получили широкое распространение домашние стереосистемы класса Hi-Fi, и в 1982 году Dolby представила домашний декодер для окружающего звука. Сначала этот декодер (для потребителей он был назван Dolby Surround) мог декодировать только три канала — левый, правый и surround, так как в нем использовался пассивный декодер без логических функций. Для большей части зрителей этого было достаточно, так как при небольшом экране телевизора вполне хватало «фантомного» центра, который обеспечивали левый и правый громкоговорители. В связи с распространением телевизоров с большой диагональю (27-32 дюйма), с которыми «фантомный» центр уже не удовлетворял пользователей, в 1987 году был представлен Dolby Surround Pro Logic, способный извлекать из двухканальной фонограммы на видеокассете все четыре дорожки окружающего звука. С этого момента «домашние кинотеатры» стали стремительно завоевывать рынок, и из предметов роскоши превратились в обычное явление.

В 1986 году Dolby представила новый аналоговый формат записи звука на кинопленку — Dolby SR (Spectral Recording). От обычного Dolby Stereo он отличался только применением новой системы шумоподавления (SR), в два раза более эффективной, чем Dolby A. Благодаря этому динамический диапазон звуковой дорожки к фильмам увеличился, но все еще применялся матричный способ кодирования. В настоящее время большая часть фильмов выходит со звуком в Dolby SR (наряду с одним или несколькими цифровыми форматами), кроме того, эта система шумоподавления до сих пор используется в профессиональной аналоговой звукозаписи и послужила основой для Dolby S, которая применяется в кассетных магнитофонах.

Девяностые годы характеризуются развитием цифровых технологий, и киноиндустрия не стояла в стороне. Первым на ниве доставки в кинотеатры цифрового звука стал формат Cinema Digital Sound (CDS), разработанный компанией Optical Radiation Corporation совместно с Eastman Kodak. Дорожка цифрового звука в этом формате помещалась вместо аналоговой, а роль бит выполняли мельчайшие точки (пикселы) на кинопленке. Размер этих точек был очень мал, так как формат разрабатывался при поддержке фирмы Kodak, которая создала для CDS специальную кинопленку. Благодаря малому размеру пикселов и тому, что они были расположены по всей длине кинопленки, на цифровую дорожку удалось «втиснуть» шесть (а, точнее, 5.1) каналов звука с разрешением 12 бит (правда, эти биты были не линейные, как на компакт-диске, а логарифмические, то есть квантование звука было более адаптировано к особенностям человеческого слуха, что делало динамический диапазон записи в таком формате практически равным «обычным», линейным 16-ти битам). В CDS, в отличие от всех современных цифровых форматов, применялось сжатие данных без потерь, то есть звуковые данные на выходе декодера были идентичны данным на входе кодера. Но, несмотря на то, что этот формат был достаточно «продвинутым» для своего времени (например, там применялась схема обнаружения и коррекции ошибок), особого успеха он не снискал, и в нем успело выйти всего несколько фильмов. Причина этому — полный отказ от аналоговой оптической дорожки. Из-за того, что она была вытеснена цифровой, CDS остался без подстраховки, и когда цифровая дорожка давала сбой (что случалось, в том числе, из-за малого размера пикселей), то, в лучшем случае, в зале воцарялась тишина. Отсутствие аналоговой дорожки также требовало изготовления специальных прокатных копий для цифровых кинотеатров, что было накладно и неудобно.

Схема расположения громкоговорителей в кинотеатре, оборудованном для воспроизведения звука в формате Dolby Digital, DTS или CDS.

На этом историческая часть данного обзора заканчивается, и мы приступаем к более детальному рассмотрению современных цифровых форматов многоканального звука. Все они используют сжатие цифровых потоков, причем сжатие с потерями. То есть звук после кодирования-раскодирования уже не идентичен исходному. Хотя изначально разрабатывались эти форматы именно для кинопленки, они нашли применение и в других областях, например, в вещании, DVD или компьютерных играх (исключение тут составляет лишь SDDS). Начнем же мы рассмотрение с самого распространенного формата — Dolby Digital.

Dolby Digital, SR-D

Цифровой формат Dolby SR-D был представлен публике в 1992 году, на премьере фильма Batman Returns (Возвращение Бэтмена), и в настоящее время этот формат является самым распространенным (в том числе и в домашних кинотеатрах). Широкой публике он больше известен под торговой маркой Dolby Digital, профессионалы же от кинопроизводства обычно называют его SR-D. Звук в Dolby Digital записывается в пространство между перфорациями, при помощи таких же «точек» (пикселей), как и в системе CDS. Место для аналоговой дорожки (с Dolby Stereo или SR) сохраняется, и она выполняет роль резервной, если вдруг что-то случится с цифровой. Совмещение цифровой и аналоговой записи звука на одной пленке позволило использовать одну и ту же копию фильма как в продвинутых цифровых, так и в старых аналоговых кинотеатрах (вплоть до моно), к тому же не требовалось какой-то специальной пленки из-за того, что пикселы в Dolby Digital довольно большие и вполне воспроизводятся на обычной кинопленке Fuji, Kodak или Agfa.

Из-за большой величины пикселей и малого пространства между перфорациями поток данных, который удается туда «запихнуть» сравнительно небольшой — 320 Кбит/с (напомню, что поток данных с обычного аудио-CD составляет более 1400 Кбит/с). Поэтому для размещения в этом тесном цифровом пространстве шести (а точнее 5.1) каналов компания Dolby применила сжатие звуковых данных с помощью алгоритма AC-3. В принципе в AC-3 можно закодировать и большее количество дискретных каналов (до 8), однако ни один из существующих декодеров не позволяет их раскодировать.

Этот алгоритм кодирования обладает очень высокой эффективностью (коэффициент сжатия может быть более 12:1, поддерживаемые битрейты от 32 до 640 Кбит/с, в кино обычно используется 320 Кбит/с) и при этом довольно высоким субъективным качеством звука. AC-3, как и большая часть современных схем сжатия звуковых потоков (в частности, MP3), использует в своей работе особенности слухового восприятия человека. Например, в присутствии громкого сигнала менее громкие и имеющие немного более высокую или низкую частоту звуки маскируются громким сигналом, то есть не слышны или слышны очень плохо. Также маскируются сигналы, звучащие после, и даже перед громким звуком. Это явление позволяет маскируемые звуки не кодировать или кодировать с меньшей разрядностью. Совокупность правил, используемых кодером для удаления малозначительной информации из аудиопотока, называется психоакустической моделью. Компрессия данных осуществляется также путем недеструктивного избавления от избыточной информации, примерно по тем же алгоритмам, которые применяются в архиваторах ZIP или RAR.

Перед собственно кодированием аудиосигнал (хотя AC-3 допускает кодирование звука с частотами дискретизации 32, 44,1 и 48 кГц, в Dolby Digital используется только последняя, 48 кГц) попадает в буферную память кодера. Затем убирается постоянная составляющая сигнала (DC offset, с помощью фильтра низких частот на 3 Гц) и фильтруется низкочастотный канал (убирается все, что выше 120 Гц). Следующий этап — детектирование коротких (транзиентных) звуковых импульсов. По результатам работы детектора звуковой поток разбивается на блоки — 512 семплов, если транзиентных сигналов не обнаружено, или 256 семплов, если таковые есть в сигнале. Это делается для того, чтобы улучшить передачу резких громких звуков (таких, как выстрелы или резкая атака некоторых музыкальных инструментов, например, барабанов). Временные блоки перекрываются между собой на 50% для создания избыточности и более точного кодирования.

Цифровым кроссовером звук в блоке разбивается на 256 частотных полос, что дает ширину одной полосы в 93,75 Гц. При этом цифровой сигнал преобразуется в формат чисел с плавающей запятой. Такое представление данных позволяет кодеру AC-3 использовать звук с разрядностью 20-24 бита. И хотя результат кодирования будет звучать чуть хуже, чем несжатый 16-битный звук, для более качественного результата Dolby рекомендует подавать на кодер именно 20/24-разрядную фонограмму.

После этого кодер анализирует информацию в каждой из частотных полос блока и, в соответствии с заданной психоакустической моделью, распределяет биты между ними — если, по мнению кодера, звук в данной частотной полосе несет важную для человеческого слуха информацию, то ей отводится больше бит для кодирования (изменяется разрядность как целочисленной мантиссы, так и экспоненты), а если кодер считает, что сигнал мы не услышим или услышим плохо, то частотная полоса не кодируется вовсе или ей выделяется меньшее количество бит. Психоакустическая модель используется не только для кодирования отдельных частотных полос в каждом канале, но и для распределения доступных бит между каналами. У кодера есть в распоряжении некое фиксированное количество бит (bit pool), которым необходимо закодировать блок данных в 512 семплов для всех шести каналов. Для распределения битов из общего пула каждому каналу и используется психоакустическая модель — во время диалога больше битов отдается центральному, а во время звучания музыки — левому и правому каналам. Это позволяет еще эффективнее упаковать сигнал, не сильно влияя на восприятие звуковой картины.

Механизм следующей ступени сжатия звука, используемой только когда всеми остальными способами не удалось сжать информацию до нужного размера, основан на особенности восприятия направления звучания высоких частот (выше 2,5 кГц). Человек не способен определить положение источника звука высокой частоты по разности фаз между приходящими в левое и правое ухо сигналами. Вместо этого мы определяем направление по огибающей звука, и разница в огибающих несет для нас пространственную информацию. Поэтому в AC-3 применяется объединение высоких частот из разных каналов, для каждого канала в отдельности кодируется лишь огибающая несущей частоты. В современных версиях кодеров AC-3 объединение высоких частот происходит, как правило, не ниже 10 кГц, поэтому заметного влияния на локализацию звука не оказывает (в ранних версиях были жалобы на плохое качество при объединении частот порядка 3-3,5 кГц). Объединяться высокие частоты могут в любом количестве каналов (от 2 до 5) и в любом сочетании, это решает алгоритм кодера.

Поток данных Dolby Digital считывается с пленки специальной насадкой на кинопроектор, а затем поступает на декодер, встроенный в кинопроцессор. В декодер данные поступают блоками (по 512 или 256 семплов), и сначала проверяется целостность данных в блоке. В Dolby Digital нет схемы коррекции ошибок, а только их обнаружения, поэтому если блок данных признан дефектным, то кодер использует предыдущий блок, прошедший такой контроль. Так как блоки перекрываются на 50%, это не вызывает слышимых проблем, более того, декодер может использовать один и тот же блок несколько раз подряд (если поступают поврежденные данные). Если же цифровой звук перестает поступать на протяжении некоторого количества блоков, то декодер переключает кинопроцессор на аналоговую дорожку с Dolby SR. Таким образом, даже при серьезных повреждениях цифровой аудиодорожки звук при показе в кинотеатре все равно не прерывается. Еще одним плюсом AC-3 является то, что кодер может включать в поток данных некоторые особенности использованной им психоакустической модели; соответственно, декодер, используя эти данные, более качественно раскодирует звук. Это позволяет совершенствовать алгоритм кодирования, не модифицируя существующие декодеры.

Таким образом, система сжатия AC-3 обладает высокой эффективностью (коэффициент сжатия, использующийся в кинопроизводстве, составляет почти 13:1) при минимальных потерях в качестве звучания. Однако стоит иметь в виду, что алгоритмы и психоакустические модели AC-3 разрабатывались именно для кинозвука и не предназначены для чисто музыкальных фонограмм (это подтверждает и сама фирма Dolby). Погрешности, вносимые процессом кодирования, малозаметны при демонстрации фильма, в то же время в музыке они становятся слышны и иногда неприятны (это в особенности касается тех случаев, когда кодер применяет технику объединения высоких частот).

Хотя Dolby Digital оперирует с шестью дискретными каналами, артефакты кодирования зачастую проявляют себя самым неожиданным образом. Поэтому для серьезной работы с окружающим звуком, который впоследствии будет закодирован в Dolby Digital, при мониторинге необходимо применять такую же цепочку кодер-деко

Показать все Самые популярные Высокий рейтинг Низкий рейтинг Добавьте свой отзыв

Ответить
Evil 09.07.2004 - 11:13

Здравствуйте.Интересно спросить…практически все фильмы идут с DD дорожкой.Куда же делись DTS(DTS ES) и SDDS?Даже DD EX практически не видел.Я имею в виду Российский кинопрокат.Есть ли прокатные фирмы(организации ) где есть такие фильмы.
Ответить
Гость. 18.10.2004 - 16:45

Добрый день.А как получается,что на одних схемах расположения громкоговорителей в кинотеатрах справа(например)от сидящего зрителя расположены громкоговорители именуемые»левый сурраунд» в формате Dolby Digital, DTS или CDS.А в долби стерео справа расположен действительно «правый сурраунд»?Это особенности стандарта?
Ответить
Дмитрий Попов 19.10.2004 - 01:48

Нет, это были ошибки в иллюстрациях. Исправлено, спасибо.
Ответить
ramiraz 11.04.2005 - 22:10

большое спасибо за подробнре освещение существующих стандартов, очень давно хотел в этом разобраться. всё понятно и без маркетинговой шелухи.
Ответить
Andrey Gule 18.04.2005 - 18:14

Спасибо за отличную статью: исчерпывающую, подробную.
Ответить
walera 19.11.2007 - 13:08

Огромное спасибо. Отличная статья.

Многоканальный окружающий звук

Dolby Digital, SR-D

Подготовка к записи в студии

MIDI в деталях. Часть 1 — Основы.

Установка жесткого диска под Windows 98

PC: Оптимальная конфигурация. Часть I: Процессоры.

MIDI в деталях. Часть 1 — Основы.

Запись прочих инструментов

Оставить ответ Отменить