Домой / Группы / Принципы имитации объемного звучания. Что такое объёмный звук (surround sound)

Принципы имитации объемного звучания. Что такое объёмный звук (surround sound)

Развитие систем объемного звучания - от монофонии к 3D

В настоящее время двухканальная стереофония стала уже классическим способом передачи и воспроизведения звука. Целью стереофонического звуковоспроизведения является максимально точная передача звукового образа. Локализация звука при этом является лишь средством, позволяющим получить более богатое и естественное звучание. Однако передача пространственной информации наиболее распространенными "классическими" двухканальными системами имеет ряд недостатков, что побуждает конструкторов к созданию различных систем объемного звучания.

Слушатель, находящийся в концертном зале слышит не только прямой звук, исходящий от отдельных инструментов оркестра, но и приходящий с различных направлений (в том числе и сзади) отраженный от стен и потолка помещения рассеянный (диффузный) звук, который создает эффект пространства и дорисовывает общее впечатление. Запаздывание, с которым диффузный звук достигает ушей слушателя, и его спектральный состав зависят от размера и акустических свойств помещения. При двухканальной передаче информация, создаваемая диффузным звуком, в значительной степени теряется, а в случае студийной записи может отсутствовать изначально.

Человеческое ухо лучше всего локализует источники звука в горизонтальной плоскости. При этом звуки приходящие сзади, при отсутствии дополнительной информации локализуются хуже. Зрение, в том числе и периферийное, является основным чувством определения местоположения объектов, поэтому без зрительной информации возможность оценки положения звука в вертикальной плоскости и его удаленности от нас слаба и достаточно индивидуальна. Отчасти это можно объяснить индивидуальными анатомическими особенностями ушных раковин. При воспроизведении записей зрительная информация отсутствует, поэтому любая звуковая технология для массового рынка, претендующая на "объемное звучание", вынуждена создавать нечто усредненное и заведомо компромиссное.

Для воспроизведения или синтезирования "эффекта зала" можно использовать множество способов. Еще в середине 50-х годов фирмами Philips, Grundig, Telefunken были опробованы системы трехмерного воспроизведения 3D и Raumton. Передача звука была монофонической, но дополнительные громкоговорители (обычно встроенные, реже - выносные), излучающие звук вбок или вверх, создавали за счет отраженного от стен и потолка звука впечатление большого пространства. Поскольку задержка эхо-сигнала в бытовых помещениях достаточно мала, для ее увеличения позднее использовались пружинные ревербераторы в канале усиления дополнительных сигналов. Эти системы ввиду значительной для того времени технической сложности продержались на рынке недолго и быстро сошли со сцены.

В дальнейшем для передачи диффузного звука были разработаны амбиофонические системы, нашедшие применение, главным образом, в кино. Дополнительный канал (или каналы) для передачи диффузного звука в таких системах имеют меньшую мощность, чем основные, а их частотный диапазон соответствует полосе частот диффузного сигнала (примерно 300...5000 Гц). Излучение дополнительных динамиков должно быть рассеянным, для чего они направлены на стены или потолок помещения прослушивания.

Сложность стандартизации и технические проблемы с записью и передачей сигналов трех, четырех и более каналов привели к тому, что основной системой записи и передачи звука на долгие годы стала двухканальная стереофония. Но попытки создания систем объемного звучания не прекращались. Развитием амбиофонии стала квадрафония (четырехканальное звуковоспроизведение), пик популярности которой пришелся на первую половину 70-х годов. В отличие от амбиофонической системы здесь все каналы воспроизведения звука оборудованы равноценно. Дискретная (полная) квадрафония, обеспечивающая максимальный эффект присутствия, требует четырех каналов передачи звука и в силу этого оказалась несовместимой с существовавшими в тот момент техническими средствами звукозаписи и радиовещания.

Для преодоления этого препятствия было создано несколько систем матричной квадрафонии (по терминологии того времени - квазиквадрафонии), в которых исходные сигналы четырех каналов матрицировались для передачи по двум каналам, а при воспроизведения исходные сигналы восстанавливались путем суммарно-разностных преобразований, причем без декодера можно было воспроизводить обычный стереосигнал. Поскольку ни одна из этих систем не была ни полноценно квадрафонической, ни полностью совместимой с двухканальной стереофонией из-за большого проникновения сигналов из канала в канал, практическое их применение было ограниченным и интерес к ним быстро угас.

В "войне стандартов" квадрафонических систем победителей не было, идея благополучно скончалась, принципы позабылись, а термин остался. Поэтому сейчас мало кого смущает тот факт, что "нечто", имеющее четыре канала усиления и четыре колонки гордо именуется "квадрафонической системой". Однако это в корне неправильно, поскольку источник сигнала остается двухканальным, а сигналы фронтальных и тыловых каналов при таком построении системы отличаются друг от друга только уровнем, то есть используется принцип панорамирования.

Панорамирование при производстве стереозаписей широко применялось уже с середины 50-х годов для расположения монофонических звуковых сигналов "слева/справа/в середине" звукового поля. При панорамировании не оказывается никакого воздействия на частоту и фазу сигнала, изменяется только уровень монофонического сигнала, подводимого к каждому из стереоканалов. Панорамирование на несколько каналов (в случае многоканальных записей) осуществляется аналогично. Однако при определении направления на источник звука наш слуховой аппарат использует не только разность интенсивности звуковых сигналов, но и фазовый сдвиг между ними, причем влияние фазового сдвига на точность локализации источника звука наиболее ярко выражено в области частот приблизительно от 500 до 3000 Гц. (Опять диапазон частот диффузного звука!).

Поэтому простое панорамирование не обеспечивает нужной достоверности звучания. Стереоэффекты ("бегающий звук", привязка звука "слева-справа" и т.д.) первых стереозаписей достаточно быстро приелись. Поэтому лучшие записи электронных инструментов в студии в 60-е годы проводились с использованием микрофонной техники, что объясняет "живой" характер звучания: Внедрение многоканальной полностью электронной (без использования микрофонов) записи инструментов с последующим сведением, облегчив работу звукорежиссера, одновременно уничтожило атмосферу зала. В последующем этот факт стал учитываться при проведении студийных записей, хотя полного возврата к микрофонной технике не произошло.

При использовании двухканальной схемы воспроизведения основная зона эффективного расположения кажущихся источников звука (КИЗ) находится спереди от слушателя и покрывает пространство порядка 180 градусов в горизонтальной плоскости. Два фронтальных канала не в состоянии адекватно воспроизвести звуки, источники которых в реальности расположены сзади и в вертикальной плоскости, если нет поддержки в виде дополнительных сигналов. Применение тыловых акустических систем в сочетании с панорамированием звука хорошо справляется с расположением источников звука спереди и сзади от слушателя и слабее с боковым расположением. Однако само по себе панорамирование звука никогда не сможет обеспечить приемлемое позиционирования источников звука в вертикальной плоскости.

В ходе разработки матричных систем выяснилось, что значительная часть пространственной информации содержится в разностном сигнале (сигнале стереоинформации), который можно подать на громкоговорители тыловых каналов или в чистом виде, или в смеси с некоторой долей фронтальных сигналов. В простейшем случае для этого даже не нужны дополнительные каналы усиления, а матрицирование сигналов можно провести на выходе усилителя:

Так появились на свет несколько псевдоквадрафонических систем, полностью вытеснивших "истинных арийцев" с рынка в середине 70-х. Они отличались друг от друга только способами получения разностного сигнала. Впрочем, их триумф тоже был недолгим, что объяснялось недостатками носителя сигнала - винилового диска и магнитной ленты. Некоррелированные шумы левого и правого каналов не вычитались, что в сочетании с относительно невысоким уровнем разностного сигнала сильно ухудшало отношение сигнал/шум в тыловых каналах.

Другой, не менее существенный недостаток подобных систем - отсутствие зависимости уровня тылового сигнала от характера фонограммы. При малом уровне тылового сигнала пространственный эффект мало заметен, при увеличении уровня появляется разрыв звуковой сцены и перемещение ее фрагментов назад (эффект "окружения оркестром", не соответствующий действительности).

При воспроизведении "живых" записей (имеющих естественное распределение суммарных, разностных и фазовых составляющих) этот недостаток проявлялся незначительно, но на большинстве студийных фонограмм тыловые каналы вносили значительные ошибки в положение КИЗ. Для устранения этого недостатка в ранних системах объемного звучания пытались применить автоматическое панорамирование. Управляющие сигналы получали из уровня пространственной информации - возрастание уровня разностных сигналов приводило к увеличению усиления в тыловых каналах. Однако принятая модель панорамирования была очень грубой, в результате чего ошибки регулирования экспандера приводили к хаотическому изменению уровня тыловых сигналов (эффект "тяжелого дыхания").

Интерес к системам объемного звучания вновь возник с появлением цифровых носителей информации, уровень собственных шумов которых пренебрежимо мал и даже аналоговая обработка сигнала практически не ухудшит динамический диапазон системы. Развитие цифровых методов обработки сигнала привело к созданию цифровых звуковых процессоров (Digital Sound Processor - DSP).

Разработанные первоначально для систем "домашнего театра" процессоры объемного звучания в последнее время начали активно использоваться и в автомобильных аудиосистемах. Их применение позволяет значительно улучшить звучание в салоне автомобиля, поэтому они выпускаются не только в виде отдельных DSP-устройств, но и входят в состав относительно недорогих магнитол. Настройки процессоров позволяют выбрать наиболее оптимальные параметры для выбранного места прослушивания.

Существует ряд методов, позволяющих аппаратуре воспроизводить звук, локализуемый в пространстве, при ограниченном количестве акустических систем. Разные методы реализации имеют сильные и слабые стороны, поэтому важно понимать принципиальные различия между основными методами обработки сигнала. В основе современных систем пространственного звучания (Dolby Surround, Dolby Pro-Logic, Q-Sound, Curcle Surround и других) лежит все та же идея суммарно-разностного преобразования, дополненная "фирменными" методами обработки сигналов (как аналоговыми, так и цифровыми). Часто их объединяют общим названием "3D-системы" ("второе рождение" термина сорокалетней давности!).

Прежде чем рассматривать принципы, используемые при обработке звуковых сигналов в системах объемного звучания, вспомним типичный процесс создания записи. Сначала производится запись, имеющая много индивидуальных каналов -- инструменты, голоса, звуковые эффекты и т.д. Во время микширования для каждой звуковой дорожки контролируется уровень громкости и расположение источника звука для достижения требуемого результата. В случае стереозаписи результатом микширования являются два канала, для surround-систем число каналов больше (например, 6 каналов для формата "5.1" Dolby Digital/AC-3). В любом случае, каждый канал состоит из сигналов, которые предназначены для направления в отдельные колонки при прослушивании пользователем. Каждый из этих сигналов представляет собой результат сложного микширования сигналов исходных источников.

Далее происходит процесс кодирования каналов, полученных после микширования и в результате получается один цифровой поток (bitstream). При проигрывании декодер обрабатывает цифровой поток, разделяя его на индивидуальные каналы и передавая их для воспроизведения на акустические системы. Для многоканальных (дискретных) систем объемного звучания при этом возможен режим имитации реально отсутствующих акустических систем (Phantom mode). Если у вас всего две колонки, тогда канал сабвуфера (низкочастотный) и центральный (диалогов) просто добавляются одновременно к обоим выходным каналам. Задний левый канал добавляется к левому выходному каналу, задний правый к правому выходному каналу.

Вспомним, что панорамирование воздействует только на амплитуду звукового сигнала. Преобразование звука в современных 3D-системах включает в звуковой поток дополнительную информацию о амплитуде и разности фаз/задержке между выходными каналами. Обычно степень обработки зависит от частоты сигнала, хотя некоторые эффекты создаются с использованием простых задержек по времени.

Какие же методы используются для обработки звукового сигнала? В первую очередь это расширение стереобазы (Stereo Expansion), которое производится путем воздействия на разностный стереосигнал фронтальных каналов. Этот метод можно считать классическим и он применяется прежде всего к обычным стереозаписям.

Обработка сигнала может быть как аналоговой, так и цифровой. Во-вторых, Positional 3D Audio (локализуемый 3D звук). Этот метод оперирует с множеством отдельных звуковых каналов и пытается индивидуально определить местоположение каждого сигнала в пространстве. В-третьих, Virtual Surround (виртуальный окружающий звук) - метод воспроизведения многоканальной записи с использованием ограниченного числа источников звука, например воспроизведение пятиканального звука на двух акустических колонках. Очевидно, что два последних метода применимы только к многоканальным звуковым носителям (записи в формате DVD, AC-3), что пока для автомобильных систем не очень актуально.

Замыкают список различные методы искусственной реверберации. Когда звук распространяется в пространстве, он может отражаться или поглощаться различными объектами. Отраженные звуки в большом пространстве могут в реальности создавать ясно различимое эхо, но в ограниченном пространстве происходит совмещение множества отраженных звуков так, что мы слышим их как единую последовательность, которая следует за исходным звуком и затухает, причем степень затухания различна для разных частот и напрямую зависит от свойств окружающего пространства.

В цифровых звуковых процессорах используется обобщенная модель реверберации, что сводит управление процессом реверберации к заданию ключевых параметров (время задержки, количество отражений, скорость затухания, изменение спектрального состава отраженных сигналов). Таким образом реализуются режимы hall, live, stadium, и т.д. Имитация получается достаточно реалистичной. В аналоговых процессорах для этой цели используются линии задержки сигнала. Управление параметрами реверберации в этом случае значительно сложнее, поэтому обычно имеется только один фиксированный режим работы.

Конечно, изложить особенности строения всех существующих систем объемного звучания трудно, но их работа основана на рассмотренных принципах - различие только в деталях алгоритмов и наборе режимов (предустановок). Поэтому лучший советчик при выборе звукового процессора - собственный слух.

Термин «3D-звук» использовался настолько часто в разной технике, что сейчас уже сложно понять, что же именно он означает. Это может быть и простой алгоритм расширения стереобазы, и, например, бинауральная запись для наушников. Поэтому компания Auro особо подчеркивает, что в ее понимании 3D-звук - это звук в трех измерениях, когда схема расстановки колонок ведется по трем перпендикулярным осям (x, y, z), а запись и сведение делаются исходя из такой расстановки системы. О том, что творится внутри Auro-дорожек и почему бельгийская компания решила отвоевать себе рынок у Dolby Atmos и DTS:X, и пойдет речь.

История

Все началось с телефонного звонка в марте 2005 года. Немецкий продюсер Том Хапке загорелся идеей сделать микс в аудиоформате 2+2+2 и предложил заняться этим Вильфриду ван Балену (Wilfried Van Baelen), главе бельгийской студии Galaxy. Вильфрид поначалу отнесся к идее скептически: эта конфигурация предполагала квадрофоническую схему с двумя дополнительными каналами, установленными повыше фронтальных, и казалась оправданной в озвучке фильмов, но в чем же выиграет музыка от двух дополнительных фронтальных каналов, он не понимал. Пока не послушал классику в таком формате.

Звук оказался глубже, прозрачнее, объемнее, чем в «плоскостной» конфигурации 5.1, и побудил Вильфрида на эксперименты. Так как альбом необходимо было записать в форматах 2+2+2, 5.1 и 2.0, он взял за отправную точку схему 5.1 и добавил к ней пару фронтальных каналов, однако после ощутил дисбаланс: за фронтальную полусферу отвечали 6 каналов, в то время как за тыловую - всего 2. Его решение было простым - добавить еще больше каналов, и так тылы тоже обзавелись дополнительной парой спикеров, расположенных чуть выше. Конфигурация доросла до формата 9.1, но при этом не утратила обратной совместимости с форматом 5.1.


По словам Вильфрида, то, что он испытал, было сравнимо с его первым знакомством с квадрофоническим звуком. Колонки действительно исчезли, появилось ощущение присутствия на месте, где производилась запись.

Этот эксперимент и положил начало пятилетней истории разработки формата Auro 3D.

От уха до мозга

Вильфрид стал изучать принципы работы слухового аппарата, чтобы понять, почему же от добавления дополнительного звукового измерения у него настолько сильно изменилось восприятие звука и откуда возникло это ощущение погружения. В итоге он узнал, что такое всеобъемлющее впечатление создает диффузное поле за спиной.

Как известно, при сведении в стерео очень часто используется прием перехода звука из одного канала в другой, создающий иллюзию перемещения источника в горизонтальной плоскости. Вильфрид, продолжая эксперименты, захотел добиться похожего эффекта в вертикальной плоскости, но не преуспел. Сначала он считал, что проблема в оборудовании, но все оказалось интереснее: он услышал желаемый эффект, склонив голову набок и подойдя поближе к колонкам.


Суть в том, что диаграмма направленности человеческого слуха больше тяготеет к горизонтальной плоскости, и поскольку у людей нет уха на затылке, вертикальную составляющую мы соответствующим образом обработать не можем. В локализации звука человеку помогает разница в уровне сигналов, разница во времени восприятия сигнала левым и правым ухом и отраженные сигналы. На самом деле 90% звуков, которые воспринимает человеческое ухо - трехмерные отражения исходного сигнала. И находящиеся на уровне головы колонки воспроизводят именно те сигналы, которые впоследствии отражаются от пола.

По каналам, по объектам

Формат Auro-3D, в отличие от конкурирующих Dolby Atmos и DTS:X, не объектно-ориентированный, а поканальный. Для достижения «обволакивающего звука» к двум слоям колонок - классическому и второму, расположенному под углом 30 градусов к горизонту - Вильфрид добавил третий, установленный прямо над слушателем. Этот третий слой акустики получил название «глас Бога» и добавил третье измерение в звук - высоту. Если в стандартных кинотеатральных конфигурациях, даже в Dolby Atmos и DTS:X, слушатель окружен сферическим слоем звука, то в Auro-3D его как бы обволакивает полноценная полусфера.


В объектной технологии звукозаписи каждый источник звука прописывается отдельно, а в поканальной звук распределяется между разными каналами, а потом уже суммируется вместе в колонках. Например, при записи звука оживленной проезжей части в объектно-ориентированном формате не удастся выделить сами движущиеся объекты - машины, велосипеды, людей - для дальнейшего использования, нельзя будет получить отраженный от этих объектов трехмерный звук, равно как и прямой. В поканальной системе эта проблема решена путем упрощения, и именно здесь на сцену выходит вертикальная составляющая.

Третий слой колонок в Auro 3D создает вокруг слушателя «вертикальное стереополе», причем при любой схеме расположения акустики в Auro 3D. Сам по себе третий слой не помогает в локализации - он помогает в воспроизведении пролетающих над головой вертолетов, звездолетов и погодных эффектов, но человеческий слух мало восприимчив к поступающим непосредственно сверху звукам, да и в целом оттуда, с потолка, приходит мало звуковой информации. В этом виновата эволюция: так сложилось, что чаще всего на заре человечества опасность исходила примерно с того же уровня, на котором находился человек, а не сверху, и именно поэтому мозг усиленно обрабатывал отраженные от земли звуки.

Формат Auro 3D даже в сокращенной конфигурации, с меньшим количеством аудиослоев, способен воспроизвести вертикальное позиционирование источников звука, и поэтому прекрасно адаптируется к самым разным помещениям и системам. Кроме того, Auro 3D является единственным форматом 3D-звука на рынке, поддерживающим процесс мастеринга, основанный на смешивании всех каналов, чего не умеют форматы объектной записи. Фактически Auro 3D - единственный формат на рынке для музыки в 3D. При этом в век сжатых фоматов - MP3, AAC и других - Auro 3D имеет качество 24 бит/96 кГц.

На каждом устройстве

Технология Auro-3D Engine включает в себя декодер Auro-Codec и апмиксер Auro-Matic. С помощью этих двух алгоритмов и достигается универсальность системы. Декодер распознает и декодирует нативный звук в формате Auro-3D, в то время как апмиксер использует алгоритм повышающего распределения звука из моно, стерео, 5.1 и 7.1 в Auro-3D, при наличии, конечно, необходимого количества каналов. То есть фильмы, уже записанные на Blu-ray или даже DVD, и музыку, смонтированную в стерео, можно будет оценить в новом, максимально трехмерном формате.


Традиционно технология апмикса использует изменения в эквализации спектра и добавляет алгоритмы отражений. При разработке Auro-Matic инженеры не хотели слышать лишних ревербераций или фазовых неточностей, но хотели передать звук максимально близко к тому, как его слышал и задумывал автор. И разработали алгоритмы, связанные с HRTF (Head Related Transfer Function) - технологией, которая учитывает, как человеческое ухо воспринимает звуки в естественных условиях. Обладатели iPhone и iPad могут оценить работу алгоритма, ознакомившись с приложением Beautifyer (увы, не доступен в России).


В свое время Auro-Technologies столкнулась с интересной проблемой: разработчики оборудования не стремились внедрять технологию Auro-3D из-за того, что не было соответствующего контента, а создатели контента не использовали Auro-3D формат из-за того, что его не на чем было воспроизводить. Поэтому компания решила самостоятельно выпустить ресивер, поддерживающий Auro-3D, и со временем за ней подтянулись и остальные. Сейчас помимо линейки продуктов от компании StormAudio все больше и больше производителей внедрили Auro-3D в свое AV оборудование: среди них Denon, Marantz, Steinway Lyngdorf, Macintosh, Trinnov, Theta Digital, StormAudio, ATI и Datasat.


Интерфейс настроек инсталляции Auro-3D в процессоре Trinnov Altitude 32

Помимо домашних и недомашних кинотеатров и аудиосистем Auro-3D занял место и в автомобильной промышленности. Совместно с компанией Continental разработчики создали в автомобиле уникальную встроенную систему трехмерного звука, и первые автомобили, оборудованные системой Auro-3D, увидят свет в 2017 году. Звуковое поле такого плана меняет атмосферу для водителя, позволяет ему расслабиться и почувствовать себя комфортнее, и даже, по мнению некоторых, будто бы расширяют пространство салона. Как считает Вильфрид, при прослушивании музыки в 3D наш мозг меньше напрягается, чем при обработке стереофонограммы - отсюда и дополнительный комфорт.


Автомобиль Porsche Panamera с установленной системой от Burmester, которая умеет работать с Auro-3D-звуком

Сейчас уже есть порядка 200 альбомов, записанных в формате Auro 9.1, а совсем немного - в формате 10.1, с использованием наивысшего канала. Область использования этого канала достаточно специфична - он нужен для воспроизведения именно тех звуков, которые доносятся непосредственно сверху, а в музыке расположенных над слушателем объектов обычно не бывает. Даже записи живых концертов не нуждаются в «гласе Бога», потому как в концертных залах, как правило, меньше отражений. Среди двух сотен альбомов в формате 9.1 встречаются не только классические композиции, но также и джаз, и рок, и популярные исполнители, и даже танцевальная музыка.


Также формат захватит и мобильные устройства. В сочетании с бинауральной технологией Auro-3D для мобильных устройств сможет создавать трехмерный иммерсивный звук сразу в смартфоне и передавать его в наушники: система способна как декодировать оригинальный Auro-3D контент, так и воспроизвести всю стереофонтеку, фильмы и прочие медиафайлы в звуковом формате Auro-3D при помощи апмикса.


Интерфейс программы Wwise с опциями для работы с Auro-3D-звуком

Особняком стоят видеоигры. Технология Auro-3D позволит создавать звуковые ландшафты, которые подарят игрокам совершенно иные ощущения. Компания заключила партнерство с Audio-Kinetics и внедрила формат в программу Wwise для создания звука для компьютерных игр. Версия AuroWwise поддерживает 3D-звук для интерактивных средств массовой информации и игр, сохраняя при этом все функциональные возможности. Первой игрой в формате Auro-3D станет Get Even, которая выйдет весной 2017 года. С колонками, правда, по мнению Вильфрида, такое звучание все равно не сравнится.

Сколько нужно колонок?

Для домашних кинотеатров минимальная рекомендованная конфигурация - 9.1, оптимальное решение - 11.1, а в особо крупных залах следует воспользоваться Auro 13.1. Места необходимо столько же, сколько и для оптимального размещения систем 5.1 и 7.1. Разработчики протестировали работу Auro-3D в самых разных помещениях - с высоким потолком, низким потолком, в сухой и влажной среде, и поняли, что система оказалась действительно гибкой.


Сейчас уже появился новый формат AuroMax - это гибридный, канальный и объектно-ориентированный формат, который использует конфигурацию от 20.1 до 26.1. Формат AuroMax - совместная разработка компаний Auro-Technologies, Barco и Iosono, и используется в полноценных кинотеатрах. В домашних кинотеатрах, по мнению разработчиков, необходимости в такой максимальной конфигурации нет, но слово заказчика - закон. Правда, места потребуется еще больше, чем на 13.1-канальную версию.

По мнению Вильфрида, даже миллион колонок не сможет воспроизвести окружающий нас мир натурально - наши уши слишком умны для того, чтобы их можно было так обмануть. Поэтому цель Auro-3D - не задействовать как можно больше каналов, а наоборот, добиться максимально обволакивающего звучания с наименьшим числом динамиков. Потому и не стоит пытаться уместить в небольшом кинотеатре 26.1-канальную конфигурацию - в ней просто не будет смысла, эффект от дополнительных каналов не перекроет потраченных на установку сил, нервов и денег. Лучше обойтись 11.1-канальной версией.

Для широкоформатных кинотеатров и киностудий

В 2011 году Вильфрид начал партнерство с бельгийским производителем видеооборудования Barco. Эта фирма стала использовать системы Auro-3D в своем оборудовании для кинотеатров, и в том же году впервые установила систему Auro 11.1. Первым фильмом в таком формате стала лента «Red Tails», снятая Джорджем Лукасом. Сейчас по всему миру системами Auro 11.1 by Barco и AuroMax оборудовано более 550 кинотеатров.


В России на сегодняшний день таким звуком оснащены главный премьерный кинозал «Октябрь» и 27 кинотеатров в Москве и других городах. Оборудование Auro-3D уже установлено в двух студиях - «Пифагор» и «Нева-Фильм». Всего более 100 студий по всему миру создают и дублируют фильмы в формате Auro-11.1 by Barco.

Прежде всего, формат хорош тем, что для студий и кинотеатров обходится дешевле. Официальный сайт Auro-3D указывает такие плюсы:

Отсутствие платы за лицензию

Минимальный объем усилий по распространению

Возможность использовать созданный контент в этом формате на системах Auro- 11.1 by Barco

Удобный переход от DCP к эквивалентному качеству на Blu-ray

Простота последующего преобразования

Возможность записи в формате Auro-11.1 by Barco непосредственно на съемочной площадке

Отсутствие необходимости в дополнительном мастеринге DCP и ключах

Дополнительные каналы кодируются непосредственно в мастер 5.1 (7.1)

Полная совместимость с миксом в 5.1 (7.1)

Не нужно тратить время на дополнительную перезапись в другом формате

Возможность использовать функцию «up mix» для готовых фильмов в формате стерео, 5.1, 7.1 для воспроизведения в Auro-11.1 by Barco

Где контент?

Поначалу, когда формат только зарождался, контента было мало. Но сейчас ситуация изменилась: в формате Auro-3D есть и музыка, и фильмы. Списки фильмов и музыки, а также будущих кинотеатральных релизов, опубликованы на сайте Auro-3D.

Хотите получить качественный объемный звук в своих наушниках или на домашнем кинотеатре совершенно бесплатно? Читайте эту инструкцию.

С каждым новым выпуском (обновлением) операционной системы Windows 10, разработчики не перестают удивлять пользователей различными полезными мини-функциями. Стоит лишь перейти в какие-либо параметры системы, устройств, персонализации, конфиденциальности и т.д., непременно можно найти, на первый взгляд сразу не слишком заметные, но очень полезные настройки.

И кто бы не говорил, Майкрософт разрабатывает свою операционку, в первую очередь, для нас с вами. Все эти заявления о том, что они собирают конфиденциальные данные, следят за нами — ерунда!

Грамотный юзер настроит работу системы так, что передача секретной информации другой стороне будет сведена к минимуму. Не хотите сбора данных о ваших предпочтениях, отключите такую возможность. Надоела реклама — заблокируйте её отображение. Боитесь вирусов и других вредоносных приложений — пользуйтесь официальным, а не взломанным софтом!

И наконец, если не нравится сама Windows, найдите замену в виде или MacOS. Но сейчас поговорим не об этом!

Последнее обновление системы поставляется с новой функцией «Пространственный звук». Если её активировать, то вы непременно получите ощущение, что звук играет вокруг вас, а не через наушники. Если сказать немного по-другому — он будет 3D или объемный.

Как вы можете убедиться, здесь Майкрософт никак не навязывает эту функцию пользователю, так как по умолчанию она отключена. А дальше мы узнаем, как её включить.

ОБЪЕМНЫЙ ЗВУК

Windows 10 умеет транслировать пространственный звук при помощи комбинации специального драйвера, приложения и наушников. Эта технология предназначена для улучшения качества звучания, в первую очередь, ваших наушников.

Для включения необходимо:

  • кликнуть правой кнопкой мышки по значку в системном трее и нажать на «Устройства воспроизведения»;
  • выбрать «Динамики» и нажать на кнопку «Свойства»;
  • перейти на вкладку «Пространственный звук» и выбрать его формат из раскрывающегося списка (Windows Sonic или Dolby Atmos for headphones).

DOLBY ATMOS

Это технология объемного звука для создания в реальном времени динамически отображаемой звуковой среды. Для её работы требуется специальное приложение из магазина Store. Если вы выберете этот вариант и нажмете кнопку «Применить», он автоматически установит приложение Dolby Access.

Существенным плюсом приложения является поддержка улучшения звучания и для домашнего кинотеатра, в случае аппаратной поддержки им технологии Dolby.

Настройка не заставит пользователя вникать в дебри сложных параметров. Просто выберите соответствующий профиль на стартовом экране и приложение автоматически настроит оборудование.

WINDOWS SONIC

Включает интегрированный пространственный звук в Xbox и Windows, с поддержкой сигналов как для объемного звучания, так и для их высоты. Аудио сможет быть передано без необходимости изменения кода.

Теперь итог! В моем случае, даже самые простые и дешевые наушники при выборе формата Dolby Atmos изменили свое звучание, на порядок качественнее первоначального. Что получилось у вас? Жду ответа в комментариях.

Настоятельно прошу вас заглянуть в . Наша группа в Facebook ждет вас.

Что такое объёмный звук (surround sound) и как он устроен

Большинство современных дешёвых и не очень звуковоспроизводящих устройств включая звуковые карты для персональных мультимедиа компьютеров позволяют воспроизводить звук в режиме "3D Sound" или "Suround", что можно перевести как "объёмный звук". Что же это такое и для чего это нужно?

Системы объёмного воспроизведения звука были разработаны потому, что качество звучания, реализуемое обычной стереофонической системой или головными телефонами, перестало удовлетворять взыскательных слушателей. Хотя стерео системы и создают эффект пространственного звучания за счет синтеза панорамы мнимых источников звука (МИЗ) между двумя громковорителями (рис. 1), все же стереозвучание имеет существенный недостаток. Стереопанорама получается плоской и ограничена углом между направлениями на громкоговорители.

Рисунок 1. Стереопанорама

Такое звучание в значительной степени лишено естественности, свойственной тому, что достигается в реальном звуковом поле, когда человек способен воспринимать реальные источники практически со всех направлений как в горизонтальной так и в вертикальной плоскостях и оценивать, хотя порой и с ошибками, расстояние до источников звука. Считается, что восприятие звуков с разных направлений и расстояний имеет важное значение не только как факт их пространственного расположения. Оно создаёт у слушателя ощущение звучащего объёма (трёхмерного звукового поля), существенно обогащает тембры музыкальных инструментов и голосов, восстанавливая реверберационный процесс, свойственный первичному помещению (концерному залу). Обычная стереофония создаёт эффект пространственного звучания в очень ограниченной области перед слушателем, не позволяет в полной мере выявить названные особенности восприятия звуков в реальном звуковом поле и, следовательно, снижает качество звучания.

Квадрофонические системы также не обеспечивают полную имитацию реального звукового поля. Во-первых, при квадрофонии не получается круговая стереопанорама - слушатель ощущает обычную стереопанораму перед собой и заднюю стереопанораму сзади себя. Во-вторых, все мнимые источники звука располагаются в одной плоскости и на линии между динамиками, т.е. нет глубины и нет, собственно, 3-го измерения и трёхмерного объемного звучания (рис. 2).


Рисунок 2. Квадропанорама

Головные стерео телефоны также не позволяют получить естественное звучание воспроизводимой фонограммы. Дело в том, что возникающее при этом впечатление бесконечной ширины стереобазы и четкая локализация звукового изображения внутри головы слушателя не могут удовлетворить требовательных меломанов. Для устранения эффекта локализации звука внутри головы применяются схемы подобные приведенной на рис. 3.


Рисунок 3. Блок схема устройства создания объемного звука для стереотелефонов

Здесь сигналы левого и правого каналов через входные устройства А1 и А2 поступают соответственно на делители напряжения А3 и А6 и на входы перекрестных каналов, состоящих из линий задержки (ЛЗ) А4, А5, согласующих устройств А8, А9 и фильтров нижних частот (ФНЧ) Z1, Z2. С делителей А3, А6 сигналы подаются на корректоры АЧХ А7 и А10 и далее - на один из входов сумматоров, а с них - на входы усилителей мощности для стереотелефонов. Таким образом, на выходе каждого канала формируется сигнал, состоящий из ослабленного и скорректированного сигнала своего канала и задержанного и соответствующим образом скорректированного сигнала другого канала.

Подобными устройствами, выполненными в виде приставок или встроенных устройств, в настоящее время оснащены многие музыкальные центры. Интересно, что такие устройства могут быть реализованы и чисто программными методами с использованием цифровой обработки сигналов в реальном времени. Читатели, имеющие персональный компьютер с фулдуплексной звуковой картой (к сожалению, программа плохо работает с картами производства сингапурской фирмы Creative Labs.), могут скачать одну из подобных программ здесь. Программа, кроме того, позволяет добавить эффекты реверберации для маленького, среднего и большого помещения, эхо, хорус, флэнжер и имеет довольно неплохой эквалайзер, значительно улучшающий воспроизведение низких (20...60 Гц) частот через стереотелефоны среднего класса качества. Все эффекты работают в реальном времени даже на очень дешевых звуковых картах без DSP процессоров, например на OPTi-931 или Acer S23.

Наиболее совершенный метод имитации реального трёхмерного звукового поля это бинауральная передача звука. Бинауральный метод состоит в том, что звуковая информация воспринимается микрофонами, размещёнными в ушных раковинах человека или?искусственной головы? - модели, симулирующей слуховое восприятие человека. Сигналы, поступающие с каждого микрофона, усиливаются раздельными усилителями низкой частоты и воспроизводятся стереотелефонами. В идеале такая система позволяет создать полную иллюзию естественного звучания.

Она как бы переносит слушателя из помещения прослушивания в помещение, откуда ведётся передача. Однако полноценно прослушивать её можно только с помощью стереотелефонов и при условии что в качестве образца для создания искусственной головы использовалась именно ваша голова. Читатели могут прослушать бинауральные демонстрационные звуковые WAV файлы, скачав их через Интернет с серверов


www.geocities.com/SiliconValley/Pines/7899

При воспроизведении бинаурального сигнала через звуковые колонки из-за попадания сигнала правого канала в левое ухо слушателя и наоборот возникают перекрёстные искажения, в конечном счёте сводящие на нет все преимущества бинаурального звуковоспроизведения. Указанные недостатки в значительной мере удаётся устранить с помощью специального устройства обработки звуковых сигналов, позволяющего получить бинауральный эффект при прослушивании бинауральной записи через колонки. Такие устройства получили название бифонических процессоров. Запись производится с микрофонов, расположенных в искусственной голове, а воспроизводится после обработки бифоническим процессором, в котором точно рассчитанная величина сфазированного, задержанного и скорректированного по частоте сигнала левого канала вычитается из сигнала правого канала и наоборот. Структурная схема бифонического процессора, впервые разработанного фирмой JVC, показана на рис. 4.


Рисунок 4. Блок-схема бинаурального процессора

Он состоит из усилителей сигналов левого и правого каналов А1, А2, усиливающих сигналы с микрофонов, установленных в искусственной голове А0, линий задержки D1, D2, фазовращающих устройств U1, U2 и сумматоров Е1, Е2. После обработки бифоническим процессором сигналы, приходящие из колонок в уши слушателя суммируются так, что левое ухо слышит только сигналы левого канала, а правое - правого канала. Таким образом, можно сказать, что бифонический эффект подобен бинауральному и отличается от него только способом воспроизведения бинауральной записи.

И хотя площадь, где он отчётливо проявляется, невелика, зато, находясь в её пределах, слушатель может иметь представление о расстоянии до источников звука и их взаимном расположении в пространстве в момент записи, чего не удаётся достигнуть при стереофоническом звуковоспроизведении, дающем представление только о расположении источников звука на линии между звуковыми колонками. Другое интересное свойство бифонического процессора - это возможность расширения с его помощью стереобазы обычных стереофонических записей. Именно это обычно и имеется ввиду под "3DSound". А если сиcтема позволяет увеличить мнимый угол между направлениями на звуковые колонки (Рис.1) до 180 градусов, то такую систему называют "Suround" и создаваемая звуковая панорама для неё будет такой же как при прослушивании на стереотелефоны, но без концентрации мнимых источников звука внутри головы слушателя. Конечно, бифонический процессор может быть реализован чисто программными методами с использованием методов цифровой обработки сигналов в реальном времени.

Совсем недавно можно было наблюдать, как в мир коммерческих и домашних кинотеатров пришло стереокино, а сейчас на очереди уже стоит видео сверхвысокого разрешения 4K. От изображения не отстает и звук: в домашний кинотеатр пришло 3D Audio, полное звуковое окружение зрителя — не только в горизонтальной плоскости, но и в третьем измерении. В английском языке для этого применяется термин immersive, «погружающий».

Глас божий и другие аудиоканалы

Формат Auro-3D был представлен в мае 2006 года бельгийской компанией Galaxy Studios. Первым массовым фильмом, записанным в данном формате, стала лента Red Tails («Красные хвосты»), снятая в 2012 году Джорджем Лукасом. Принципиальное отличие Auro-3D от преобладавших на тот момент форматов Dolby Surround EX и DTS заключалось в том, что кроме традиционных каналов 7.1, расположенных в одной плоскости, разработчики предложили использовать третье измерение — то есть разместить акустические системы (АС) не просто вокруг слушателя, но и сверху, вторым «слоем», под углом в 30 градусов к фронтальным акустическим системам и каналам окружающего звучания.

Дальнейшее усовершенствование формата привело к появлению еще одного «слоя» — над головами слушателей, который символично назвали voice of god («глас божий»). Максимальное количество каналов (не стоит путать с количеством акустических систем) при этом достигло 13.1, то есть фактически стало в два раза больше, чем в применяемых тогда форматах 7.1 и 6.1. Внедрение верхних каналов позволило более точно передать ряд событий в звуковой дорожке фильма, таких как пролеты объектов над зрителями (шум вертолета или реактивного истребителя), атмосферные эффекты (завывание ветра, раскаты грома).


Если потолок расположен слишком низко, акустика будет слишком близко к зрителю. В этом случае Dolby рекомендует использовать специальные акустические системы, работающие «на отражение» от потолка — по утверждению компании, результат будет более качественным.

Объектный подход

Старейший игрок на рынке кинотеатрального звука, компания Dolby Laboratories, использует в своем новом формате Dolby Atmos два «слоя» акустических систем. Первый располагается вокруг слушателя по классической схеме, а второй на потолке — попарно слева и справа. Но самое главное — принципиально новый подход к микшированию саундтреков. Вместо привычного поканального сведения в студии используется метод «объектной» записи. Режиссер работает со звуковыми файлами, указывая место в трехмерном пространстве, откуда эти звуки должны воспроизводиться, когда и с какой громкостью. К примеру, если необходимо воспроизвести шум движущейся машины, то режиссер указывает время появления, уровень громкости, траекторию движения, место и время прекращения звучания «объекта».

Более того, из студии в кинозал звук попадает не в виде записанных дорожек, а как набор звуковых файлов. Эта информация обрабатывается процессором, который в реальном времени каждый раз просчитывает саундтрек фильма с учетом количества АС в зале, их типа и расположения. Благодаря точной калибровке нет привязки к какому-то «типовому» количеству каналов, и можно использовать в разных залах разное количество АС (каждый зал калибруется и настраивается индивидуально) — процессор сам просчитает, как и куда нужно отправить звук для получения оптимальной звуковой панорамы. Максимальное количество одновременно обрабатываемых звуковых «объектов» составляет 128, а количество одновременно поддерживаемых независимых АС — до 64.


Формат Dolby Atmos не привязан к конкретному количеству аудиоканалов. Звуковая картина формируется процессором в реальном времени из «объектов» и по «программе», составленной звукорежиссером фильма. При этом процессор учитывает точное расположение акустических систем, их тип и количество — все это заранее прописывается в настройках при калибровке каждого конкретного зала. Правда, как такой подход реализовать в домашнем кинотеатре, пока не совсем понятно.

Профессионалы и любители

Вслед за появлением в коммерческих кинозалах оба формата трехмерного звука начали завоевание домашнего рынка. Auro-3D стартовал чуть раньше, несколько производителей домашней электроники представили первые процессоры и ресивер с поддержкой формата еще в начале 2014 года. Dolby Laboratories не заставила себя долго ждать, и в середине сентября прошлого года представила весьма доступные решения на базе недорогих ресиверов. Кроме того, в начале 2015 года еще один крупный игрок, американская компания DTS, анонсировала свой формат трехмерного звучания — DTS: X (о котором известно пока только то, что он, как и Dolby Atmos, является объект-но-ориентированным и будет поддержан многими производителями бытовой электроники).

Между тем, коммерческое и домашнее кино в некоторых аспектах имеют серьезные отличия. Бобины с кинопленкой ушли в далекое прошлое, и в кинопрокате в настоящее время практически повсеместно используются цифровые копии фильмов. Саундтрек к фильму «выходит» из сервера в виде потока цифрового аудио с высоким битрейтом и практически без сжатия. Серверы, на которых хранятся фильмы, могут передавать до 16 цифровых каналов таких данных параллельно.


Самый популярный носитель для домашнего кино — Blu-ray диск. Как правило, он содержит саундтрек, записанный в одном из двух самых популярных форматов — DTS HD Master Audio или Dolby True HD. Встречаются и диски, записанные с использованием старых кодеков DTS и Dolby Digital со звуком 2.1 (лево-право и LFE). Если дорожка к фильму изначально была записана в студии в формате 5.1 или 7.1, перенести ее на диск довольно просто, отличие лишь в дополнительной компрессии данных, связанной с ограниченной емкостью цифрового носителя. А как же будут адаптироваться новые форматы Auro-3D и Dolby Atmos при переносе их из профессионального кино в домашний кинозал?

Путь домой

Для Auro-3D перенос будет практически «бесшовным». Если фильм изначально записан в студии в формате 13.1 или 11.1, ровно с таким же количеством каналов он и будет переноситься на диски Blu-ray. Для обратной совместимости в Auro-3D используется специальный алгоритм, который умеет «дописывать» верхние каналы в кодек DTS HD MA, официально поддерживающий максимум 7.1 каналов — например, в левый канал инкапсулируется информация для верхнего левого канала, в центральный — для верхнего центрального и т. д. Если в ресивере или процессоре есть поддержка декодирования кодека Auro-3D, то он «вынет» вложенную информацию и подаст ее на соответствующие каналы. Если нет — просто декодирует данные как обычную дорожку 7.1, пропустив «лишнюю» информацию. Таким образом, диск с фильмом в формате Auro-3D в любом случае будет корректно прочитан любым современным плеером и распознан любым из процессоров или ресиверов, поддерживающих DTS HD MA. А если процессор или ресивер обладает встроенным декодером Auro-3D, то на выходе можно получить саундтрек из 9.1, 11.1 или даже 13.1 каналов. Существует и возможность «апмиксинга» (upmixing) — процессор, умеющий работать с Auro-3D, может пересчитать даже обычную двухканальную стереозапись, скажем, в 13.1.


В Auro-3D используется трехслойное расположение акустических систем и более традиционный подход с многоканальной записью звука. Это обеспечивает отличную обратную совместимость стандарта с текущими форматами и переносимость на домашние системы.

Ситуация с Dolby Atmos в домашнем кинотеатре намного более сложная: процессор в реальном времени обсчитывает довольно большой поток данных и выдает звук на соответствующие акустические каналы (с учетом того, сколько их в конкретной инсталляции). На текущий момент спецификациями Dolby Atmos для домашнего применения предлагается использовать конфигурации АС от 5.1.2 до 7.1.4, где первая цифра — это количество «обычных» каналов: левый-центр-правый-боковые-тылы, вторая — это канал низкочастотных эффектов, а третья — так называемые «верхние» каналы (overhead). При этом единственный процессор для коммерческого применения (Dolby CP850) стоит более миллиона рублей, а стоимость домашних ресиверов с поддержкой Atmos начинается всего от 30−40 тысяч. Тем не менее даже для самых доступных по цене домашних ресиверов заявлены и декодирование, и поддержка «апмиксинга», хотя как именно это сделано, не совсем понятно.

Еще один не очень ясный момент заключается в том, что для правильного обсчета звукового поля необходимо знать точное местоположение всех акустических систем. В коммерческом кинотеатре этот вопрос решается калибровкой аппаратуры, а вот в домашних ресиверах, насколько известно, такой возможности не предусмотрено. Как в таком случае решается вопрос о получении дома полноценного звучания Atmos «как в кино», пока неясно. Правда, формат пока еще не обрел окончательные черты. Несколько производителей процессоров премиум-класса даже отложили выпуск обновлений с поддержкой Dolby Atmos из-за изменений в алгоритме обработки сигнала, вносимых, по их словам, разработчиками Dolby. Так что можно предположить, что в последующих обновлениях Dolby может внести коррективы в процесс обработки звука и/или калибровки системы под конкретное расположение акустических систем.


Вопросы совместимости

Поскольку Auro-3D использует традиционный метод поканального сведения, а Dolby и DTS — объектно-ориентированный монтаж звука, переконвертировать один формат в другой невозможно. Кроме того, построить домашний кинотеатр, умеющий правильно работать со всеми форматами, тоже непросто. Проблема совместимости заключается в различных требованиях к установке акустических систем. В Dolby Atmos используется два «слоя» акустики, а в Auro-3D — три. Можно было бы предположить, что саундтрек Dolby Atmos может быть воспроизведен через часть АС для проигрывания Auro-3D, но вряд ли это будет корректно. Требования для расположения АС весьма жесткие у обоих форматов, а учитывая чувствительность к точному позиционированию для получения плавных переходов, это может стать проблемой для проектировщиков и инсталляторов домашних кинозалов (информации по расположению акустики DTS: X пока нет).


Перспективы

Несмотря на все неясности описания Dolby Atmos, нужно признать, что этот формат имеет больший потенциал, чем Auro-3D. Во‑первых, объектно-ориентированный подход к записи однозначно более перспективен, чем традиционный поканальный. Во вторых, поддержка Dolby Atmos в массовых моделях AV-ресиверов таких фирм, как Yamaha, Pioneer, Onkyo, Integra, Denon, доступна «в базе», в то время как лицензию на Auro3D придется покупать как опциональное программное обновление за $199, что ощутимо для бюджетных моделей.

В более дорогом сегменте процессоров для построения домашних кинозалов о поддержке всех форматов 3D Audio заявили и такие производители, как Trinnov Audio и Datasat Digital, работающие в том числе и на коммерческом кинорынке. Их опыт может весьма благотворно сказаться на реализации Dolby Atmos для домашнего кинотеатра: например, Trinnov для калибровки своих процессоров использует уникальный трехмерный микрофон, позволяющий точно определить место каждой АС в пространстве и применять эти данные для дополнительной коррекции звукового поля.

Редакция благодарит журнал avreport.ru за помощь в подготовке статьи.