Чтение онлайн

ЖАНРЫ

Как музыка стала свободной. Конец индустрии звукозаписи, технологический переворот и «нулевой пациент» пиратства
Шрифт:

Алгоритм сжатия, подобно сокращающемуся лучу света, мог нацеливаться на разные размеры конечного файла [8] . Сжатые вполовину, файлы звучали пристойно. В четверть — ок, нормально. В марте 1988 года Бранденбург «изолировал» запись соло фортепиано, а потом запрограммировал такой большой коэффициент сжатия, на который только мог решиться: то есть вот этот безумный 1/12 от CD, придуманный Зайтцером. Файл получился полным ошибок. Бранденбург потом говорил, что пианист звучал «как пьяный». Но, несмотря на это, такой вот опыт непростого прослушивания придал ему уверенности — он впервые понял, как можно достичь цели, поставленной Зайтцером.

8

Алгоритм Бранденбурга с технической точки зрения работал так: он повторял операцию с источником аудио много раз до тех пор, пока не достигался нужный битрейт. Каждое повторение упрощало информацию, то есть для записи использовалось меньше битов. Для создания mp3 на 128 kbps требовалось больше подходов, чем для 256 kbps, поэтому его качество всегда будет ниже.

С развитием мощностей

процессоров, дело пошло быстрее. Год алгоритм Бранденбурга применяли к широкому спектру записанной музыки. Вехой для команды стала «Увертюра 1812 года» Чайковского, следующей — Трейси Чапман, а потом ещё одной — песня Глории Эстефан (Грилл был двинут на «латино»). В конце 1988 года команда совершила первую сделку: доставила mp3-кодировщик первому в истории пользователю mp3 — крошечной миссионерской радиостанции на далёком марианском острове Сайпан.

Однако, один вид аудиозаписей всё ещё не поддавался хорошей оцифровке — то, что Грилл, не слишком хорошо знавший английский, называл «одиноким голосом», имея в виду, конечно, один голос без аккомпанемента. Изолированную человеческую речь невозможно было психоакустически замаскировать. Хаффмановский принцип распознавания тоже не годился, потому что в человеческой речи главное — динамика: взрывные звуки, шипящие, сильный приступ. Алгоритм сжатия Бранденбурга справлялся с симфониями, гитарными соло, артиллерийским орудием, даже с «Оуе mi canto», а с выпуском новостей — всё ещё нет.

Зашедший в тупик Бранденбург начал изолировать сэмплы «одиноких» голосов. Первый — запись трудных диалектов немецкого языка, которые морочили голову инженерам годами. Второй — кусочек вокала Сьюзен Веги, первые такты хита «Tom's Diner». Песню часто играли по радио, так что вы, наверное, помните акапелльное вступление к нему:

Тут-ту-туу-ду

Тут-ту-туу-ду

Тут-ту-туу-ду

Тут-ту-туу-ду.

У Веги очень красивый голос, но в оцифрованном виде он поначалу звучал так, как будто крысы грызут плёнку.

В 1989 году Бранденбург защитил диссертацию, став «доктором философии». Потом он, захватив свои голосовые сэмплы, отправился на работу в лаборатории Белла AT&T в Мюррей-Хилл (штат Нью-Джерси). Там он работал с Джеймсом Джонстоном, специалистом по кодированию голоса. Джонстон и Бранденбург оказались как Ньютон и Лейбниц [9] — независимо друг от друга и практически одновременно они оба нашли одинаковый математический подход к моделированию психоакустики.

9

Подобно Ньютону, Джонстон заявлял, что первым нашёл этот путь, и довольно резковато и упрямо рассказывал о публичной презентации, которую он провёл в 1984 году в Торонто, на которой представил концепцию бесконечного кодирования, предвосхитившую идею Бранденбурга примерно на два года. Но AT&T не осознало ценности его исследований, а Бранденбург подал заявку на патент первым.

Какое-то время они пытались «метить территорию», но потом всё-таки решили объединить усилия. Весь 1989 год в Эрлангене и Мюррей-Хилл параллельно проходили тестовые прослушивания, но американские «кролики» оказались менее терпеливыми, чем немецкие. Прослушав тот крысами обгрызенный четырёхсекундный сэмпл «Tom's Diner» несколько сот раз, добровольные участники эксперимента взбунтовались, и Бранденбургу пришлось прервать эксперимент. Тут, в Нью-Джерси, он слушал Сьюзен Вегу, а в Берлине в это самое время рухнула Стена.

Джонстона Бранденбург впечатлил. Он всю жизнь общался с учёными-исследователями, привык к блистательным умникам, но до Бранденбурга он не встречал никого, кто работал бы с такой самоотдачей.

Объединившись, они достигли очень серьёзных результатов, таких, что вскоре жрущие плёнку крысы исчезли.

В начале 1990 года Бранденбург вернулся в Германию с почти что готовым продуктом. Многие сжатые сэмплы теперь показывали практически идеальную «прозрачность»: даже такие разборчивые и придирчивые слушатели, как Грилл, на высококлассной аппаратуре не отличали звучание этих файлов от звучания компакт-дисков. Результат впечатлил AT&T: они признали технологию своей и выделили крошечный бюджет. Французский концерн бытовой техники Thomson также начал выделять средства и обеспечивать техническую поддержку. Обе компании стали искать в психоакустике свою поляну, поскольку эта академическая дисциплина, на которую так долго никто не обращал никакого внимания, вдруг стала очень актуальной. Над одной и той же проблемой работали группы исследователей из Европы, Японии и США, и другие крупные корпорации уже также искали там своё место. Многие употребили своё влияние на поддержку самых сильных конкурентов Фраунгофера. Тут функции посредника решил взять на себя MPEG (Moving Picture Experts Group — Экспертная группа по движущемуся изображению), а это такой комитет стандартизации, который и по сей день решает, какой технологии быть на потребительском рынке [10] — и провёл в июне 1990 года в Стокгольме формализованный конкурс тестовых прослушиваний с целью выбрать лучшую из конкурирующих разработок.

10

Возможно, что MPEG — один из самых странных комитетов по стандартизации на свете. То, что он так долго существует, зависит от работы только одного человека — эксцентричного итальянского инженера по имени Леонардо Кьярильони. Хотя за последние 25 лет он посвятил 10 000 часов времени своей жизни управлению комитетом, Кьярильони никаких денег не требует — ни за патенты, ни за свою работу. Свою мотивацию он описывает в каких-то метафизических терминах: «MPEG — это мост, соединяющий человеческое существо с остальным миром».

В начале 90-х MPEG готовилась к десятилетию раздора, определяя технологические стандарты ближайшего будущего вроде телевидения высокой чёткости и цифровых видеодисков. Поскольку в Группу входили эксперты в области кино, то

она поначалу обращала внимание только на качество видео. Лишь позже они поняли, что со звуком тоже надо что-то решать — после того, как Бранденбург заметил, что время немого кино давно миновало (он, кстати, именно в таком духе шутил всё время.)

Одобрение MPEG гарантировало поток лицензионных отчислений, но Бранденбург понимал, что добиться его будет трудно. Для стокгольмского теста-соревнования [11] отобрали десять аудио-примеров: некое соло Орнетта Коулмена, песню Трейси Чапман «Fast Саг», некое соло на трубе, глокеншпиль, запись фейерверка, два отдельных соло баса, десятисекундный сэмпл кастаньет, кусочек выпуска новостей и «Tom's Diner» Сьюзен Веги (последнее предложил Фраунгофер). Судили нейтральные участники, выбранные из шведских студентов последних курсов. Комитет склонялся к молодёжи потому, что требовались неиспорченные уши, которые ещё слышат высокие частоты.

11

Техническое описание формата и результатов стокгольмского теста можно найти в «MPEG/ Audio Subjective Assessments Test Report», International Organization for Standardization, 1990.

В тестах MPEG участвовало 14 разных групп — вариант школьной «научной ярмарки», но с высокими ставками. Накануне соревнования конкурирующие группы провели неформальные показы. Бранденбург был уверен, что победит его группа. Ему казалось, что цвикеровское исследование-веха, всё еще не переведённое с немецкого, дало ему колоссальную фору.

На следующий день зал, полный светлоголовых скандинавских созданий с прекрасными девственными ушами, слушал 14 разных способов «рипа» песни «Fast Саг». Качество звука слушатели оценивали по пятибалльной шкале. MPEG свела результаты в таблицу — вышла ничья. На финише — Франугофер и конкурирующая фирма под названием MUSICAM. все остальные — далеко в хвосте. Столь сильный результат Фраунгофера стал полной неожиданностью: они считались тёмной лошадкой, эдакая группка вчерашних студентов, ввязавшихся в поединок с известными корпорациями. Типичный победитель этого состязания — как раз MUSICAM, хорошо финансируемый консорциум исследователей четырёх европейских университетов, к тому же крепко связанный с нидерландской корпорацией Philips, запатентовавшей компакт-диск. В штате у MUSICAM также было несколько исследователей из Германии, и Бранденбург начал подозревать, что тут не простое совпадение: они ведь тоже могли прочесть работу Цвикера на немецком. Ничью в соревновании MPEG никак не ожидала и ничего не предприняла, чтобы её не было. Метод Фраунгофера давал лучшее качество аудио при меньшем количестве данных, зато изобретение MUSICAM требовало меньших мощностей для обработки данных. Бранденбург почувствовал, что сила на его стороне — поскольку скорость обработки данных росла с каждым новым поколением чипов: она удваивалась примерно каждые два года или вроде того. А вот улучшить полосу пропускания гораздо сложнее — для этого надо перерыть все улицы города и поменять тысячи километров кабеля.

Бранденбург считал, что MPEG именно на это должна обратить внимание и сохранить пропускную способность, а не циклы обработки, и он всё повторял этот довод Группе, хотя чувствовал, что на его слова почти не обращают внимания.

После Стокгольма команда ждала решения MPEG несколько месяцев. В октябре 1990 года Германия объединилась, а Грилл занялся применением алгоритма Бранденбурга к своей новой любимейшей песне — «Wind of Change» группы Scorpions. В ноябре Эберхард Цвикер, исследователь аудио и фанат настольного тенниса, в возрасте 66 лет ушел в мир иной. В январе 1991 года команда Франугофера выдала свой первый коммерческий продукт — 25-фунтовое устройство для вещания. Первый покупатель — автобусные стоянки объединённого Берлина. Наконец, MPEG предложила Фраунгоферу компромисс: Группа ожидает большое количество заказов, а команду Фраунгофера включат в пул исполнителей, но для этого они должны сначала согласиться на некоторые правила, установленные MUSICAM [12] .

12

В добавок, к сделке с MPEG Фраунгофер сделал некоторые инженерные уступки, чтобы порадовать Thomson и AT&T. Окончательное технологическое решение соединяло различное сэмплирование звука с методами сжатия, и соединяло их как будто скотчем, только компьютерным. Сварливый и несдержанный на язык Джеймс Джонстон поклялся не ругаться матом, поэтому описал mp3 как «Гибрид. Ну. или вот это слово, которым называют незаконнорожденного».

Конкретно, команда должна принять её технологию абсолютно муторного «фильтр-банка полифазной квадратуры». Трудно придумать более уродские четыре слова. Конечно, нужен был некий фильтр, расщепляющий звук на частоты, подобно тому, что делает призма со светом, но у команды Фраунгофера уже был свой, и работал он очень хорошо. Если добавить ещё один, то алгоритм усложнится, а качество звука никак не улучшится. Но, что гораздо хуже, Philips владела патентом на код, и это означало, что придётся отдать экономическую составляющую фраунгоферовского проекта главным конкурентам. После длительных жарких внутренних споров Бранденбург пошёл на этот компромисс — он просто не видел никакого будущего без поддержки MPEG. Но все остальные члены команды почувствовали, что с них содрали три шкуры.

В апреле 1991 года MPEG опубликовала результаты конкурса. Из 14 методов выбрали только три. Первый назвали Moving Picture Experts Group аудиослой-1 (метод сжатия для цифровых кассет, которые устарели уже к моменту рассылки пресс-релиза). Далее, MPEG огласила остальные методы, избрав принцип названия, который могла придумать лишь группа инженеров: MPEG аудиослой-2, более известный как mp2 (от MUSICAM) и бранденбурговский, названный MPEG аудиослой-3, сегодня известный как mp3 [13] .

13

Термин mp3 не имел широкого применения до появления операционной системы Windows 95. До неё, после оглашения результатов MPEG, mp3 называли Layer 3. Для простоты я буду везде использовать термин mp3, хотя это и не точно.

Поделиться с друзьями: