The Ebook. Книга об электронных книгах
Шрифт:
Можно считать, что EPUB — это некий, более коммерческий аналог FB2, но, по сути, читателю должно быть безразлично — какой из этих форматов использовать. Главное — это доступность книг. И очень важно, чтобы формат поддерживала программа или устройство.
Форматы книг делятся на три типа: «простой», «текстовый», «графический».
Ярким представителем «простого» типа можно назвать формат TXT. Ничего кроме текста и маркера «конец строки» (раньше, когда ещё знали, что такое «пишущая машинка», говорили: «перевод каретки»). TXT может быть в одной из общепринятых кодировок. Современное представление о форматах рекомендует использование кодировки unicode (UTF8) для поддержки множества языков и совместимости между платформами.
«Текстовый» тип,
«Графический» формат проще всего представить в виде «факсимильного» издания, когда с полученным текстом ничего уже сделать нельзя, кроме как увеличить фрагмент на экране. Считайте, что каждый лист это отдельная фотография, отпечаток или лист из факса. И в данном случае неважно, содержит ли PDF текст, а не его графическое изображение единой страницей. Функция Reflow позволяет масштабировать текст, если он есть внутри файла, но в ущерб вёрстки. Если текст верстался в отдельных окнах или колонках, то ничего хорошего при Reflow не получится. Текст смешается в нечитаемое пятно. В данном случае увеличивать лучше с помощью «лупы» для изменения размера изображения всего листа, а не отдельного текста.
Основным и распространённым «обманом» при выборе устройства с множеством поддерживаемых форматов — является игнорирование разметки. В списке характеристик может быть перечислено огромное количество форматов, но не факт, что они поддерживаются на должном уровне. В данном случае существует три градации качества: полное или частичное игнорирование тегов разметки, а также наоборот, полная поддержка разметки текста. Бывает так, что в характеристиках значится формат FB2, а на экране вместо него «простой текст» без разметки. Был FB2, а стал TXT. Интерпретатор удалил теги, тем самым облегчив себе задачу по выводу текста на экран. Это наиболее распространённый способ игнорирования тегов, разница только в том, сколько и какие теги игнорируются.
Сказанное не относится к сервисным функциям устройств, они везде разные. Их может быть много, ради увеличения комфорта чтения, а может быть мало, ради использования слабого процессора или за счёт элементарной лени разработчика.
Также, не стоит путать сложный интерфейс с богатством функций и настроек. Есть устройства, которые визуально отличаются интерфейсом, но делают одно и то же. Сложный интерфейс не говорит о том, что устройство может гораздо лучше, чем устройство с простым и понятным интерфейсом. Разработчики умышленно могут создавать сложные интерфейсы, чтобы вводить в заблуждение. Проще всего определять возможности устройства с помощью подсчёта количества функций: делает ли типографскую разметку текста, можно ли изменить текстовое окно, или расстояние между строк и так далее.
При выборе устройства нужно заранее предполагать, какой текст будет читаться и из какого источника будет доставляться контент. Если файл книги подготовлен профессионалом, то для чтения художественной литературы достаточно одного из форматов: FB2 или EPUB. И неважно, какого из них. Эти форматы ничем особым не отличаются от AZW (MOBI), который используется в Kindle. Особой разницы для потребителя в форматах нет, кроме распространённости их на локальном рынке.
Для более сложно-оформленного текста, такого, как научная или техническая литература, европейским читателям лучше использовать PDF или DJVU. Не потому, что эти форматы лучше, а потому, что именно в них обычно распространяются в Интернет. Разница в том, что иностранные издательства оформляют такие книги в «текстовом» формате, а наши читатели
используют факсимильные копии, то есть, кем-то отсканированные постранично, как было в бумажном оригинале.DJVU отличается тем, что в его составе отдельные листы страниц, упакованные в единый блок. Сканируется каждая страница книги в высоком разрешении и с последующим сжатием для компактности общего размера файла. Далее, страницы собираются в едином блоке. Подобный трюк можно сделать и в формате PDF, но DJVU прижился лучше. Оглавлением, индексом и прочими особенностями графических форматов, забивать голову не стоит. В большинстве случаев — это дешёвый и быстрый вариант копии бумажной книги.
Также работает CBZ и CBR — форматы для комиксов. Каждая отдельная страница в одном из графических форматов, например JPG, именуется по правилу «трёх цифр» — 001, 002, 003, 004 и так далее. Все отсканированные файлы упаковываются архиватором ZIP или RAR. Именно последняя буква в названии формата Z или R говорит о том, каким архиватором упакованы страницы.
Из сложного «текстового» формата почти всегда можно сделать «простой текст». В истории была только одна программа — BookDesigner, которая из TXT могла интуитивно создать сложную разметку текста. Она пыталась определить название главы, окончание абзаца, преобразование в наклонный или жирный текст. Это делалось не по воле и задумке автора книги, а как бы предполагалось программой, что так может быть, раз в тексте написано: «Глава 1» или абзац начинается с нескольких звёздочек: «***» или «* * *», если со знака «*», «—» или «» и абзацы повторяются — следовательно, используется перечисление неких характеристик или условий.
Ранее были тексты, которые распространялись в модемную, доинтернетовскую эпоху. Например, фраза могла начинаться и заканчивать знаком подчёркивания «_», тогда BookDesigner интерпретировал это как наклонный текст. И так далее, если мой читатель заскучал от перечислений, и стало скучно. Добавлю только, что подобную разметку сейчас называют «Markdown».
Пропорции экрана влияют на просмотр «графических» форматов. Для «текстовых» это абсолютно неважно — как заполнить буквами поверхность электронной страницы. Обычно пропорции рассчитывались по ряду Фибоначчи, или «золотого ряда» чисел. Каждый член этого ряда равен сумме двух предыдущих: 3, 5, 8, 13, 21 и так далее. Зная, что первыми идут цифры 3 и 5, легко догадаться, что следующей будет 8. И соответственно пропорциями страницы могут быть соотношения 3:5, или 8:13. Но не стоит это путать с размерами страниц, как в полиграфии, где книги могут иметь физический размер — от сверхмалой до сверхбольшой формы издания.
Это может показаться лишним знанием, когда нельзя выбрать пропорции экрана. Практически все экраны E-Ink на 5, 6 и 9.7, а также 13,3 дюйма имеют пропорции близкие к печатному листу бумаги и они почти одинаковы. Разница только в физическом размере. Исключение составляет экран размером 7 дюймов. Подобные устройства можно пересчитать по пальцам. Раз, два и всё!
Типографика — очень важна. Она влияет на настроение и интонацию передаваемого в печатном виде текста. Форматы обязуются доносить первоначальный смысл автора до своего читателя. Им не обязательно поддерживать ударения в словах или переносы по слогам. В большинстве случаев — это поддержка на уровне буквенной разметки и относится к интерпретатору.
При выборе «подходящего» для чтения формата очень важно определить, чем можно пожертвовать. Не все программы или устройства могут корректно и точно отображать не только иллюстрации, таблицы, но и теги самого текста. Есть часть читателей, которым это и не нужно. Мало того, они не могут сравнить несколько устройств между собой, поэтому считают лучшим тот, которым уже владеют.
При выборе устройства важнее знать, что ограничение поддержки качества и количества форматов — является умышленной жертвой или обманом производителя? Во всех случаях, в списках характеристик будет «безкачественное» (анг. «Without Quality») определение «поддержки и количества форматов».