Книга: The Ebook. Книга об электронных книгах
Форматы электронных книг
Общие сведения
При выборе устройства для чтения, причём можно сказать умышленно — «неважно какого», специализированного или только адаптированного для чтения (планшет, смартфон и так далее), потребитель сталкивается с серьёзной проблемой выбора подходящего «формата книг». Это очень важная характеристика, но на самом деле — довольно простая тема. Разобраться в ней не сложно, если мой читатель понимает свои потребности и не преувеличивает значение «форматов» для этих целей. Основы таких знаний помогут разобраться с уже имеющейся стереотипной информацией и понять, что является реальностью, а что только воображением, благодаря самосозданным мифам.
Формат книг — это как заклинание. «Печатный текст» с типографской разметкой упакован внутри магической оболочки. Но это всё происходит после того, как книга написана.
При чтении в нашу голову попадает текст в виде образов или значений. Эмоции и интонации «рассказанного сюжета» создают визуальное представление. Восприятие можно усилить или ослабить. Поставить акцент на фразе или разделить текст на главы. Как бы писатель ни поступил, он хочет донести до читателя не только определённый сюжет, но и смысл каждой фразы — шёпота, крика или даже сарказма.
Электронное устройство для чтения — сундучок для книг. Для множества. Самая простая форма упаковки текста в единый блок — архивирование. Эта процедура экономит место на диске, но не вмешивается в разметку текста.
Чтобы сохранить структуру печатной книги требуется набор «тегов» в начале и конце выделенной фразы, абзаца или только одной буквы. Чтобы устройство понимало, какая фраза в тексте относится к «названию главы», этот набор слов также размечается тегами, как «кавычками» — в начале и в конце фразы.
Каждый отечественный потребитель, или почти каждый, хочет иметь устройство, которое поддерживает максимальное количество форматов. Теоретически — это ничем не подкреплено, кроме желания купить универсальное устройство. Также думает производитель, неважно в каком формате будет читать потребитель, устройство будет рассчитано на поддержку большого количества форматов и это «на всякий случай».
Зарубежный производитель электронных книг, прежде всего, продаёт контент, а устройство это инструмент для чтения, носитель информации. Поддерживаются обычно только два формата: для книг и формат PDF, как средство для чтения «частных» документов и способ для привлечения новых потребителей.
Бумажная книга печатается на отдельном листе с двух сторон, и вся получившаяся стопка брошюруется в единый блок. Понятие «страница» для электронной книги — это видимый на экране текст и не более того.
Разные производители придерживаются собственные стандарты для «нумерации» страниц. Кто-то считает текст «экранными страницами» и при изменении размера шрифта количество страниц пересчитывается устройством. Таким образом, страниц становится больше или меньше. Другой производитель может использовать универсальную форму подсчёта, например, в процентах от общего количества знаков. В данном случае изменение размера текста, который влияет на количество привычных страниц, в процентном соотношении не меняется, но найти нужную страницу крайне сложно и для этого читатель ищет текст глазами. И наконец, метод, который использовался Amazon изначально для своего устройства Kindle — это крошечный блок, стандартизированный по количеству знаков, где учитывается только количество знако-мест (в том числе пробелы и знаки препинания), а не только то, что помещается на экране. При таком подходе очень просто переходить от одного устройства к другому, читая одну и ту же книгу, введя необходимое цифровое значение на экране. Количество страниц не зависит от размера букв или текстового окна (место для текста с учётом отступов от края страницы/экрана).
Электронная страница, на самом деле — это не отдельные листы текста, а длинный рулон. Даже абзац текста — это длинная череда слов и предложений оформленная единым блоком, где в начале и конце стоят теги. Впоследствии устройство разбивает текст построчно и постранично, используя разметку. Конечный тег даёт команду на осуществление какого-либо последующего действия. Например, если интерпретатор видит «конец абзаца», то следующее действие «начало нового абзаца». В то же время, не существует тега «конец страницы», вместо него интерпретатор сам определяет, нужно ли начать новую страницу, если следующий тег «название главы».
Внутри любого формата находится структура документа. Именно незнание структуры приводит к непониманию важности и бесполезности форматов для определённых задач. Например, очень трудно прямо ответить на вопрос: «какой формат лучше, например, FB2 или EPUB»? Ответ на самом деле зависит от доступности книги в одном из этих форматов. Тот и другой формат довольно легко конвертируются. FB2 может быть преобразован в EPUB и наоборот. Если внутри файла нет специфических данных для другого формата, то преобразование происходит без потерь.
По статистике — 16 % читателей использует только формат PDF. Трудно представить, но именно такое количество читателей в какой-то промежуток времени ограничивает себя чтением специфической литературы. Статистика увеличится ещё более серьёзно, если представить, какая литература читается в этом формате. Найти журнал в формате PDF гораздо проще, чем в FB2 или EPUB. Но те, кто покупает журналы и делает это регулярно, чаще читают в узкоспециализированном формате, который даёт представление не только для графических элементов, но и может содержать скрытый текст. Подобный ZINIO формат используется для специальной программы.
Основное отличие FB2 от других форматов заключается в том, что он был изначально задуман как разметка текста и ничего более. Внешним видом текста на экране занимается программный интерпретатор.
FB2 создан на основе XML для разметки текста. Разработчик формата придумал простой ход — исследовал строение книги и воспроизвёл его в тегах. Со временем часть тегов оказалась ненужной, а другая часть, наоборот, была добавлена.
Если посмотреть книгу в формате FB2 с помощью текстового редактора, то, можно будет увидеть содержание обычного TXT файла, где абзац окружён тегами. Также — глава, название книги, формулы, таблицы и так далее.
Можно считать, что EPUB — это некий, более коммерческий аналог FB2, но, по сути, читателю должно быть безразлично — какой из этих форматов использовать. Главное — это доступность книг. И очень важно, чтобы формат поддерживала программа или устройство.
Форматы книг делятся на три типа: «простой», «текстовый», «графический».
Ярким представителем «простого» типа можно назвать формат TXT. Ничего кроме текста и маркера «конец строки» (раньше, когда ещё знали, что такое «пишущая машинка», говорили: «перевод каретки»). TXT может быть в одной из общепринятых кодировок. Современное представление о форматах рекомендует использование кодировки unicode (UTF8) для поддержки множества языков и совместимости между платформами.
«Текстовый» тип, к которым относятся FB2 и EPUB, содержит в себе не только текст, но и оформительскую разметку, графические иллюстрации, ссылки и так далее. В таких форматах выделяется жирный и наклонный текст, таблицы и стихи, сноски и заголовки. Основное преимущество — возможность масштабировать текст по размеру, изменять расстояние между строками или регулировать «текстовое поле», то есть расстояние от текста до края экрана. Можно сохранять типографику даже при разбиении страницы на несколько колонок. Лишь бы это поддерживал интерпретатор текста.
«Графический» формат проще всего представить в виде «факсимильного» издания, когда с полученным текстом ничего уже сделать нельзя, кроме как увеличить фрагмент на экране. Считайте, что каждый лист это отдельная фотография, отпечаток или лист из факса. И в данном случае неважно, содержит ли PDF текст, а не его графическое изображение единой страницей. Функция Reflow позволяет масштабировать текст, если он есть внутри файла, но в ущерб вёрстки. Если текст верстался в отдельных окнах или колонках, то ничего хорошего при Reflow не получится. Текст смешается в нечитаемое пятно. В данном случае увеличивать лучше с помощью «лупы» для изменения размера изображения всего листа, а не отдельного текста.
Основным и распространённым «обманом» при выборе устройства с множеством поддерживаемых форматов — является игнорирование разметки. В списке характеристик может быть перечислено огромное количество форматов, но не факт, что они поддерживаются на должном уровне. В данном случае существует три градации качества: полное или частичное игнорирование тегов разметки, а также наоборот, полная поддержка разметки текста. Бывает так, что в характеристиках значится формат FB2, а на экране вместо него «простой текст» без разметки. Был FB2, а стал TXT. Интерпретатор удалил теги, тем самым облегчив себе задачу по выводу текста на экран. Это наиболее распространённый способ игнорирования тегов, разница только в том, сколько и какие теги игнорируются.
Сказанное не относится к сервисным функциям устройств, они везде разные. Их может быть много, ради увеличения комфорта чтения, а может быть мало, ради использования слабого процессора или за счёт элементарной лени разработчика.
Также, не стоит путать сложный интерфейс с богатством функций и настроек. Есть устройства, которые визуально отличаются интерфейсом, но делают одно и то же. Сложный интерфейс не говорит о том, что устройство может гораздо лучше, чем устройство с простым и понятным интерфейсом. Разработчики умышленно могут создавать сложные интерфейсы, чтобы вводить в заблуждение. Проще всего определять возможности устройства с помощью подсчёта количества функций: делает ли типографскую разметку текста, можно ли изменить текстовое окно, или расстояние между строк и так далее.
При выборе устройства нужно заранее предполагать, какой текст будет читаться и из какого источника будет доставляться контент. Если файл книги подготовлен профессионалом, то для чтения художественной литературы достаточно одного из форматов: FB2 или EPUB. И неважно, какого из них. Эти форматы ничем особым не отличаются от AZW (MOBI), который используется в Kindle. Особой разницы для потребителя в форматах нет, кроме распространённости их на локальном рынке.
Для более сложно-оформленного текста, такого, как научная или техническая литература, европейским читателям лучше использовать PDF или DJVU. Не потому, что эти форматы лучше, а потому, что именно в них обычно распространяются в Интернет. Разница в том, что иностранные издательства оформляют такие книги в «текстовом» формате, а наши читатели используют факсимильные копии, то есть, кем-то отсканированные постранично, как было в бумажном оригинале.
DJVU отличается тем, что в его составе отдельные листы страниц, упакованные в единый блок. Сканируется каждая страница книги в высоком разрешении и с последующим сжатием для компактности общего размера файла. Далее, страницы собираются в едином блоке. Подобный трюк можно сделать и в формате PDF, но DJVU прижился лучше. Оглавлением, индексом и прочими особенностями графических форматов, забивать голову не стоит. В большинстве случаев — это дешёвый и быстрый вариант копии бумажной книги.
Также работает CBZ и CBR — форматы для комиксов. Каждая отдельная страница в одном из графических форматов, например JPG, именуется по правилу «трёх цифр» — 001, 002, 003, 004 и так далее. Все отсканированные файлы упаковываются архиватором ZIP или RAR. Именно последняя буква в названии формата Z или R говорит о том, каким архиватором упакованы страницы.
Из сложного «текстового» формата почти всегда можно сделать «простой текст». В истории была только одна программа — BookDesigner, которая из TXT могла интуитивно создать сложную разметку текста. Она пыталась определить название главы, окончание абзаца, преобразование в наклонный или жирный текст. Это делалось не по воле и задумке автора книги, а как бы предполагалось программой, что так может быть, раз в тексте написано: «Глава 1» или абзац начинается с нескольких звёздочек: «***» или «* * *», если со знака «*», «—» или «» и абзацы повторяются — следовательно, используется перечисление неких характеристик или условий.
Ранее были тексты, которые распространялись в модемную, доинтернетовскую эпоху. Например, фраза могла начинаться и заканчивать знаком подчёркивания «_», тогда BookDesigner интерпретировал это как наклонный текст. И так далее, если мой читатель заскучал от перечислений, и стало скучно. Добавлю только, что подобную разметку сейчас называют «Markdown».
Пропорции экрана влияют на просмотр «графических» форматов. Для «текстовых» это абсолютно неважно — как заполнить буквами поверхность электронной страницы. Обычно пропорции рассчитывались по ряду Фибоначчи, или «золотого ряда» чисел. Каждый член этого ряда равен сумме двух предыдущих: 3, 5, 8, 13, 21 и так далее. Зная, что первыми идут цифры 3 и 5, легко догадаться, что следующей будет 8. И соответственно пропорциями страницы могут быть соотношения 3:5, или 8:13. Но не стоит это путать с размерами страниц, как в полиграфии, где книги могут иметь физический размер — от сверхмалой до сверхбольшой формы издания.
Это может показаться лишним знанием, когда нельзя выбрать пропорции экрана. Практически все экраны E-Ink на 5, 6 и 9.7, а также 13,3 дюйма имеют пропорции близкие к печатному листу бумаги и они почти одинаковы. Разница только в физическом размере. Исключение составляет экран размером 7 дюймов. Подобные устройства можно пересчитать по пальцам. Раз, два и всё!
Типографика — очень важна. Она влияет на настроение и интонацию передаваемого в печатном виде текста. Форматы обязуются доносить первоначальный смысл автора до своего читателя. Им не обязательно поддерживать ударения в словах или переносы по слогам. В большинстве случаев — это поддержка на уровне буквенной разметки и относится к интерпретатору.
При выборе «подходящего» для чтения формата очень важно определить, чем можно пожертвовать. Не все программы или устройства могут корректно и точно отображать не только иллюстрации, таблицы, но и теги самого текста. Есть часть читателей, которым это и не нужно. Мало того, они не могут сравнить несколько устройств между собой, поэтому считают лучшим тот, которым уже владеют.
При выборе устройства важнее знать, что ограничение поддержки качества и количества форматов — является умышленной жертвой или обманом производителя? Во всех случаях, в списках характеристик будет «безкачественное» (анг. «Without Quality») определение «поддержки и количества форматов».
Можно задать ещё один и не последний вопрос — влияет ли выбранный для чтения формат на продолжительность автономной работы устройства?
Если не учитывать некачественные устройства, сами по себе, то ответить надо так — все зависит от того, как и что делает устройство во время чтения. Устройство может брать «чистый» формат и перестраивать его отображение для вывода на экран. Для этого необходимы ресурсы процессора.
Есть и был — другой способ, когда форматирование создавалось в компьютере, а устройство получало не структуру книги, а готовый машинный код для отображения на экране. Таким способом экономится не только время обработки формата устройством, но и можно создать значительно дешевле железную часть электронного аппарата за счёт «слабых» процессоров и программного обеспечения. Нагрузка ляжет на источник возникновения книги.
Формат действительно влияет на продолжительность работы устройства, но честно говоря, это стыдно слышать и сообщать в XXI веке.
Если пользователь устройства не обременён вопросом «как читать» и больше волнуется о том «что читать» — можно легко понять, что важнее качество, а не количество поддерживаемых форматов.
Производители могут искусственно придумать собственные форматы и вписать их в характеристики устройства. Сделать на этой основе красивую рекламу — «мировой рекорд по количеству поддерживаемых форматов»! Но будет ли читателю легче от той мысли, что любая книга, в любом формате — открывается в течение нескольких десятков секунд? Этого не происходит с бумажной книгой, и быть не должной с электронной. Достаточно просто представить время открытия бумажной книги на нужной странице и опираться на этот показатель, как на «стандарт де факто».
После полученной информации о небольшом количестве перечисленных форматов следует задать последний вопрос — годится ли устройство для планируемой задачи?
Поддержку форматов конкретным устройством можно проверить в магазине или у реальных владельцев. Можно стать тем самым «другом», который купит первое попавшееся устройство и расскажет всем о его «преимуществах». Другие, надеюсь, постараются лично убедиться в качестве отображения текста на экране, прежде чем решатся на покупку. Приходите на встречи клуба «The-eBook» во множестве мест на этой планете и поинтересуйтесь не только мнением владельцев устройств, но и сравните их эмоции со своими ощущениями. Они могут быть и будут разными.
- Популярные текстовые форматы
- Лекция 1. Доверие в сфере электронных коммуникаций
- Какие форматы звука поддерживает Flash
- Глава 7 Форматы и виды текстов
- 4.2 Редактор электронных таблиц «OpenCalc»
- Форматы для персональных документов
- Оцифровка книг
- Форматы лид-магнитов
- «Стероиды» для электронных книг
- Сохранение рабочей книги с именем, представляющим собой текущую дату
- Почему я написал эту книгу
- Настройка доступа пользователей к рабочей книге