100 великих достижений в мире техники
Шрифт:
В отношении электронных книг тоже легко построить «теорию заговора». Простой факт: прототип электронной бумаги SmartPaper появился в исследовательской лаборатории Xerox PARC почти 30 лет назад. Но тогда же его и положили в долгий ящик. Автору идеи Николасу Шеридону понадобилось более 20 лет, чтобы, основав собственную фирму Gyricon Media, довести идею до реального продукта.
Но даже если книгоиздательская индустрия до сих пор не тормозила развитие электронной бумаги, она будет это делать в ближайшие годы. Хотя бы вот каким образом. В 2001 году в продаже появились первые «одноразовые книги». Электронный роман Агаты Кристи «И после не осталось никого» издательства RosettaBooks можно читать
Кроме того, электронные носители позволяют автору через Интернет обратиться непосредственно к читателю, минуя книгоиздателей. Именно так, например, поступил всем известный писатель-фантаст Стивен Кинг. В 2000 году он начал публиковать на своем сайте свой роман «Росток», призывая читателей платить по доллару за каждую скачанную главу. Несмотря на то что, по мнению писателя, эксперимент окончился неудачно – после публикации 5-й главы только половина читателей продолжала платить, – Кинг на самом деле получил около полумиллиона долларов чистой прибыли. Далеко не каждая книга в обычном издании приносит такой гонорар…
Оцифрованная эра. Тем не менее одна серьезная проблема превращения всех книг в электронные все же существует. Ведь долгое время книги печаталась на бумаге, писались на пергаменте. И на деле оказалось не так-то просто превратить содержимое ветхого фолианта, впитавшего запахи веков, в микрочип красивой флешки, переписать книгу на диск.
Трудности начинаются уже со сканирования. Нынешние технологии оцифровки книг можно сравнить с печатным станком Гутенберга – медленный и очень трудоемкий процесс.
В мире же сегодня около 600 тыс. библиотек, в которых хранится более 20 млрд экземпляров книг; а ведь есть еще и периодика (не менее 10 млрд экземпляров).
К счастью, современные книги, журналы и газеты уже набраны на компьютерах, имеют электронные копии. Но как быть с миллиардами старых? Современные темпы оцифровки явно невысоки. Например, за 8 лет работы программы поиска книг Google Book Search удалось создать электронную библиотеку из 10 млн книг. Причем часто коммерческие компании больше заинтересованы в электронном издании разрекламированных новинок и не хотят тратиться на классику.
Стало быть, нужна новая уникальная техника. И она создается. Прототип ультрабыстрого сканера, способный оцифровать книгу за минуту, намерены создать в течение двух лет сотрудники Токийского университета. Причем камера, которая делает до 500 фотографий в секунду, что позволяет оцифровывать 170 страниц за 60 секунд, уже имеется. Созданы и инфракрасные датчики, которые работают в трех измерениях и корректируют искажения, вызванные изгибом переворачиваемых страниц. В настоящее время японские инженеры заняты разработкой надежного робота, который мог бы быстро переворачивать страницы, не повреждая их. Пока это приходится делать вручную.
Но и это еще не все…
Не только скопировать, но и расшифровать. С помощью качественной цифровой камеры довольно просто получить оригинал страницы любого фолианта. Однако в большинстве случаев он воспринимается компьютером как своего рода картинка. Чтобы работать с текстом – анализировать, выделять фрагменты, редактировать и т. д., – необходимо перевести «картинки» в текстовый формат. И здесь начинаются главные проблемы.
Старые книги изобилуют декоративными элементами, щедро украшены вязью и стилизованными буквицами. Устаревшие шрифты, которые использовались печатниками пару столетий назад,
давно не применяются в современной полиграфии, а некоторые символы вообще исчезли из современных алфавитов. Потому стандартные «распознавалки» с такими текстами не работают.Кроме того, со временем бумага желтеет, темнеет, а текст выцветает так, что местами становится почти неразличим. Вот почему в течение последних лет в мире реализуются специальные проекты оцифровки старинных книг.
Один из самых масштабных – МЕТА – был задуман и осуществлен странами ЕС. Причем его главная идея такова: надо не раскидывать деньги между библиотеками для покупки сканирующей техники, а финансировать прежде всего разработку системы компьютерных программ для распознавания любых европейских текстов, напечатанных в XVI–XIX веках.
Главным инструментом тут стало программное обеспечение оптического распознавания, разработанное российской компанией ABBYY. На этом, кстати, участие России в данном масштабном проекте завершилось, потому что ориентирован проект был на тексты, напечатанные с помощью популярных в тот период шрифтов Fraktur, Schwabacher, a также другой ломаной «готики».
«Чтобы качественно распознавать любые тексты, не только старые, компьютеру мало уметь узнавать символы алфавита. Нужно обладать знаниями о морфологии языка, структуре слов, – рассказывает генеральный директор ABBYY Россия Григорий Липич. – Это необходимо и для исправления опечаток, встречающихся в текстах, и для уточнения архаичных выражений… А для этого опять-таки нужны исследования по морфологии старинных языков…»
Так у разработчиков из ABBYY появились партнеры – российские лингвисты из новосибирской компании ATAPY Software, которые создали специальные языковые модели для распознавания старых европейских языков. Они проанализировали 10 словарей и более 100 книг, изданных в периоде с 1750 по 1930 год, и загрузили в систему распознавания 159 новых грамматических моделей, не использующихся в современных европейских языках. В итоге на странице текста из 1856 символов средневековой печатной «готики» оказались не распознаны всего четыре. Иными словами, вероятность распознавания достигает 99,8 %!
Понятно, что за качество приходится платить. По оценкам Григория Липича, обработка 25 тыс. страниц стоит около 75 тыс. рублей. По мировым меркам вполне приемлемо. Тем более что программа способна помочь также экспертам, криминалистам, краеведам…
Связь на «сотах»
Телефон, точнее – его потомок, ныне часто именуемый мобильником, похоже, грозит перевернуть весь уклад нашей жизни. Ведь если еще лет семь – восемь тому назад человек, разговаривающий на улице по сотовому радиотелефону, вызывал жгучее любопытство, то сегодня все привыкли, многие сами имеют подобные штучки. А что будет завтра?
Истории свойственно повторяться? Впервые в мире слова по телефону, как известно, произнес 10 марта 1876 года американец Александер Белл. Однако сама по себе идея передачи звуков на расстояние была придумана не им, а вице-инспектором Парижского телеграфа Шарлем Бурселем. Случилось это еще в 1854 году.
После этого многие изобретатели пытались осуществить идею на практике. Так, например, немецкий учитель физики Иоганн Рейс 26 октября 1861 года продемонстрировал на заседании Физического общества в Франкфурте-на-Майне прибор, названный им «телефоном», что в переводе с латыни означает «далеко слышу». Однако, несмотря на название, расстояние, на которое был передан звук, составило всего лишь 100 м. Поэтому аппарат был воспринят как любопытная техническая игрушка. И заслуга Белла в том, что он из игрушки сделал действительно полезную вещь.