300 лучших программ на все случаи жизни
Шрифт:
Все эти операции в большинстве программ OCR могут выполняться как в автоматическом, с помощью программы-мастера, так и в ручном режиме, по отдельности.
С двумя первыми и последней операциями справится любая программа распознавания. А вот весь процесс целиком по зубам, увы, только нескольким продуктам, разработанным в нашей стране. Хотя в теории с русским текстом должны справляться еще несколько западных «распознавалок», качество их работы не может сравниться с CuneiForm от фирмы Cognitive и FineReader от ABBYY Software.
Обе программы вы можете приобрести отдельно или получить бесплатно вместе с купленным вами сканером. В частности, известная во всем мире компания HewlettPackard (на долю которой приходится значительная часть
FineReader
Сайт: http://www.abbyy.com
Размер: 35 140 Мб (Поставляется на CD)
Статус: Commercial
Цена: $130 (Professional), $260 (Corporate)
Именно эту программу чаще всего поминают, когда речь заходит о системах распознавания. И вполне заслуженно – компания ABBYY ( смогла не просто создать удобный для пользователя и качественный продукт, но и, самое главное, удачно «раскрутить» его, обеспечив «Файнридеру» пламенную любовь всей компьютерной прессы. Одно это, согласитесь, многого стоит.
Другим удачным ходом разработчиков FineReader стало внедрение в продукт массы дополнительных функций, которые простому пользователю, возможно, и без надобности, но зато производят впечатление на определенные группы покупателей. Так, одним из козырей FineReader является поддержка неимоверного количества языков распознавания – почти 200, в числе которых вы найдете экзотические и древние языки, и даже популярные языки программирования (Basic, С/C++, COBOL, Fortran, Java, Pascal)! Так что FineReader сможет без запинки справиться с древнегреческим свитком или с бледными распечатками исходных текстов программ, сделанных вашими предками лет 30 назад.
Как ни странно, большинство пользователей на деле интересуются совсем другим. Офисных работников интересует распознавание типовых форм документов, студентов – возможность быстро «передрать» для реферата многостраничный текст из учебника, сканируя и распознавая книжный разворот целиком, бухгалтеров – возможность автоматического распознавания таблиц и документов на бланках. Все это и многое другое FineReader умеет... или не все, а только частично, в зависимости от модификации продукта. Далеко не все возможности из нашего перечня включены в самую простую модификацию программы, которую вы можете получить бесплатно вместе со сканером. Пакетное сканирование, грамотная обработка таблиц и изображений – для всего этого стоит приобрести профессиональную версию программы – FineReader Pro. Заодно она умеет безукоризненно читать штрихкоды, позволяет добавлять в базу данных новые языки. А самая мощная (и дорогостоящая) версия – FineReader Corporate без труда справится и с распознаванием любых бланков и форм! Эта версия отличается также поддержкой сетевого режима, возможностью удаленного администрирования и рядом других возможностей.
После завершения распознавания страницы FineReader предложит пользователю выбор: сканировать и распознавать дальше (для многостраничного документа) или сохранить полученный текст в одном из множества популярных форматов – от документов Microsoft Office до HTML или PDF. Можно, впрочем, сразу же перебросить документ в Word или Excel, и уже там исправить все огрехи распознавания (без них обойтись просто невозможно). При этом FineReader полностью сохраняет все особенности форматирования документов и его графическое оформление.
Электронные архивы и системы поиска
Документы, как известно, имеют премерзкое свойство накапливаться. И чем больше документов, тем труднее в их залежах найти нужный. Электронные документы здесь не слишком отличаются от бумажных. Проблема места для хранения, правда, стоит в этом случае не столь остро. Но проблема поиска остается.
На вашем диске хранятся сотни и даже тысячи текстовых документов, страниц Интернета, электронных таблиц, графических и даже звуковых файлов. Попробуйте-ка быстро
отыскать среди этой горы информации нужный документ – особенно если вы слабо представляете себе, где он лежит и как называется.Выход один воспользоваться поиском, благо в Windows есть собственная искалка, которая (теоретически) может отыскать любой файл по нескольким ключевым словам. Однако стандартный механизм индексации и поиска в Windows изначально работает «спустя рукава», и на быстрый (и главное – успешный) поиск рассчитывать не приходится. Выход Windows Vista должен, как ожидается, исправить положение, ведь в эту операционную систему изначально включена мощная система индексации. Но владельцам Windows XP не стоит унывать, благо существует добрый десяток программ, которые способны решить проблему поиска без перехода на новую ОС.
Еще пару лет назад программы «локального поиска» были в страшном дефиците – несмотря на то, что время от времени появлялись удачные разработки («Следопыт», ЕВФРАТ), они либо быстро сходили со сцены, либо полностью переключались на корпоративный рынок. Единственной поисковой программой, способной корректно работать с русскоязычными текстами, оставалась Ищейка – именно эта программа и была описана в предыдущих изданиях нашей Энциклопедии.
Но время не стоит на месте – за последние два года на свет появилось несколько новых программ, существенно превосходящих Ищейку, как в скорости индексирования, так и по удобству работы.
Яндекс. Персональный поиск
Сайт: http://desktop.yandex.ru
Размер: 5 Мб
Статус: Freeware
Эта программа создана лучшим русскоязычным поисковиком – Yandex.Ru. Правда, ищет она не в Сети, а на вашем собственном компьютере.
Загрузить и установить программу вы можете прямо со странички Яндекса, нажав одну-единственную кнопку. После установки программа пропишет своей значок (в виде бордовой буквы Я) в системной области-трее и начнет довольно долгую и кропотливую работу по индексации вашего жесткого диска. Эта операция может занять несколько часов, причем в течение этого процесса вы можете продолжать работу с другими программами. Заметим, что в отличие от других программ никаких «зон поиска» вам создавать не нужно – программа сама проверит все жесткие диски и папки. Впрочем, позднее вы можете легко ограничить круг ее интересов, щелкнув по значку искалки в трее левой кнопкой мышки и выбрав меню Настроить... Радует и то, что все новые документы программа индексирует автоматически.
Поддерживается индексация большинства видов документов (в форматах DOC, XLS, PPT, SWF, PDF, CHM, RTF, HTML, DjVU и TXT). Кроме этого, индексируются файлы в архивах (RAR), базы вашей почтовой программы (Outlook Express, Outlook, The Bat и Thunderbird), коллекция MP3 и OGG файлов – ведь в них тоже есть текстовые поля-тэги! Дело это не быстрое: на индексацию жесткого диска может уйти несколько часов (хотя и происходит она в фоновом режиме и для пользователя практически незаметна). Однако после этого вы можете найти любой документ в мгновение ока – достаточно щелкнуть по значку программы в «трее» (нижнем правом углу рабочего стола) и ввести нужное слово или фразу в поисковую строчку – она откроется в окне вашего браузера. Найденные результаты можно отсортировать как по типу документов (письма, документы, музыка), так и по времени создания. Кстати, подобно своему «старшему брату» Персональный поиск умеет работать со словоформами и поддерживает язык запросов!
Щелкнув по букве Я в нижнем правом углу экрана вы выведете на экран поисковое окно. И с удивлением обнаружите, что поиск на вашем компьютере пратически ничем не отличается от поиска в Сети! С «ищейкой» вы будете общаться с помощью обычного браузера никаких тебе навороченных окон, ни хитрых настроек... К тому же вы можете использовать «яндексовский» язык запросов и сортировку найденных документов по релевантности и дате создания (об этом мы еще поговорим в разделе, посвященном поиску в Интернете). Кроме того, программа самостоятельно отсортирует список результатов по типу документа – письма будут лежать отдельно, от текстов и музыки.