Чтение онлайн

ЖАНРЫ

Журнал «Компьютерра» №43 от 22 ноября 2005 года
Шрифт:

Вернемся, однако, к приятному и светлому. На прошлой неделе мы остановились на языке запросов, реализованном в «Архивариусе 3000». Язык этот отстает от Cros по одной-единственной позиции: поиску в интервале слов (рис. 1).

Изображенное на рисунке выражение позволяет найти контекст, в котором слова «голубятня» и «корова» находятся друг от друга на расстоянии, не превышающем трех слов. Не спешите отмахиваться: за внешней экзотичностью этого запроса скрывается мощнейший инструмент датамайнинга, который только и позволяет проводить контекстные изыскания. Пример из личного опыта: в эссе «Запах несвежего чизбургера» я рассказывал читателям «Бизнес-журнала» о скрытых механизмах, позволивших американским автомобильным империям порвать на гербарий (© «Голубятня») корейскую Daewoo. По вполне понятным причинам во время подготовки материалов голова моя совершенно съехала от корейских имен -

Чунг Джу Йанг, Ли Бьонг Чул, Ку Ин Вэй, Ким У Чун … Как вы догадываетесь, связать эти кракозябры с реальными лицами и обстоятельствами не представлялось ни малейшей возможности, поэтому, взяв перо в руки, был не в состоянии вспомнить ни единого факта: где родился Ким У Чун? Какой чаебол возглавлял Чун Джу Йан? Спасательный круг бросил именно «поиск в интервале слов», реализованный в Cros: «Kim Woo Chung, born: 3», «Chung Ju Yung, found*:4». Обратите внимание: если бы я оформил вопрос банальным рабоче-крестьянским способом («Kim Woo Chung AND born»), то получил бы в ответ список документов, в которых встречаются ОБА слова. Конечно, рано или поздно нужный контекст удалось бы отыскать и при таком запросе, однако затраты времени оказались бы несоизмеримы.

В текущей версии «Архивариуса 3000» реализованы все джентльменские операторы запросов: "+" для обязательного присутствия слова в документе, "-" для его обязательного отсутствия, "~" для возможного, но необязательного присутствия слова, "*" для замены любых букв в искомом слове, "?" для замены одной буквы в слове. Есть и первое приближение к поиску в интервале слов - оператор «[]», осуществляющий поиск в фиксированном диапазоне из десяти слов. Иными словами, запрос в «Архивариусе» [Kim Woo Chung born] аналогичен кросовскому «Kim Woo Chung, born: 10».

Интерфейс поиска в «Архивариусе» вполне веселенький и комильфо (рис. 2).

При желании можно заняться тонкой настройкой поиска, определив дату изменения файла, его имя, параметры почтового сообщения (на случай, если поиск ведется по индексу электронных писем), обозначить язык контекста, кодировку, тип и т. д. (рис. 3).

Очень удачен, на мой взгляд, Мастер поиска, практически гарантирующий программе коммерческий успех в Пиндустане (рис. 4).

Шутки шутками, но с помощью Мастера поиска и в самом деле можно детализировать запросы с высокой эффективностью.

Впрочем, в Cros эта же функция реализована хоть и менее наглядно (в типичном user-unfriendly-ключе), однако более гибко (рис. 5).

Наконец, окно результатов поиска в «Архивариусе» радует выразительностью и осмысленностью (рис. 6).

Многоцветная подсветка, безусловно, добавляет наглядности, однако мне лично не хватает дополнительного окна для заметок пользователя - очень ценная фича датамайнинга, реализованная в Cros. В любом случае, абсолютно уверен, что все эти мелкие недоделы Евгений Троицкий наверстает уже в ближайших релизах. Помните, как неделю назад я восхищался скоростью, с которой развивается «Архивариус»? Причем развивается не по мелочам, а глобально. Так вот, за истекший короткий срок появился очередной релиз программы, устраняющий фундаментальное ограничение размера индекса в 1,5 гигабайта. Для получения результата Евгению потребовалось полностью пересмотреть весь формат индексных баз. И ничего - всё пересмотрел, всё изменил. Полагаю, «поиск в интервале слов» и окно для заметок - фичи гораздо более простые. Так что буду внимательно следить за дальнейшим развитием «Архивариуса 3000» и сразу же информировать читателей обо всех достойных нововведениях.

Линки, помянутые в «Голубятне», вы найдете на домашней странице internettrading.net/guru.

АНАЛИЗЫ:Информационные технологии и космос

Музы математики Эллада не знала - геометрией по совместительству ведала министр астрономии Урания. Во время научной революции Нового времени космические исследования и наука о счете тоже были неразрывны. Первую попытку запуска искусственного спутника - из пушки короля Луи XIV вертикально в небо - предпринял аббат Мерсенн (Mersenne, 1588-1648), который сыграл выдающуюся роль в организации науки, написал классические работы по теории чисел и придумал термин «баллистика». Конечно, стрельба в небо была наивной, но вычислять орбиты стало возможным лишь после работ Исаака Ньютона, а баллистический маятник, дающий возможность определять дульную скорость, был изобретен Робинсом только в 1742 году.

В середине ХХ века, после первых прорывов конца 1950 - начала 1960-х годов, космические

технологии вышли на довольно стабильное плато. А информационная отрасль рванула вперед такими темпами, что превратилась в фактор, определяющий развитие отрасли космической.

Величайший успехи крупнейший провал

Рождались технологии по-разному. Одни - на многомиллиардные правительственные контракты. Другие - на немногие тысячи долларов, отложенные с зарплаты. Одни - в высоченных цехах размером со стадион. Другие - в фанерных гаражиках. Национальные герои США 1980-х - корабли Space Shuttle и персональные компьютеры. Засекреченные аристократы военного и общедоступные плебеи бытового назначения. Величайший успех и крупнейший провал. Но успеха достигли отнюдь не двухтысячетонные гиганты, казалось, являвшиеся символом величия нации. Новую отрасль экономики - информационную, превратившую Соединенные Штаты в лидера глобального мироустройства, создали настольные крошки. Почему? Неужели дело в случайностях, приведших к крупнейшим катастрофам в истории освоения космоса - Challenger в 1986 году и Columbia - в 2003-м? Нет, дело, скорее всего, в непреложных законах экономики, распространяющих свою тираническую власть и на небесные выси, и на глубины овеществленной в компьютерах мысли.

Итак, начало 70-х. Успех программы Apollo-Saturn делает США безоговорочным лидером в космическом противостоянии с СССР. На орбиту с помощью носителя Saturn-V выводится обитаемая космическая лаборатория Skylab. Но дальше все уперлось в деньги. Слишком дорога стала транспортировка грузов на орбиту. Даже для американской экономики. Ведь шла война во Вьетнаме; продолжалась гонка вооружений с Советским Союзом, находившимся в зените геополитического могущества. И орбитальные экспедиции на Skylab с использованием дорогостоящих носителей Saturn-IB и кораблей Apollo оказываются вашингтонскому бюджету не по карману. Skylab забрасывается после трех экспедиций и шесть лет крутится вокруг планеты необитаемая.

Предвидя трудности, NASA еще в 1969 году заключает с четырьмя подрядчиками контракт на предпроектные исследования по ILRV - Integrated Launch and Reentry Vehicle (интегрированный аппарат для запуска и возвращения). Ключевое слово тут - «интегрированный», по образу и подобию интегральных схем, уже доказавших свою эффективность. Цель - добиться эффективности путем унификации, пусть даже конструктивно устройство и будет избыточным. Не огорчает же нас, что в матричном синтезаторе частоты радиоприемника, построенном на микропроцессоре, большая часть элементов не используется. Все равно он компактнее и надежнее гетеродина архаичных аналоговых аппаратов, построенного на одном активном и десятке пассивных элементов. Попробуем провернуть такой же трюк и в астронавтике. Пусть один аппарат и выводит на орбиту грузы, и возит пассажиров, и служит платформой для научных исследований и ремонта спутников. При этом пусть будет многоразовым (во всех своих элементах!) и вместительным - вот подлинная дорога человечества в космос!!!

Такие соображения и легли в основу программы американского многоразового космического аппарата. Стоимость орбитального рейса - вывод 29,5 т на орбиту высотой 180 км - была в 1971 году оценена в 5 млн. долларов. Но затраты на всю программу исчислялись уже десятью миллиардами в тогдашних ценах, с двухмиллиардным максимумом расходов в 1976-м и первым пуском в 1978 году.

Таких расходов не потянули даже Соединенные Штаты. Для снижения стоимости (ну очень хотелось уложиться в 4,5 гигабакса, тратя не больше миллиарда в год) пошли на компромисс - ввели в конструкцию будущего челнока одноразовые элементы - хорошо всем известный топливный бак. Расчетная стоимость пуска при этом возросла до 10-12 млн. долларов. Но это не пугало - близились выборы 1972 года, Никсону хотелось остаться в Овальном кабинете еще на один срок. И контракт в 2,6 млрд. долларов получила Rockwell International. Десятки тысяч новых рабочих мест способствовали переизбранию президента!

Однако природу не обманешь. И выражается это в экономических показателях! Полетел «Спейс Шаттл» лишь в 1981-м, опоздав на три года. Бюджет в ценах 1971 года был превышен на треть. Стоимость изготовления каждой орбитальной ступени возросла восьмикратно - с 250 млн. аж до 2 млрд. долларов. Перезарядить твердым топливом «многоразовые» ускорители обходится в 25 млн., а стоимость орбитального полета даже по первым двадцати стартам в 1981-85 гг. составила 257 млн. долларов. Частота запусков не превышала девяти в год, а реально, даже перед последней катастрофой «Колумбии», летали пять-шесть раз…

Результаты же ИТ-отрасли прямо противоположны. Несмотря на инфляцию, цены падают, а объемы продаж и прибыль растет. Говорить же о стоимости вычислительных операций просто неприлично - до того она низка.

Почему? Ведь фейерверк технологических новаций, примененных в челноках, впечатляет!

Несомненно, все дело в экономике. Основа ИТ-процветания - использование цифровых схем, выполняющих массовые вычислительные операции и производимых массово - везде и для всего.

А пять орбитальных ступеней-шаттлов, с одной стороны, слишком специализированы и производятся индивидуально, из-за чего невероятно дороги. С другой же - требуют опять-таки индивидуального и очень дорогого обслуживания.

Поделиться с друзьями: