Программирование. Принципы и практика использования C++ Исправленное издание, Страуструп Бьерн

Программирование. Принципы и практика использования C++ Исправленное издание

на обложку

Страуструп Бьерн

Шрифт:

double weighted_value(

const pair<string,double>& a,

const pair<string,double>& b

) // извлекает значения и перемножает

{

return a.second * b.second;

}

Теперь просто подставим эту функцию в обобщенную версию алгоритма

inner_product и получим значение индекса.

double dji_index =

inner_product(dow_price.begin, dow_price.end,

// все компании

dow_weight.begin, // их веса

0.0, // начальное значение

plus<double>, // сложение (обычное)

weighted_value); //

извлекает значение и веса,

// а затем перемножает их

Почему целесообразно хранить такие данные в ассоциативных массивах, а не в векторах? Мы использовали класс map, чтобы связь между разными значениями стала явной. Это одна из причин. Кроме того, контейнер

map

хранит элементы в порядке, определенном их ключами. Например, при обходе контейнера

dow

мы выводили символы в алфавитном порядке; если бы мы использовали класс

vector

, то были бы вынуждены сортировать его. Чаще всего класс

map

используют просто потому, что хотят искать значения по их ключам. Для крупных последовательностей поиск элементов с помощью алгоритма

find

намного медленнее, чем поиск в упорядоченной структуре, такой как контейнер

map

ПОПРОБУЙТЕ

Приведите этот пример в рабочее состояние. Затем добавьте несколько компаний по своему выбору и задайте их веса.

21.6.4. Алгоритм unordered_map

Для того чтобы найти элемент в контейнере

vector

, алгоритм

find

должен проверить все элементы, начиная с первого и заканчивая искомым или последним элементом вектора. Средняя сложность этого поиска пропорциональна длине вектора (N); в таком случае говорят, что алгоритм имеет сложность O(N).

Для того чтобы найти элемент в контейнере map, оператор индексирования должен проверить все элементы, начиная с корня дерева и заканчивая искомым значением или листом дерева. Средняя сложность этого поиска пропорциональна глубине дерева. Максимальная глубина сбалансированного бинарного дерева, содержащего N элементов, равна log2N, а сложность поиска в нем имеет порядок O(log2N), т.е. пропорциональна величине log2N. Это намного лучше, чем O(N).

Реальная сложность поиска зависит от того, насколько быстро нам удастся найти искомые значения и какие затраты будут связаны с выполнением операции сравнения и итераций. Обычно следование за указателями (при поиске в контейнере map) несколько сложнее, чем инкрементация указателя (при поиске в контейнере vector с помощью алгоритма

find

Для некоторых типов, особенно для целых чисел и символьных строк, можно достичь еще более высоких результатов поиска, чем при поиске по дереву контейнера

map

. Не вдаваясь в подробности, укажем, что идея заключается в том, что по ключу мы можем вычислить индекс в контейнере

vector

. Этот индекс называется значением хеш-функции (hash value), а контейнер, в котором используется этот метод, — хеш-таблицей (hash table). Количество возможных ключей намного больше, чем количество ячеек в хеш-таблице. Например, хеш-функция часто используется для того, чтобы отобразить миллиарды возможных строк в индекс вектора, состоящего из тысячи элементов. Такая задача может оказаться сложной, но ее можно решить. Это особенно полезно при реализации больших контейнеров

map

. Основное преимущество хеш-таблицы заключается в том, что средняя сложность поиска в ней является (почти) постоянной и не зависит от количества ее элементов, т.е. имеет порядок O(1). Очевидно, что это большое преимущество для крупных ассоциативных массивов, например, содержащих 500 тысяч веб-адресов. Более подробную информацию о хеш-поиске читатели могут найти в документации о контейнере

unordered_map

(доступной в сети веб) или в любом учебнике по структурам данных (ищите в оглавлении хеш-таблицы

и хеширование).

Рассмотрим графическую иллюстрацию поиска в (неупорядоченном) векторе, сбалансированном бинарном дереве и хеш-таблице.

• Поиск в неупорядоченном контейнере

vector

• Поиск в контейнере

map

(сбалансированном бинарном дереве).

• Поиск в контейнере

unordered_map

(хеш-таблица).

Контейнер

unordered_map

из библиотеки STL реализован с помощью хештаблицы, контейнер

map

— на основе сбалансированного бинарного дерева, а контейнер

vector

— в виде массива. Полезность библиотеки STL частично объясняется тем, что она позволила объединить в одно целое разные способы хранения данных и доступа к ним, с одной стороны, и алгоритмы, с другой.

Эмпирическое правило гласит следующее.

• Используйте контейнер

vector

, если у вас нет веских оснований не делать этого.

• Используйте контейнер

map

, если вам необходимо выполнить поиск по значению (и если тип ключа позволяет эффективно выполнять операцию “меньше”).

• Используйте контейнер

unordered_map

, если вам необходимо часто выполнять поиск в большом ассоциативном массиве и вам не нужен упорядоченный обход (и если тип вашего ключа допускает эффективное использование хеш-функций).

Мы не будем подробно описывать контейнер

unordered_map

. Его можно использовать с ключом типа

string

или

int

точно так же, как контейнер map, за исключением того, что при обходе элементов они не будут упорядочены. Например, мы могли бы переписать фрагмент кода для вычисления индекса- Доу–Джонса из раздела 21.6.3 следующим образом:

unordered_map<string,double> dow_price;

typedef unordered_map<string,double>::const_iterator Dow_iterator;

for (Dow_iterator p = dow_price.begin; p!=dow_price.end; ++p) {

const string& symbol = p–>first; // the "ticker" symbol

cout << symbol << '\t'

<< p–>second << '\t'

<< dow_name[symbol] << '\n';

}

Теперь поиск в контейнере

dow

можно выполнять быстрее. Однако это ускорение может оказаться незаметным, поскольку в этот индекс включены только тридцать компаний. Если бы мы учли цены акций всех компаний, котирующихся на нью-йоркской фондовой бирже, то сразу почувствовали бы разницу в производительности работы программы. Отметим пока лишь логическое отличие: данные на каждой итерации выводятся не в алфавитном порядке.

Неупорядоченные ассоциативные массивы в стандарте языка С++ являются новшеством и еще не стали полноправным его элементом, поскольку они описаны в техническом отчете Комиссии по стандартизации языка С++ (Technical Report), а не в тексте самого стандарта. Тем не менее они широко распространены, а там, где их нет, часто можно обнаружить их аналоги, например, что-нибудь вроде класса

hash_map

ПОПРОБУЙТЕ

Напишите небольшую программу, используя директиву

#include<unordered_map>

. Если она не работает, значит, класс

unordered_map

не был включен в вашу реализацию языка C++. Если вам действительно нужен контейнер

unordered_map

, можете загрузить одну из его доступных реализаций из сети веб (см., например, сайт www.boost.org).

21.6.5. Множества

Контейнер

set

можно интерпретировать как ассоциативный массив, в котором значения не важны, или как ассоциативный массив без значений. Контейнер

set

можно изобразить следующим образом:

Например, контейнер

set

, в котором перечислены фрукты (см. раздел 21.6.2), можно представить следующим образом:

1-240 241 242 243 244 245 246 247 248 249 250 251 252 253 254-377

Поделиться с друзьями:

Чтение онлайн

КНИГИ

АВТОРЫ

ЖАНРЫ

Деловая литература

Детективы

Детские

Документальная литература

Дом и Семья

Драматургия

Жанр не определен

Компьютеры и Интернет

Любовные романы

Научно-образовательная

Поэзия

Приключения

Проза

Прочее

Религия и эзотерика

Справочная литература

Старинная литература

Техника

Фантастика

Фольклор

Юмор

Программирование. Принципы и практика использования C++ Исправленное издание

Страуструп Бьерн

Шрифт: