Чтение онлайн

ЖАНРЫ

Разработка ядра Linux (Второе издание)
Шрифт:

Как было показано в предыдущем разделе, поиск в страничном кэше выполняется на основании информации объекта

address_space
и значения смещения. Каждый объект
address_space
имеет свое уникальное базисное дерево (radix tree), которое хранится в поле
page_tree
. Базисное дерево — это один из типов бинарных деревьев. Базисное дерево позволяет выполнять очень быстрый поиск необходимой страницы только на основании значения смещения в файле. Функции поиска в страничном кэше, такие как
find_get_page
и
radix_tree_lookup
, выполняют поиск с использованием заданного дерева и заданного объекта.

Основной код для работы с базисными деревьями находится в файле

lib/radix-tree.c
. Для использования базисных деревьев необходимо подключить заголовочный
файл
<linux/radix-tree.h>
.

Старая хеш-таблица страниц

Для ядер до серии 2.6 поиск в страничном кэше не выполнялся с помощью базисных деревьев. Вместо этого поддерживалась глобальная хеш-таблица всех страниц памяти в системе. Специальная хеш-функция возвращала двухсвязный список значений, связанных с одним значением ключа. Если нужная страница находится в кэше, то один из элементов этого списка соответствует этой нужной странице. Если страница в кэше отсутствует, то хеш-функция возвращает значение

NULL
.

Использование глобальной хеш-таблицы приводило к четырем основным проблемам.

• Хеш-таблица защищалась одной глобальной блокировкой. Количество конфликтов при захвате этой блокировки было достаточно большим даже для не очень больших машин. В результате страдала производительность.

• Размер хеш-таблицы был большим, потому что в ней содержалась информация обо всех страницах памяти в страничном кэше, в то время как важными являются лишь страницы, связанные с одним конкретным файлом.

• Производительность в случае неудачного обращения в кэш (когда искомая страница памяти не находится в кэше) падала из-за необходимости просматривать все элементы списка, связанного с заданным ключом.

• Хеш-таблица требовала больше памяти, чем другие возможные решения.

Применение в ядрах серии 2.6 страничного кэша на основании базисных деревьев позволило решить эти проблемы.

Буферный кэш

В операционной системе Linux больше нет отдельного буферного кэша. В ядрах серии 2.2 существовало два отдельных кэша: страничный и буферный. В первом кэшировались: страницы памяти, а в другом — буферы. Эти два кэша не были объединены между собой. Дисковый блок мог находиться в обоих кэшах одновременно. Это требовало больших усилий по синхронизации двух кэшированных копий, не говоря уже о напрасной трате памяти.

Так было в ядрах серии 2.2 и более ранних, но начиная с ядер Linux серии 2.4 оба кэша объединили вместе. Сегодня существует только один дисковый кэш — страничный кэш.

Ядру все еще необходимо использовать буферы для того, чтобы представлять дисковые блоки в памяти. К счастью, буферы описывают отображение блоков на страницы памяти, которые в свою очередь находятся в страничном кэше.

Демон

pdflush

Измененные (dirty, "грязные") страницы памяти когда-нибудь должны быть записаны на диск. Обратная запись страниц памяти выполняется в следующих двух случаях.

• Когда объем свободной памяти становится меньше определенного порога, ядро должно записать измененные данные обратно на диск, чтобы освободить память.

• Когда несохраненные данные хранятся в памяти достаточно долго, то ядро должно их записать на диск, чтобы гарантировать, что эти данные не будут находиться в несохраненном состоянии неопределенное время.

Эти два типа записи имеют разные цели. В более старых ядрах они выполнялись двумя разными потоками пространства ядра (см. следующий раздел). Однако в ядре 2.6 эту работу выполняет группа (gang [87] ) потоков ядра

pdflush
, которые называются демонами фоновой обратной записи (или просто потоками
pdflush
). Ходят слухи, что название
pdflush
— это сокращение от "dirty page flush" ("очистка грязных страниц"). Не обращайте внимание на это сомнительное название, давайте лучше более детально рассмотрим, для чего нужны эти процессы.

87

Слово "gang" не является жаргонным. Этот термин часто используется в компьютерных науках, чтобы указать группу чего-либо, что может выполняться параллельно.

Во-первых, потоки

pdflush
служат для записи измененных страниц на диск, когда объем свободной памяти в системе уменьшается до определенного уровня. Цель такой фоновой записи — освобождение памяти, которую
занимают незаписанные страницы, в случае недостатка физических страниц памяти. Уровень, когда начинается обратная запись, может быть сконфигурирован с помощью параметра
dirty_background_ratio
утилиты
sysctl
. Когда объем свободной памяти становится меньше этого порога, ядро вызывает функцию
wakeup_bdflush
[88] для перевода в состояние выполнения потока
pdflush
, который выполняет функцию обратной записи измененных страниц памяти
background_writeout
. Эта функция получает один параметр, равный количеству страниц, которые функция должна попытаться записать на диск.

88

Да, название функции не совсем верное. Должно было бы быть

wakeup_pdflush
. В следующем разделе рассказано, откуда произошло это название.

Функция продолжает запись до тех пор, пока не выполнятся два следующих условия.

• Указанное минимальное количество страниц записано на диск.

• Объем свободной памяти превышает соответствующее значение параметра

dirty_background_ratio
.

Выполнение этих условий гарантирует, что демон

pdflush
выполнил свою работу по предотвращению нехватки памяти. Если эти условия не выполняются, то обратная запись может остановиться только тогда, когда демон
pdflush
запишет на диск все несохраненные страницы и для него больше не будет работы.

Во-вторых, назначение демона

pdflush
— периодически переходить в состояние выполнения (независимо от состояния нехватки памяти) и записывать на диск очень давно измененные страницы памяти. Это гарантирует, что измененные страницы не будут находиться в памяти неопределенное время. При сбоях системы будут потеряны те страницы памяти, которые не были сохранены на диске, так как содержимое памяти после перегрузки не сохраняется. Следовательно, периодическая синхронизация страничного кэша с данными на диске является важным делом. При загрузке системы инициализируется таймер, периодически возвращающий к выполнению поток
pdflush
, который выполняет функцию
wb_kupdate
. Эта функция выполняет обратную запись данных, которые были изменены более чем
dirty_expire_centisecs
сотых секунды тому назад. После этого таймер снова инициализируется, чтобы сработать через
dirty_expire_centisecs
сотых секунды. Таким образом потоки
pdflush
периодически возвращаются к выполнению и записывают на диск все измененные страницы, данные в которых старше, чем указанный лимит.

Системный администратор может установить эти значения с помощью каталога

/proc/sys/vm
и утилиты
sysctl
. В табл. 15.1 приведен список всех соответствующих переменных.

Таблица 15.1. Параметры для настройки демона

pdflush

Переменная Описание
dirty_background_ratio
Объем свободной оперативной памяти, при котором демон
pdflush
начинает обратную запись незаписанных данных
dirty_expire_centisecs
Время, в сотых долях секунды, в течение которого незаписанные данные могут оставаться в памяти, перед тем как демон
pdflush
не запишет их на диск при следующем периоде обратной записи
dirty_ratio
Процент от общей оперативной памяти, соответствующий страницам памяти одного процесса, при котором начинается обратная запись незаписанных данных
dirty_writeback_centisecs
Насколько часто, в сотых долях секунды, процесс
bdflush
возвращается к выполнению для обратной записи данных
laptop_mode
Переменная булевого типа, которая включает или выключает режим ноутбука (см. следующий раздел)
Поделиться с друзьями: