Чтение онлайн

ЖАНРЫ

UNIX: разработка сетевых приложений
Шрифт:

Использование собственных данных потоков — это распространенный способ сделать существующую функцию безопасной в многопоточной среде. Прежде чем описывать функции Pthread, работающие с такими данными, мы опишем саму концепцию и возможный способ реализации, так как эти функции кажутся более сложными, чем являются на самом деле.

Частично осложнения возникают по той причине, что во всех книгах, где идет речь о потоках, описание собственных данных потоков дается по образцу стандарта Pthreads. Пары ключ-значение и ключи рассматриваются в них как непрозрачные объекты. Мы описываем собственные данные потоков в терминах индексов и указателей, так как обычно в реализациях в качестве ключей используются небольшие положительные целые числа (индексы), а значение, ассоциированное с ключом, — это просто указатель на область памяти, выделяемую потоку с помощью функции

malloc
.

В

каждой системе поддерживается ограниченное количество объектов собственных данных потоков. В POSIX требуется, чтобы этот предел не превышал 128 (на каждый процесс), и в следующем примере мы используем именно это значение. Система (вероятно, библиотека потоков) поддерживает один массив структур (которые мы называем структурами
Key
) для каждого процесса, как показано на рис. 26.2.

Рис. 26.2. Возможная реализация собственных данных потока

Флаг в структуре

Key
указывает, используется ли в настоящий момент данный элемент массива. Все флаги инициализируются как указывающие на то, что элемент не используется. Когда поток вызывает функцию
pthread_key_create
для создания нового элемента собственных данных потока, система отыскивает в массиве структур
Key
первую структуру, не используемую в настоящий момент. Индекс этой структуры, который может иметь значение от 0 до 127, называется ключом и возвращается вызывающему потоку как результат выполнения функции. О втором элементе структуры
Key
, так называемом указателе-деструкторе, мы поговорим чуть позже.

В дополнение к массиву структур

Key
, общему для всего процесса, система хранит набор сведений о каждом потоке процесса в структуре
Pthread
. Частью этой структуры является массив указателей, состоящий из 128 элементов, который мы называем
pkey
. Это показано на рис. 26.3.

Рис. 26.3. Информация, хранящаяся в системе для каждого потока

Все элементы массива

pkey
инициализируются пустыми указателями. Эти 128 указателей являются «значениями», ассоциированными с каждым из 128 «ключей» процесса.

Когда мы с помощью функции

pthread_key_create
создаем ключ, система сообщает нам фактическое значение ключа (индекс). Затем каждый поток может сохранить значение (указатель), связанное с этим ключом, и, как правило, каждый поток получает этот указатель в виде возвращаемого значения функции
malloc
. Частично путаница с собственными данными потока обусловлена тем, что указатель в паре ключ-значение играет роль значения, но сами собственные данные потока — это то, на что указывает данный указатель.

Теперь мы перейдем к примеру применения собственных данных потока, предполагая, что наша функция

readline
использует их для хранения информации о состоянии каждого потока при последовательных обращениях к ней. Вскоре мы покажем код, выполняющий эту задачу, в котором функция
readline
модифицирована так, чтобы реализовать представленную далее последовательность шагов.

1. Запускается процесс, и создается несколько потоков.

2. Один из потоков вызовет функцию

readline
первой, а та, в свою очередь, вызовет функцию
phtread_key_create
. Система отыщет первую неиспользуемую структуру
Key
(см. рис. 26.2) и возвратит вызывающему процессу ее индекс. В данном примере мы предполагаем, что индекс равен 1.

Мы будем использовать функцию

pthread_once
, чтобы гарантировать, что функция
pthread_key_create
вызывается только первым потоком, вызвавшим функцию
readline
.

3. Функция

readline
вызывает функцию
pthread_getspecific
, чтобы получить значение
pkey[1]
(«указатель» на рис. 26.3 для ключа, имеющего значение 1) для данного потока, но эта функция возвращает пустой указатель. Тогда функция
readline
вызывает функцию
malloc
для выделения памяти, которая необходима
для хранения информации о каждом потоке при последовательных вызовах функции
readline
. Функция
readline
инициализирует эти области памяти по мере надобности и вызывает функцию
pthread_setspecific
, чтобы установить указатель собственных данных потока (
pkey[1]
), соответствующий данному ключу, на только что выделенную область памяти. Мы показываем этот процесс на рис. 26.4, предполагая, что вызывающий поток — это поток с номером 0 в данном процессе.

Рис. 26.4. Соответствие между областью памяти, выделенной функцией malloc, и указателем собственных данных потока

На этом рисунке мы отмечаем, что структура Pthread поддерживается системой (вероятно, библиотекой потоков), но фактически собственные данные потока, которые мы размещаем в памяти с помощью функции

malloc
, поддерживаются нашей функцией (в данном случае
readline
). Все, что делает функция
pthread_setspecific
, — это установка указателя для данного ключа в структуре Pthread на выделенную область памяти. Аналогично, действие функции
pthread_getspecific
сводится к возвращению этого указателя.

4. Другой поток, например поток с номером

n
, вызывает функцию
readline
, возможно, в тот момент, когда поток с номером 0 все еще находится в стадии выполнения функции
readline
.

Функция

readline
вызывает функцию
pthread_once
, чтобы инициализировать ключ этого элемента собственных данных, но так как эта функция уже была однажды вызвана, то больше она не выполняется.

5. Функция

readline
вызывает функцию
pthread_getspecific
для получения значения указателя
pkey[1]
для данного потока, но возвращается пустой указатель. Тогда поток вызывает функцию
malloc
и функцию
pthread_setspecific
, как и в случае с потоком номер 0, инициализируя элемент собственных данных потока, соответствующий этому ключу (1). Этот процесс иллюстрирует рис. 26.5.

Рис. 26.5. Структуры данных после того, как поток n инициализировал свои собственные данные

6. Поток номер nпродолжает выполнять функцию

readline
, используя и модифицируя свои собственные данные.

Один вопрос, который мы пока не рассмотрели, заключается в следующем: что происходит, когда поток завершает свое выполнение? Если поток вызвал функцию

readline
, эта функция выделила в памяти область, которая должна быть освобождена по завершении выполнения потока. Для этого используется указатель-деструктор, показанный на рис. 26.2. Когда поток, создающий элемент собственных данных, вызывает функцию
pthread_key_create
, одним из аргументов этой функции является указатель на функцию-деструктор. Когда выполнение потока завершается, система перебирает массив
pkey
для данного потока, вызывая соответствующую функцию-деструктор для каждого непустого указателя
pkey
. Под «соответствующим деструктором» мы понимаем указатель на функцию, хранящийся в массиве
Key
с рис. 26.2. Таким образом осуществляется освобождение памяти, занимаемой собственными данными потока, когда выполнение потока завершается.

Первые две функции, которые обычно вызываются при работе с собственными данными потока, — это

pthread_once
и
pthread_key_create
.

#include <pthread.h>

int pthread_once(pthread_once_t * onceptr, void (* init)(void));

int pthread_key_create(pthread_key_t * keyptr, void (* destructor)(void * value));

Поделиться с друзьями: