Linux программирование в примерах, Роббинс Арнольд

Linux программирование в примерах

на обложку

Роббинс Арнольд

Шрифт:

Рис. 12.1. Перекрывающиеся копии

Целью является скопировать четыре экземпляра

struct xyz

от

data[0]

до

data[3]

в участок от

data[3]

до

data[6]

. Здесь проблемой является

data[3]

, побайтовое копирование с перемещением в памяти из

data[0]

затрет

data[3]

до того, как он будет безопасно скопирован в

data[6]

! (Может возникнуть также сценарий,

когда копирование в памяти в обратном направлении разрушит перекрывающиеся данные.)

Функция

memcpy

была первоначальной функцией в System V API для копирования блоков памяти; ее поведение для перекрывающихся блоков памяти не была подробно определена тем или иным способом. Для стандарта С 1989 г. комитет почувствовал, что это отсутствие определенности является проблемой, поэтому они придумали

memmove

. Для обратной совместимости

memcpy

была оставлена, причем поведение для перекрывающейся памяти было специально отмечено как неопределенное, а в качестве процедуры, корректно разрешающей проблемные случаи, была предложена

memmove

Какую из них использовать в своем коде? Для библиотечной функции, которая не знает, какие области памяти ей передаются, следует использовать

memmove

. Таким способом вы гарантируете, что не будет проблем с перекрывающимися областями. Для кода приложения, который «знает», что две области не перекрываются, можно безопасно использовать

memcpy

Как для

memcpy

, так и для

memmove

(как и для

strcpy

) буфер назначения является первым аргументом, а источник — вторым. Чтобы запомнить это, обратите внимание на порядок, который тот же самый, как в операторе присваивания:

dest = src;

(Справочные страницы во многих системах не помогают, предлагая прототип в виде '

void *memcpy(void *buf1, void *buf2, size_t n)

' и полагаясь на то, что текст объяснит, что есть что. К счастью, справочная страница GNU/Linux использует более осмысленные имена.)

12.2.3. Сравнение блоков памяти:

memcmp

Функция

memcmp

сравнивает

count

байтов из двух произвольных буферов данных. Возвращаемое ею значение подобно

strcmp

: отрицательное, нулевое или положительное, если первый буфер меньше, равен или больше второго.

Вы можете поинтересоваться: «Почему бы не использовать для такого сравнения

strcmp

?» Разница между двумя функциями в том, что

memcmp

не принимает во внимание нулевые байты (завершающий строку '

'.) Таким образом,

memcmp

является функцией, которая используется, когда вам нужно сравнить произвольные двоичные данные.

Другим преимуществом

memcmp

является то, что она быстрее типичной реализации на C:

/* memcmp --- пример реализации на С, НЕ для реального использования */

int memcmp(const void *buf1, const void *buf2, size_t count) {

const unsigned char *cp1 = (const unsigned char*)buf1;

const unsigned char *cp2 = (const unsigned char*)buf2;

int diff;

while (count-- != 0) {

diff = *cp1++ - *cp2++;

if (diff != 0)

return diff;

}

return 0;

}

Скорость

может быть достигнута в результате использования специальных инструкций «блочного сравнения памяти», которые поддерживают многие архитектуры, или в результате сравнения единиц, превышающих байты. (Эта последняя операция коварна, и лучше оставить ее автору библиотеки.)

По этим причинам всегда следует использовать вашу библиотечную версию

memcmp

вместо прокручивания своей собственной. Велика вероятность, что автор библиотеки знает машину лучше вас

12.2.4. Поиск байта с данным значением:

memchr

Функция

memchr

сходна с функцией

strchr

: она возвращает местоположение определенного значения внутри произвольного буфера. Как и в случае

memcmp

против

strcmp

, основной причиной для использования

memchr

является использование произвольных двоичных данных.

GNU

использует

memchr

при подсчете лишь строк и байтов [124] , и это позволяет

wс

быть быстрой. Из

wc.c

в GNU Coreutils:

124

См. wс(1).

подсчитывает строки, слова и символы — Примеч. автора.

257 else if (!count_chars && !count_complicated)

258 {

259 /* Использует отдельный цикл при подсчете лишь строк или строк и байтов -

260 но не символов или слов. */

261 while ((bytes_read = safe_read(fd, buf, BUFFER_SIZE)) > 0)

262 {

263 register char *p = buf;

264

265 if (bytes_read == SAFE_READ_ERROR)

266 {

267 error(0, errno, "%s", file);

268 exit_status = 1;

269 break;

270 }

271

272 while ((p = memchr(p, '\n', (buf + bytes_read) - p)))

273 {

274 ++p;

275 ++lines;

276 }

277 bytes += bytes_read;

278 }

279 }

Внешний цикл (строки 261–278) читает блоки данных из входного файла. Внутренний цикл (строки 272–276) использует

memchr

для поиска и подсчета символов конца строки. Сложное выражение '

(buf + bytes_read) - р

' сводится к числу оставшихся байтов между текущим значением p и концом буфера.

Комментарии в строках 259–260 нуждаются в некотором объяснении. Вкратце, современные системы могут использовать символы, занимающие более одного байта в памяти и на диске. (Это несколько более подробно обсуждается в разделе 13.4 «Не могли бы вы произнести это для меня по буквам?».) Таким образом,

должна использовать другой код, если она различает байты и символы: этот код имеет дело со случаем подсчета байтов.

1-138 139 140 141 142 143 144 145 146 147 148 149 150 151 152-220

Поделиться с друзьями:

Чтение онлайн

КНИГИ

АВТОРЫ

ЖАНРЫ

Деловая литература

Детективы

Детские

Документальная литература

Дом и Семья

Драматургия

Жанр не определен

Компьютеры и Интернет

Любовные романы

Научно-образовательная

Поэзия

Приключения

Проза

Прочее

Религия и эзотерика

Справочная литература

Старинная литература

Техника

Фантастика

Фольклор

Юмор

Linux программирование в примерах

Роббинс Арнольд

Шрифт: