Linux программирование в примерах, Роббинс Арнольд

Linux программирование в примерах

Роббинс Арнольд

Шрифт:

Вторичной задачей является распоряжение продлением строк. Как и в С, строки, заканчивающиеся обратным слешем, логически продолжаются со следующей строки. Используется стратегия поддержания буфера. В нем хранится столько строк, сколько помещается в буфер, причем указатели отслеживают начало буфера, текущую строку и следующую строку. Вот структура:

struct ebuffer {

char *buffer; /* Начало текущей строки в буфере. */

char *bufnext; /* Начало следующей строки в буфере. */

char *bufstart; /* Начало всего буфера. */

unsigned int size; /* Размер буфера для malloc. */

FILE *fp; /*

Файл или NULL, если это внутренний буфер. */

struct floc floc; /* Информация о файле в fp (если он есть). */

};

Поле

size

отслеживает размер всего буфера, a

является указателем типа

FILE

для файла ввода. Структура floc не представляет интереса при изучении процедуры.

Функция возвращает число строк в буфере. (Номера строк здесь даны относительно начала функции, а не исходного файла.)

1 static long

2 readline(ebuf) /* static long readline(struct ebuffer *ebuf) */

3 struct ebuffer *ebuf;

4 {

5 char *p;

6 char *end;

7 char *start;

8 long nlines = 0;

10 /* Использование строковых буферов и буферов потоков достаточно

11 различается, чтобы использовать разные функции. */

13 if (!ebuf->fp)

14 return readstring(ebuf);

16 /* При чтении из файла для каждой новой строки мы всегда

17 начинаем с начала буфера. */

19 p = start = ebuf->bufstart;

20 end = p + ebuf->size;

21 *p = '\0';

Для начала заметим, что GNU Make написан на С K&R для максимальной переносимости. В исходной части объявляются переменные, и если ввод осуществляется из строки (как в случае расширения макроса), код вызывает другую функцию,

readstring

(строки 13 и 14). Строка '

!ebuf->fp

' (строка 13) является более короткой (и менее понятной, по нашему мнению) проверкой на пустой указатель; это то же самое, что и '

ebuf->fp==NULL

Строки 19-21 инициализируют указатели и вводят байт NUL, который является символом завершения строки С в конце буфера. Затем функция входит в цикл (строки 23–95), который продолжается до завершения всего ввода.

23 while (fgets(p, end - р, ebuf->fp) != 0)

24 {

25 char *p2;

26 unsigned long len;

27 int backslash;

29 len = strlen(p);

30 if (len == 0)

31 {

32 /* Это случается лишь тогда, когда первый символ строки '\0'.

33 Это довольно безнадежный случай, но (верите или нет) ляп Афины

34 бьет снова! (xmkmf помещает NUL в свои makefile.)

35 Здесь на самом деле нечего делать; мы создаем новую строку, чтобы

36 следующая строка не была частью данной строки. */

37 error (&ebuf->floc,

38 _("warning: NUL character seen; rest of line ignored"));

39 p[0] = '\n';

40 len = l;

41 }

Функция

fgets

(строка 23)

принимает указатель на буфер, количество байтов для прочтения и переменную

FILE*

для файла, из которого осуществляется чтение. Она читает на один байт меньше указанного, чтобы можно было завершить буфер символом '

'. Эта функция подходит, поскольку она позволяет избежать переполнения буфера. Она прекращает чтение, когда встречается с символами конца строки или конца файла; если это символ новой строки, он помещается в буфер. Функция возвращает

NULL

при неудаче или значение указателя первого аргумента при успешном завершении.

В этом случае аргументами являются указатель на свободную область буфера, размер оставшейся части буфера и указатель

FILE

для чтения.

Комментарии в строках 32–36 очевидны; если встречается нулевой байт, программа выводит сообщение об ошибке и представляет вывод как пустую строку. После компенсирования нулевого байта (строки 30–41) код продолжает работу.

43 /* Обойти только что прочитанный текст. */

44 p += len;

46 /* Если последний символ - не конец строки, она не поместилась

47 целиком в буфер. Увеличить буфер и попытаться снова. */

48 if (p[-1] != '\n')

49 goto more_buffer;

51 /* Мы получили новую строку, увеличить число строк. */

52 ++nlines;

Строки 43–52 увеличивают указатель на участок буфера за только что прочитанными данными. Затем код проверяет, является ли последний прочитанный символ символом конца строки. Конструкция

p[-1]

(строка 48) проверяет символ перед p, также как

p[0]

является текущим символом, а

p[1]

— следующим. Сначала это кажется странным, но если вы переведете это на язык математики указателей,

*(p-1)

, это приобретет больший смысл, а индексированная форма, возможно, проще для чтения.

Если последний символ не был символом конца строки, это означает, что нам не хватило места, и код выходит (с помощью

goto

) для увеличения размера буфера (строка 49). В противном случае увеличивается число строк.

54 #if !defined(WINDOWS32) && !defined(__MSDOS__)

55 /* Проверить, что строка завершилась CRLF; если так,

56 игнорировать CR. */

57 if ((p - start) > 1 && p[-2] == '\r')

58 {

59 --p;

60 p[-1] = '\n';

61 }

62 #endif

Строки 54–62 обрабатывают вводимые строки, следующие соглашению Microsoft по завершению строк комбинацией символов возврата каретки и перевода строки (CR-LF), а не просто символом перевода строки (новой строки), который является соглашением Linux/Unix. Обратите внимание, что

#ifdef

исключает этот код на платформе Microsoft, очевидно, библиотека

<stdio.h>

на этих системах автоматически осуществляет это преобразование. Это верно также для других не-Unix систем, поддерживающих стандартный С.

1-19 20 21 22 23 24 25 26 27 28 29 30 31 32 33-220

Поделиться с друзьями:

Чтение онлайн

КНИГИ

АВТОРЫ

ЖАНРЫ

Деловая литература

Детективы

Детские

Документальная литература

Дом и Семья

Драматургия

Жанр не определен

Компьютеры и Интернет

Любовные романы

Научно-образовательная

Поэзия

Приключения

Проза

Прочее

Религия и эзотерика

Справочная литература

Старинная литература

Техника

Фантастика

Фольклор

Юмор

Linux программирование в примерах

Роббинс Арнольд

Шрифт: