Чтение онлайн

ЖАНРЫ

Разработка приложений в среде Linux. Второе издание

Троан Эрик В.

Шрифт:

36: }

37:

38: pmatch = alloca(sizeof(regmatch_t) * (p.re_nsub+1));

39: if (!pmatch) {

40: perror("alloca");

41: }

42:

43: printf("Введите строку: ");

44: fgets(string, sizeof(string), stdin);

45:

46: if ((rerr = regexec(&p, string, p.re_nsub+1, pmatch, 0))) {

47: if (rerr == REG_NOMATCH) {

48: /* эту ситуацию может обработать regerror,

49: *
но зачастую она обрабатывается особым образом

50: */

51: printf("Строка не совпадает с %s\n", regex);

52: } else {

53: do_regerror(rerr, &p);

54: }

55: } else {

56: /* сопоставление закончено */

57: printf("Строка совпадает с регулярным выражением %s\n", regex);

58: for (i = 0; i <= p.re_nsub; i++) {

59: /* вывод на экран совпавшей части (частей) строки */

60: if (pmatch[i].rm_so != -1) {

61: char *submatch;

62: size_t matchlen = pmatch[i].rm_eo - pmatch[i].rm_so;

63: submatch = malloc(matchlen+1);

64: strncpy(submatch, string+pmatch[i].rm_so,

65: matchlen);

66: submatch[matchlen] = '\0';

67: printf("совпавшее подвыражение %d: %s\n", i,

68: submatch);

69: free(submatch);

70: } else {

71: printf ("нет совпадения с подвыражением %d\n", i);

72: }

73: }

74: }

75: exit(0);

76: }

В примере регулярного выражения из программы

match.с
имеется три подвыражения. Первое из них представляет собой всю строку, содержащую текст, за которым следует символ комментария, вторым является текст в строке, предшествующей символу комментария, а третье представляет всю строку без символа комментария. Для строки, в начале которой содержится комментарий, элементу
rm_so
во втором и третьем элементе из массива
pmatch[]
присвоено значение
– 1
. Для строки, в начале которой содержится комментарий, значение
– 1
присваивается первому и второму элементу; для строки, не содержащей символы комментария, второму и третьему элементу присваивается значение
– 1
.

Каждый раз после завершения работы с компилированным регулярным выражением его необходимо освободить, чтобы избежать утечек памяти. Для освобождения памяти необходимо использовать функцию

regfree
, но не
free
:

#include <regex.h>

void regfree(regex_t *preg);

В стандарте POSIX четко не сказано, следует ли использовать функцию

regfree
каждый раз при вызове функции
regcomp
, или же только после того, как вы в последний раз вызывали функцию
regcomp
в одной структуре
regex_t
. Таким образом, чтобы избежать утечек памяти, в промежутках между использованием структур
regex_t
необходимо вызывать функцию
regfree
.

Всякий раз когда функция

regcomp
или
regex
возвращает ненулевой результат, функция
regerror
может предоставить подробное сообщение,
в котором будет указано, в чем состоит ошибка. Она записывает по возможности все сообщение об ошибке в буфер и возвращает размер всего сообщения. Поскольку вы заранее не знаете, какой размер будет иметь сообщение, то сначала вам необходимо узнать его размер, а затем распределить и использовать буфер, как показано в следующем далее примере кода. Поскольку этот вариант обработки ошибок быстро становится устаревшим, и вам придется включать его как минимум дважды (один раз после функции
regcomp
и один раз после функции
regex
), мы советуем вам написать код собственной оболочки функции
regerror
, как показано в строке 10 из листинга
math.с
.

23.2.3. Простая утилита

grep

grep
является популярной утилитой, определенной в стандарте POSIX, которая предлагает возможности поиска регулярного выражения в текстовых файлах. Ниже показана простая (не соответствующая стандарту POSIX) версия утилиты
grep
, реализованная с помощью функций стандартного регулярного выражения.

1: /* grep.с */

2:

3: #include <alloca.h>

4: #include <ctype.h>

5: #include <popt.h>

6: #include <regex.h>

7: #include <stdio.h>

8: #include <string.h>

9: #include <unistd.h>

 10:

 11: #define MODE_REGEXP 1

 12: #define MODE_EXTENDED 2

 13: #define MODE_FIXED 3

 14:

 15: void do_regerror(int errcode, const regex_t *preg) {

 16: char *errbuf;

 17: size_t errbuf_size;

 18:

 19: errbuf_size = regerror(errcode, preg, NULL, 0);

 20: errbuf = alloca(errbuf_size);

 21: if (!errbuf) {

 22: perror("alloca");

 23: return;

 24: }

 25:

 26: regerror(errcode, preg, errbuf, errbuf_size);

 27: fprintf(stderr, "%s\n", errbuf);

 28: }

 29:

 30: int scanFile(FILE * f, int mode, const void * pattern,

 31: int ignoreCase, const char * fileName,

 32: int * maxCountPtr) {

 33: long lineLength;

 34: char * line;

 35: int match;

 36: int rc;

 37: char * chptr;

 38: char * prefix = "";

 39:

 40: if (fileName) {

 41: prefix = alloca(strlen(fileName) + 4);

 42: sprintf(prefix, "%s: ", fileName);

 43: }

 44:

 45: lineLength = sysconf(_SC_LINE_MAX);

 46: line = alloca(lineLength);

 47:

 48: while (fgets(line, lineLength, f) && (*maxCountPtr)) {

 49: /* если у нас не будет завершающего символа '\n'

Поделиться с друзьями: