Теперь, когда вы увидели, как читать строки произвольной длины, вы можете сделать вздох облегчения, что вам не нужно самим писать такую функцию. GLIBC предоставляет вам для этого две функции:
ssize_t getdelim(char **lineptr, size_t *n, int delim, FILE *stream);
Определение
константы
_GNU_SOURCE
вводит объявления функций
getline
и
getdelim
. В противном случае они неявно объявлены как возвращающие
int
. Для объявления возвращаемого типа
ssize_t
нужен файл
<sys/types.h>
. (
ssize_t
является «знаковым
size_t
». Он предназначен для такого же использования, что и
size_t
, но в местах, где может понадобиться использование также и отрицательных значений.)
Обе функции управляют для вас динамической памятью, гарантируя, что буфер, содержащий входную строку, достаточно большой для размещения всей строки. Их отличие друг от друга в том, что
getline
читает до символа конца строки, a
getdelim
использует в качестве разделителя символ, предоставленный пользователем. Общие аргументы следующие:
char **lineptr
Указатель на
char*
указатель для адреса динамически выделенного буфера. Чтобы
getline
сделала всю работу, он должен быть инициализирован
NULL
. В противном случае, он должен указывать на область памяти, выделенную с помощью
malloc
.
size_t *n
Указатель на размер буфера. Если вы выделяете свой собственный буфер,
*n
должно содержать размер буфера. Обе функции обновляют
*n
новым значением размера буфера, если они его изменяют.
FILE* stream
Место, откуда следует получать входные символы.
По достижении конца файла или при ошибке функция возвращает -1. Строки содержат завершающий символ конца строки или разделитель (если он есть), а также завершающий нулевой байт. Использование
getline
просто, как показано в
ch03-getline.с
:
/* ch03-getline.c --- демонстрация getline. */
#define _GNU_SOURCE 1
#include <stdio.h>
#include <sys/types.h>
/* main - прочесть строку и отобразить ее, пока не достигнут EOF */
int main(void) {
char *line = NULL;
size_t size = 0;
ssize_t ret;
while ((ret = getline(&line, &size, stdin)) != -1)
printf("(%lu) %s", size, line);
return 0;
}
Вот эта функция в действии, показывающая размер буфера. Третья входная и выходная строки намеренно длинные, чтобы заставить
getline
увеличить размер буфера:
$ ch03-getline /* Запустить программу */
this is a line
(120) this is a line
And another line.
(120) And another line.
A llllllllllllllllloooooooooooooooooooooooooooooooonnnnnnnnnnnnnnnngnnnggggggggggg llliiiiiiiiiiiiiiiiiiinnnnnnnnnnnnnnnnnnnneeeeeeeeee
(240) A llllllllllllllllloooooooooooooooooooooooooooooooonnnnnnnnnnnnnnnngnnnggggggggggg llliiiiiiiiiiiiiiiiiiinnnnnnnnnnnnnnnnnnnneeeeeeeeee
3.2.2.
Копирование строк:
strdup
Одной чрезвычайно типичной операцией является выделение памяти для копирования строки. Это настолько типично, что многие программисты предусматривают для нее простую функцию вместо использования внутритекстового кодирования, и часто эта функция называется
strdup
:
#include <string.h>
/* strdup --- выделить память с malloc и скопировать строку */
char *strdup(const char *str) {
size_t len;
char *copy;
len = strlen(str) + 1;
/* включить место для завершающего '\0' */
copy = malloc(len);
if (copy != NULL) strcpy(copy, str);
return copy; /* при ошибке возвращает NULL */
}
С появлением стандарта POSIX 2001 программисты по всему миру могут вздохнуть свободнее: эта функция является теперь частью POSIX в виде расширения XSI:
, если была ошибка, или указатель на динамически выделенную память с копией
str
. Возвращенное значение должно быть освобождено с помощью
free
, когда больше не требуется.
3.2.3. Системные вызовы:
brk
и
sbrk
Четыре функции, которые мы рассмотрели (
malloc
,
calloc
,
realloc
и
free
) являются стандартными, переносимыми функциями для управления динамической памятью.
На Unix-системах стандартные функции реализованы поверх двух дополнительных, очень примитивных процедур, которые непосредственно изменяют размер адресного пространства процесса. Мы представляем их здесь, чтобы помочь вам понять, как работают GNU/Linux и Unix (снова «под капотом»); крайне маловероятно, что вам когда-нибудь понадобится использовать эти функции в обычных программах. Они определены следующим образом:
#include <unistd.h> /* Обычный */
#include <malloc.h> /* Необходим для систем GLIBC 2 */
int brk(void *end_data_segment);
void *sbrk(ptrdiff_t increment);
Системный вызов
brk
действительно изменяет адресное пространство процесса. Адрес является указателем, представляющим окончание сегмента данных (на самом деле, области кучи, как было показано ранее на рис. 3.1). Ее аргумент является абсолютным логическим адресом, представляющим новое окончание адресного пространства. В случае успеха функция возвращает 0, а в случае неуспеха (-1).