C++. Сборник рецептов, Когсуэлл Джефф

C++. Сборник рецептов

на обложку

Когсуэлл Джефф

Шрифт:

last = cur;

}

int main(int argc, char** argv) {

if (argc < 3)

return(EXIT_FAILURE);

int w = 72;

ifstream in(argv[1]);

ofstream out(argv[2]);

if (!in || !out)

return(EXIT_FAILURE);

if (argc == 4) w = atoi(argv[3]);

textWrap(in, out, w);

out.close;

if (out)

return(EXIT_SUCCESS);

else

return(EXIT_FAILURE);

}

Обсуждение

textWrap

читает по одному символы из входного потока. Каждый символ добавляется к временной строке

tmp

до тех пор, пока не будет достигнут конец слов или максимальная длина строки. Если достигнут конец слова, а максимальная длина строки еще не достигнута, то временная строка записывается в выходной поток. В противном случае, если максимальная длина строки была превышена, в выходной поток записывается новая строка, пробел в начале временной строки удаляется, и строка записывается в выходной поток. Таким образом,

textWrap

записывает в выходной поток столько, сколько можно, но не превышая максимальной длины строки. Вместо разделения слов она переносит все слово на новую строку.

Пример 4.25 использует потоки почти так же, как и рецепт 4.15. За дополнительной информацией о потоках и их использовании обратитесь к этому рецепту.

Смотри также

Рецепт 4.15.

4.17. Подсчет числа символов, слов и строк в текстовом файле

Проблема

Требуется подсчитать число символов, слов и строк — или каких-либо других элементов текста — в текстовом файле.

Решение

Для чтения символов по одному используйте входной поток и по мере чтения символов, слов и строк увеличивайте счетчики. Пример 4.26 содержит функцию

countStuff

, которая именно это и делает.

Пример 4.26. Подсчет статистики по текстовому файлу

#include <iostream>

#include <fstream>

#include <cstdlib>

#include <cctype>

using namespace std;

void countStuff(istream& in,

int& chars, int& words, int& lines) {

char cur = '\0';

char last = '\0';

chars = words = lines = 0;

while (in.get(cur)) {

if (cur == '\n' ||

(cur == '\f' && last == '\r'))

lines++;

else chars++;

if (!std::isalnum(cur) && // Это конец

std::isalnum(last)) // слова

words++;

last = cur;

}

if (chars > 0) { // Изменить значения слов

if (std::isalnum(last)) // и строк для специального

words++; // случая

lines++;

}

int main(int argc, char** argv) {

if (argc < 2)

return(EXIT _FAILURE);

ifstream in(argv[1]);

if (!in)

exit(EXIT_FAILURE);

int c, w, l;

countStuff(in, c, w, l);

cout << "символов: " << c << '\n';

cout << "слов: " << w << '\n';

cout << "строк: " << l << '\n';

}

Обсуждение

Этот

алгоритм очень прост. С символами все просто: увеличивайте счетчик символов при каждом вызове

get

для входного потока. Со строками все не намного сложнее, так как способ представления концов строк зависит от операционной системы. К счастью, обычно это либо символ новой строки (

), либо последовательность из символов возврата каретки и перевода строки (

\r\n

). Отслеживая текущий и предыдущий символы, можно легко обнаружить вхождения этой последовательности. Со словами все проще или сложнее, в зависимости от определения того, что такое «слово».

Для примера 4.26 я предположил, что слово это неразрывная последовательность буквенно-цифровых символов. В процессе просмотра каждого символа входного потока при обнаружении неалфавитно-цифрового символа я проверяю предыдущий символ — был ли он буквенно-цифровым или нет. Если был то это конец слова, и я увеличиваю счетчик слов. Определить, является ли символ буквенно-цифровым, можно с помощью функции

isalnum

из

. Но это еще не все — с помощью аналогичных функций можно проверять символы на целый ряд других качеств. Функции, которые предназначены для проверки характеристик символов, приведены в табл. 4.3. Для широких символов используйте функции с такими же именами, но с буквой «w» после «is», например

iswSpace

. Версии для широких символов объявлены в заголовочном файле

Табл. 4.3. Функции для проверки символов из <cctype> и <cwctype>

Функция	Описание
isalpha iswalpha	Буквенные символы: a-z, A-Z (верхний или нижний регистр)
isupper iswupper	Буквенные символы верхнего регистра: A-Z
islower iswlower	Буквенные символы нижнего регистра: a-z
isdigit iswdigit	Числовые символы: 0-9
isxdigit iswxdigit	Шестнадцатеричные числовые символы: 0-9, a-f, A-F
isspace iswspace	Пробельные символы. ' ', \n, \t, \v, \r, \l
iscntrl iswcntrl	Управляющие символы: ASCII 0-31 и 127
ispunct iswpunct	Символы пунктуации, не принадлежащие предыдущим группам
isalnum iswalnum	isalpha или isdigit равны true
isprint iswprint	Печатаемые символы ASCII
isgraph iswgraph	isalpha , isdigit или ispunct равны true

После того как были прочтены все символы и достигнут конец файла, требуется сделать еще кое-что. Во-первых, строго говоря, цикл подсчитывает только переносы строк, а не сами строки. Следовательно, это значение будет на одну меньше, чем реальное число строк. Чтобы решить эту проблему, я, если файл содержит ненулевое число символов, просто увеличиваю счетчик строк на единицу. Во-вторых, если поток заканчивается на буквенно-цифровой символ, то поиск конца последнего слова не сработает, так как не будет следующего символа. Чтобы учесть это, я проверяю, является ли последний символ потока буквенно-цифровым (также только в том случае, если в файле содержится ненулевое число символов), и увеличиваю счетчик слов на единицу.

1-56 57 58 59 60 61 62 63 64 65 66 67 68 69 70-197

Поделиться с друзьями:

Чтение онлайн

КНИГИ

АВТОРЫ

ЖАНРЫ

Деловая литература

Детективы

Детские

Документальная литература

Дом и Семья

Драматургия

Жанр не определен

Компьютеры и Интернет

Любовные романы

Научно-образовательная

Поэзия

Приключения

Проза

Прочее

Религия и эзотерика

Справочная литература

Старинная литература

Техника

Фантастика

Фольклор

Юмор

C++. Сборник рецептов

Когсуэлл Джефф

Шрифт: