Книга: Разработка приложений в среде Linux. Второе издание
23.2.3. Простая утилита grep
23.2.3. Простая утилита grep
является популярной утилитой, определенной в стандарте POSIX, которая предлагает возможности поиска регулярного выражения в текстовых файлах. Ниже показана простая (не соответствующая стандарту POSIX) версия утилиты
grepgrep
, реализованная с помощью функций стандартного регулярного выражения.
1: /* grep.с */
2:
3: #include <alloca.h>
4: #include <ctype.h>
5: #include <popt.h>
6: #include <regex.h>
7: #include <stdio.h>
8: #include <string.h>
9: #include <unistd.h>
10:
11: #define MODE_REGEXP 1
12: #define MODE_EXTENDED 2
13: #define MODE_FIXED 3
14:
15: void do_regerror(int errcode, const regex_t *preg) {
16: char *errbuf;
17: size_t errbuf_size;
18:
19: errbuf_size = regerror(errcode, preg, NULL, 0);
20: errbuf = alloca(errbuf_size);
21: if (!errbuf) {
22: perror("alloca");
23: return;
24: }
25:
26: regerror(errcode, preg, errbuf, errbuf_size);
27: fprintf(stderr, "%sn", errbuf);
28: }
29:
30: int scanFile(FILE * f, int mode, const void * pattern,
31: int ignoreCase, const char * fileName,
32: int * maxCountPtr) {
33: long lineLength;
34: char * line;
35: int match;
36: int rc;
37: char * chptr;
38: char * prefix = "";
39:
40: if (fileName) {
41: prefix = alloca(strlen(fileName) + 4);
42: sprintf(prefix, "%s: ", fileName);
43: }
44:
45: lineLength = sysconf(_SC_LINE_MAX);
46: line = alloca(lineLength);
47:
48: while (fgets(line, lineLength, f) && (*maxCountPtr)) {
49: /* если у нас не будет завершающего символа 'n'
50: то мы не сможем получить всю строку целиком */
51: if (line [strlen (line) -1] != 'n') {
52: fprintf(stderr, " %s line слишком длиннаяn", prefix);
53: return 1;
54: }
55:
56: if (mode == MODE_FIXED) {
57: if (ignoreCase) {
58: for (chptr = line; *chptr; chptr++) {
59: if (isalpha(*chptr)) *chptr = tolower(*chptr);
60: }
61: }
62: match = (strstr(line, pattern) != NULL);
63: } else {
64: match = 0;
65: rc = regexec (pattern, line, 0, NULL, 0);
66: if (!rc)
67: match = 1;
68: else if (rc != REG_NOMATCH)
69: do_regerror(match, pattern);
70: }
71:
72: if (match) {
73: printf("%s%s", prefix, line);
74: if (*maxCountPtr > 0)
75: (*maxCountPtr)--;
76: }
77: }
78:
79: return 0;
80: }
81:
82: int main(int argc, const char ** argv) {
83: const char * pattern = NULL;
84: regex_t regPattern;
85: const void * finalPattern;
86: int mode = MODE_REGEXP;
87: int ignoreCase = 0;
88: int maxCount = -1;
89: int rc;
90: int regFlags;
91: const char ** files;
92: poptContext optCon;
93: FILE * f;
94: char * chptr;
95: struct poptOption optionsTable[] = {
96: { "extended-regexp", 'E', POPT_ARG_VAL,
97: &mode, MODE_EXTENDED,
98: "шаблоном для соответствия является расширенное регулярное "
99: "выражение"},
100: { "fixed-strings", 'F', POPT_ARG_VAL,
101: &mode, MODE_FIXED,
102: "шаблоном для соответствия является базовая строка (не "
103: "регулярное выражение)", NULL },
104: { "basic-regexp", 'G', POPT_ARG_VAL,
105: &mode, MODE_REGEXP,
106: "шаблоном для соответствия является базовое регулярное выражение" },
107: { "ignore-case", 'i', POPT_ARG_NONE, &ignoreCase, 0,
108: "выполнять поиск, чувствительный к регистру", NULL },
109: { "max-count", 'm', POPT_ARG_INT, &maxCount, 0,
110: "завершить после получения N. совпадений", "N" },
111: { "regexp", 'e', POPT_ARG_STRING, &pattern, 0,
112: "регулярное выражение для поиска", "pattern" },
113: POPT_AUTOHELP
114: { NULL, '', POPT_ARG_NONE, NULL, 0, NULL, NULL }
115: };
116:
117: optCon = poptGetContext("grep", argc, argv, optionsTable, 0);
118: poptSetOtherOptionHelp(optCon, "<шаблон> <список файлов>");
119:
120: if ((rc = poptGetNextOpt(optCon)) < -1) {
121: /* во время обработки параметра возникла ошибка */
122: fprintf(stderr, "%s: %sn",
123: poptBadOption(optCon, POPT_BADOPTION_NOALIAS),
124: poptStrerror(rc));
125: return 1;
126: }
127:
128: files = poptGetArgs(optCon);
129: /* если мы не получили шаблон, то он должен быть первым
130: из оставшихся */
131: if (!files && !pattern) {
132: poptPrintUsage(optCon, stdout, 0);
133: return 1;
134: }
135:
136: if (!pattern) {
137: pattern = files[0];
138: files++;
139: }
140:
141: regFlags = REG_NEWLINE | REG_NOSUB;
142: if (ignoreCase) {
143: regFlags |= REG_ICASE;
144: /* преобразование шаблона в нижний регистр; этого можно не делать,
145: если мы игнорируем регистр в регулярном выражении, однако позволяет
146: функции strstr() правильно обработать -i */
147: chptr = alloca(strlen(pattern) + 1);
148: strcpy(chptr, pattern);
149: pattern = chptr;
150:
151: while (*chptr) {
152: if (isalpha(*chptr)) *chptr = tolower(*chptr);
153: chptr++;
154: }
155: }
156:
157:
158: switch (mode) {
159: case MODE_EXTENDED:
160: regFlags |= REG_EXTENDED;
161: case MODE_REGEXP:
162: if ((rc = regcomp(®Pattern, pattern, regFlags))) {
163: do_regerror(rc, ®Pattern);
164: return 1;
165: }
166: finalPattern = ®Pattern;
167: break;
168:
169: case MODE_FIXED:
170: finalPattern = pattern;
171: break;
172: }
173:
174: if (!*files) {
175: rc = scanFile(stdin, mode, finalPattern, ignoreCase, NULL,
176: &maxCount);
177: } else if (!files[1]) {
178: /* эта часть обрабатывается отдельно, поскольку имя файла
179: выводить не нужно */
180: if (!(f = fopen(*files, "r"))) {
181: perror(*files);
182: rc = 1;
183: } else {
184: rc = scanFile(f, mode, finalPattern, ignoreCase, NULL,
185: &maxCount);
186: fclose(f);
187: }
188: } else {
189: rc = 0;
190:
191: while (*files) {
192: if (!(f = fopen(*files, "r"))) {
193: perror(*files);
194: rc = 1;
195: } else {
196: rc |= scanFile(f, mode, finalPattern, ignoreCase,
197: *files, &maxCount);
198: fclose(f);
199: }
200: files++;
201: if (!maxCount) break;
202: }
203: }
204:
205: return rc;
206: }
- 20.1 Утилита dpkg
- 5.4 Утилита резервного копирования Windows 2000
- 16.3. Простая программа для автоматического доказательства теорем
- ГЛАВА 37. Интерактивный SQL (утилита isql).
- 15.4. Утилита make: автоматизация процедур
- Простая архитектура PKI
- Searches for a String in Input with grep
- Пример A-3. rn: Очень простая утилита для переименования файлов
- Простая функция хеширования для строк
- 17.1.1. Простая разметка
- Утилита ksymoops
- Непростая задача