8.6 Этап 6: функции и процедуры; ввод-вывод / UNIX — универсальная среда программирования / Библиотека (книги, учебники и журналы) / В помощь Веб-Мастеру

Обложка
Аннотация

Книги автора: UNIX — универсальная среда программированияThe UNIX Programming Environment Язык программирования Си. Издание 3-е, исправленноеThe C programming Language. Second Edition

/ Роб Пайк i

Книги автора: UNIX — универсальная среда программированияThe UNIX Programming Environment

/ А. Березко i

Книги автора: UNIX — универсальная среда программированияThe UNIX Programming Environment

/ В. Иващенко i

Книги автора: Управление контент-маркетингом. Практическое руководство по созданию лояльной аудитории для вашего бизнеса UNIX — универсальная среда программированияThe UNIX Programming Environment Продающий контент. Как связать контент-маркетинг, SEO и социальные сети в единую систему Как быстро заработать деньги в ИнтернетYour Internet Cash Machine. The Insiders

/ Brian Kernighan i

/ Rob Pike i

Книги автора: UNIX — универсальная среда программированияThe UNIX Programming Environment DirectX 8 Programming Tutorial

Книга: UNIX — универсальная среда программирования

8.6 Этап 6: функции и процедуры; ввод-вывод

8.6 Этап 6: функции и процедуры; ввод-вывод

На последнем из описываемых здесь этапе развития программа значительно разрастается: в нее добавляются процедуры и функции, средства печати строк символов наряду с числами и чтения чисел из стандартного входного потока. Кроме того, в язык hoc6 вводятся аргументы имен файлов, включая имя "-", обозначающее стандартный входной поток. Все эти изменения увеличивают программу на 235 строк, доводя ее общий размер до 810 строк. В результате hoc преобразуется из калькулятора в интерпретатор языка программирования. Полностью программа приводится в приложении 3.

В грамматике вызовы функции определяются как выражения, а вызовы процедур как операторы. И то, и другое детально поясняется в приложении 2, где дается еще несколько примеров. Так, определение и использование процедуры печати всех чисел Фибоначчи, меньших заданного параметра, происходят следующим образом:

$ cat fib proc fib() { a = 0 b = 1 while (b < $1) { print b с = b b = a+b a = с } print "n" } $ hoc6 fib - fib(1000) 1 1 2 3 5 8 13 21 34.55 89 144 233 377 610 987 ...

Здесь также показано использование файлов: имя файла "-" задает стандартный входной поток.

Ниже приведена функция "факториал":

$ cat fac func fac() { if ($1 <= 0) return 1 else return $1 * fac($1-1) } $ hoc6 fac - fac(0) 1 fac(7) 5040 fac(10) 3628800 ...

Внутри процедуры или функции к параметрам можно обращаться с помощью $1 и т.д., как в командных файлах, но, кроме того, допустимо присваивание параметрам. Функции и процедуры рекурсивны, но в качестве локальных переменных можно использовать только параметры; остальные переменные являются глобальными, т.е. доступными во всей программе.

В языке hoc функции и процедуры различаются, что дает возможность проверки, ценной для освобождения стека. (Ведь так легко забыть выполнить возврат или записать липшее выражение и получить несбалансированный стек!)

Требуется значительное число изменений для преобразования грамматики при переходе от hoc5 к hoc6, но все они локальные. Нужны новые лексемы и нетерминальные символы, а в описание %union необходимо ввести новый элемент для хранения числа аргументов:

$cat hoc.y ... %{ #include "hoc.h" #define code2(c1,c2) code(c1); code(c2) #define code3(c1,c2,c3) code(c1); code(c2); code(c3) %} %union { Symbol *sym; /* symbol table pointer */ Inst *inst; /* machine instruction */ int narg; /* number of arguments */ } %token <sym> NUMBER STRING PRINT VAR BLTIN UNDEF WHILE IF ELSE %token <sym> FUNCTION PROCEDURE RETURN FUNC PROC READ %token <narg> ARG %type <inst> expr stmt asgn prlist stmtlist %type <inst> cond while if begin end %type <sym> procname %type <narg> arglist %right '=' %left OR %left AND %left GT GE LT LE EQ NE %left '+' %left '*' '/' %left UNARYMINUS NOT %right '^' %% list: /* nothing */ | list 'n' | list defn 'n' | list asgn 'n' { code2(pop, STOP); return 1; } | list stmt 'n' { code(STOP); return 1; } | list expr 'n' { code2(print, STOP); return 1; } | list error 'n' { yyerrok; } ; asgn: VAR '=' expr { code3(varpush,(Inst)$1,assign); $$=$3; } | ARG '=' expr { defnonly("$"); code2(argassign,(Inst)$1); $$=$3;} ; stmt: expr { code(pop); } | RETURN { defnonly("return"); code(procret); } | RETURN expr { defnonly("return"); $$=$2; code(funcret); } | PROCEDURE begin '(' arglist ')' { $$ = $2; code3(call, (Inst)$1, (Inst)$4); } | PRINT prlist { $$ = $2; } | while cond stmt end { ($1)[1] = (Inst)$3; /* body of loop */ ($1)[2] = (Inst)$4; } /* end, if cond fails */ | if cond stmt end { /* else-less if */ ($1)[1] = (Inst)$3; /* thenpart */ ($1)[3] = (Inst)$4; } /* end, if cond fails */ | if cond stmt end ELSE stmt end { /* if with else */ ($1)[1] = (Inst)$3; /* thenpart */ ($1)[2] = (Inst)$6; /* elsepart */ ($1)[3] = (Inst)$7; } /* end, if cond fails */ | '{' stmtlist '}' { $$ = $2; } ; cond: '(' expr ')' { code(STOP); $$ = $2; } ; while: WHILE { $$ = code3(whilecode,STOP,STOP); } ; if: IF { $$ = code(ifcode); code3(STOP, STOP, STOP); } ; begin: /* nothing */ { $$ = progp; } ; end: /* nothing */ { code(STOP); $$ = progp; } ; stmtlist: /* nothing */ { $$ = progp; } | stmtlist 'n' | stmtlist stmt ; expr: NUMBER { $$ = code2(constpush, (Inst)$1); } | VAR { $$ = code3(varpush, (Inst)$1, eval); } | ARG { defnonly("$"); $$ = code2(arg, (Inst)$1); } | asgn | FUNCTION begin '(' arglist ')' { $$ = $2; code3(call,(Inst)$1,(Inst)$4); } | READ '(' VAR ')' { $$ = code2(varread, (Inst)$3); } | BLTIN '(' expr ')' { $$=$3; code2(bltin, (Inst)$1->u.ptr); } | '(' expr ')' { $$ = $2; } | expr '+' expr { code(add); } | expr '-' expr { code(sub); } | expr '*' expr { code(mul); } | expr '/' expr { code(div); } | expr '^' expr { code (power); } | '-' expr %prec UNARYMINUS { $$=$2; code(negate); } | expr GT expr { code(gt); } | expr GE expr { code(ge); } | expr LT expr { code(lt); } | expr LE expr { code(le); } | expr EQ expr { code(eq); } | expr NE expr { code(ne); } | expr AND expr { code(and); } | expr OR expr { code(or); } | NOT expr { $$ = $2; code(not); } ; prlist: expr { code(prexpr); } | STRING { $$ = code2(prstr, (Inst)$1); } | prlist ',' expr { code(prexpr); } | prlist ',' STRING { code2(prstr, (Inst)$3); } ; defn: FUNC procname { $2->type=FUNCTION; indef=1; } '(' ')' stmt { code(procret); define($2); indef=0; } | PROC procname { $2->type=PROCEDURE; indef=1; } '(' ')' stmt { code(procret); define($2); indef=0; } ; procname: VAR | FUNCTION | PROCEDURE ; arglist: /* nothing */ { $$ = 0; } | expr { $$ = 1; } | arglist expr { $$ = $1 + 1; } ; %% /* end of grammar */ ...

С помощью правила для аргсписок (список аргументов) подсчитывается число аргументов. На первый взгляд может показаться, что нужно каким-то образом собирать аргументы, но это не так, поскольку каждое выражение (выраж) из списка аргументов вырабатывает значение в стеке как раз там, где оно необходимо.

Правило для опред вводит новое свойство языка yacc: встроенное действие. Оказывается, можно поместить действие посредине правила, так, чтобы оно выполнялось в процессе распознавания последнего. Мы воспользовались этой возможностью, чтобы запомнить, что сейчас распознается: определение функции или процедуры. (В качестве альтернативного решения можно было бы ввести новый символ типа begin, который распознавался бы в соответствующее время.) Функция defnonly печатает предупреждающее сообщение, если вопреки синтаксису какая-либо конструкция окажется вне определения функции или процедуры. Обычно вам предоставляется выбор: обнаруживать ошибку синтаксически или семантически. Перед нами уже стояла такая задача ранее, при диагностике неопределенных переменных. Функция defnonly хорошо иллюстрирует ситуацию, когда семантическая проверка легче синтаксической.

defnonly(s) /* warn if illegal definition */ char *s; { if (!indef) execerror(s, "used outside definition"); }

Переменная indef определена в hoc.y и принимает значения в действиях для опред.

К лексическому анализатору добавлены средства проверки аргументов: символ $, за которым следует чисто для строки в кавычках. Последовательности в строках, начинающиеся с обратной дробной черты, например n, обрабатываются функцией backslash:

yylex() /* hoc6 */ ... if (c == '$') { /* argument? */ int n = 0; while (isdigit(c=getc(fin))) n = 10 * n + c — '0'; ungetc(с, fin); if (n == 0) execerror("strange $...", (char*)0); yylval.narg = n; return ARG; } if (c == '"') { /* quoted string */ char sbuf [100], *p, *emalloc(); for (p = sbuf; (c=getc(fin)) != '"'; p++) { if (с == 'n' || c == EOF) execerror("missing quote", ""); if (p >= sbuf + sizeof (sbuf) - 1) { *p = ''; execerror("string too long", sbuf); } *p = backslash(c); } *p = 0; yylval.sym = (Symbol*)emalloc(strlen(sbuf)+1); strcpy(yylval.sym, sbuf); return STRING; } ... backslash(c) /* get next char with 's interpreted */ int c; { char *index(); /* 'strchr()' in some systems */ static char transtab[] = "bbffnnrrtt"; if (c != '') return c; c = getc(fin); if (islower(c) && index(transtab, c)) return index(transtab, с)[1]; return c; }

Лексический анализатор является примером конечного автомата независимо от того, написан ли он на Си или получен с помощью порождающей программы типа lex. Наша первоначальная версия Си программы стала весьма сложной, и поэтому для всех программ, больших ее по объему, лучше использовать lex, чтобы максимально упростить внесение изменений.

Остальные изменения сосредоточены главным образом в файле code.c, хотя несколько имен функций добавляется к файлу hoc.h. Машина остается той же, но с дополнительным стеком для хранения последовательности вложенных вызовов функций и процедур (проще ввести второй стек, чем загружать больший объем информации в существующий). Начало файла code.c выглядит так:

$ cat code.c #include "hoc.h" #include "y.tab.h" #include <stdio.h> #define NSTACK 256 static Datum stack[NSTACK]; /* the stack */ static Datum *stackp; /* next free spot on stack */ #define NPROG 2000 Inst prog[NPROG]; /* the machine */ Inst *progp; /* next free spot for code generation */ Inst *pc; /* program counter during execution */ Inst *progbase = prog; /* start of current subprogram */ int returning; /* 1 if return stmt seen */ typedef struct Frame { /* proc/func call stack frame */ Symbol *sp; /* symbol table entry */ Inst *retpc; /* where to resume after return */ Datum *argn; /* n-th argument on stack */ int nargs; /* number of arguments */ } Frame; #define NFRAME 100 Frame frame[NFRAME]; Frame *fp; /* frame pointer */ initcode() { progp = progbase; stackp = stack; fp = frame; returning = 0; } ... $

Поскольку теперь в таблице имен хранятся указатели на функции и процедуры, а также на строки для печати, необходимо расширить определение типа объединения в файле hoc.h:

$ cat hoc.h typedef struct Symbol { /* symbol table entry */ char *name; short type; union { double val; /* VAR */ double (*ptr)(); /* BLTIN */ int (*defn)(); /* FUNCTION, PROCEDURE */ char *str; /* STRING */ } u; struct Symbol *next; /* to link to another */ } Symbol; $

В процессе трансляции функция define заносит запись о функции в таблицу имен, сохраняет указатель на нее и изменяет в случае успешной компиляции адрес следующего после созданных команд свободного слова:

define(sp) /* put func/proc in symbol table */ Symbol *sp; { sp->u.defn = (Inst)progbase; /* start of code */ progbase = progp; /* next code starts here */ }

Когда в процессе выполнения вызывается функция или процедура, все аргументы уже вычислены и помещены в стек (первый аргумент находится на наибольшем уровне). Код операции вызова (call) сопровождается указателем на таблицу имен и числом аргументов. Сохраняется образ стека, в котором содержится вся существенная информация о программе: запись в таблице имен, место возврата после вызова, место хранения аргументов в стеке выражений, а также число аргументов, сопровождающих вызов. Образ стека создается функцией call, которая затем выполняет тело программы.

call() /* call a function */ { Symbol *sp = (Symbol*)pc[0]; /* symbol table entry */ /* for function */ if (fp++ >= &frame[NFRAME-1]) execerror(sp->name, "call nested too deeply"); fp->sp = sp; fp->nargs = (int)pc[1]; fp->retpc = pc + 2; fp->argn = stackp - 1; /* last argument */ execute(sp->u.defn); returning = 0; }

Создаваемая структура показана на рис. 8.2.

8.6 Этап 6: функции и процедуры; ввод-вывод

Рис. 8.2: Структуры данных для вызова процедуры

В конце концов произойдет возврат из вызываемой программы при выполнении procret или funcret:

funcret() /* return from a function */ { Datum d; if (fp->sp->type == PROCEDURE) execerror(fp->sp->name, "(proc) returns value"); d = pop(); /* preserve function return value */ ret(); push(d); } procret() /* return from a procedure */ { if (fp->sp->type == FUNCTION) execerror(fp->sp->name(func) returns no value"); ret(); }

Функция ret удаляет аргументы из стека, сохраняет указатель на образ стека fp и устанавливает счетчик команд:

ret() /* common return from func or proc */ { int i; for (i = 0; i < fp->nargs; i++) pop(); /* pop arguments */ pc = (Inst*)fp->retpc; --fp; returning = 1; }

Некоторые программы интерпретатора нуждаются в небольших поправках для учета ситуаций, когда происходит возврат во вложенных операторах. Решение не элегантно, но верно и состоит во введении признака с именем returning, который принимает значение 1 при обнаружении оператора return. Выполнение, организуемое функциями ifcode, whilecode, execute, завершается раньше, если установлен признак returning; в функции call он обнуляется.

ifcode() { Datum d; Inst *savepc = pc; /* then part */ execute(savepc+3); /* condition */ d = pop(); if (d.val) execute(*((Inst**)(savepc))); else if (*((Inst**)(savepc+1))) /* else part? */ execute(*((Inst**)(savepc+1))); if (!returning) pc = *((Inst**)(savepc+2)); /* next stmt */ } whilecode() { Datum d; Inst *savepc = pc; execute(savepc+2); /* condition */ d = pop(); while (d.val) { execute(*((Inst**)(savepc))); /* body */ if (returning) break; execute(savepc+2); /* condition */ d = pop(); } if (!returning) pc = *((Inst**)(savepc+1)); /* next stmt */ } execute(p) Inst *p; { for (pc = p; *pc != STOP && !returning; ) (*((++pc)[-1]))(); }

Аргументы выбираются для получения значения или присваивания с помощью функции getarg, которая следит за сбалансированностью стека:

double *getarg() /* return pointer to argument */ { int nargs = (int)*pc++; if (nargs > fp->nargs) execerror(fp->sp->name, "not enough arguments"); return &fp->argn[nargs - fp->nargs].val; } arg() /* push argument onto stack */ { Datum d; d.val = *getarg(); push(d); } argassign() /* store top of stack in argument */ { Datum d; d = pop(); push(d); /* leave value on stack */ *getarg() = d.val; }

Функции prstr и prexpr печатают строки и числа:

prstr() /* print string value */ { printf("%s", (char*)*pc++); } prexpr() /* print numeric value */ { Datum d; d = pop(); printf("%.8g d.val); }

Функция varread читает переменные. Она возвращает 0 при обнаружении конца файла и 1 — в противном случае, а также устанавливает значение указанной переменной:

varread() /* read into variable */ { Datum d; extern FILE *fin; Symbol *var = (Symbol*)*pc++; Again: switch (fscanf(fin, "%lf", &var->u.val)) { case EOF: if (moreinput()) goto Again; d.val = var->u.val = 0.0; break; case 0: execerror("non-number read into", var->name); break; default: d.val = 1.0; break; } var->type = VAR; push(d); }

Обнаружив конец файла для текущего входного потока, функция varread обратится к moreinput, которая откроет следующий файл, заданный в качестве аргумента (если он есть). В функции moreinput обработка входной информации имеет некоторые нюансы, здесь не рассматриваемые; речь о них идет в приложении 3.

Итак, мы завершили разработку программы hoc. Для сравнения приведем число непустых строк в каждой версии:

hoc1 59

hoc2 94

hoc3 248 (для версии с lex 229)

hoc4 396

hoc5 574

hoc6 809

Конечно, эти значения были вычислены программным способом: $

sed '/$/d' `pick *.[chyl]` | wc -l

Безусловно, развитие языка может быть продолжено, и вам предоставляется такая возможность в приведенных ниже упражнениях.

Упражнение 8.18

Измените hoc6 так, чтобы можно было использовать поименованные формальные параметры в подпрограммах вместо $1 и т.д.

Упражнение 8.19

Сейчас все переменные глобальны, за исключением параметров. Уже есть большая часть механизма для введения локальных переменных, хранимых в стеке. Одно из решений заключается во введении описания auto, которое резервирует место в стеке для перечисленных переменных; не перечисленные переменные считаются глобальными. Кроме того, придется расширить таблицу имен так, чтобы поиск в ней осуществлялся вначале для локальных, а затем для глобальных переменных. Как это связано с поименованными аргументами?

Упражнение 8.20

Как бы вы ввели массивы в язык hoc? Как следует передавать их функциям и процедурам? Как возвращать их?

Упражнение 8.21

Обобщите работу со строками так, чтобы переменные могли хранить строки, а не только числа. Какие операции потребуются для этого? Самая трудная часть управление памятью добейтесь динамичного хранения строк: память должна освобождаться, когда строки перестают быть нужными. В качестве промежуточного шага добавьте более развитые форматы печати, например, обеспечьте возможность использования некоторых форм стандартной Си функции printf.

Оглавление книги

Оглавление статьи/книги

Похожие страницы