Книга: UNIX: разработка сетевых приложений
4.7. Функции fork и exec
4.7. Функции fork и exec
Прежде чем рассматривать создание параллельного сервера (что мы сделаем в следующем разделе), необходимо описать функцию Unix fork
. Эта функция является единственным способом создания нового процесса в Unix.
#include <unistd.h>
pid_t fork(void);
Возвращает: 0 в дочернем процессе, идентификатор дочернего процесса в родительском процессе, -1 в случае ошибки
Если вы никогда не встречались с этой функцией, трудным для понимания может оказаться то, что она вызывается один раз, а возвращает два значения. Одно значение эта функция возвращает в вызывающем процессе (который называется родительским процессом) — этим значением является идентификатор созданного процесса (который называется дочерним процессом). Второе значение (нуль) она возвращает в дочернем процессе. Следовательно, по возвращаемому значению можно определить, является ли данный процесс родительским или дочерним.
Причина того, что функция fork
возвращает в дочернем процессе нуль, а не идентификатор родительского процесса, заключается в том, что у дочернего процесса есть только один родитель, и дочерний процесс всегда может получить идентификатор родительского, вызвав функцию getppid
. У родителя же может быть любое количество дочерних процессов, и способа получить их идентификаторы не существует. Если родительскому процессу требуется отслеживать идентификаторы своих дочерних процессов, он должен записывать возвращаемые значения функции fork
.
Все дескрипторы, открытые в родительском процессе перед вызовом функции fork
, становятся доступными дочерним процессам. Вы увидите, как это свойство используется сетевыми серверами: родительский процесс вызывает функцию accept
, а затем функцию fork
. Затем присоединенный сокет совместно используется родительским и дочерним процессами. Обычно дочерний процесс использует присоединенный сокет для чтения и записи, а родительский процесс только закрывает присоединенный сокет.
Существует два типичных случая применения функции fork
:
1. Процесс создает свои копии таким образом, что каждая из них может обрабатывать одно задание. Это типичная ситуация для сетевых серверов. Далее в тексте вы увидите множество подобных примеров.
2. Процесс хочет запустить другую программу. Поскольку единственный способ создать новый процесс — это вызвать функцию fork
, процесс сначала вызывает функцию fork
, чтобы создать свою копию, а затем одна из копий (обычно дочерний процесс) вызывает функцию exec
(ее описание следует за описанием функции fork
), чтобы заменить себя новой программой. Этот сценарий типичен для таких программ, как интерпретаторы командной строки.
Единственный способ запустить в Unix на выполнение какой-либо файл — вызвать функцию exec
. (Мы будем часто использовать общее выражение «функция exec
», когда неважно, какая из шести функций семейства exec
вызывается.) Функция exec
заменяет копию текущего процесса новым программным файлом, причем в новой программе обычно запускается функция main
. Идентификатор процесса при этом не изменяется. Процесс, вызывающий функцию exec
, мы будем называть вызывающим процессом, а выполняемую при этом программу — новой программой.
ПРИМЕЧАНИЕ
В старых описаниях и книгах новая программа ошибочно называется «новым процессом». Это неверно, поскольку новый процесс не создается.
Различие между шестью функциями exec
заключается в том, что они допускают различные способы задания аргументов:
? выполняемый программный файл может быть задан или именем файла (filename), или полным именем (pathname);
? аргументы новой программы либо перечисляются один за другим, либо на них имеется ссылка через массив указателей;
? новой программе либо передается окружение вызывающего процесса, либо задается новое окружение.
#include <unistd.h>
int execl(const char *pathname, const char *arg0, ... /* (char*)0 */ );
int execv(const char *pathname, char *const argv[]);
int execle(const char *pathname, const char *arg0 ... /* (char*)0,
char *const envp[] */ );
int execve(const char *pathname, char *const argv[], char *const envp[]);
int execlp(const char *filename, const char *arg0, .... /* (char*)0 */ );
int execvp(const char *filename, char *const argv[]);
Все шесть функций возвращают: -1 в случае ошибки, если же функция выполнена успешно, то ничего не возвращается
Эти функции возвращают вызывающему процессу значение -1, только если происходит ошибка. Иначе управление передается в начало новой программы, обычно функции main
.
Отношения между этими шестью функциями показаны на рис. 4.4. Обычно только функция execve
является системным вызовом внутри ядра, а остальные представляют собой библиотечные функции, вызывающие execve
.
Рис. 4.4. Отношения между шестью функциями exec
Отметим различия между этими функциями:
1. Три верхних функции (см. рис. 4.4) принимают каждую строку как отдельный аргумент, причем перечень аргументов завершается пустым указателем (так как их количество может быть различным). У трех нижних функций имеется массив argv
, содержащий указатели на строки. Этот массив должен содержать пустой указатель, определяющий конец массива, поскольку размер массива не задается.
2. Две функции в левой колонке получают аргумент filename
. Он преобразуется в pathname
с использованием текущей переменной окружения PATH
. Если аргумент filename
функций execlp
или execvp
содержит косую черту (/
) в любом месте строки, переменная PATH
не используется. Четыре функции в двух правых колонках получают полностью определенный аргумент pathname
.
3. Четыре функции в двух левых колонках не получают явного списка переменных окружения. Вместо этого с помощью текущего значения внешней переменной environ
создается список переменных окружения, который передается новой программе. Две функции в правой колонке получают точный список переменных окружения. Массив указателей envp
должен быть завершен пустым указателем.
Дескрипторы, открытые в процессе перед вызовом функции exec
, обычно остаются открытыми во время ее выполнения. Мы говорим «обычно», поскольку это свойство может быть отключено при использовании функции fcntl
для установки флага дескриптора FD_CLOEXEC
. Это нужно серверу inetd
, о котором пойдет речь в разделе 13.5.
- Семейство функций exec()
- Листинг 3.3. (fork.c) Ветвление программы с помощью функции fork()
- 9.1.1. Создание процесса: fork()
- Вызов функции fork()
- 6.1 fork
- 10.4.4. Ускоренное создание процессов с помощью vfork()
- 3.2.2. Функции fork() и exec()
- Совместное использование функций fork() и exec()
- Аргументы функции в Python
- 3. Функции
- Новые функции API для работы с Blob и массивами
- Математические функции