Книга: C# для профессионалов. Том II
Потоки
Потоки
Идея потока существует уже очень давно. Поток является объектом, используемым для пересылки данных. Данные могут передаваться в одном или в двух направлениях:
? Если данные передаются в программу из некоторого внешнего источника, то речь идет о чтении из потока.
? Если данные передаются из программы в некоторый внешний источник, то речь идет о записи в поток.
Очень часто внешний источник является файлом, но не всегда. Другими вариантами могут быть:
? Чтение или запись данных в сети с помощью некоторого сетевого протокола, куда посылают данные или получают с другого компьютера.
? Чтение или запись через именованный канал.
? Чтение или запись данных в области памяти.
Для таких примеров Microsoft поставляет базовый класс .NET для записи в память и чтения из памяти System.IO.MemoryStream
, в то время как System.Net.Sockets.Networkstream
обрабатывает сетевые данные. Не существует базовых классов потока для записи в каналы или чтения из каналов, но существует базовый класс потока, System.IO.Stream
, из которого можно создать, если понадобиться, производный класс. Поток не делает никаких предположений о природе внешнего источника данных.
Внешний источник иногда бывает даже переменной в коде приложения. Возможно, это звучит парадоксально, но техника использования потоков для передачи данных между переменными может оказаться полезным приемом для преобразования типов данных. Язык С использовал что-то подобное для преобразования между целыми типами данных и строками или для форматирования строк с помощью функции sprintf()
, а в C# два базовых класса .NET, StringReader
и StringWriter
, могут использоваться в таком контексте.
Преимущество применения отдельного объекта для передачи данных, вместо классов FileInfo
и DirectoryInfo
, состоит в том, что разделение концепции передачи данных и определенного источника данных облегчает замену источников данных. Сами объекты потоков содержат большой объем базового кода, имеющего отношение к переносу данных между внешними источниками и переменными в коде приложения, и сохраняя этот код отдельно от любой концепции определенного источника данных, мы облегчаем повторное применения этого кода (через наследование) в различных обстоятельствах. Например, упомянутые выше классы StringReader
и StringWriter
являются частью того же дерева наследования, что и два класса, используемых для чтения и записи текстовых файлов, — StreamReader
и StreamWriter
. Классы почти наверняка неявно задействуют значительный объем общего кода.
Реальная иерархия связанных с потоком классов в пространстве имен System.IO
выглядит следующим образом:
Что касается чтения из файлов или записи в файлы, то мы будем связаны в основном со следующими классами:
? FileStream
. Этот класс предназначен для чтения и записи двоичных данных в произвольный двоичный файл, однако при желании можно использовать его для чтения и записи в любой файл.
? StreamReader
и StreamWriter
. Эти классы специально предназначены для чтения и записи в текстовые файлы.
Упомянем также другие классы, которые могут оказаться полезными, хотя они и не будут представлены в приводимых примерах. Если вы хотите использовать эти классы, обратитесь к документации MSDN, чтобы получить подробности об их работе.
BinaryReader
и BinaryWriter
. Эти классы в действительности сами не реализуют потоки, но они могут обеспечить оболочки вокруг других потоковых объектов. BinaryReader
и BinaryWriter
поддерживают дополнительное форматирование двоичных данных, что позволяет напрямую читать или записывать содержимое переменных C# в соответствующий поток. Проще всего считать, что BinaryReader
и BinaryWriter
находятся между потоком и кодом приложения, обеспечивая дополнительное форматирование:
Различие между использованием этих классов и непосредственным использованием описанных ниже потоковых объектов состоит в том, что базовый поток работает с байтами. Например, пусть часть процесса сохранения некоторого документа состоит в записи содержимого переменной типа long
в двоичный файл. Каждая переменная типа long
занимает 8 байтов, если используется плоский обыкновенный двоичный поток, необходимо будет явно записывать каждые эти 8 байтов памяти. В коде C# это будет означать, что необходимо явно выполнять некоторые битовые операции для извлечения каждых 8 байтов из значения long
. Используя экземпляр BinaryWriter
, можно инкапсулировать всю операцию в перегруженный метод BinaryWriter.Write()
, который получает long
в качестве параметра и который будет помещать эти 8 байтов в поток (и следовательно, если поток направлен в файл, то в файл). Соответствующий метод BinaryReader.Read()
будет извлекать 8 байтов из потока и восстанавливать значение long
.
BufferedStream
. По соображениям производительности при чтении из файла или при записи в файл вывод буферизуется. Это означает, что если программа запрашивает следующие 2 байта файлового потока и поток передает запрос Windows, то Windows не станет соединяться с файловой системой и затем искать и считывать файл с диска, для того чтобы получить 2 байта. Вместо этого произойдет извлечение большого блока файла за один раз и сохранение этого блока в области памяти, называемой буфером. Последующие запросы данных из потока будут удовлетворяться из буфера, пока он не будет исчерпан, и тогда Windows извлечет другой блок данных из файла. Запись в файлы работает таким же образом. Для файлов это делается автоматически операционной системой, но возможен случай, когда придется написать потоковый класс для чтения из некоторого другого устройства, которое не буферизуется. В таком случае можно вывести этот класс из BufferedStream
, который сам реализует буфер (BufferedStream
не создан, однако, для ситуаций, когда приложение часто чередует операции чтения и записи данных).