Книга: C# 4.0: полное руководство
Основы LINQ
Разделы на этой странице:
Основы LINQ
В основу LINQ положено понятие запроса, в котором определяется информация, получаемая из источника данных. Например, запрос списка рассылки почтовых сообщений заказчикам может потребовать предоставления адресов всех заказчиков, проживающих в конкретном городе; запрос базы данных товарных запасов — список товаров, запасы которых исчерпались на складе; а запрос журнала, регистрирующего интенсивность использования Интерента, — список наиболее часто посещаемых вебсайтов. И хотя все эти запросы отличаются в деталях, их можно выразить, используя одни и те же синтаксические элементы LINQ.
Как только запрос будет сформирован, его можно выполнить. Это делается, в частности, в цикле foreach
. В результате выполнения запроса выводятся его результаты. Поэтому использование запроса может быть разделено на две главные стадии. На первой стадии запрос формируется, а на второй — выполняется. Таким образом, при формировании запроса определяется, что именно следует извлечь из источника данных. А при выполнении запроса выводятся конкретные результаты.
Для обращения к источнику данных по запросу, сформированному средствами LINQ, в этом источнике должен быть реализован интерфейс IEnumerable
. Он имеет две формы: обобщенную и необобщенную. Как правило, работать с источником данных легче, если в нем реализуется обобщенная форма IEnumerable<T>
, где Т обозначает обобщенный тип перечисляемых данных. Здесь и далее предполагается, что в источнике данных реализуется форма интерфейса IEnumerable<T>
. Этот интерфейс объявляется в пространстве имен System.Collections.Generic
. Класс, в котором реализуется форма интерфейса IEnumerable<T>
, поддерживает перечисление, а это означает, что его содержимое может быть получено по очереди или в определенном порядке. Форма интерфейса IEnumerable<T>
поддерживается всеми массивами в С#. Поэтому на примере массивов можно наглядно продемонстрировать основные принципы работы LINQ. Следует, однако, иметь в виду, что применение LINQ не ограничивается одними массивами.
Простой запрос
А теперь самое время обратиться к простому примеру использования LINQ. В приведенной ниже программе используется запрос для получения положительных значений, содержащихся в массиве целых значений.
// Сформировать простой запрос LINQ.
using System;
using System.Linq;
class SimpQuery {
static void Main() {
int[] nums = { 1, -2, 3, 0, -4, 5 };
// Сформировать простой запрос на получение только положительных значений,
var posNums = from n in nums where n > 0 select n;
Console.Write("Положительные значения из массива nums: ");
// Выполнить запрос и отобразить его результаты,
foreach(int i in posNums) Console.Write(i + " ");
Console.WriteLine();
}
}
Эта программа дает следующий результат.
Положительные значения из массива nums: 1 3 5
Как видите, в конечном итоге отображаются только положительные значения, хранящиеся в массиве nums
. Несмотря на всю свою простоту, этот пример наглядно демонстрирует основные возможности LINQ. Поэтому рассмотрим его более подробно.
Прежде всего обратите внимание на применение в данном примере программы следующего оператора.
Для применения средств LINQ в исходный текст программы следует включить пространство имен System.Linq
.
Затем в программе объявляется массив nums
типа int
. Все массивы в C# неявным образом преобразуются в форму интерфейса IEnumerable<T>
. Благодаря этому любой массив в C# может служить в качестве источника данных, извлекаемых по запросу LINQ.
Далее объявляется запрос, по которому из массива nums
извлекаются элементы только с положительными значениями.
var posNums = from n in nums where n > 0 select n
Переменная posNums
называется переменной запроса. В ней хранится ссылка на ряд правил, определяемых в запросе. Обратите внимание на применение ключевого слова var
для объявления переменной posNums
неявным образом. Как вам должно быть уже известно, благодаря этому переменная posNums
становится неявно типизированной. Такими переменными удобно пользоваться в запросах, хотя их тип можно объявить и явным образом (это должна быть одна из форм интерфейса IEnumerable<T>
). Объявляемой переменной posNums
в итоге присваивается выражение запроса.
Все запросы начинаются с оператора from
, определяющего два элемента. Первым из них является переменная диапазона, принимающая элементы из источника данных. В рассматриваемом здесь примере эту роль выполняет переменная n. Вторым элементом является источник данных (в данном случае — массив nums
). Тип переменной диапазона выводится из источника данных. Поэтому переменная n относится к типу int
. Ниже приведена общая форма оператора from
.
from переменная_диапазона in источник_данных
Далее следует оператор where
, обозначающий условие, которому должен удовлетворять элемент в источнике данных, чтобы его можно было получить по запросу. Ниже приведена общая форма синтаксиса оператора where
.
where булево_выражение
В этой форме булево_выражение должно давать результат типа bool
. Такое выражение иначе называется предикатом. В запросе можно указывать несколько операторов where
. В данном примере программы используется следующий оператор where
.
where n > О
Этот оператор будет давать истинный результат только для тех элементов массива, значения которых оказываются больше нуля. Выражение n > 0 будет вычисляться для каждого из n элементов массива n при выполнении запроса. В итоге будут получены только те значения, которые удовлетворяют этому условию. Иными словами, оператор where
выполняет роль своеобразного фильтра, отбирая лишь определенные элементы.
Все запросы оканчиваются оператором select
или group
. В данном примере используется оператор select
, точно определяющий, что именно должно быть получено по запросу. В таких простых примерах запросов, как рассматриваемый здесь, выбирается конкретное значение диапазона. Поэтому по данному запросу возвращаются только те целые значения, которые удовлетворяют условию, указанному в операторе where. В более сложных запросах можно дополнительно уточнять, что именно следует выбирать. Например, по запросу списка рассылки может быть получена лишь фамилия адресата вместо его полного адреса. Обратите внимание на то, что оператор select
завершается точкой с запятой, поскольку это последний оператор в запросе. А другие его операторы не оканчиваются точкой с запятой.
Итак, переменная запроса posNums
создана, но результаты запроса пока еще не получены. Дело в том, что сам запрос определяет лишь ряд конкретных правил, а результаты будут только после выполнения запроса. Кроме того, один и тот же запрос может быть выполнен два раза или больше, причем с разными результатами, если в промежутке между последовательно производимыми попытками выполнить один и тот же запрос изменяется базовый источник данных. Поэтому одного лишь объявления переменной запроса posNums
совершенно недостаточно для того, чтобы она содержала результаты запроса.
Для выполнения запроса в данном примере программы организуется следующий цикл.
foreach(int i in posNums) Console.WriteLine(i + " ");
В этом цикле переменная posNums
указывается в качестве коллекции, к которой происходит обращение на каждом шаге цикла. В цикле foreach
соблюдаются правила, определенные в запросе и доступные по ссылке из переменной posNums
. На каждом шаге цикла возвращается очередной элемент, полученный из массива. Этот процесс завершается, когда запрашиваемых элементов в массиве больше не обнаружено. В данном примере тип int
переменной шага цикла i указывается явно, поскольку по запросу извлекаются элементы именно этого типа. Явное указание типа переменной шага цикла вполне допустимо в тех случаях, когда заранее известен тип значения, выбираемого по запросу. Но в более сложных случаях оказывается проще, а иногда даже нужно, указывать тип переменной шага цикла неявным образом с помощью ключевого слова var
.
Неоднократное выполнение запросов
Итак, в запросе определяются правила, по которым извлекаются данные, но этого явно недостаточно для получения результатов, поскольку запрос должен быть выполнен, причем это может быть сделано несколько раз. Если же в промежутке между последовательно производимыми попытками выполнить один и тот же запрос источник данных изменяется, то получаемые результаты могут отличаться. Поэтому как только запрос определен, его выполнение будет всегда давать только самые последние результаты. Обратимся к конкретному примеру. Ниже приведен другой вариант рассматриваемой здесь программы, где содержимое массива nums
изменяется в промежутке между двумя последовательно производимыми попытками выполнить один и тот же запрос, хранящийся в переменной posNums
.
// Сформировать простой запрос.
using System;
using System.Linq;
using System.Collections.Generic;
class SimpQuery {
static void Main() {
int[] nums = { 1, -2, 3, 0, -4, 5 };
// Сформировать простой запрос на получение только положительных значений,
var posNums = from n in nums where n > 0 select n;
Console.Write("Положительные значения из массива nums: ");
// Выполнить запрос и отобразить его результаты,
foreach(int i in posNums) Console.Write(i + " ");
Console.WriteLine();
// Внести изменения в массив nums.
Console.WriteLine("nЗадать значение 99 для элемента массива nums[1].");
nums[1] = 99;
Console.Write("Положительные значения из массива numsn" +
"после изменений в нем: ");
// Выполнить запрос второй раз.
foreach(int i in posNums) Console.Write(i + " ");
Console.WriteLine();
}
}
Вот к какому результату приводит выполнение этой программы.
Положительные значения из массива nums: 1 3 5
Задать значение 99 для элемента массива nums[l].
Положительные значения из массива nums после изменений в нем: 1 99 3 5
Как следует из результата выполнения приведенной выше программы, значение элемента массива nums[1] изменилось с -2 на 99, что и отражают результаты повторного выполнения запроса. Этот важный момент следует подчеркнуть особо. Каждая попытка выполнить запрос приносит свои результаты, получаемые при перечислении текущего содержимого источника данных. Поэтому если источник данных претерпевает изменения, то могут измениться и результаты выполнения запроса. Преимущества такого подхода к обработке'запросов весьма значительны. Так, если по запросу получается список необработанных заказов в Интернет-магазине, то при каждой попытке выполнить запрос желательно получить сведения обо всех заказах, включая и только что введенные.
Связь между типами данных в запросе
Как показывает предыдущий пример, запрос включает в себя переменные, типы которых связаны друг с другом. К их числу относятся переменная запроса, переменная диапазона и источник данных. Соблюсти соответствие этих типов данных очень важно, но в то же время нелегко — по крайней мере, так кажется на первый взгляд, поэтому данный вопрос заслуживает более пристального внимания.
Тип переменной диапазона должен соответствовать типу элементов, хранящихся в источнике данных. Следовательно, тип переменной диапазона зависит от типа источника данных. Как правило, тип переменной диапазона может быть выведен средствами С#. Но выводимость типов может быть осуществлена при условии, что в источнике данных реализована форма интерфейса IEnumerable<T>
, где Т обозначает тип элементов в источнике данных. (Как упоминалось выше, форма интерфейса IEnumerable<T>
реализуется во всех массивах, как, впрочем, и во многих других источниках данных.) Но если в источнике данных реализован необобщенный вариант интерфейса IEnumerable
, то тип переменной диапазона придется указывать явно. И это делается в операторе from
. Ниже приведен пример явного объявления типа int
переменной диапазона n.
var posNums = from int n in nums // ...
Очевидно, что явное указание типа здесь не требуется, поскольку все массивы неявно преобразуются в форму интерфейса IEnumerable<T>
, которая позволяет вывести тип переменной диапазона.
Тип объекта, возвращаемого по запросу, представляет собой экземпляр интерфейса IEnumerable<T>
, где Т — тип получаемых элементов. Следовательно, тип переменной запроса должен быть экземпляром интерфейса IEnumerable<T>
, а значение Т должно определяться типом значения, указываемым в операторе select
. В предыдущих примерах значению Т соответствовал тип int
, поскольку переменная n имела тип int. (Как пояснялось выше, переменная n относится к типу int
, потому что элементы именно этого типа хранятся в массиве nums
.) С учетом явного указания типа IEnumerable<int>
упомянутый выше запрос можно было бы составить следующим образом.
IEnumerable<int> posNums = from n in nums
where n > 0 select n;
Следует иметь в виду, что тип элемента, выбираемого оператором select
, должен соответствовать типу аргумента, передаваемого форме интерфейса IEnumerable<T>
, используемой для объявления переменной запроса. Зачастую при объявлении переменных запроса используется ключевое слово var
вместо явного указания ее типа, поскольку это дает компилятору возможность самому вывести соответствующий тип данной переменной из оператора select
. Как будет показано далее в этой главе, такой подход оказывается особенно удобным в тех случаях, когда оператор select
возвращает из источника данных нечто более существенное, чем отдельный элемент.
Когда запрос выполняется в цикле foreach
, тип переменной шага цикла должен быть таким же, как и тип переменной диапазона. В предыдущих примерах тип этой переменной указывался явно как int
. Но имеется и другая возможность: предоставить компилятору самому вывести тип данной переменной, и для этого достаточно указать ее тип как var
. Как будет показано далее в этой главе, ключевое слово var приходится использовать и в тех случаях, когда тип данных просто неизвестен.
- Основы LINQ
- Общая форма запроса
- Отбор запрашиваемых значений с помощью оператора where
- Сортировка результатов запроса с помощью оператора orderby
- Подробное рассмотрение оператора select
- Применение вложенных операторов from
- Группирование результатов с помощью оператора group
- Продолжение запроса с помощью оператора into
- Применение оператора let для создания временной переменной в запросе
- Объединение двух последовательностей с помощью оператора join
- Анонимные типы
- Создание группового объединения
- Методы запроса
- Режимы выполнения запросов: отложенный и немедленный
- Деревья выражений
- Методы расширения
- PLINQ
- ГЛАВА 1 Основы построения баз данных
- Глава 1 Основы графологии
- Часть I Основы Ubuntu
- 2.10. Основы конфигурирования
- Нейрофизиологические основы различия «нравится» и «хочу»
- Основы интерфейса Access 2007
- 7.7.1. Основы безопасности
- 13.1. Основы резервного копирования
- 14.1. Основы безопасности
- Урок 1.4. Программа Блокнот. Основы работы с текстом
- Глава 1 Коммуникационные основы PR
- Глава 1. Основы современного корпоративного налогообложения