18.2.8. Получение Web-страницы с известным URL / Программирование на языке Ruby / Библиотека (книги, учебники и журналы) / В помощь Веб-Мастеру

Обложка
Аннотация

Хэл Фултон i

Книги автора: Программирование на языке RubyThe Ruby Way, Second Edition

/ Hal Fulton i

Книги автора: Программирование на языке RubyThe Ruby Way, Second Edition

Книга: Программирование на языке Ruby

18.2.8. Получение Web-страницы с известным URL

Пусть нам нужно получить HTML-документ из Web. Возможно, вы хотите проверить контрольную сумму и узнать, не изменился ли документ, чтобы послать автоматическое уведомление. А быть может, вы пишете собственный браузер — тогда это первый шаг на пути длиной в тысячу километров.

require "net/http" begin h = Net::HTTP.new("www.marsdrive.com", 80) # MarsDrive Consortium resp, data = h.get("/index.html", nil) rescue => err puts "Ошибка: #{err}" exit end puts "Получено #{data.split.size} строк, #{data.size} байтов" # Обработать...

Сначала мы создаем объект класса HTTP, указывая доменное имя и номер порта сервера (обычно используется порт 80). Затем выполняется операция get, которая возвращает ответ по протоколу HTTP и вместе с ним строку данных. В примере выше мы не проверяем ответ, но если возникла ошибка, то перехватываем ее и выходим.

Если мы благополучно миновали предложение rescue, то можем ожидать, что содержимое страницы находится в строке data. Мы можем обработать ее как сочтем нужным.

Что может пойти не так, какие ошибки мы перехватываем? Несколько. Может не существовать или быть недоступным сервер с указанным именем; указанный адрес может быть перенаправлен на другую страницу (эту ситуацию мы не обрабатываем); может быть возвращена пресловутая ошибка 404 (указанный документ не найден). Обработку подобных ошибок мы оставляем вам.

Следующий раздел окажется в этом смысле полезным. В нем мы представим несколько более простой способ решения данной задачи.

Оглавление книги

Оглавление статьи/книги

Похожие страницы