Книга: Программирование на языке Ruby
18.2.8. Получение Web-страницы с известным URL
18.2.8. Получение Web-страницы с известным URL
Пусть нам нужно получить HTML-документ из Web. Возможно, вы хотите проверить контрольную сумму и узнать, не изменился ли документ, чтобы послать автоматическое уведомление. А быть может, вы пишете собственный браузер — тогда это первый шаг на пути длиной в тысячу километров.
require "net/http"
begin
h = Net::HTTP.new("www.marsdrive.com", 80) # MarsDrive Consortium
resp, data = h.get("/index.html", nil)
rescue => err
puts "Ошибка: #{err}"
exit
end
puts "Получено #{data.split.size} строк, #{data.size} байтов"
# Обработать...
Сначала мы создаем объект класса HTTP, указывая доменное имя и номер порта сервера (обычно используется порт 80). Затем выполняется операция get
, которая возвращает ответ по протоколу HTTP и вместе с ним строку данных. В примере выше мы не проверяем ответ, но если возникла ошибка, то перехватываем ее и выходим.
Если мы благополучно миновали предложение rescue
, то можем ожидать, что содержимое страницы находится в строке data
. Мы можем обработать ее как сочтем нужным.
Что может пойти не так, какие ошибки мы перехватываем? Несколько. Может не существовать или быть недоступным сервер с указанным именем; указанный адрес может быть перенаправлен на другую страницу (эту ситуацию мы не обрабатываем); может быть возвращена пресловутая ошибка 404 (указанный документ не найден). Обработку подобных ошибок мы оставляем вам.
Следующий раздел окажется в этом смысле полезным. В нем мы представим несколько более простой способ решения данной задачи.
- 18.2.1. Получение истинно случайных чисел из Web
- 18.2.2. Запрос к официальному серверу времени
- 18.2.3. Взаимодействие с РОР-сервером
- 18.2.4. Отправка почты по протоколу SMTP
- 18.2.5. Взаимодействие с IMAP-сервером
- 18.2.6. Кодирование и декодирование вложений
- 18.2.7. Пример: шлюз между почтой и конференциями
- 18.2.8. Получение Web-страницы с известным URL
- 18.2.9. Библиотека Open-URI
- Получение статистики
- Информация заголовочной страницы (Database header)
- Тестирование Web-сервиса XML с помощью WebDev.WebServer.exe
- Размер страницы базы данных
- Дополнительные национальные кодовые страницы и порядки сортировки
- Листинг 15.11. Код для загрузки файла с Web-сервера
- Получение помощи
- Получение помощи по работе с книгой и компакт-диском
- Получение помощи по Windows SharePoint Services 3.0
- Страницы веб-частей
- Использование домашней страницы рабочей области для собраний
- Получение доменного имени