Книга: 1001 совет по обустройству компьютера

13.1.2. URL – универсальный ресурсный указатель

13.1.2. URL – универсальный ресурсный указатель

Для доступа к конкретным страничкам на сайтах знать доменное имя недостаточно. Ведь оно указывает только на компьютер-сервер, но ничего не говорит о том, по какому протоколу связываться (запрашиваем ли мы веб-страницу, просто файл для скачивания или, может быть, обращаемся в группы новостей Usenet), а также к какому именно файлу на сервере идет запрос. Поэтому полный интернет-адрес указывается в виде Uniform Resource Locator (URL) – что можно перевести, как «универсальный ресурсный указатель». URL создается по такому образцу:

Протокол://доменное_имя/имя_каталога/:имя_файла

Естественно, если файл лежит в корневом каталоге (папке) сервера, то элемент имя_каталога – лишний. При этом элемент протокол: для веб-страниц – HTTP, для скачивания файлов – FTP, остальные протоколы для нас не очень актуальны. Принципы построения доменного имени мы описали ранее, а все, что после него, – почти идентично обычным путям в файловой системе компьютера, за тремя важными исключениями:

? во-первых, вместо обратного слэша «» (как в Windows) здесь ставится прямой «/» (так принято в UNIX, в среде которой это все создавалось);

? во-вторых, имена файлов и каталогов в общем случае могут записываться только латиницей. В ряде случаев кириллические имена папок или страниц допустимы, но, как правило, в таком неудобоваримом виде, как что-то вроде этого: %D0%A8%D0%B0%D1%85%D0%BC%D0%B0%D1%82%D1%8B (так выглядит слово «Шахматы» в варианте кодировки Unicode под названием UTF-8). О возможности регистрации кириллических доменных имен мы поговорим отдельно;

? а в-третьих, эти имена в ряде случаев чувствительны к регистру букв: Vasya.html, vasya.html и VASYA.HTML – это могут быть разные файлы, а не одинаковые, как в Windows. Причем обратите внимание, что в доменных именах можно употреблять любой регистр букв (наименование зоны RU и ru – одно и то же), а вот в наименованиях папок и файлов – лучше только тот, что указан. Так, http://sony.com/product.html и http://SONY.COM/product.html – это одно и то же, а вот адрес http://sony.com/PRODUCT.HTML может указывать на совсем другой файл. Многие интернет-серверы (например, основанные на системе Windows Server) такой строгости не придерживаются и допускают произвольное употребление регистра букв в названиях папок и файлов, но на всякий случай это следует иметь в виду.

О буквах www в адресе сайта

Тройное даблъю (WWW), часто предваряющее доменное имя, по сути является отдельным доменом третьего уровня, и в принципе сайты bhv.ru и www.bhv.ru – это совсем разные адреса. Такая приставка-паразит возникла когда-то, чтобы указать на принадлежность адреса к интернет-пространству, названному World Wide Web (WWW), Всемирная паутина. Сейчас она служит лишь источником недоразумений, правда, относительно немногочисленных – когда веб-разработчики забывают прописать идентичность сайтов с WWW и без нее. При создании своего сайта на отдельном веб-хостинге об этом забывать не следует – всегда стоит создать домен третьего уровня с добавлением WWW к имени сайта и установить для него переадресацию на основной ресурс без приставки (правильно именно так, а не наоборот).

Все браузеры в отношении ввода адреса очень лояльны к пользователю и обычно угадывают, что вы имели в виду. Поэтому и можно вводить просто одно доменное имя bhv.ru, а браузер сам превратит его в полный URL: http://www.bhv.ru/ и откроет стартовую страницу сайта. И это несмотря на то, что здесь не указана страничка – файл, к которому производится обращение. Так происходит потому, что существует некая договоренность – если в корневом каталоге имеется файл под названием index.html, то обращение по умолчанию производится именно к нему, при этом явно его можно не указывать. Этот файл обычно и представляет собой заглавную страницу сайта или содержит команду для переадресации на другую страницу (в другой каталог или часто даже на другой сервер). Если же такого файла не имеется, то страницу нужно указывать явно.

Кроме того, если URL ссылается на каталог, а не на файл, что вообще-то происходит в подавляющем большинстве случаев, то такой URL должен заканчиваться символом обратный слэш (см. пример с http://www.bhv.ru/ в предыдущем абзаце). Простому пользователю это практически не добавляет никаких хлопот – обратный слэш автоматически добавит браузер, если в конце URL указано имя папки (без расширения) или это просто доменное имя, без указания папки. Но надо учитывать, что на некоторых неграмотно созданных сайтах отсутствие или наличие слэша в конце URL может приводить к неоднозначным результатам.

Оглавление книги


Генерация: 2.211. Запросов К БД/Cache: 3 / 1
поделиться
Вверх Вниз