Книга: Интернет-разведка. Руководство к действию
Просмотр содержимого файла robots.txt
Просмотр содержимого файла robots.txt
Для просмотра содержимого этого файла мы рекомендуем воспользоваться скриптом, созданным Сергеем Матвеенко – специалистом по IT из Санкт-Петербурга.
Скрипт доступен по адресу: http://serge.matveenko.ru/robotstxt/.
Вот что пишет о нем сам автор.
Кнопка на панель ссылок браузера для просмотра текста файла robots.txt
Вы можете добавить на панель ссылок вашего браузера кнопку «Посмотреть robots.txt». Чтобы установить кнопку, просто перетащите эту ссылку на панель ссылок вашего браузера: Посмотреть robots.txt.
Теперь, если Вы захотите увидеть файл robots.txt сайта, который в данный момент открыт в браузере, просто щелкните по кнопке «Посмотреть robots.txt» в панели ссылок. Откроется страница, содержащая текст файла.
Кнопка работает во всех браузерах при включенном JavaScript.
При просмотре сайта компании «Автоленд» выяснилось, что файл robots.txt на ресурсе отсутствует. Таким образом, данный способ ограничения индексации поисковыми роботами в указанном случае не применяется. Для получения доказательств того, что скрипт все-таки работает, мы обратились к другому сайту, а именно – форуму на екатеринбургском портале e1 по адресу: www.e1.ru/talk/ forum/.
Результат проверки содержимого файла robots.txt на сайте форума приведен ниже.
User-Agent: *
Disallow: /mye1
Disallow: /ad.php
Disallow: /cgi/go
Disallow: /talk/forum/go.php
Disallow: /fun/photo/get_code.php
Disallow: /auto/sale/print/
Disallow: /talk/forum/forum_news.php
В ряде случаев специалиста конкурентной разведки может ждать удача – когда переход по гиперссылке, указанной в окне с результатами проверки содержимого файла robots.txt, открывает доступ в те зоны сайта, которые в принципе предназначены лишь для служебного пользования, но при этом не запрещены к посещению людьми (то есть ограничения на посещение введены исключительно для поисковых пауков). Соответственно, на наш взгляд, ничего противозаконного или неэтичного в попытке представителя конкурентной разведки взглянуть на страницы ресурса, к которым ведут гиперссылки в файле robots.txt, нет.
- Введение
- Интернет как уникальный инструмент маркетинга
- Интернет как инструмент PR
- Принципы организации и поиска информации в Интернете
- Описание языков запросов различных поисковых машин
- Невидимый Интернет
- Оценка достоверности и качества онлайновой информации
- Онлайновые службы, предоставляемые поисковыми системами
- Формы расширенного поиска в поисковых системах
- Метапоисковые машины Интернета с примерами поиска различных типов информации
- Программы для работы с информацией
- Исследование сайта конкурента с точки зрения получения коммерческой информации – на примере конкретных сайтов
- Просмотр служебной информации о сайте с помощью ресурса NETCRAFT
- Просмотр содержимого файла robots.txt
- Визуальный осмотр офиса изучаемого предприятия на спутниковой фотографии с использованием Google Map
- Грамматические ошибки в тексте, размещенном на сайте
- Изучение контента сайта
- На что обращать внимание при изучении сотрудников конкурента
- Как увидеть появление в Интернете новой информации о своем предприятии
- Как обнаружить присутствие в Интернете информации о своих сотрудниках и о сотрудниках конкурента
- Как использовать информацию из Интернета для поддержки маркетинговых исследований, повышения клиентоориентированности компании и контрпропаганды
- Как конкурентная разведка может закрыть «разрыв» между отделом продаж и отделом маркетинга
- Платные ресурсы Интернета против бесплатных
- Как искать в Интернете информацию о конкретных людях
- Как искать информацию о компаниях
- Как искать информацию о продуктах конкурента
- Как найти нужный закон или постановление
- Как посетить сайт конкурента анонимно и зачем нужна такая анонимность
- Как в точности сохранить информацию, найденную на сайтах в Интернете
- Фальшивые «зеркала»
- Создание документов PDF из Microsoft Office и наоборот
- Как восстановить поврежденный файл Office
- Как продвинуть свое предприятие в Интернете
- Как защитить компьютер от взлома техническими средствами
- Как воспрепятствовать незаметному подключению к своему компьютеру посторонних
- Как бороться с вирусами и другими вредоносными программами
- Кто такие хакеры и социальные инженеры и как от них уберечься
- Как распознать, что письмо по электронной почте фактически пришло не с того адреса, который указан в заголовке письма
- Как восстановить стертую с жесткого диска информацию и как удалить информацию без возможности восстановления
- Как спрятать информацию на своем компьютере от посторонних глаз
- Заключение
- Сноски из книги
- Содержание книги
- Популярные страницы
- Эффективная работа с временными файлами сортировки
- Первый просмотр: краткий обзор
- Второй просмотр: детали
- Единое имя файла параметров InterBase
- Параметры конфигурационного файла InterBase
- Использование типов содержимого и столбцов
- 13. Зарабатываем на своих файлах: файлообменники, загружаеми получаем процент за скачивание
- rc.firewall.txt script structure
- rc.firewall.txt
- rc.DMZ.firewall.txt
- rc.DHCP.firewall.txt
- rc.UTIN.firewall.txt