Книга: Яндекс для всех
3.3.3. Яндекс. Лента как RSS-синдикатор
3.3.3. Яндекс. Лента как RSS-синдикатор
Новости, которые публикуются на Яндексе, поставляются сайтами в RSS-формате. Можно пройти на сайт любого информационного партнера Яндекса и найти на нем RSS-ленту, которую он предлагает для экспорта. Например, издание "Главные новости Ульяновска" (http://mosaica.ru) предлагает свою ленту на странице http://www.mosaica.ru/feed/. Эта лента экспортируется и Яндексом, и новости, публикуемые в ней, попадают в общую ленту Яндекс. Новостей. Аналогичным образом поступают и другие поставщики новостей.
Полученные новости "достаются" из RSS-файла, сортируются по различным тематическим разделам, добавляются в разделы региональные, и каждая становится частью нового фида соответствующей тематики. Для удобства сортировки поставщики информации указывают в описании новостей раздел, наиболее близкий по тематике какому-либо разделу Яндекс. Новостей.
И вот какое происходит преобразование (листинги 3.4 и 3.5).
Листинг 3.4. Новость в RSS-фиде Ульяновского издания
<item>
<link>http://mosaica.ru/news/society/8574/</link>
<title^ Ульяновской области серьезно взялись за пожарную безопасность территорий</title>
<description>21 февраля на базе Ульяновского государственного университета под председательством губернатора Сергея Морозова состоялось совещание, посвященное подведению итогов деятельности областной подсистемы предупреждения и ликвидации чрезвычайных ситуаций в регионе за 2006 год. </description>
<pubDate>Wed, 21 Feb 2007 14:49:00 +0300</pubDate>
<guid>http://mosaica.ru/news/society/8574/</guid>
</item>
Листинг 3.5. Та же новость на Яндексе
<item>
<title^ Ульяновской области серьезно взялись за пожарную безопасность территорий</title>
<link>http://news.yandex.ru/yandsearch?cl4url=mosaica.ru/news/society/8574
html&country=Russia</link>
<description^ частности, усовершенствована нормативно-правовая база по предупреждению чрезвычайных ситуаций, начата серьезная работа с муниципальными образованиями в плане. ^^Губернатор призвал глав районов принять меры по решению данных проблем и распорядился в первую очередь уделить серьезное внимание пожарной безопасности территорий и… <br></description>
<pubDate>Wed, 21 Feb 2007 14:47:28 +0300</pubDate>
<guid>http://news.yandex.ru/yandsearch?cl4url=mosaica.ru/news/society/8574
html&country=Russia</guid>
</item>
Как можно увидеть, новость одна и та же, но вот ее подача в разных лентах различается. Первое отличие в ссылке на новость. Если поставщик информации указывает на новость, опубликованную на своем сайте, то Яндекс по ссылке из своего RSS-фида приведет на свою страницу, где и опубликована полученная им новость. Заголовок новостей Яндексом оставлен без изменений, а вот анонс изменен полностью. Видимо, обработчики новостей посчитали, что исходный анонс не подходит, и сформировали новый на базе полного текста новости. Можно обратить внимание и на время публикации. Как ни странно, но на Яндексе новость оказалась опубликованной раньше, чем она была опубликована на сайте-первоисточнике. И пусть разница во времени небольшая, но она говорит о том, что RSS-поток источника сформирован и отдан потребителю раньше, чем был обработан и опубликован на собственном сайте.
Таким образом обрабатываются и формируются как новостные страницы, так и RSS-файлы, предназначенные для экспорта уже с Яндекса.