Книга: Яндекс Воложа. История создания компании мечты
Приложения
Приложения
Публичные активы
У «Яндекса» огромное хозяйство. Это материальные и нематериальные активы, штат, оборот, дочерние структуры, пользователи, реноме и бренд. Фондовая капитализация колеблется в диапазоне $6–7 млрд. А еще у «Яндекса» есть принципы и понятия, которые яндексоиды не просто провозглашают, а строят на них свой бизнес и мироощущение.
Основная компания: зарегистрирована в России как ООО «Яндекс», 100 % уставного капитала которого с июня 2004 г. принадлежит нидерландскому холдингу Yandex N.V.
Материнская компания: Yandex N.V. (Нидерланды, Гаага).
Акционеры: «Яндекс» давно и окончательно не является российской компанией. Стопроцентным владельцем российского ООО «Яндекс» с июня 2004 г. является голландская компания Yandex N.V., большая часть акций которой принадлежит иностранным гражданам и зарубежным структурам. Причем намеренно или так вышло, но значительная часть акционеров голландской матери напоминает одну большую семью, в которой, конечно, есть чужаки, но все же степень согласованности и единомыслия у них очень высокая. Что также является еще одной степенью защиты от возможных посягательств со стороны и одним из объяснений не всегда понятных со стороны движений акций. На самом деле после IPO делается все, чтобы защитить компанию от недружественных спекулятивных приобретений, сохранив контроль над компанией внутри узкой группы своих акционеров-ветеранов, у которых долгосрочные инвестиции в «Яндекс».
К маю 2011 г., то есть в преддверии IPO, сложилась следующая структура собственности Yandex N.V.: Baring Vostok — 22,6 % голосов (включая 18,74 % акций класса A); Tiger Global — 20,5 %; Аркадий Волож — 14,67 % (включая 4,5 % акций, которыми офшор Воложа Belka Holdings владел через совместную с Baring Vostok структуру BC&B Holdings); Владимир Иванов — 4,05 %; Илья Сегалович — 3,07 %; UFG Group и Almaz Capital владели в совокупности 5,13 % (включая 8,14 % акций класса A; контролирующим акционером UFG Group был Чарльз Райн, член совета директоров Yandex N.V. и старший партнер Almaz Capital); Roth Advisors — 4,9 %; IFC (International Financial Corporation) — 4,54 %; Emerald Trust — 2,88 %; ru-Net Holdings (Леонида Богуславского) — 2,4 %; Cole Management — 2,15 %; Eden Capital — 1,4 %; Джон Бойнтон — 1,18 %. У Сбербанка «золотая акция» номинальной стоимостью €1. Среди миноритарных акционеров были отмечены Бен Коул, Альфред Феноти, Эстер Дайсон, Александр Волошин, Александр Шульгин и другие.
После IPO началось брожение акционерного капитала, продажи, перемены, конвертации. Поэтому сейчас можно уверенно говорить лишь о названиях и именах акционеров — они остались прежними, включая Сбербанк, но доли участия и соотношения в портфелях переменились, в одном случае принципиально — Tiger, например, предпочел свое влияние внутри компании монетизировать, и поэтому он владеет всего несколькими процентами голосующих акций B, увеличив число акций А, которые легче конвертировать в деньги. А у Воложа и Сегаловича доли сократились, и весной 2013 г. они вновь выставили небольшую часть своих акций на продажу.
В совокупности структура акционерного капитала «Яндекса» выглядит теперь так: около 30 % (включая опционы) — у основателей и менеджеров, 60 % — у инвестфондов, 10 % — у частных инвесторов и бывших сотрудников, «золотая акция» — у Сбербанка.
До выхода на IPO, то есть до мая 2011 г., когда компания стала публичной, «Яндекс» ежегодно выплачивал дивиденды акционерам. Хотя Волож постоянно и подчеркивал, что «основную часть прибыли мы реинвестируем в развитие». Такой подход довольно распространен. Он свидетельствует о значительных зарплатах управленцев, в частности, подтверждал мне это и Евгений Касперский, основной совладелец и генеральный директор «Лаборатории Касперского» (второй — вместе с «Яндексом» — российской ИТ-компании, фактически вышедшей на глобальный уровень). После IPO акционерам предложено зарабатывать на операциях со своими акциями.
Акции: по уставу в компании есть два вида акций: привилегированные типа А — один голос на одну акцию, и типа В — 10 голосов на одну акцию (такими акциями владеют только основатели и первые инвесторы). В случае перепродажи В-акции автоматически конвертируются в А, часть которых и находится на вторичном рынке. Акционеры могут продать свои акции, прежде предложив их существующим акционерам. Такую структуру корпоративного управления Волож прокомментировал следующим образом: «Такая структура характерна для компаний, в которых бизнес на 90 % зависит от творческого коллектива, где, как и у нас, люди — основной актив компании. Для нас главными примерами были компании, работающие в той же области, что и мы. Такое же корпоративное управление у Google в Америке и Baidu в Китае. Это гарантирует компании некоторую защиту от неквалифицированного инвестора».
Совет директоров: Альфред Феноти — председатель, Елена Ивашенцева (партнер инвестфонда Baring Vostok Capital Partners; по одной из версий, вместе с Леонидом Богуславским инициатор вложения денег фонда ru-Net Holdings в «Яндекс» в 2000 г.), Аркадий Волож, Джон Бойнтон, Эстер Дайсон, Александр Волошин и Илья Сегалович.
Руководство: Аркадий Волож — генеральный директор, Илья Сегалович — директор по технологиям и разработке, Алексей Третьяков — коммерческий директор, Светлана Кондрашова — директор по рекламе, Дмитрий Иванов — директор по проектам, Андрей Себрант — директор по маркетингу сервисов, Екатерина Фадеева — директор по правовым вопросам, Аркадий Борковский — главный инженер Yandex Labs, Александр Шульгин — финансовый директор, Максим Киселев — директор по развитию бизнеса.
Капитализация: колеблется в диапазоне $6–7 млрд (то есть примерно в два раза ниже, чем на момент проведения IPO на бирже NASDAQ в мае 2011 г.).
Бизнес-модель: размещение контекстных объявлений в поиске и на партнерских сайтах, входящих в рекламную сеть Яндекса, это около 1500 агентств. Оставаясь первой и крупнейшей системой размещения контекстной рекламы в Рунете, «Яндекс. Директ» ежесуточно показывает объявления примерно 50 млн пользователей. Число рекламодателей «Яндекс. Директа» превышает 350 000.
По уровню доходов «Яндекс» опережает все российские интернет-компании. Выручка «Яндекса» за 2012 г. составила 28,8 млрд рублей / $947,1 млн (рост 44 % по сравнению с 2011 г.); операционная прибыль — 9,5 млрд рублей / $311,2 млн (рост 34 %), показатель EBITDA[11] — 13,1 млрд рублей / $432,7 млн (рост 42 %), рентабельность по операционной прибыли составила 32,9 %; чистая прибыль — 8,2 млрд рублей / $270,7 млн (рост 42 %), рентабельность по чистой прибыли — 28,6 %. Основной доход «Яндекс» получает от продажи контекстной рекламы, причем именно от продаж в России (до 90 %).
Аудитория: ежедневная аудитория «Яндекса» превысила 19 млн, а ежемесячная составила 38–50 млн человек (в декабре 2012 г. — 52 млн). Впервые за все время наблюдений (по данным TNS) еще в апреле 2012 г. «Яндекс» обогнал «Первый канал» российского телевидения по аудитории. В апреле 2012 г. портал http://yandex.ru ежедневно посещали 19,1 млн человек, тогда как ежедневная апрельская аудитория «Первого канала» составила 18,2 млн. Более того, по оценке TNS, в апреле Интернетом ежедневно пользовалось 30,5 млн граждан России, то есть примерно на 1 млн больше, чем смотрели ТВ. Впрочем, в главном ящик остался не превзойден: «Первый канал» среднестатистический потребитель смотрел в апреле больше часа в день, а на «Яндекс» заходил только на десять минут. Приложения «Яндекса» доступны в России, Украине, Казахстане, Беларуси и Турции.
Рейтинг: к концу 2012 г. «Яндекс» вышел на четвертое место в мире по числу обрабатываемых поисковых запросов (по данным comScore): Google — 114,73 млрд (65,2 % мирового рынка), Baidu — 14,4 млрд (8,2 %), Yahoo! — 8,63 млрд (4,9 %), Yandex — 4,84 млрд (2,8 %), Microsoft (Bing, поиск на сайте http://microsoft.com) — 4,48 млрд (2,5 %). При этом «Яндекс» уступает поисковым сервисам от Microsoft по числу пользователей — 74,4 млн против 268,6 млн человек. «Яндекс» остается лидирующей поисковой системой на российском рынке, его доля в поисковом трафике по данным LiveInternet в июне 2013 г. составила 61,6 %. На втором месте — Google. Согласно рейтингу Alexa, по популярности сайт http://yandex.ru (по состоянию на 16 ноября 2012 г.) занимал 18-е место в мире и 1-е в России. Международная аудитория портала — 93,1 млн человек (comScore, май 2013 г.). К концу 2012 г. все поисковые запросы пользователей «Яндекса» за неделю суммарно содержали в общей сложности более 3 млрд слов.
Команда: около 5000 сотрудников в семи странах; средний возраст — 29 лет, примерно четверти сотрудников — меньше 25, до сих пор в компании работают люди, которые начинали проект в 1997 г. Компания официально декларирует следующее:
…По числу работающих в компании инженеров «Яндекс» — одна из крупнейших программистских компаний России. «Яндекс» открывает офисы в любых городах, где удается найти группы специалистов. «Яндекс» — очень открытая компания. Здесь приветствуется умение думать, открыто высказываться и внимательно слушать коллег. Обязательным требованием ко всем сотрудникам «Яндекса» является умение работать в коллективе. Коллектив — это все сотрудники, не только те, с кем вы непосредственно общаетесь по работе. Именно все вместе мы делаем тот «Яндекс», который любят пользователи, уважают партнеры и клиенты. Сотрудники разных отделов часто видят одну и ту же проблему с разных сторон — именно это позволяет «Яндексу» успешно развиваться. Поэтому будьте терпимы и внимательны к чужому мнению, предполагайте априори, что у несогласного с вами коллеги есть не менее весомые основания, чем у вас. Главный актив «Яндекса» — это команда, специалисты высокого уровня.
Основные дочерние структуры: головная компания Yandex LLC (Россия, Москва), ООО «ПС Яндекс. Деньги» (25 % плюс одна акция), «Яндекс. Украина» (Киев), Yandex Labs (США, Пало-Альто), Yandex Europe B. V. (Нидерланды, Гаага), Yandex Europe AG (Швейцария, Цюрих).
Офисы: в России (Москва, Санкт-Петербург, Екатеринбург, Новосибирск, Казань, Ростов-на-Дону), на Украине (Киев, Одесса, Симферополь), в Беларуси (Минск), в Калифорнии (Пало-Альто), в Турции (Стамбул), в Швейцарии (Цюрих, Люцерн), в Нидерландах (Гаага). Некоторые офисы занимаются всеми направлениями деятельности компании, другие специализируются, например, на продажах (Люцерн) или разработке (Симферополь, Пало-Альто).
Головной офис находится в Москве, на ул. Льва Толстого, 16.
Московский офис — это комплекс внушительных хайтековских зданий с двумя разноцветными лошадьми на входе. И внутри помимо обязательного набора, присутствующего в офисе любой современной компании, имеются еще и разные приятности: всякие дизайнерские фишки; бесплатные обеды, кофе, чай, бутерброды и булочки; теннис и бильярд.
Инфраструктура: объем исходящего трафика портала http://yandex.ru давно измеряется сотнями мегабайт в секунду. «Яндекс» владеет самым большим в России и мощнейшим в Европе парком из десятков тысяч серверов, которые поддерживают громадную сеть центров обработки и хранения данных. Серверы объединены в кластеры и даже в кластеры кластеров. Архитектура поиска «Яндекса» устроена так, что к уже существующим серверам можно легко добавлять новые. Серверное оборудование «Яндекса» размещено во всех федеральных округах России. У компании есть несколько собственных дата-центров (один дата-центр потребляет энергии как большой завод), включая крупнейший в Европе. Все они соединены собственными каналами. Это десятки мегаватт электроэнергии, оптические линии, системы распределения контента. Эта физическая инфраструктура почти доходит до каждого пользователя. Вычислительные мощности «Яндекса» работают не только на компанию. Их используют партнеры «Яндекса», например, для ядерных исследований и геологоразведки. Для обеспечения быстрого и дешевого доступа к своим сервисам «Яндекс» развивает программу «Локальная сеть». «Яндекс» присутствует на украинской и франкфуртской точках обмена трафиком.
Технологии: «Яндекс» — технологическая компания. В основе сервисов поисковика лежат собственные технологии, зачастую первые в своем классе. «Яндекс» первым начал использовать морфологию русского языка при поиске (еще до появления Интернета в России), первым запустил параллельный поиск (одновременный поиск по разным массивам информации). В 2001 г. «Яндекс» первым в России создал систему размещения контекстной рекламы. Корреспондентов «Яндекс. Почты» с 2002 г. защищает спамооборона — первая в Рунете технология защиты от спама, примененная на массовом сервисе с миллионной аудиторией. В 2009 г. «Яндекс» разработал и внедрил собственный метод машинного обучения — «Матрикснет», который используется для построения формул ранжирования и показа рекламы, с его помощью ЦЕРН анализирует распад мезонов. В поиске, «Яндекс. Новостях» и «Яндекс. Почте» работает собственная технология извлечения фактов. Для классификации изображений «Яндекс» использует собственные разработки в области компьютерного зрения. В 2011 г. запущен сервис статистического перевода — один из трех подобных во всем мире. Во многом благодаря «Яндексу» Россия является одной из немногих стран, имеющих поисковые технологии мирового уровня. Национальные поисковые системы лидируют еще только в США (Google), Китае (Baidu), Южной Корее (Naver) и Чехии (Seznam). То есть «Яндекс» — по факту одна из основных поисковых машин (поисковых интернет-технологий) в мире. Разумеется, лучше всех о своих поисковых технологиях рассказывает сам «Яндекс» (http://company.yandex.ru/technologies/searchindex/index.xml).
Фасад: за всю историю «Яндекса» было реализовано 12 версий главной страницы http://yandex.ru — пожалуй, самой посещаемой в Рунете. Ежемесячно на нее заходят около 30 млн человек. Первая версия главной страницы, сделанная студией Артемия Лебедева (впрочем, как и все последующие), была презентована 23 сентября 1997 г. на выставке Softool в Москве, то есть в день рождения «Яндекса»; вторая — 5 февраля 1998 г.; третья — 1 апреля 1999 г.; четвертая — 18 октября 1999 г.; пятая — 6 июня 2000 г.; шестая — 23 мая 2001 г.; седьмая — 1 января 2002 г.; восьмая — 23 сентября 2003 г.; девятая — 4 ноября 2004 г.; десятая — 7 августа 2007 г.; одиннадцатая — 15 марта 2010 г.; двенадцатая — 23 января 2013 г.
Миссия: у любой уважающей себя компании есть официальная идеология (не в смысле политики, но в смысле формулирования позиции), свое послание миру, объясняющее цели, смысл, перспективы компании. Есть такое послание и у «Яндекса» (http://company.yandex.ru/about/main). В последнем варианте миссии, который появился непосредственно перед запуском нового «Яндекса» (платформы «Острова») летом 2013 г., у «Яндекса» сменился вектор цели: с 1997 г. поисковик ВСЕГДА отвечал на ВСЕ вопросы ВСЕХ пользователей, а на шестнадцатом году своего существования «Яндекс» взялся за решение ЗАДАЧ ЛЮДЕЙ.
Принципы: основа позиционирования компании, основа ее идеологии — это принципы, которые в «Яндексе» сформулированы давно и подробно и время от времени уточняются. Принципы официально продекларированы, и смысла их пересказывать нет. Их можно найти на официальной странице «Яндекса» (http://сompany.yandex.ru/rules). Сотрудники компании подчеркивают: «Мы ни в коем случае не навязываем наши принципы кому бы то ни было».
Альтруизм: «Яндекс» стал инициатором создания целой системы подготовки математиков и программистов экстра-класса. В 2007 г. была открыта Школа анализа данных (в сотрудничестве с МГУ, МФТИ и Высшей школой экономики) — бесплатные двухгодичные курсы, которые готовят специалистов в области обработки и анализа данных и извлечения информации из Интернета для проведения фундаментальных научных разработок в этой области и участия в прикладных проектах «Яндекса». В том же 2007 г. в МФТИ на факультете инноваций и высоких технологий открыты кафедры дискретной математики и анализа данных (во главе с Аркадием Воложем). Также был запущен проект для школьников http://school.yandex.ru, в рамках которого создан каталог, куда собраны ресурсы по теме образования, культуры и науки. «Яндекс» на регулярной основе проводит лекции для старшеклассников, спонсирует школьные олимпиады по информатике, математике, лингвистике.
Сайты «Яндекса»: http://new.yandex.ru; http://yandex.ru; http://ya.ru; http://яндекс. рф (рус.); http://yandex.сom.tr (тур.); http://yandex.сom (англ.); http://yandex.ua (укр.); http://yandex.by (белор.); http://yandex.kz (казах.); http://new.yandex.ru; http://images.yandex.ru; http://video.yandex.ru; http://books.yandex.ru; http://blogs.yandex.ru; http://people.yandex.ru; http://market.yandex.ru; http://afisha.yandex.ru; http://realty.yandex.ru; http://auto.yandex.ru; http://rabota.yandex.ru; http://music.yandex.ru; http://yaca.yandex.ru; http://news.yandex.ru; http://uslugi.yandex.ru; http://pogoda.yandex.ru; http://tv.yandex.ru; http://time.yandex.ru; http://slovari.yandex.ru; http://translate.yandex.ru; http://maps.yandex.ru; http://rasp.yandex.ru; http://metrika.yandex.ru; http://direct.yandex.ru; http://partner.yandex.ru; http://mail.yandex.ru; http://Я. ру; http://my.ya.ru; http://moikrug.ru; http://disk.yandex.ru; http://n.maps.yandex.ru; http://zen.yandex.ru…
Все сервисы: http://yandex.ru/all.
Все о поиске: http://help.yandex.ru/search.
Поиск: текстов — http://ya.ru, http://yandex.ru; изображений — http://images.yandex.ru; роликов, видеохостинг — http://video.yandex.ru; книг, изданий и авторов — http://books.yandex.ru; по ресурсам, имеющим RSS-представление, а также рейтинг актуальных запросов, популярных категорий и новостей в блогосфере — http://blogs.yandex.ru; профилей в социальных сетях — http://people.yandex.ru; предложений по продаже товаров и услуг, подбор моделей — http://market.yandex.ru; информации о доступных мероприятиях: кино, театр, концерты, спорт, клубы и т. д. — http://afisha.yandex.ru; объявлений о продаже и аренде квартир, домов и комнат — http://realty.yandex.ru; объявлений о продаже автомобилей — http://auto.yandex.ru; вакансий — http://rabota.yandex.ru.
Каталоги: легальной музыки для прослушивания — http://musiс. yandex.ru; веб-сайтов с сортировкой по индексу цитирования (имеется возможность платной регистрации) — http://yaсa.yandex.ru.
Новости: главные новости дня, полученные из основных СМИ, представленных в Интернете, с возможностью поиска по новостям, а также подписки на новости по заданному поисковому запросу — http://news.yandex.ru.
Услуги: сравнение вкладов, потребительских кредитов, автокредитов, ипотеки — http://uslugi.yandex.ru.
Погода: http://pogoda.yandex.ru.
Телепрограмма: http://tv.yandex.ru.
Время: http://time.yandex.ru.
Словари: http://slovari.yandex.ru.
Перевод: http://translate.yandex.ru.
Карты: карты мира и России, карты крупных городов РФ (с точностью до дома), поиск по карте, информация о пробках, прокладка маршрутов и панорамы улиц — http://maps.yandex.ru.
Расписания: поездов, самолетов и пригородных электричек — http://rasp.yandex.ru.
Самолетики: онлайн-сервис, позволяющий отслеживать расчетное местоположение любого самолета в реальном времени — http://rasp.yandex.ru.
Паровозики: онлайн-сервис, позволяющий отслеживать расчетное местоположение любого поезда в реальном времени — http://rasp.yandex.ru.
Метрика: измерение трафика, анализ поведения пользователей и оценка эффективности рекламных кампаний — http://metrika.yandex.ru.
Директ: система размещения контекстной рекламы с оплатой по кликам — http://direсt.yandex.ru.
Рекламная сеть: система, позволяющая владельцам сайтов зарабатывать, размещая блоки «Яндекс. Директа» на своих сайтах — http://partner.yandex.ru.
Почта: http://mail.yandex.ru, http://Я. ру.
Блоговый сервис: http://my.ya.ru.
«Мой Круг»: социальная сеть — http://moikrug.ru.
Фотки: бесплатный фотохостинг — http://fotki.yandex.ru.
Народ: бесплатный хостинг персональных веб-страниц, а также служба хранения файлов — http://narod.yandex.ru.
Диск: сервис для хранения файлов и работы с ними на любом устройстве, подключенном к Интернету, — http://disk.yandex.ru.
Народная карта: сервис, предоставляющий пользователям возможность самим нарисовать схематическую карту знакомой местности, расставить POI (точки интереса) — http://n.maps.yandex.ru.
Дзен: медитативный поиск (на основе запросов пользователей к «Яндексу» в реальном времени) — http://сompany.yandex.ru/researсhes/interes.
Поиск «Яндекса» позволяет искать документы на русском, татарском, украинском, белорусском, казахском, турецком, английском, немецком и французском языках с учетом морфологии этих языков и близости слов в предложении.
Индексирование: помимо веб-страниц в формате HTML, «Яндекс» индексирует документы в форматах PDF (Adobe Aсrobat), Riсh Text Format (RTF), двоичных форматах Word (.doс), Exсel (.xls), PowerPoint (.ppt), RSS (блоги и форумы).
Поиск и сервисы поддерживаются в России, Украине, Беларуси, Казахстане, Турции.
Самый узнаваемый рекламный слоган: «Найдется все».
Все о компании: http://company.yandex.ru, http://yandex-team.ru.
Понятийный словарь
Антиспам поисковый — набор алгоритмов, позволяющих отделить спам от качественных веб-страниц. С помощью алгоритмов антиспама «Яндекс» проверяет все сайты, которые индексирует. А уже проиндексированные страницы регулярно перепроверяет, чтобы убедиться, что на них не появился спам. Страницы, содержащие спам, могут быть понижены при ранжировании или исключены из поиска. Об этом говорится в лицензии на использование поисковой системы «Яндекс».
Архитектура продукта — структура программы или вычислительной системы, которая включает программные компоненты, видимые снаружи свойства этих компонентов, а также отношения между ними.
Асессоры — специалисты, оценивающие релевантность страницы тому запросу, по которому она была представлена в результатах поиска; основная задача асессора — улучшение качества выдачи; асессоры, оценивая сайт, смотрят и на его содержание, и на раскрытие тематики, и на удобство использования ресурса; асессоры не только оценивают релевантность документа запросу, но и помогают настраивать алгоритмы поисковой системы.
Бета-тестирование — распространение новой версии (бета-версии) продукта или сервиса, платформы среди ограниченного числа пользователей.
Браузер — программное обеспечение для просмотра сайтов, то есть для запроса веб-страниц (преимущественно из Сети), их обработки, вывода и перехода от одной страницы к другой.
Движок — выделенная часть программного кода для реализации конкретной прикладной задачи — программа, часть программы, комплекс программ или библиотека, в зависимости от задачи и реализации. Использование готового движка при разработке программы, сайта или другого продукта сокращает время разработки, позволяет уделить больше времени разработке других подсистем.
Дистрибутив (дистрибутивная копия) — копия программного продукта, предназначенная для распространения (бесплатного или платного) и установки пользователем. В большинстве случаев — установочная архивированная версия программного продукта.
Детектировать (от англ. detect) — замечать, открывать, обнаруживать, раскрывать.
Интерфейс — часть программы, взаимодействующая с пользователем, посредством него приложение получает доступ к операционной системе и другим сервисам.
Код — написанный человеком текст компьютерной программы на каком-либо языке программирования.
Колдунщики — информационные блоки в результатах поиска с ответами от сервисов «Яндекса».
«Матрикснет» (MatrixNet) — метод машинного обучения, с помощью которого строится формула ранжирования поиска «Яндекса», которую теперь можно настраивать отдельно для достаточно узких классов запросов. Например, локализовать поиск для региональных пользователей.
Машинное обучение — попытка научить компьютер решать задачи, которые легко даются человеку, но формализовать путь их решения сложно. В результате машинного обучения компьютер может демонстрировать поведение, которое в него не было явно заложено.
Морфология (от греч. morhpe — форма, logos — учение) — изучает слова как части речи с точки зрения их грамматических свойств, это наука о правилах словоизменения и словообразования. Основа морфологии: корень, суффикс, приставка, окончание (или флексия — самая большая головная боль разработчиков русскоязычных поисковиков), которое способно меняться в зависимости от рода, числа и падежа. Морфология русского языка еще в 1970-х гг. была исчерпывающе описана Андреем Анатольевичем Зализняком, будущим академиком Российской академии наук. Результатом этого научного прорыва стали базовые труды для русской морфологии — «Русское именное словоизменение» (1967) и особенно «Грамматический словарь русского языка» (1977), в котором для 100 000 слов русского языка указана точная модель словоизменения и предложена классификация самих этих моделей. Этот словарь стал основой для разработки компьютерных программ автоматического морфологического анализа, в том числе в информационном поиске, в машинном переводе. Именно этот труд лег в основу алгоритма поиска «Яндекса» и других поисковиков, основанного на морфологическом принципе опознавания слов.
Омонимия — совпадение слов (словоформ) с разным лексическим значением.
Паук (робот-паук) — регулярно обходит документы по заданному маршруту; если сайт на месте, то есть работает и доступен, паук выкачивает запланированные в маршруте документы. Он определяет тип скачанного документа (.html, pdf, swf и т. п.), кодировку и язык, а затем отправляет данные в хранилище.
Псевдооптимизация — попытка обмана поисковой системы и манипулирования ее результатами с целью завышения позиции сайтов (страниц) в результатах поиска; использование SEO-ссылок, которые на коммерческой основе размещаются на сторонних ресурсах (количество ссылок на страницу и их текст учитываются при ранжировании). Спрос на SEO-ссылки стимулирует наводнение Интернета сотнями тысяч бесполезных сайтов, забитых заимствованным или бессмысленным контентом.
Поиск — состоит из двух больших частей: первая — когда поисковик ищет различные документы в Интернете и составляет поисковый индекс; вторая — когда ищется ответ на конкретный запрос пользователя в уже подготовленной поисковой базе. Пользовательские запросы сначала попадают в компьютерную систему «метапоиск», который обрабатывает каждый запрос в реальном времени — выясняет все необходимые данные про запрос (из какого региона он был задан, к какому классу относится и т. п.), проводит лингвистическую обработку; затем метапоиск проверяет, формировались ли в последнее время результаты поиска для этого запроса, потому что результаты поиска по часто задаваемым запросам некоторое время хранятся в памяти метапоиска, а не формируются каждый раз заново; если вновь пришедший запрос оказался популярным, метапоиск покажет пользователю заранее сохраненные результаты. Если же ответа в памяти нет, то метапоиск передает запрос на сервера другой компьютерной системы — «базового поиска». На базовом поиске хранится слепок Интернета, по которому ищет «Яндекс», — поисковая база. Она разбита на части, которые хранятся на разных серверах — искать ответ одновременно по нескольким частям базы данных быстрее, чем по всей базе целиком. Кроме того, у каждого сервера есть несколько копий. Это позволяет распределять нагрузку и не терять данные — если один из серверов не сможет своевременно ответить, информация все равно найдется на дублирующих серверах. Из тысяч серверов базового поиска метапоиск выбирает наименее загруженные — таким образом, чтобы вместе они содержали целую поисковую базу. Каждый из серверов отдает список документов, в которых есть слова из запроса, обратно в метапоиск. Там они объединяются, ранжируются с помощью технологии «Матрикснет» и попадают на страницу результатов поиска. Благодаря такой организации поиска «Яндекс» может отвечать пользователю за доли секунды.
Поисковая база — слепок Интернета, по которому ищет поисковик; поисковый индекс, данные о типе документов, кодировке, языке и сохраненные копии документов вместе составляют поисковую базу; обновляется постоянно, но, чтобы это обновление стало доступно пользователям, ее нужно перенести на «базовый поиск». Обновление поисковой базы из хранилища основного робота попадает в поиск «пакетами» — раз в несколько дней. Этот процесс создает дополнительную нагрузку на сервера, поэтому производится ночью, когда к «Яндексу» обращается на порядок меньше пользователей. Сначала новые части базы помещаются рядом с такими же частями из прошлого обхода. Затем они проверяются по целому ряду факторов, чтобы обновление не ухудшило качество поиска. Если проверка прошла успешно, новая часть базы заменяет собой старую.
Поисковый индекс — база данных, по которым ищет поисковая машина; поиск с помощью индекса ускоряет процесс ответа пользователю, как, например, предметный указатель в книге помогает быстрее найти нужное слово; размеры предметного индекса огромны.
Поисковые подсказки — список запросов, один из которых, скорее всего, хотел задать пользователь. Появляются под поисковой строкой при вводе запроса. 1 млрд — примерно столько раз в день «Яндекс» подсказывает запросы пользователям.
Поисковый робот — специальная компьютерная система регулярно обходит Интернет, выкачивает документы и обрабатывает их; создается своего рода слепок Интернета, который хранится на серверах поисковика и обновляется при каждом новом обходе. Например, у «Яндекса» два поисковых робота — основной и быстрый (он называется Orange). Основной робот индексирует Интернет в целом, а Orange в режиме реального времени отвечает за то, чтобы в поиске можно было найти самые свежие документы, которые появились минуты или даже секунды назад. У каждого робота есть список адресов документов, которые нужно проиндексировать.
Принадлежность сайта к тому или иному региону определяется по многим признакам — в том числе по указанным на нем контактам, ip-адресу сайта, региону, которому посвящена большая часть информации на ресурсе, и т. д.
Провайдер — организация, предоставляющая услуги доступа к Интернету и иные связанные с Интернетом услуги.
Программа-планировщик — выстраивает маршрут, очередность обхода документов. При этом планировщик учитывает важные для поисковой системы характеристики сайтов, такие как, например, цитируемость или частота обновления документов. После создания маршрута планировщик отдает его другой части поискового робота — пауку.
Ранжирование — упорядочивание результатов поиска в соответствии с запросом пользователя. Именно ранжирование определяет качество поиска — то есть качество ответа на вопрос, заданный в поисковой строке.
Результаты поиска — ссылки на различные веб-страницы, которые пользователь видит в ответ на свой запрос к «Яндексу».
Саджест — поисковая подсказка.
Сигнатура — характерные признаки атаки или вируса, используемые для их обнаружения.
Сниппет — краткая структура найденного сайта в поисковой выдаче.
Спам — сайты, веб-страницы или элементы страниц, которые создают для обмана поисковых систем и манипулирования результатами поиска. Например, чтобы сайт появлялся в результатах поиска как можно чаще, на странице ресурса размещают мелкий, нечитаемый текст с популярными запросами. Посетители его не замечают, зато поисковая система видит и индексирует. К распространенным видам спама можно отнести текстовый спам (невидимый, нечитаемый или бессмысленный текст), а также дорвеи (от англ. doorway — дверной проем, вход) — промежуточные странички, которые перенаправляют посетителей на целевой сайт, который нужно раскрутить. Спам — это также анонимные незапрошенные массовые рассылки электронной почты, то есть электронный эквивалент бумажной рекламной корреспонденции, засоряющей обычные почтовые ящики. Спам чаще всего используется для рекламы товаров и услуг. Спамеры рассылают большое количество рекламных сообщений и наживаются на тех, кто на них отвечает. Кроме того, злоумышленники используют спам для проведения фишинговых атак и распространения вредоносных программ.
Утилита — компьютерная программа, расширяющая стандартные возможности оборудования и операционных систем, выполняющая узкий круг специфических задач.
Уязвимость — используется для обозначения недостатка в системе, используя который можно нарушить ее целостность и вызвать неправильную работу.
BIOS — часть программного обеспечения, входящего в состав компьютера. Отвечает за первоначальное тестирование и загрузку компьютера.
Cliсkunder-реклама — неожиданно для пользователя открывает рекламную страницу при любом клике по сайту, в том числе — по ссылкам.
Popunder-баннеры — перемещаются по экрану вслед за прокруткой страницы и закрывают ее содержание, а при попытке закрытия такого баннера открывается новое окно.
Использованные источники
http://help.yandex.ru/search/?id=1125352
http://www.miloserdie.ru/print/2/41/4330
http://habrahabr.ru/company/yandex/profile
http://forbes.ru/news/68246-aktsii-yandeksa-v-pervyi-den-posle-ipo-vyrosli-na-55
http://propr.me/prodvigat-skype-v-rossii-budet-yandeks
http://cnews.ru/news/2012/01/11/umer_odin_iz_osnovateley_yandeksa_ben_koul_472199
http://expert.com.ua/70968-yandeks-ishhet-v-tvittere.html
http://vsbi.dev.cpeople.ru/news/v_bi_partner_conference_2012_kib_reef
http://open.cnews.ru/news/top/index.shtml?2012/06/22/493961
http://internet.afisha.ru/yandex
http://ria.ru/culture/20130313/927138571.html
http://towave.ru/news/yandeks-obyavlyaet-finansovye-rezultaty-za-iv-kvartal-2012-i-2012-god.html
http://bizhit.ru/index/users_count/0–151
http://sobesednik.ru/news/since/Yahoo_Yandex
http://forbes.ru/sobytiya/lyudi/81454-alisher-usmanov-milliardy-i-chelovecheskie-otnosheniya
http://1prime.ru/Stocks/20130122/760655001.html
http://vedomosti.ru/tech/news/9243281/prodavec_yandeksa
http://fundmarket.ua/news/tiger-global-izbavlyayetsya-ot-akziy-yandyeksa-20130218164423
http://1prime.ru/Stocks/20130218/761260969.html
http://kurs.ru/news/44663/investfond-tiger-global-prodal-aktsii-yandeksa-i-kupil-groupon
http://robingut.ru/eto-interesno/tiger-global-izbavlyaetsya-ot-yandeksa
http://grani.ru/Internet/m.145961.html
http://biz.liga.net/all/it/novosti/2431088-amerikantsy-sokratili-dolyu-v-yandekse-.htm
http://www.burocrats.ru/investcomp/081223095048.html
http://habrahabr.ru/post/129579
http://ukrrudprom.ua/digest/YAndeks_zaplatil_za_otkrovennost.html
http://sterlegrad.ru/bussines/15360-investory-yandex-ispugalis-google.html
http://hostingua.net/content/ereklama/Akcii-Jandeksa-uronil-schetchik-Klimenko
http://olegros.blogspot.ru/p/200–200.html
http://superinvestor.ru/archives/672
http://jr-partners.info/index.php/genius/131-julian-robertson
http://alt-norvik.lv/ru/hedge-funds/history
http://meta.kz/186383-u-vladelca-krupnejjshego-avtokoncerna-ukrainy.html
http://company.yandex.ru/press_releases/1997/09–23_00
http://gazeta.ru/business/2013/01/25/4940421.shtml
http://rapsinews.ru/international_news/20120515/263157482.html
http://gazeta.ru/business/2012/09/28/4792565.shtml
http://monetka.biz/business-i-internet/kto-i-kak-budet-spasatsya-ot-google-v-runete.html
http://kpis.ru/uploads/search_context_2008.pdf
http://netpromoter.ru/articles_70.html
http://2012.russianinternetforum.ru/itogi/resolution
http://net-lit.com/writer/12636/books/54987/dorofeev_vladislav_yurevich/vyikidyish/read
http://cfin.ru/press/sf/2003–01/03.shtml
http://inweb.net.ru/view_258.htm
http://ktonanovenkogo.ru/seo/search/google-gugl-istoriya-poiskovoj-sisteme.html
http://alexnetworks.ru/stat/poiskoviki.htm
http://netpromoter.ru/articles_70.html
http://monetka.biz/business-i-internet/kto-i-kak-budet-spasatsya-ot-google-v-runete.html
http://forbes.ru/sobytiya-column/vlast/77292-arkadii-volozh-vmesto-vladimira-churova
http://peoples.ru/undertake/internet/arkady_volozh/interview.html
http://business-gazeta.ru/article/67427
http://business-gazeta.ru/text/66997
http://diogenes.ru/press/publish/detail.php?ID=3438
http://gtmarket.ru/laboratory/publicdoc/2009/2161
http://libma.ru/delovaja_literatura/rossiiskaja_reklama_v_licah/p19.php
http://seosbornik.kz/techcrunch-moscow-2011-publichnoe-intervyu-arkadiya-volozha.html
http://seonews.ru/analytics/papa-podari-mne-yandeks
http://norilsk-city.ru/about/832/index.shtml
http://constructorus.ru/istorii-uspexa/arkadij-volozh.html
http://stalker.dp.ua/success-stories/yandex.html
http://www.forbes.ru/tehno/internet-i-telekommunikatsii/65029-v-protsesse-poiska
http://seo.boss111.ru/?page_id=1564
http://skillper.com/story/view.php?ID=12289
http://works.tarefer.ru/35/100119/index.html
http://ph4.ru/yandex_yastory.ph4
http://computernavigation.ru/poisk-v-internete-istoriya-yandeks
http://tasstelecom.ru/news/one/11857
http://tv-technopark.ru/index.php?option=com_content&view=article&id=81&catid=6&Itemid=17
http://internet.afisha.ru/yandex
http://sostav.ru/articles/2002/02/19/comm190202
http://onlinesem.ru/seo-intervyu/yandex-interview
http://expert.ru/expert/2006/25/yandex_vybiraet_put_razvitiya
http://roboxchange.com/Environment/Wiki/YandexMoney.aspx
http://antispam.rin.ru/news.htm
http://newstyle-mag.com/personalii/vsya-zhizn-v-poiske-osnovatel-yandeksa-ilya-segalovich.html
http://kommersant.ru/doc/1830557?isSearch=True
http://company.yandex.ru/press_releases/2013/0725/index.xml
http://clubs.ya.ru/company/replies.xml?item_no=69367
http://www.yandex-ostrova.info/%D0%BF%D1%80%D0%B5%D0%B7%D0%B5%D0%BD%D1%82%D0%B0%D1%86%D0%B8%D1%8F
ya.ru; яндекс. рф; new.yandex.ru; yandex.com.tr; yandex.com; yandex.ua; yandex.by; yandex.kz; ya.ru; yandex.ru; images.yandex.ru; video.yandex.ru; books.yandex.ru; blogs.yandex.ru; people.yandex.ru; market.yandex.ru; afisha.yandex.ru; realty.yandex.ru; auto.yandex.ru; rabota.yandex.ru; music.yandex.ru; yaca.yandex.ru; news.yandex.ru; uslugi.yandex.ru; pogoda.yandex.ru; tv.yandex.ru; time.yandex.ru; slovari.yandex.ru; translate.yandex.ru; maps.yandex.ru; rasp.yandex.ru; metrika.yandex.ru; direct.yandex.ru; partner.yandex.ru; mail.yandex.ru; Я. ру; my.ya.ru; moikrug.ru; disk.yandex.ru; n.maps.yandex.ru; zen.yandex.ru
«IНОСТРАНЕЦ»
«АИФ»
«Ведомости»
«Время новостей»
«Интерфакс»
«ИТАР-ТАСС»
«Коммерсантъ»
«Московские новости»
«Новые известия»
«Новый стиль»
«РБК daily»
«РИА Новости»
«Секрет фирмы»
«Сноб»
«Финанс»
«Финансовая Россия»
«Эксперт»
Bloomberg
Citizen K
Forbes
Top-Manager
И др.
- 1.8 Ввод-вывод типичного приложения хранения данных
- Извлечение и возврат документов в приложениях Microsoft Office 2007
- Использование панели задач Управление документами в приложениях Office 2007
- Каждый раз после загрузки Windows запускаются разные бесполезные приложения, а возле часов появляются лишние значки. Что...
- Удаляю Windows Messenger из автозапуска, но после перезагрузки программа снова запускается. С другими приложениями таког...
- Создание приложения-клиента в C#
- Глава 4 Работа с приложениями
- Управление приложениями
- Пример приложения Pocket PC, демонстрирующий работу средств контроля запуска событий
- Глава 23 Использование команд для доступа к приложениям
- Самые популярные приложения
- Часть II Приложения, которые «живут» в Макинтоше