Книга: Яндекс для всех

8.1.1. Переводим с Яндексом

8.1.1. Переводим с Яндексом

Главный и единственный партнер Яндекса в реализации онлайнового перевода — компания ABBYY Software House (рис. 8.1).


ABBYY Software House

Российская компания ABBYY (до 1997 года — BIT Software) была основана в 1989 году студентом IV курса МФТИ Давидом Яном и на сегодняшний день является одним из ведущих мировых разработчиков программного обеспечения в области искусственного интеллекта, в частности распознавания документов и обработки естественного языка.

Совместный проект двух компаний (он доступен по двум адресам — старому http://lingvo.yandex.ru/ и новому http://slovari.yandex.ru/) был запущен в середине 2001 года. До этого момента онлайновая версия словаря уже присутствовала на сайте компании ABBYY, и спрос на нее был, по моим воспоминаниям, довольно стабильным. Зачем же компании решили выпустить в свет конкурента уже имеющемуся проекту? Вот что об этом говорилось представителями компаний при старте сервиса Яндекс. Словари:

Онлайновая версия этого словаря уже давно существует непосредственно на сайте Lingvo.ru. Однако она является, скорее, демо-версией словаря, распространяемого на компакт-диске. Как сообщила "Нетоскопу" директор по проектам Яндекса Евгения Завалишина, сам словарь, т. е. база, практически одинакова. "Но Яндекс. Lingvo — это не только словарь от ABBYY, но и технологии от Яндекса, — уточнила она. — С этим проектом Яндекс добавляет к имеющимся еще один полезный сервис, ABBYY же рекламирует свой словарь — и это основной смысл проекта. Яндекс кардинально переработал и интерфейс словарей".

Источник: http://company.yandex.ru/press/2001/10-07_03.xml.

Эти слова подтвердил и представитель компании ABBYY:

"Для нас основная цель проекта — популяризация Lingvo. Яндекс — один из лидеров российского Интернета, наиболее динамично развивающийся портал. И мы надеемся, что с его помощью в ближайшее время многие посетители Рунета из тех, кто ранее не сталкивался с Lingvo, смогут оценить по достоинству наш словарь. Я надеюсь, наша работа с Яndex не ограничится одним проектом, и мы будем сотрудничать и в дальнейшем", — сказал генеральный директор компании ABBYY Сергей Андреев.

Источник: http://company.yandex.ru/news/2001/07-10_00.xml.

Словари

Совместный проект получился удачным. Он оказался настолько востребованным, что следующие годы шло его постоянное развитие. Менялся движок, разрабатываемый компанией ABBYY, пополнялись словари, расширялось количество поддерживаемых языков. Сегодня в онлайновой версии можно работать со всеми основными европейскими языками — английским, немецким, французским, итальянским и испанским.

При использовании словарей-переводчиков следует помнить, что они предназначены для перевода отдельных слов и словосочетаний. Сервис позволяет получить полноценный перевод слов с примерами их использования, идиоматическими выражениями, списком различных значений слова. Поэтому не следует использовать его для перевода целых предложений.

Для различных языков и направлений перевода используются разные наборы словарей.

? Для испанского языка набор пока самый минимальный — словарь общей лексики и тезаурус (словник) деловой лексики. Тезаурус получен в результате полуавтоматического анализа большого корпуса текстов, принадлежащих так называемой деловой прозе. Словарь впервые в отечественной лексикографии фиксирует синонимические ряды для значений, используемых в деловых текстах: договорах, проектной и технической документации, деловой переписке.

? Итальянский язык представлен более широким набором словарей. Кроме словарей, подобных испанским, для перевода используются словари основной лексики и политехнический:

• словарь основной лексики позволяет переводить периодику и современную художественную литературу, понимать молодежный сленг или даже нецензурную брань (и иметь возможность адекватно ответить с помощью русско-итальянской части словаря). Представлена здесь и базовая техническая лексика, экономические и финансовые термины и выражения. Особое внимание при составлении словаря было уделено именам собственным. Здесь есть имена знаменитых исторических личностей, персонажей мифологии, библейских текстов, сказок, названия основных мировых культурных объектов, которые иногда затруднительно опознать в иностранном тексте или правильно перевести с русского языка;

• в политехническом словаре предпочтение отдается прежде всего терминологии новых, быстро развивающихся отраслей, таких как автоматика, вычислительная техника, радиоэлектроника и квантовая электроника, ядерная физика, космонавтика, высокополимерные материалы и других, терминологии теоретических дисциплин, тесно связанных с производственными процессами: математики, механики, физики, химии, сопротивления материалов, гидравлики, термодинамики, а также терминологии машиностроения, деталей машин, металлообработки и строительных материалов.

? Для тех, кто работает с французскими текстами, особый интерес может представлять юридический словарь, включающий термины и относящиеся к ним выражения, отражающие основные правовые институты и понятия в области теории государственного, конституционного, международного, финансового, торгового, гражданского, трудового, уголовного права, гражданского и уголовного процесса и криминалистики.

Словарь отражает юридическую терминологию, применяемую, главным образом, во Франции, но также и в других странах с французским государственным языком. Практически вся французская терминология была заимствована из оригинальных французских текстов, содержащихся в законах и иных нормативных актах Французской республики, а также в правовой литературе. В качестве русских эквивалентов предлагаются термины, принятые в современном русском юридическом языке.

? Коллекция немецких словарей включает дополнительно экономический и медицинский словари:

• немецко-русский экономический словарь содержит около 50 тыс. терминов по различным разделам современной экономики — это финансы, банковское и биржевое дело, экономика промышленности, народное хозяйство, маркетинг, торговля, логистика, социология, статистика, трудовое и хозяйственное право и т. д.;

• медицинский словарь содержит термины, охватывающие все разделы медицинской науки и практики. Существенно расширена терминология современных направлений медицины, в частности иммунологии, генетики, биохимии. Впервые в словаре нашла отражение медицинская техника. В словарь введен ряд эпонимических терминов, облегчающих взаимопонимание врачей.

? Наибольшее количество словарей предназначено для работающих с английскими текстами. Как и во всех остальных словарях, перевод может выполняться в обоих направлениях, при этом используются не только словари общей лексики, но и специализированные: экономический, по вычислительной технике и программированию, политехнический, медицинский, юридический, научно-технический, по маркетингу и коммерции, а также тезаурус деловой лексики.

Особенности перевода

Одной из особенностей сервиса Яндекс. Словари является то, что, помимо обычных переводов, в результатах приводятся также разговорные выражения слов. Для поиска перевода используются не только названия словарных статей, но и остальные ее части: непосредственно текст статьи, примеры словоупотребления и комментарии.


Например, известное многим английское слово pig. Обычно при переводе его используют в значении "свинья". А перевод на Яндексе (рис. 8.3) дал множество и других понятий и смыслов этого слова:

? долька плода цитрусовых;

? болванка, чушка (об отливке необработанного металла);

? pig board — серфинг;

? pig-boat — (амер. сленг) подводная лодка;

? pig's breakfast — нечто неаппетитное или отталкивающее;

? pig's ear — пиво (рифмуется с beer).

Если же вас не удовлетворят предложенные переводы, то Яндекс. Словари предложат поискать варианты на внешних сервисах, таких как словари толкования Webster, Oxford, Cambridge, этимологии и литературных контентов употребления Bartleby, либо выполнить одновременный запрос к 993 онлайновым словарям с помощью метасловаря Onelook.

Если слово, заданное для перевода, присутствует и в энциклопедических словарях, то после всех результатов будет приведено количество статей, содержащих его, и ссылка, по которой их можно посмотреть.

Вторая особенность словарей Яндекса связана с его поисковыми возможностями. Как и в "большом" поиске, поиск перевода по словарям учитывает совокупность введенных слов, которая до передачи в словари предварительно анализируется. Такая обработка оказывает влияние на порядок вывода результатов. Найденные статьи ранжируются по релевантности, и пользователю представляются лишь наиболее близкие к смыслу запроса переводы слов и словосочетаний. Кроме того, опять же сказывается система поиска на Яндексе, — сервис предполагает использование "нечеткого" поиска, заключающегося в том, что если исходное слово было написано с опечаткой, система предложит варианты наиболее близких по написанию слов, переводы которых имеются в словарях.

Следующая особенность Яндекс. Словарей — в довольно существенной переработке интерфейса словарей Lingvo. Если вы работали с программой Lingvo, то должны помнить, какое количество окошек могло открываться при просмотре различных вариантов перевода. Пользователям Интернета такой вариант неудобен, поэтому многочисленные итерации перехода от окна к окну были убраны. Теперь существенная часть информации выводится сразу, в первом же окне результатов.

Поиск по словарям можно выполнять как в обычном, так и в расширенном режиме. Расширенный режим предусматривает возможность выполнения дополнительных настроек. Для перехода в этот режим перейдите по ссылке расширенный поиск, расположенной в форме поиска под полем ввода.

Расширенный режим поиска позволяет выполнить настройки для каждого из возможных направлений перевода. Выбрав требуемый вам язык, вы можете отключить или подключить дополнительные словари, по которым будет выполняться поиск. Самое интересное в этих настройках — определение места и формы поиска. Возможны несколько вариантов:

? в заголовках словарных статей;

? по точному словосочетанию;

? всех слов либо на определенном расстоянии друг от друга, в том числе с учетом порядка их следования;

? любого из слов в поисковом словосочетании;

? поиск похожих слов.

По умолчанию предусмотрен поиск всех форм заданного слова, но эту возможность вы можете отключить.

Плагин для браузера

Наконец, еще одна особенность сервиса Яндекс. Словари. Предназначена она для тех, кто использует для доступа к сервису браузер Microsoft Internet Explorer 5-й версии и выше. Это небольшая резидентная программа, с помощью которой можно выполнять переводы, находясь на сайтах. После того как вы установите ее у себя на компьютере, для перевода нужного слова достаточно будет выделить его в окне браузера, нажать правую кнопку мыши и выбрать пункт Translate (Перевести). Результат перевода появится в новом окне. Программа добавляет в это меню и опцию Search, которая позволяет искать выделенное слово Яндексом.

Загрузить программу можно со страницы http://lingvo.yandex.ru/ download.xml. Точнее, это даже не программа, а набор ключей для добавления в реестр Windows (листинг 8.1). Для установки ключей можно скачать файл ie5cont.reg, сохранить его на компьютере и выполнить. В контекстное меню будут добавлены опции поиска и перевода с английского и других языков.

Листинг 8.1. Содержимое файла ie5cont.reg

REGEDIT4

[HKEY_CURRENT_USERSoftwareMicrosoftInternet Ex-plorerMenuExt&Translate]

@="http://lingvo.yandex.ru/ie5trans.htm"

"Contexts"=dword:00000030

[HKEY_CURRENT_USERSoftwareMicrosoftInternet ExplorerMenuExtYandex &Search]

@="http://lingvo.yandex.ru/ie5search.htm"

"Contexts"=dword:00000030

[HKEY_CURRENT_USERSoftwareMicrosoftInternet Ex-plorerMenuExt&Ubersetzen]

@="http://lingvo.yandex.ru/ie5trans1.htm"

"Contexts"=dword:00000030

[HKEY_CURRENT_USERSoftwareMicrosoftInternet ExplorerMenuExtT&raduire] @=''http://lingvo.yandex.ru/ie5trans2.htm"

"Contexts"=dword:00000030

[HKEY_CURRENT_USERSoftwareMicrosoftInternet ExplorerMenuExtTradurr&e] @=''http://lingvo.yandex.ru/ie5trans3.htm"

"Contexts"=dword:00000030

[HKEY_CURRENT_USERSoftwareMicrosoftInternet ExplorerMenuExtTraduc&ir] @=''http://lingvo.yandex.ru/ie5trans4.htm" "Contexts"=dword:00000030

Если вам не требуется перевод с итальянского или испанского, можно установить каждую дополнительную опцию с помощью отдельного reg-файла. Аналогично для удаления также есть специальные файлы, которые могут удалить новые опции как одновременно, так и по одиночке. Все эти файлы имеются на указанной странице.

Второй способ еще проще. На той же странице, откуда вы скачиваете reg-файлы, есть две кнопки. Одна называется Set Search and Translate menu items и предназначена для добавления в реестр необходимых записей, вторая имеет название Remove Search and Translate menu items и предназначена, как вы уже поняли, для удаления установленных опций.

Внимание!

При использовании этих возможностей будут вызываться Java-скрипты и компоненты ActiveX, которые по умолчанию не помечены как безопасные. Выполните настройки вашего браузера, чтобы вы могли сами разрешать или запрещать их выполнение, либо добавьте словарный сервис в число доверенных узлов, для которых разрешено выполнение компонентов.

"Умный" Яндекс

Частота обращения посетителей к сервису Яндекс. Словари заставила разработчиков задуматься над упрощением доступа к этому специализированному поиску. Решение было найдено простое и элегантное. Яндекс "научили" понимать, когда посетитель ищет статью в Интернете, а когда значение слова в словарях и энциклопедиях. Правда, пришлось доработать, расширить язык запросов. Зато теперь можно с главной страницы поиска выполнять и перевод слов, и поиск в словарных статьях (рис. 8.4).


Вариантов задания таких специальных вопросов несколько. Яндекс распознает как команду к поиску перевода конструкцию Как ЭТО по-английски (по-немецки, по-испански) и конструкцию запроса как по-английски (по-немецки, по-испански) это. Можно использовать и более простой вариант, например, климат по-итальянски. Переводить таким способом можно не только на иностранные языки, но и с иностранных на русский.

Можно использовать и другие варианты запросов, например, в запросе можно написать слово перевод или перевести перед словом, требующим перевода. Если слово написано на иностранном языке, оно будет переведено на русский, а если на русском, то перевод будет выполнен на английский язык, как наиболее употребляемый.

При использовании таких стандартных теперь уже форм запроса, сама форма работает как переключатель, выполняя поиск по словарным статьям.

Русскоглийский словарь

Кроме словарей, включенных в систему поиска, есть один словарь, созданный еще "на заре Яндекса". В нем собраны слова, которые в русском и английском языках графически выглядят одинаково, но иногда означают совершенно различные понятия. И чтобы не запутаться в них, была предпринята попытка найти их и свести воедино. Полностью познакомиться со словарем можно здесь: http://company.yandex.ru/team/rusglish.html. А далее — небольшой пример из него (табл. 8.1).


Оглавление книги


Генерация: 2.075. Запросов К БД/Cache: 3 / 1
поделиться
Вверх Вниз