Книга: Новые соединения. Цифровые космополиты в коммуникативную эпоху

Прозрачный перевод

Прозрачный перевод

Сама возможность переводить тексты с помощью автоматизированных систем или переводчиков-волонтеров не гарантирует того, что мы эти переводы когда-нибудь обнаружим. Перевод Роланда Суна статьи Qilu Evening News об училище Ланьсян был доступен в интернете, но журналисты, пишущие о китайских хакерах, не смогли ее найти. Поиск стал настолько важным механизмом, что для многих из нас информации, которой нет в первой выборке поисковой системы, просто не существует. Для преодоления языкового барьера недостаточно просто сделать перевод доступным. Для этого необходимо сделать язык прозрачным.

В кризисные моменты нам часто приходится вспоминать, каким высоким может быть языковой барьер. Когда в начале 2011 года по Тунису, Египту, а затем большей части стран Северной Африки и Ближнего Востока прокатилась волна народных протестов, миллионы заинтересованных читателей стали использовать Twitter для получения новостей и комментариев в режиме реального времени. Самые интересные посты в Twitter были не на английском, а на арабском языке. Такие выдающиеся журналисты, как Дима Хатиб, начальник бюро телеканала «Аль-Джазира» в Латинской Америке, в режиме реального времени переводили размещенные на арабском твиты на английский и испанский языки, значительно расширяя таким образом аудиторию этих сообщений.

Энди Карвин, главный специалист NPR[202] по вопросам стратегии в социальных медиа, отложив другие дела, все первые месяцы 2011 года посвятил освещению этих событий с помощью интернет-СМИ. Обращаясь к читателям своего Twitter, он нередко просил помочь перевести лозунг, который кричали на площади Тахрир, или твит тунисского диссидента. Поскольку за его Twitter следит более 25 тысяч пользователей во всем мире, переводы нередко приходили спустя буквально несколько секунд, и тогда Карвин немедленно делал репост перевода. Дэнни О’Брайен, вместе с Комитетом по защите журналистов выступающий за свободу слова в сети, автоматизировал процесс, создав простой инструмент – расширение браузера, которое рядом с каждым твитом помещает кнопку «перевести», что позволяет заинтересованному пользователю быстро прочитать машинный перевод поста на непонятном ему языке.

Методы Карвина и О’Брайена действенны, если у нас есть мотивация искать записи на других языках. Однако мы по-прежнему предпочитаем подписываться на Twitter тех, кто говорит на понятном нам языке. До тех пор пока язык не станет абсолютно прозрачным, именно язык будет формировать круг тех, кого мы слушаем, и тех, чей голос игнорируем.

Google предпринимает шаги к повышению уровня прозрачности перевода во всех своих продуктах. Когда вы загружаете страницу в веб-браузере Google Chrome, программа пытается определить, на каком языке написана страница, и, если это не тот язык, который вы используете по умолчанию, предлагает машинный перевод содержания. Вы можете отключить эту функцию, согласиться на предложенный перевод или настроить Chrome так, чтобы он всегда переводил определенный иноязычный контент на ваш родной язык. Я настроил Chrome, чтобы страницы на китайском, японском и арабском по умолчанию отображались у меня на английском, и обнаружил, что больше не тянусь к кнопке «Назад» в своем браузере, когда сбиваюсь с удобного пути англоязычных страниц. Предлагаемые переводы бывает трудно прочесть, но, по крайней мере, я получаю представление о тематике материала и могу понять, стоит ли просить знакомых полиглотов сделать более читаемый перевод. Сервис Gmail компании Google работает аналогичным образом, предлагая перевести письмо, если оно написано на непонятном вам языке.

На этом пути Google сталкивается с более крупной проблемой. Чтобы язык перестал быть основной преградой, перевод должен работать не только в браузере, но и в поисковой системе. Когда мы ищем информацию через поисковые системы, мы получаем результаты на языке запроса. Забейте в строку поиска Google в Соединенных Штатах «apple», и ваши результаты будут заметно отличаться от тех, которые вы получили бы вписав то же слово по-испански «manzana» на Google.mx. Это, конечно, имеет смысл, поскольку многие пользователи Google в Соединенных Штатах хотят получать результаты на английском. В то же время такое положение ограничивает круг доступной информации.

Исполнительный директор Global Voices Иван Сигал серьезно увлекается велосипедным спортом. Когда он купил подержанную, сделанную вручную, раму велосипеда малоизвестной немецкой марки под названием Technobull, которая к тому времени уже прекратила свое существование, он сразу захотел узнать больше о своем новом приобретении и о людях, которые ездят на велосипедах той же марки. Поиск на Google.com не дал практически ничего: несколько десятков страниц на английском, где бренд описывался как элитный и дорогой, и одну страницу фотографий на Flickr. Тогда он зашел на Google.de и обнаружил тысячи страниц, в том числе действующий форум велосипедистов-фанатов Technobull. Иван немного говорит по-немецки, и некоторые велосипедисты оказались готовы помочь и ответить на его вопросы. Однако необходимая Ивану информация была на немецком, а не на английском, а Google.com оказался не в состоянии помочь ему найти то, что нужно.

Директор по продуктам Google Анджали Джоши работает над тем, чтобы язык перестал быть непреодолимым препятствием на пути обмена знаниями. «Человек в Корее или любой другой части мира должен иметь доступ ко всей информации в интернете на своем языке, так, чтобы это легко читалось, было понятно и удобно для поиска». Это задача помасштабнее, чем поиск по запросу «яблоко» на английском, испанском и корейском языках: «В итоге мы хотим, чтобы люди могли общаться друг с другом, чтобы их высказывания плавно преодолевали языковые барьеры и в устной, и в письменной речи».

Несмотря на стремительный прогресс Google в области перевода, им еще предстоит долгий путь. (Google-переводчик может переводить с английского на 60 языков и обратно. Однако при переводе, к примеру, с исландского на идиш текст сперва переводится на английский.) «Для достижения этой цели нам нужно пройти три ступени, – говорит Джоши. – В первую очередь нам нужен безупречный машинный перевод. Кроме того, нам нужен поисковик, дающий одинаково хорошие результаты на всех языках». Иными словами, нам нужны алгоритмы поиска, которые смогут решить, какой из вариантов поиска даст наилучшие результаты – перевод испаноязычной страницы про «manzanas» или выдача англоязычной страницы про «apples».

Коллегам Джоши, сидящим с нами в комнате для совещаний в Маунтин-Вью, как будто немного не по себе от масштаба проблем, которые ставит перед ними шеф. Джоши же откидывается на спинку стула и объявляет третью ступень. «Когда мы сможем искать на всех языках и пользоваться безупречным переводом, любой человек будет иметь доступ к тому, что ему действительно нужно. И наступит нирвана».

Полагаю, Джоши отчасти права. Даже при наличии идеального, многоязычного поиска мы столкнемся с еще одной проблемой: понимание последствий и важности того, что нам говорят. Чтобы получить информацию из различных частей мира, нам нужно нечто большее, чем безупречный перевод: мы должны понимать контекст того, что нам говорят. Путь к нирване неблизкий, и на этом пути нам нужны проводники, которые помогут нам понять контекст обнаруженных сведений.

Оглавление книги


Генерация: 1.177. Запросов К БД/Cache: 3 / 1
поделиться
Вверх Вниз