Книга: Информационные операции в сети Интернет

3.1.3. Лаборатория виртуальных специалистов

3.1.3. Лаборатория виртуальных специалистов

Понятно, что все-таки люди больше доверяют людям, способным, в отличие от робота, принимать решения в нестандартных ситуациях и оперативно действовать согласно им. Чтобы создать интеллектуального робота, требуется время и другие затраты на его подготовку для проведения специальных действий в ходе информационной операции. Поэтому надежными исполнителями по-прежнему остаются специально нанятые посетители, которые за определенную плату или по идейным соображениям периодически заходят на заданное множество сайтов и выполняют оговоренные с заказчиком действия. Они регистрируются под несколькими никами и массово продвигают определенную идею[26].

В Сети рекрутинговые интернет-ресурсы для троллей содержат типовые объявления:

«На постоянную работу требуется специалист по работе в социальных медиа (фейсбук, вконтакте, твиттер, ЖЖ и др. блоги). График работы гибкий/свобод-ный. Оформление по ТК. Обязанности: работа в комментариях — требуется оперативная реакция на изменяющуюся ситуацию в блогах, способность поддержания дискуссии и перенаправление ее в требуемое русло; создание виртуалов, написание постов от их имени, раскрутка; мониторинг социальных медиа. Требования: опыт использования социальных сетей и блогов как продвижение чего-либо, понимание механизма их работы и психологии пользователей. Знание популярных блогеров, их основных позиций приветствуется».

Интересно, что такой способ используется даже на государственном уровне. Он хорош тем, что позволяет довольно быстро собрать эффективно действующую армию информационных бойцов.

Например, в 2010 году Израиль объявил призыв добровольцев в своеобразную «армию блоггеров», которой предстоит выйти на поля интернет-сражений для борьбы с антисионизмом. Руководит проектом министерство абсорбции Израиля[27]. Согласно опубликованному министерством объявлению, оно приглашает израильтян, владеющих каким-либо иностранным языком, представлять Израиль в антисионистских блогах на английском, французском, испанском и немецком языках. Также представляют интерес блоггеры, пишущие на русском и португальском.

Более того, «Всемирный совет еврейского студенчества (World Union of Jewish Students, WUJS) нашел способ организовать эффективную борьбу за мировое общественное мнение в Интернете. В начале войны с «Хезболлой», когда Израиль, как всегда в таких случаях, начал проигрывать информационную войну, WUJS выступил с новой инициативой: создать в интернете активное произраильское сообщество, которое могло бы в режиме реального времени реагировать на появляющиеся в сети антиизраильские материалы. Инициативу поддержал отдел по связям с общественностью израильского МИД, а техническое средство реализации идеи обеспечила израильская компания по разработке программного обеспечения: была создана программа под названием «Интернет-мегафон», позволяющая быстро оповестить всех желающих о появляющихся в сети онлайновых опросах, статьях и форумах, связанных с Израилем. Добровольцы WUJS ежедневно ведут мониторинг и сообщают обо всех интернет-публикациях, которые, по их мнению, требуют реакции израильской публики. Отныне внести свой вклад в информационную войну за интересы Израиля может любой желающий »[28].

Соединенные Штаты в ноябре 2009 года сформировали аналогичное интернет-подразделение — «Команда по цифровым внешним контактам». Данное подразделение предназначено для противодействия антиамериканской дезинформации в Интернете за рубежом. В ее задачу входит присутствовать в Интернете — в чатах, на популярных интернет-сайтах и в блогах, рассказывая об американской политике, исправлять ошибки, которые имеют место, а также отсылать людей «к правильным документам».

Так все же, какие специальные мероприятия в контексте перечисленных в разделе 1.1 типовых задач способны выполнять люди, выступающие акторами информационной операции в телекоммуникационной среде, а какие задания — виртуальные специалисты-[ро]боты? Сравним:



Множество действий, доступных виртуальному специалисту, — это также:

— рассылка сообщений-напоминаний, аудио, видеоматериалов в рамках утвержденного графика работ;

— регулярный сбор материалов с заданных источников в сети Интернет, обработка (реферирование), хранение;

— сбор аудио-, видеоинформации с WEB-камер и других технических средств;

— ведение новостной ленты (кто и когда включил/выключил компьютер, отправил сообщение, сколько раз обратился к той или иной базе данных и т. п.);

— контроль технологических процессов;

— ведение журналов аудита;

— разработка предсказаний; предупреждение о возможной опасности;

— акцентирование внимания руководства на нетипичных ситуациях;

— ответы на вопросы с использованием всего спектра разнородной информации (текст, аудио, видео), обсуждение сформулированной человеком проблемы[29]; при этом диалог может вестись как в виде текстовых сообщений, так и голосом и на уровне видеореплик (так, например, браузер Google Chrome позволяет вводить запросы и реплики голосом с высоким качеством распознавания).

Одним из перспективных направлений для решения перечисленных выше функциональных задач является применение специального программного обеспечения, интерфейс которого идентичен поведению реального пользователя сети. Понимаем, что виртуальный специалист — это программный модуль, написанный на языке web-программирования, например, php. Модуль исполняется на сервере и способен использовать любые доступные ему как программному модулю ресурсы. Особенностью модуля является наличие всех тех механизмов, которые пожелает встроить в него разработчик.

Благодаря перечисленным особенностям и функциональным возможностям, виртуальные специалисты становятся все более востребованными. Создание виртуальных специалистов возможно практически в любой предметной области. Им находится место и в качестве бойцов на информационном поле боя. Таким путем идут в США, например, в 2011 году контракт стоимостью 2,76 млн. долл. достался зарегистрированной в Лос-Анджелесе компании Ntrepid. Цель контракта — разработать специальное программное обеспечение (ПО) для проведения проамериканской пропаганды через различные социальные сети и блоги. «По словам представителя Centcom Билла Спикса, данная технология позволит вести секретную блогерскую деятельность на зарубежных сайтах. В частности, такое ПО поможет противодействовать распространению пропаганды за пределами США, кампаниям по дезинформации или хакерским атакам… в рамках этой программы будут создаваться вымышленные виртуальные личности в Twitter, Facebook и других соцсетях, которые по всем внешним признакам должны казаться обычными пользователями из разных стран и иметь убедительную легенду. Под контролем одного военного будет до десяти онлайн-персонажей. Единый пункт управления расположится на базе ВВС США Макдилл близ Тампы (Флорида) и будет функционировать в круглосуточном режиме. Работать в нем будет до 50 операторов. Также предусмотрена система защиты от разоблачения. Отличить бот от настоящего пользователя будет еще более затруднительно, поскольку фэйловым аккаунтам замаскируют IP-адрес. Это позволит создать видимость того, что посты отправляются реально существующими пользователями из разных стран»[30]. По словам Билла Спикса, пресс-секретаря Центрального командования ВС США, данная система будет использоваться для общения на арабском, фарси, урду, пушту и других языках. Данный проект позволит американской армии не только получать оперативную информацию от пользователей о текущем состоянии в регионе, но и добиться «эффекта ложного единодушия» в онлайн-дискуссиях.

Для виртуального специалиста вполне реально сформулировать цели, задачи и правила поведения — это, в первую очередь, постоянное расширение знания в той предметной области, за которую он отвечает, а во вторую — набор правил, согласно которым он функционирует, зафиксированные в его функциональных обязанностях. Виртуальный специалист должен постоянно актуализировать данные, информацию, знание. Он обязан активно обучаться в части решения классической задачи по распределению ресурсов и заданий.

Рассмотрим возможности виртуальных специалистов по обучению и переобучению. При этом будем помнить о том, что, поскольку виртуальные специалисты работают в условиях анонимности, то желательно, чтобы они как можно больше походили на людей, но превосходя их в точности, скорости и масштабности действий.

Обучение виртуального специалиста предполагает организацию работ по двум направлениям:

— обучение материалам, которые, согласно оперативному сценарию, должны быть доставлены на интернет-ресурсы;

— обучение общему поведению и такому языковому интерфейсу, которые бы способствовали повышению веры посетителей ресурсов в источник сообщения.

Доверие со стороны объекта управления к источнику мультимедийного контента, в данном случае к виртуальному специалисту, во многом определяется возможностью его причисления к категории «своих». Исследуем направления работ по обучению и переобучению виртуального специалиста в направлении повышения к нему доверия со стороны других субъектов. Основой любого доверия всегда является понимание одного субъекта другим, которое, в свою очередь, строится на базе созданного информационного образа. Создать информационный образ любого субъекта — значит воссоздать его систему отношений, т. е. проявить его опыт на данный момент. Если же известны правила, по которым данный субъект осуществляет познание мира, то появляется возможность создания устойчивого информационного образа, способного к обучению, к самостоятельному познанию мира. В том случае, если измерение отношения осуществляется не однозначно и не двузначно, а многозначно, то система отношений превращается в систему предпочтений. Часть предпочтений задаётся на этапе создания виртуального специалиста, другие формируются в ходе проведения информационной операции.

Система предпочтений, правила познания, индивидуальная манера поведения в совокупности образуют основу любого информационного образа, в частности информационного образа виртуального специалиста. К этому образу можно добавить биографию, имя, наиболее характерные истории из жизни, чтобы он выглядел более реалистично. Чтобы информационный электронный образ был похож на «живой», он должен состоять из элементов, способных к взаимозависимой деятельности. Он должен содержать в себе своё алгоритмическое самоподобие в виде множества интегрированных компонент, способных к различным видам взаимозависимой деятельности[31].

Введение понятия «алгоритмическое самоподобие» влечет за собой переход к процессам, протекающим по структурам, образованным на базе отношений. Именно процессы определяют, какие сиюминутные информационные образы будут проявлены, а какие нет. Но сами процессы, в свою очередь, также поддаются классификации, и каждый процесс имеет свою структуру, т. к. сам по себе состоит из последовательности различных операций. Например, в объектно-ориентированном программировании элементарными составляющими процесса являются методы. В нашем исследовании к методам можно отнести возможности:

— изменения размеров;

— изменения месторасположения;

— изменения компонент объекта;

— добавление новых компонент;

— удаление компонент;

— порождение дополнительного образа объекта, освещающего (описывающего) данный объект под другим углом зрения.

Перечисленные методы связаны с перемещением объекта в пространстве и времени и с изменением компонент самого объекта.

Информационный образ виртуального специалиста проявляется через естественный язык, который понимают пользователи Интернет, а также искусственные языки среды Интернет, в частности язык разметки гипертекстов html, который они обязаны понимать, когда попадают на тот или иной интернет-ресурс. Язык среды используется для создания текстов.

Среда, в которой функционирует виртуальный специалист, структурируется наличием:

— ключевых слов для текстов, циркулирующих в этой среде;

— связей между ними;

— эмоциональной окраской, как всех текстов, так и отдельных предложений и даже слов;

— наличием определенной комбинации тегов языка разметки гипертекстов. С помощью тегов указывается значимость того или иного слова для данного текста. Подобного рода значимые слова выделяются в тексте с помощью т. н. <meta> тега и тегов разметки текста типа создания заголовков разного уровня, подчеркивания, включения жирного шрифта, гиперссылок. Виртуальному специалисту достаточно «взглянуть» на содержимое названных тегов, и он уже «понимает», о чем идет речь.

Итак, задача виртуального специалиста при общении с человеком или с сайтом заключается в переводе полученных текстов на свой внутренний язык, причем перевод этот должен начинаться с оценки эмоциональной окраски и удаления избыточности. То, что останется, и будет языковой средой.

Индивидуальная манера поведения виртуального специалиста формируется на основе множества его бесед с пользователями ресурсов сети Интернет. Беседы строятся на предпочтениях. В беседах, как правило, присутствуют любимые слова и выражения и отсутствуют нелюбимые. Беседы с теми, к кому хорошо относятся, проходят совсем не так, как с тем, кого опасаются, — другой сценарий беседы. Если в основе первого сценария лежит выбор такого сообщения, которое заинтересует и позволит увеличить продолжительность беседы, то во втором случае сообщения выбираются так, чтобы время беседы сокращалось, а сама беседа ограничилась получением только нового знания о возможных опасностях.

Правила познания. В данном случае рассматриваются способности виртуального специалиста правильно решать те или иные задачи независимо от способности к т. н. познанию. Если задача того или иного уровня решается информационной системой (виртуальным специалистом), значит, система (виртуальный специалист) соответствует этому уровню познания.

Предлагается выделить следующие семь уровней познания:

На первом уровне система способна давать ответы на вопросы только на основе содержания имеющегося у нее текста. Если, например, системе известен текст: «Началась война!», то система должна уметь отвечать правильно на вопрос типа: «Что началось?» Существуют различные алгоритмы решения данной задачи. Например:

— на базе фрейма, содержащего все места, которые посещает субъект, с перечнем его возможных действий;

— поиск в хранящихся текстах предложений, содержащих в себе вопрос или большую часть вопроса, и объединение их в текст ответа с учетом синтаксиса языка. В данном случае системе совсем необязательно уметь анализировать текст и понимать, что такое «война», и знать, что она началась, — это должен знать тот, кто задал вопрос. Главное, чтобы субъект, задающий вопрос, был удовлетворен ответом. На данном уровне важнейшей задачей является задача определения расстояния не только между различными текстами (в этой части достаточно существующих решений), но и между неизвестным вопросом и известным ответом, который и должен быть поставлен в соответствие этому вопросу.

Для определения индивидуального стиля поведения (разговора) виртуальному специалисту вполне подойдут адаптированные к текстам естественного языка алгоритмы самообучения на базе гибели и рождения элементов[32]. В магистерской диссертации Р.С. Токарева (МФТИ, 2009 г.) было показано, что для решения данной задачи вполне достаточно всего четырех видов элементов с такими базовыми операциями, как удалить слово, добавить слово, заменить слово, переставить слова.

На втором уровне у системы имеются правила пополнения текстов и правила исключения отдельных фрагментов текста. Здесь возможны два пути модификации исходных текстов:

— их действительная модификация (включение/исключение);

— расширение (сужение) для информационной системы возможностей по доступу к текстам, принадлежащим другим информационным системам.

Наличие подобных правил может стать основой механизма самообучения, т. к. при определенных условиях эти правила задают направление развития информационной системы. Все ответы готовятся на базе различных текстов. Неоднократная отрицательная оценка ответа различными собеседниками является достаточным основанием для удаления текста, понижения его статуса. Положительная оценка приводит к повышению статуса текста, что, в итоге, способствует его выбору в случае наличия конкуренции среди текстов, претендующих на роль генератора ответа.

На третьем уровне при ответе на вопрос система должна уметь оперировать историей вопросов-ответов. Например, отвечая на вопрос «Согласны?», система должна уметь посмотреть историю диалога и расширить вопрос текстами о том, с чем предполагается согласиться. Как глубоко уходить в историю, на сколько шагов, определяется собеседником. В случае рядовой беседы людей друг с другом ими обычно учитываются от 3 до 7 последних высказываний.

Повышению эффективности функционирования системы на третьем уровне может способствовать карта взаимосвязи текстов, страниц сайтов, состоящая из матрицы следования текстов (вопросов/ответов друг за другом) и матрицы расстояний между текстами.

На четвертом уровне система должна иметь не только тексты, на базе которых строится ответ, но и информацию о конкретном субъекте, являющемся источником вопросов-сообщений, о цели и правилах общения. Четвертый уровень предполагает возможность интимного общения, опирающегося на знания о собеседнике. Четвертый уровень хотя бы без частичного знания системы предпочтений собеседника невозможен. Знания о собеседнике могут быть собраны информационной системой (виртуальным специалистом) в процессе регулярных бесед с собеседником. Эти знания представляются в виде соответствующей модели, которая позволяет рассчитывать такие характеристики, как:

— отношение собеседника к данному виртуальному специалисту. Отношение можно попытаться оценить через время беседы, через число положительных оценок, выставленных собеседником виртуальному специалисту за беседу, через число непосредственных обращений;

— интересы собеседника. Интересы формируются на базе частотного словаря употребления ключевых слов — это и есть интересуемые проблемы;

— отношение к интересующим проблемам. Это отношение формируется путем сбора данных об эмоциональной окраске речи собеседника применительно к интересующим проблемам;

— адекватность собеседника, в том числе истинность или ложность его текстов. Подобное возможно, если собирать оценки других посетителей на высказывания виртуального специалиста, которым его научил конкретный собеседник.

На пятом уровне система должна уметь оценивать истинность или ложность того или иного сообщения, в том числе с учетом того, кто автор этого сообщения. Умение оценивать истинность или ложность предполагает наличие памяти о происходящем, о том, чем закончилось то или иное высказывание.

На шестом уровне система должна уметь самостоятельно достигать целей, ради которых она существует. Изначально цели должны быть сформулированы создателем конкретного виртуального специалиста.

Цели могут быть самыми разными: от максимально возможного продления времени существования себя в беседе до получения конкретного результата от собеседника. Выдача и получение соответствующих текстов становятся возможными только тогда, когда данные тексты есть у виртуального специалиста, и для него возможен сценарий беседы, приводящий к требуемому результату.

В общем виде достижение целей предполагается путем модификации правил, в соответствии с которыми осуществляется изменение статуса отдельных текстов. При этом процессы, направленные на достижение целей, должны протекать не только во время беседы, но и в «спящем» режиме. Суть этих процессов заключается, во-первых, в установлении связей между имеющимися текстами на предмет достижения поставленных целей, а во-вторых, в повышении структурированности текстов за счет внесения в текст гиперссылок, раскрывающих смыслы как отдельных слов, так и предложений.

Для седьмого уровня одного текста на естественном языке недостаточно. Здесь речь уже идет о распознавании изображений, голосов и т. п.

Уровни познания расположены в порядке расширения возможностей познания. С одной стороны, они следуют друг из друга, позволяя последовательно возводить здания искусственной жизни, получая на каждом этапе определенный практический результат. С другой стороны, многие задачи (логический вывод, построение трехмерных образов, синтаксический анализ, теория перевода, механизмы самообучения и т. п.) в рамках названных уровней познания уже решены до вполне приемлемых результатов.

Исследуя уровни познания, мы показали одно из направлений совершенствования виртуальных специалистов. Второе не менее важное направление — это повышение привлекательности виртуального специалиста. Это важнейшее направление, так как привлекательность напрямую связана с верой в передаваемое информационное сообщение.

Введем функцию определения мощности множества — ?. Обозначим через ?(Tj) мощность множества Тj. Через tn — множество истин, ставших известными субъекту i в ходе беседы с некоторым не представившимся субъектом j, которого надо узнать в ходе беседы. Тогда для субъекта i вероятность, что он беседует именно с субъектом j, могла бы быть оценена по формуле:

P = ?(t?)/ ?(Tj).

Но реально субъект i не всегда может знать все множество истин Tj. Это множество истин (в случае человека) может быть вообще не перечислимым, т. е. не всегда возможно даже посчитать мощность множества Tj, а значит, наверняка узнать собеседника. Так, предлагаемая формула верна только для случая, когда речь идет об узнавании такого виртуального специалиста, все тексты которого известны субъекту i.

Любой субъект может реализовывать операцию узнавания только на базе тех данных, что у него есть. Пусть субъект i ранее в ходе бесед с субъектом j накопил определенные знания о субъекте j в виде множества истин t3. Тогда вероятность, что в данный момент он беседует с j, можно оценить так:

P = ?(t? ? t3)/ ?(t3).

Признаем, что узнавание собеседника (робота или человека) идет не по глубине мысли, а по набору присущих субъекту любимых слов и словосочетаний. Причем таких слов и словосочетаний, именно любимых, не так уж и много. Поэтому можно усилить последнюю формулу, заменив в ней tз на t3`, где t3` — множество любимых слов и словосочетаний.

Привлекательность для виртуального собеседника — это умение притягивать к себе посетителей. Повышать привлекательность — значит повышать умение привлекать к себе внимание. Виртуальный специалист делает это целенаправленно и алгоритмически обоснованно. И он обязан это делать регулярно, чтобы оставаться востребованным.

Если измерять качество общения строго формально, то на первый план выходит именно оригинальность и новизна сказанного и желание человека слушать данного конкретного виртуального специалиста. Как только собеседники «перелили» друг другу свое содержание (доступное для понимания друг другом) и вышли на соответствующий баланс, как в их отношения вкладывается однообразие, которое затем приводит к раздражению, и на этом взаимодействие заканчивается. Психологи подобное состояние называют информационной опустошенностью.

На основании изложенного выдвинем следующие требования к оценке привлекательности:

1. Привлекательность тем выше, чем меньше пустых диалоговых квантов в каждый фиксированный временной интервал общения.

2. Привлекательность тем ниже, чем меньше пересечение диалоговых квантов каждого фиксированного временного интервала общения с базой знаний посетителя.

С одной стороны, виртуальному специалисту надо что-то говорить, а с другой — нельзя говорить то, что неинтересно посетителю. Важно правильно найти точку равновесия. Кроме того, для виртуального специалиста непростой задачей является понимание того, в чем заключаются интересы посетителя, о чем целесообразно с ним разговаривать?

Перейдем к формальной постановке задачи.

Обозначим через Ki(t) — множество диалоговых квантов, в которых виртуальный специалист а принимал участие вместе с i-м посетителем до момента времени t;

Ki(t) — множество диалоговых квантов, в которых принимал участие i-й посетитель (эти кванты могут быть из бесед данного посетителя с любыми другими посетителями, в том числе другими виртуальными специалистами-роботами) до момента времени t;

?t — фиксированный временной интервал. Предлагается считать, что вся беседа состоит из последовательности таких интервалов {?tj}.

Тогда, оценку привлекательности попробуем собрать из вероятности, что виртуальный специалист попадет в тему посетителя, и вероятности, что очередной фиксированный временной интервал беседы не будет пуст.


 — оценка вероятности попадания в тему посетителя;


 — оценка вероятности, что новая последовательность квантов будет «лучше» предыдущей.

Итого:

Рприв = Р1 · P2.


Данная формула очень важна для функционирования виртуального специалиста, она указывает цель в его самообучении, тем самым делая его существование целесообразным, а его самого — привлекательным для посетителей интернет-ресурсов.

В ходе любой беседы, используя эту формулу, виртуальный специалист первоначально подготовит несколько реплик, но прежде чем сказать, просчитает все подготовленные реплики на предмет собственной привлекательности, выберет лучшую и только потом выдаст ответ.

Обосновав основные направления самообучения, которые на уровне моделей должны быть встроены в процессы, ответственные за обучение и переобучение, перейдем к основным компонентам данной подсистемы.

Данная подсистема должна включать в себя следующие блоки (рис. 3.1.3.1):

• обучение диалогу в виде множества взаимозависимых реплик, которые позволяют настроиться собеседникам друг на друга;

• обучение историям[33], которые может рассказать виртуальный специалист о себе или о других (например, собственная биография, истории из жизни);

• обучение «любимым» фразам и индивидуальной манере подачи материала. Под любимыми фразами в данном случае понимаются выражения (диалоговые реплики, отдельные фразы, слова и словосочетания, придающие индивидуальность — по этим фразам конкретный виртуальный специалист всегда может быть идентифицирован);

• обучение заданиям. Под заданиями понимаются действия виртуального специалиста в виде размещения соответствующего материала в заданной форме на указанных интернет-ресурсах;

• хранение всех реплик диалогового взаимодействия;

• корректировка диалоговых форм и реплик с целью исправления ошибок, допущенных виртуальным специалистом в ходе информационного взаимодействия с посетителями сайтов и процесса обучения.

В ходе информационного взаимодействия виртуальный специалист может использовать все перечисленные блоки, т. е. любую входную реплику любого посетителя он должен проанализировать и активизировать соответствующие блоки. При активизации возможны ошибки следующего характера:

• активизирован не тот блок, который является более правильным в качестве выходного ответа;

• блок выбран правильно, но внутри выбранного блока выбор ответа оказался неверным.


РИСУНОК 3.1.3.1, Общая функционально-структурная схема подсистемы обучения и переобучения

База данных словарей и заданий виртуального специалиста должна состоять из взаимоувязанных таблиц, содержащих словарь виртуального специалиста, словарь синонимов, множество взаимоувязанных реплик по типу вопрос/ответ, множество взаимоувязанных историй, множество характерных фраз, определяющих индивидуальную манеру поведения виртуального специалиста, множество выданных ему заданий.

Оглавление книги


Генерация: 1.201. Запросов К БД/Cache: 3 / 1
поделиться
Вверх Вниз