Книга: Анонимность и безопасность в Интернете. От «чайника» к пользователю
11.2. Как не попасть под лингвистический анализ?
11.2. Как не попасть под лингвистический анализ?
С помощью лингвистического анализа можно легко установить, кому принадлежит написанный текст. А посему становится ясно – если вы будете комбинировать анонимные и неанонимные сессии для публикации разного рода контента, вас могут легко вычислить. Представим, что вы – журналист или писатель и публикуетесь в основном не анонимно. Но есть ряд интересующих вас тем, на которые вы бы хотели писать анонимно, поскольку опасаетесь преследований и репрессий в той или иной форме. В этом случае вам нужно изменить свой стиль изложения, иначе эксперты по лингвистическому анализу очень быстро установят, кто есть кто.
Посоветовать изменить стиль, конечно, проще всего. Но не всегда понятно, как это сделать. Чтобы знать, на что обратить внимание, следует ознакомиться с тем, как производится лингвистический анализ, то есть самому превратиться в специалиста по такому анализу.
Вот на что аналитики обращают больше всего внимания:
? средняя длина предложения в знаках;
? средняя длина диалога в знаках;
? соотношение диалогов и предложений в тексте;
? использование уникальных слов (как словарных, так и выдуманных автором);
? частота использования уникальных слов;
? использование одних и тех же уникальных слов в открытых и анонимных публикациях;
? активный словарный запас (количество уникальных словарных слов в тексте);
? активный несловарный запас (количество уникальных выдуманных слов в тексте);
? статистика использования частей речи – процент существительных, глаголов, прилагательных и т. п.;
? биграммы частей речи, то есть частота употребления пар "существительное-глагол", "наречие-прилагательное" и т. п.;
? позиции частей речи в предложении (по всем частям речи);
? биграммы буквенных пар (подсчет по всем алфавитным парам "аа", "аб", "ав" и т. п.).
Для лингвистического анализа текста специалисты используют набор различных методов. С некоторыми из них вы можете познакомиться по адресу: http://filologia.su/metody. В Интернете также можно найти программы для лингвистического анализа текста – например, Лингвистический анализатор 2.0, который можно скачать бесплатно по адресу: http://softok.org/science/naukateh/7776prog.html. Программа не заменит вам опытного аналитика, но все же это лучше, чем ничего.
В общем, информации в Интернете по этой теме – очень много, но наша книга посвящена анонимности в Интернете, а не лингвистике. Главное, чтобы вы знали, что такой способ деанонимизации существует, а предупрежден – значит вооружен.
- InterBase Classic Server под Linux
- Что делать, если при установке принтера появляется сообщение Невозможно завершение операции. Подсистема печати недоступн...
- 1.3. Правила подключения к компьютеру внешних устройств
- 2.5. Разработка технического задания на проведение детального анализа рынка при работе над инновационным проектом. Основ...
- 9.1. Проблема синтаксического анализа
- 6.9. Подготовка данных для расчета прибыльности
- 2.12.2. Анализ усилительных каскадов в области малых времен
- Поддержка SMP
- Установка системы на уже подготовленный жесткий диск
- 4. Подсчет и пересчет
- Глава 5. Разработка и анализ бизнес-планов в системе Project Expert
- 4. Использование подзапросов