Книга: Программирование на языке Ruby
3.14.6. Обнаружение повторяющихся слов в тексте
3.14.6. Обнаружение повторяющихся слов в тексте
В этом разделе мы реализуем детектор повторяющихся слов. Повторение одного и того же слова два раза подряд — типичная опечатка. Следующий код распознает такие ситуации:
double_re = /b(['A-Z]+) +1b/i
str="There's there's the the pattern."
str.scan(double_re) # [["There's"],["the"]]
Обратите внимание на модификатор i
в конце выражения, он позволяет проводить сопоставление без учета регистра. Каждой группе соответствует массив, поэтому в результате получается массив массивов.
Оглавление статьи/книги
- 3.14.1. Сопоставление с IP-адресом
- 3.14.2. Сопоставление с парой «ключ-значение»
- 3.14.3. Сопоставление с числами, записанными римскими цифрами
- 3.14.4 Сопоставление с числовыми константами
- 3.14.5 Сопоставление с датой и временем
- 3.14.6. Обнаружение повторяющихся слов в тексте
- 3.14.7. Поиск слов, целиком набранных прописными буквами
- 3.14.8. Сопоставление с номером версии
- 3.14.9. Еще несколько образцов
Похожие страницы
- 3.14.4 Сопоставление с числовыми константами
- 3.14.7. Поиск слов, целиком набранных прописными буквами
- Когда нужен постскриптум в бизнес-тексте?
- Ключевые слова
- Улучшенная стратегия вычисления предиката IN и условий, объединенных по OR
- 1.2.1. Ключевые слова и идентификаторы
- Новые ключевые слова
- Определение пользовательского формата числовых данных
- Пример 12-8. Частота встречаемости отдельных слов
- Предисловие
- Предисловие Кое-что новенькое – поговорим напрямую
- 11.2. Технология принятия решения в условиях чрезвычайной ситуации