Хэш-адресация с рехэшированием / Системное программное обеспечение. Лабораторный практикум / Библиотека (книги, учебники и журналы) / В помощь Веб-Мастеру

Обложка
Аннотация

Алексей Молчанов i

Книги автора: Системное программное обеспечение. Лабораторный практикум

/ Издательство «Питер»i

Книги автора: Системное программное обеспечение. Лабораторный практикум Мерчандайзинг. Курс управления ассортиментом в рознице Категорийный менеджмент. Курс управления ассортиментом в рознице Дефрагментация мозга. Софтостроение изнутри Искусство управления IT-проектами Гибкое управление проектами и продуктами Лидогенерация: клиентов много не бывает Идеальный программист. Как стать профессионалом разработки ПО Реклама. Принципы и практика Интернет-маркетинг 3.0. Нет русской рулетке! Информационный удар. Как сделать, чтобы в шумном медиамире услышали именно тебя Перехват клиента. Борьба за продажи в условиях жесткой конкуренции Маркетинг для государственных и общественных организаций Запуск! Быстрый старт для вашего бизнеса Большая книга директора магазина 2.0. Новые технологии Успешная короткая презентация Цифровая фотография. Трюки и эффекты Новое оружие маркетинговых войн Продвижение порталов и интернет-магазинов Разумный маркетинг. Как продавать больше при меньших затратах Установка, настройка и восстановление Windows 7 на 100% Графология XXI века HTML, XHTML и CSS на 100% Копирайтинг: как не съесть собаку. Создаем тексты, которые продают 99 инструментов продаж. Эффективные методы получения прибыли Выжми из бизнеса всё! 200 способов повысить продажи и прибыль Генератор новых клиентов. 99 способов массового привлечения покупателей Если покупатель говорит «нет». Работа с возражениями Копирайтинг: секреты составления рекламных и PR-текстов Продвижение бизнеса в ВКонтакте. Быстро и с минимальными затратами Профессиональный поиск в Интернете Восстановление данных на 100% Инфобизнес на полную мощность. Удвоение продаж Инфобизнес за один день Как сделать свой сайт и заработать на нем. Практическое пособие для начинающих по заработку в Интернете Монетизация сайта. Секреты больших денег в Интернете Удвоение продаж в интернет-магазине Деловая e-mail переписка. Пять правил успеха Социальные сети. Источники новых клиентов для бизнеса Быстрые деньги в Интернете. 50 способов заработать, сидя дома у компьютера Интернет-маркетинг на 100% Как спроектировать современный сайт

Книга: Системное программное обеспечение. Лабораторный практикум

Хэш-адресация с рехэшированием

Для решения проблемы коллизии можно использовать много способов. Одним из них является метод рехэширования (или расстановки). Согласно этому методу, если для элемента А адрес n₀ = h(A), вычисленный с помощью хэш-функции h, указывает на уже занятую ячейку, то необходимо вычислить значение функции n₁ = h₁(A) и проверить занятость ячейки по адресу п₁. Если и она занята, то вычисляется значение h₂(A), и так до тех пор, пока либо не будет найдена свободная ячейка, либо очередное значение h_i(А) не совпадет с h(A). В последнем случае считается, что таблица идентификаторов заполнена и места в ней больше нет – выдается информация об ошибке размещения идентификатора в таблице.

Тогда поиск элемента А в таблице идентификаторов, организованной таким образом, будет выполняться по следующему алгоритму:

1. Вычислить значение хэш-функции n = h(A) для искомого элемента А.

2. Если ячейка по адресу п пустая, то элемент не найден, алгоритм завершен, иначе необходимо сравнить имя элемента в ячейке n с именем искомого элемента A. Если они совпадают, то элемент найден и алгоритм завершен, иначе i:= 1 и перейти к шагу 3.

3. Вычислить n_i = h_i(A). Если ячейка по адресу n_i пустая или n = n_i, то элемент не найден и алгоритм завершен, иначе – сравнить имя элемента в ячейке n_i с именем искомого элемента A. Если они совпадают, то элемент найден и алгоритм завершен, иначе i:= i + 1 и повторить шаг 3.

Алгоритмы размещения и поиска элемента схожи по выполняемым операциям. Поэтому они будут иметь одинаковые оценки времени, необходимого для их выполнения.

При такой организации таблиц идентификаторов в случае возникновения коллизии алгоритм помещает элементы в пустые ячейки таблицы, выбирая их определенным образом. При этом элементы могут попадать в ячейки с адресами, которые потом будут совпадать со значениями хэш-функции, что приведет к возникновению новых, дополнительных коллизий. Таким образом, количество операций, необходимых для поиска или размещения в таблице элемента, зависит от заполненности таблицы.

Для организации таблицы идентификаторов по методу рехэширования необходимо определить все хэш-функции h_i для всех i. Чаще всего функции h_i определяют как некоторые модификации хэш-функции h. Например, самым простым методом вычисления функции h_i(A) является ее организация в виде h_i(A) = (h(A) + p_i) mod N_m, где p_i – некоторое вычисляемое целое число, а N_m – максимальное значение из области значений хэш-функции h. В свою очередь, самым простым подходом здесь будет положить p_i = i. Тогда получаем формулу h_i(A) = (h(A) + i) mod N_m. В этом случае при совпадении значений хэш-функции для каких-либо элементов поиск свободной ячейки в таблице начинается последовательно от текущей позиции, заданной хэш-функцией h(A).

Этот способ нельзя признать особенно удачным: при совпадении хэш-адресов элементы в таблице начинают группироваться вокруг них, что увеличивает число необходимых сравнений при поиске и размещении. Но даже такой примитивный метод рехэширования является достаточно эффективным средством организации таблиц идентификаторов при неполном заполнении таблицы.

Среднее время на помещение одного элемента в таблицу и на поиск элемента в таблице можно снизить, если применить более совершенный метод рехэширования. Одним из таких методов является использование в качестве p_i для функции h_i(A) = (h(A) + p_i) mod N_m последовательности псевдослучайных целых чисел p₁, p₂, …, p_k. При хорошем выборе генератора псевдослучайных чисел длина последовательности k = N_m.

Существуют и другие методы организации функций рехэширования h_i(A), основанные на квадратичных вычислениях или, например, на вычислении произведения по формуле: h_i(A) = (h(A)N?i) mod N'_m, где N'_m – ближайшее простое число, меньшее N_m. В целом рехэширование позволяет добиться неплохих результатов для эффективного поиска элемента в таблице (лучших, чем бинарный поиск и бинарное дерево), но эффективность метода сильно зависит от заполненности таблицы идентификаторов и качества используемой хэш-функции – чем реже возникают коллизии, тем выше эффективность метода. Требование неполного заполнения таблицы ведет к неэффективному использованию объема доступной памяти.

Оценки времени размещения и поиска элемента в таблицах идентификаторов при использовании различных методов рехэширования можно найти в [1, 3, 7].

Оглавление книги

Оглавление статьи/книги

Похожие страницы