HAIFA

HAIFA (Шаблон:Lang-en) — итеративный метод построения криптографичеких хеш-функций, являющийся усовершенствованием классической структуры Меркла — Дамгора.

Был предложен в 2007 году в целях повышения устойчивости ко многим атакам и поддержки возможности получать хеш-суммы различных длин. На основе алгоритма были разработаны такие хеш-функции, как BLAKE^[1] и SHAvite-3^[2].

История

Создателями алгоритма являются Эли Бихам и Ор Дункельман — израильские криптографы из Хайфского университета. Бихам — ученик Ади Шамира, разработавшего большое количество новых криптографических алгоритмов, в том числе взлома существующих; Дункельман — коллега Шамира по одному из проектов, а в дальнейшем продолжил свои исследования самостоятельно^[3].

Структура Меркла — Дамгора долгое время считалась устойчивой к атаке на нахождение второго прообраза, пока в 1999 году профессор Принстонского университета Ричард Дин не доказал, что это предположение неверно для длинных сообщений, если при данной функции сжатия возможно легко находить фиксированные точки последовательности. Также на структуру Меркла — Дамгора могла быть успешно произведена атака множественный коллизий и хэрдинг-атака (атака по известному префиксу)^[4]^[5].

Алгоритм

Структура Меркла — Дамгора представляет собой следующий алгоритм:

Есть сообщение $M$ , разбитое на несколько частей: $M_{1}, M_{2} . . . M_{k}$ . Есть некоторое начальное значение — $I V$ и некоторая функция $C$ , которая подсчитывает промежуточное представление хеш-функции $H$ определённым образом^[5]:

h_{0} = I V

Далее итеративно:

h_{i} = C (h_{i - 1}, M_{i})

H (M) = h_{k}

В основу нового алгоритма HAIFA легло добавление количества захешированных бит и некоторого случайного значения. Вместо обычной функции сжатия, которую теперь можно обозначить следующим образом^[4]:

{0, 1}^{m_{c}} \times {0, 1}^{n} \to {0, 1}^{m_{c}}

, где

m_{c}

— размер

h

,

n

— размер блока,

m = m_{c}

(чаще всего выходной размер совпадает с размером h)

используется:

{0, 1}^{m_{c}} \times {0, 1}^{n} \times {0, 1}^{b} \times {0, 1}^{s} \to {0, 1}^{m_{c}}

, где

b, s

— длины количества бит и соли,

внутреннее же представление подсчитывается (в соответствии с введенными выше обозначениями):

h_{i} = C (h_{i - 1}, M_{i}, b i t s, s a l t)

, где

b i t s

— количество бит, захешированных к этому времени.

Чтобы захешировать сообщение, нужно выполнить следующие шаги:

Дополнить сообщение $M$ в соответствии с нижеописанной схемой.
Подсчитать начальное значение $I V_{m}$ для внутренней ячейки размера m в соответствии с алгоритмом, описанным ниже.
Пройти по всем блокам дополненного сообщения, вычисляя на каждом шаге значение функции сжатия $h_{i}$ от текущего блока $M_{i}$ , $h_{i - 1}$ и теперь уже добавляя соль и $b i t s$ в качестве аргументов. Если к сообщению добавляется дополнительный блок (в самый конец), то для этого блока выставляем значение $b i t s$ равное нулю.
Обрезать последнее, выходное, значение функции, если необходимо^[4].

Дополнение сообщения

В HAIFA сообщение $M$ дополняется единицей, необходимым количеством нулей, длиной сообщения в битах и размером выходного блока $h$ . Т.е добавляем последовательность (количество нулей в данном случае должно быть таким, чтобы $N_{1} + N_{0} \equiv N - (M_{l e n g t h} + H_{s i z e}) m o d N$ ^[4] , где $N_{1}$ , $N_{0}$ — количество единиц и нулей, $N$ — размер блока:

$1 + 0 . . 0 + b i t s + m_{c}$

Хеширование сообщения, дополненного размером выходного блока, избавляет от проблемы нахождения коллизий, так как если два сообщения $M_{1}$ и $M_{2}$ хешируются с размерами блока $l_{1}$ и $l_{2}$ , то от коллизий спасает именно последний блок. В свою очередь, добавлением $b i t s$ = 0 в самом последнем блоке, создаётся сигнал для обозначения последнего и дополняющего блока^[4].

Возможность дополнения исходного сообщения в данном алгоритме позволяет обрезать захешированное, тем самым изменяя размер конечного хеша^[4].

Длина хеша

Часто на практике требуются различные длины итогового хеша (как, например, сделано для SHA-256, у которого существуют две урезанные версии), поэтому в данной структуре также была реализована возможность варьировать его длину с помощью специального алгоритма (чтобы сохранить стойкость к атаке на второй прообраз, нельзя использовать очевидное решение взятия $m$ бит из итогового хеша).

$I V$ — начальное значение
$m$ — желательная длина выхода
Считаем преобразованное начальное значение : $I V_{m} = C (I V, m, 0, 0)$
Таким образом получаем $m$ «зашитое» в первые $r$ бит, за которыми следуют 1 и нули.
После того, как посчитался последний блок, итоговым значением являются $m$ бит последнего значения функции сжатия цепочки^[4].

Стойкость алгоритма

Доказательство того, что HAIFA устойчив к коллизиям, если функция сжатия устойчива к коллизиям, проводится аналогично доказательству для Меркла — Дамгора^[4].

Количество захешированных бит значительно затрудняет поиск и использование фиксированных точек. Даже найдя такие $h_{i}$ и $M_{i}$ , для которых выполняется $h_{i} = C (h_{i}, M_{i}, b i t s, s a l t)$ , нельзя бесконечно размножать эти значения в данном алгоритме, потому что количество битов будет все время меняться^[4].

Соль ( $s a l t$ ), как и $b i t s$ , тоже вносит свой вклад в стойкость алгоритма^[4]:

Дает возможность устанавливать безопасность хеш-функций в теоретической модели.
Заставляет атаки, базирующиеся на предварительных расчетах, переносить все свои вычисления в онлайн-режим, так как значение соли неизвестно заранее.
Повышает безопасность электронных подписей (так как каждый раз приходится учитывать то, что есть некоторое случайное значение).

Ниже приведены оценки стойкости HAIFA к различным типам атак.

Атаки, основанные на фиксированных точках

Шаблон:Mainref В атаке на второй прообраз ищется такое значение $M^{'}$ , для которого $H (M^{'}) = h_{i} = H (M_{i})$ , то есть хеш от $M^{'}$ равен какому-либо промежуточному значению в итерациях, и далее соединить часть оставшегося сообщения $M$ (находящуюся справа от $M_{i}$ ) с нашим угаданным $M^{'}$ . Однако алгоритм был признан устойчивым к этой атаке, так как в усовершенствованном варианте в конец сообщения дописывался его размер. Ричард Дин же в своей работе указал совершенно новый способ атаки, основанный на предположении о том, что для данной функции $C$ легко найти фиксированные точки (по определению фиксированная точка — та, для которой выполняется соотношение $h = C (h, M_{i})$ ). В его алгоритме недостающая длина сообщения восполнялась добавлением множества фиксированных точек, то есть мы могли достаточным количеством повторений значения $h$ дополнить нашу длину до нужной.

В данном случае HAIFA защищает от атаки, основанной на фиксированных точках, так как наличие соли и поля, содержащего количество захешированных бит сводит к минимуму вероятность появления повторения значений сжимающей функции^[4].

Атака множественных коллизий

Шаблон:Mainref Для множественных коллизий французский криптограф Шаблон:Iw описал возможность нахождения $2^{t}$ сообщений, имеющих один и тот же хеш. Его работа базируется на факте, что возможно найти $t$ таких одноблочных коллизий, в которых $C (h_{i - 1}, M_{i}) = C (h_{i - 1}, M_{i}^{*})$ , и далее конструировать различные сообщения, всего $2^{t}$ вариантов, выбирая на каждом из $t$ шагов либо сообщение $M_{i}$ , либо $M_{i}^{*}$ .

HAIFA, несмотря на сложную структуру, не гарантирует нулевой вероятности удачного прохождения атаки на множественные коллизии. После вышеописанных модификаций, сделанных над алгоритмом Меркла — Дамгора, сложность нахождения коллизий для каждого блока не изменилась, но так как появилось случайное подмешанное значение, атакующий не может заранее перебирать варианты этих коллизий, не зная случайного значения. Расчеты переходят в онлайн-режим^[4].

Хэрдинг-атака

Шаблон:Mainref Хэрдинг-атака основана на том, что атакующий пытается найти такой суффикс по заданному префиксу, который будет давать нужное значение хеша.

Изначально строится дерево из различных $2^{t}$ внутренних значений, ищутся сообщения Mj, которые приводят к коллизиям среди этих состояний. То есть в узлах дерева находятся различные значения $h$ , на ребрах — значения $M_{j}$ .
Строим коллизии по вновь полученным значениям $h$ (с предыдущего уровня дерева) до тех пор, пока не дойдем до конечного значения $H$ .
Затем атакующий получает информацию о префиксе.
Получив эту информацию, он пытается подобрать связующее сообщение между эти префиксом и желаемым суффиксом. Связующее сообщение должно удовлетворять условию, что значение сжимающей функции от него равен одному из внутренних значений $h$ на первом уровне дерева. Далее суффикс строится обычным проходом по дереву (так как на его ребрах уже находятся сообщения, которые приведут к необходимому результату). Ключевым моментом является возможность производить предварительные вычисления, в онлайн-режиме останется подобрать только нужное промежуточное значение $h$ и $M$ .

Доказано, что на HAIFA невозможно провести первую фазу хэрдинг-атаки (построение дерева решений), пока неизвестно значение соли. То есть тот brute-force, который излагался выше, уже провести нельзя. Условие успешного отражения атаки — длина подмешиваемого сообщения, если желаемая сложность атаки ставится на уровне $O (2^{m})$ , должна быть не менее $\frac{m_{c}}{2}$ символов. Если этого правила не придерживаться, то возможны некоторые предварительные расчеты, приводящие к взлому алгоритма. Если значение соли все же было найдено, то потребуется некоторое время для поиска нужного места в сообщении в силу наличия поля $b i t s$ ^[4].

Сложность атак на алгоритмы Меркла — Дамгора и HAIFA

Шаблон:Mainref

Тип атаки	Идеальная хеш-функция	MD	HAIFA (фиксированное значение соли)	HAIFA (с различными значениями соли)
Шаблон:Iw ( $k^{'} < 2^{s}$ целей)	$2^{m_{c}}$	$2^{m_{c}}$	$2^{m_{c}}$	$2^{m_{c}}$
Атака на один из первых прообразов	$2^{m_{c}} / k^{'}$	$2^{m_{c}} / k^{'}$	$2^{m_{c}} / k^{'}$	$2^{m_{c}}$
Атака на второй прообраз ( $k$ блоков)^[6]^[7]	$2^{m_{c}}$	$2^{m_{c}} / k$	$2^{m_{c}}$	$2^{m_{c}}$
Атака на один из вторых прообразов ( $k$ блоков, $k^{'} < 2^{s}$ сообщений)	$2^{m_{c}} / k^{'}$	$2^{m_{c}} / k$	$2^{m_{c}} / k^{'}$	$2^{m_{c}}$
Коллизии	$2^{m_{c} / 2}$	$2^{m_{c} / 2}$	$2^{m_{c} / 2}$	$2^{m_{c} / 2}$
Множественные коллизии ( $k$ — количество коллизий)^[6]	$2^{m_{c} (k - 1) / k}$	$⌈ l o g_{2} k ⌉ 2^{m_{c} / 2}$	$⌈ l o g_{2} k ⌉ 2^{m_{c} / 2}$	$⌈ l o g_{2} k ⌉ 2^{m_{c} / 2}$
Herding^[8]^[9]	-	Offline: $2^{m_{c} / 2 + t / 2}$ Online: $2^{m_{c} - t}$	Offline: $2^{m_{c} / 2 + t / 2}$ Online: $2^{m_{c} - t}$	Offline: $2^{m_{c} / 2 + t / 2 + s}$ Online: $2^{m_{c} - t}$

Приложения

HAIFA, по мнению разработчиков, может являться основой для множества криптографических алгоритмов, так как представляет cобой новую усовершенствованную базовую конструкцию. Доказано, что с её использованием могут быть разработаны функции рандомизированного хеширования^[10], обёрнутая функция Меркла — Дамгора (Шаблон:Lang-en, RMC^[11]^[12], ширококонвейрного хеша^[13].

Ширококонвейерный хеш

Получить конструкцию ширококонвейерного (Шаблон:Lang-en) хеша с помощью HAIFA достаточно легко; в самом алгоритме для повышения сложности длина внутренних блоков была сделана в два раза больше, чем длина конечного блока (поэтому есть две функции сжатия $C^{'}$ и $C^{'^{'}}$ ). Можно непосредственно вывести формулу для широконвейерного хеша, с учётом того, что находить в HAIFA последний блок тривиально, так как $b i t s$ там выставлены ноль^[4].

Формула для перевода из HAIFA в ширококонвейрный хеш:

$C_{H A I F A} (h_{i - 1}, M_{i}, b i t s, s) = {\begin{matrix} C^{″} (C^{'} (I V_{2}, h_{i - 1} | | f i x p a d (M_{i}))), & if last block \\ C^{'} (h_{i - 1}, M_{i}), & otherwise \end{matrix}$

где $C^{'} : {0, 1}^{m_{c}} \times {0, 1}^{n} \to {0, 1}^{m_{c}}$

$C^{″} : {0, 1}^{m_{c}} \to {0, 1}^{m}$

$I V_{2}$ — второй вектор инициализации^[13].

Прикладное значение

Способ, предложенный учёными в HAIFA, имеет важное прикладное значение для реализации алгоритмов электронной подписи: с введением количества бит и соли стало сложнее добавлять префиксы и суффиксы к сообщению (herd attack), а следовательно подменять сообщения для подписи^[14].

Примечания

Шаблон:Примечания

Литература

Ссылки

Шаблон:Добротная статья

↑ Шаблон:Статья
↑ Шаблон:Статья
↑ Шаблон:Cite web
↑ ^4,00 ^4,01 ^4,02 ^4,03 ^4,04 ^4,05 ^4,06 ^4,07 ^4,08 ^4,09 ^4,10 ^4,11 ^4,12 ^4,13 Шаблон:Статья
↑ ^5,0 ^5,1 Шаблон:Статья
↑ ^6,0 ^6,1 Шаблон:Source
↑ Шаблон:Статья
↑ Шаблон:Статья
↑ Шаблон:Статья
↑ Шаблон:Source
↑ Шаблон:Статья
↑ Шаблон:Статья
↑ ^13,0 ^13,1 Шаблон:Статья
↑ Ошибка цитирования Неверный тег <ref>; для сносок :0 не указан текст

[1] Шаблон:Статья

[2] Шаблон:Статья

[3] Шаблон:Cite web

[:2-4] 4,00 ^4,01 ^4,02 ^4,03 ^4,04 ^4,05 ^4,06 ^4,07 ^4,08 ^4,09 ^4,10 ^4,11 ^4,12 ^4,13 Шаблон:Статья

[:3-5] 5,0 ^5,1 Шаблон:Статья

[:4-6] 6,0 ^6,1 Шаблон:Source

[7] Шаблон:Статья

[8] Шаблон:Статья

[9] Шаблон:Статья

[10] Шаблон:Source

[11] Шаблон:Статья

[12] Шаблон:Статья

[:1-13] 13,0 ^13,1 Шаблон:Статья

[:0-14] Ошибка цитирования Неверный тег <ref>; для сносок :0 не указан текст

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

HAIFA

Содержание

История

Алгоритм

Дополнение сообщения

Длина хеша

Стойкость алгоритма

Атаки, основанные на фиксированных точках

Атака множественных коллизий

Хэрдинг-атака

Сложность атак на алгоритмы Меркла — Дамгора и HAIFA

Приложения

Ширококонвейерный хеш

Прикладное значение

Примечания

Литература

Ссылки

Навигация

HAIFA

История

Алгоритм

Дополнение сообщения

Длина хеша

Стойкость алгоритма

Атаки, основанные на фиксированных точках

Атака множественных коллизий

Хэрдинг-атака

Сложность атак на алгоритмы Меркла — Дамгора и HAIFA

Приложения

Ширококонвейерный хеш

Прикладное значение

Примечания

Литература

Ссылки

Навигация

Поиск