Ataque de Aniversário - cab4

O ataque do aniversário é um tipo de ataque criptográfico que explora a matemática por trás do paradoxo do aniversário na teoria da probabilidade. Este ataque pode ser usado para abusar de comunicação entre duas ou mais partes. O ataque depende da maior probabilidade de colisões encontrado entre as tentativas de ataque aleatório e um grau fixo de permutações (pigeonholes).

Entendendo o problema editar

Como um exemplo, considere o cenário no qual um professor com uma classe de 30 estudantes pergunta pelo aniversário de todo mundo., para determinar se quaisquer dois estudantes tem o mesmo dia de aniversário (correspondendo a uma hash collision como descrito mais adiante [por simplicidade, ignore 29 de fevereiro]). Intuitivamente, essa chance pode parecer pequena. Se o professor escolheu um dia específico (digamos 16 de Setembro), então a chance de pelo menos um aluno ter nascido naquele dia especifico é $1-(364/365)^{30}$ , cerca de 7.9%. No entanto, a probabilidade de pelo menos um estudante ter a mesma data de aniversário de qualquer outro estudante é por volta de 70% para n = 30, a partir da fórmula $1-365!/((365-n)!\cdot 365^{n})$ .^[1]

Matemáticas editar

Dada uma função $f$ , o objetivo do ataque é encontrar duas diferentes entradas, $x_{1}$ e $x_{2}$ tais que $f(x_{1})=f(x_{2})$ . Tal par $x_{1},x_{2}$ é chamado colisão. O método usado para encontrar uma colisão é simplesmente calcular a função $f$ para diferentes valores de entrada que podem ser escolhidos aleatoriamente ou pseudo-aleatoriamente até que o mesmo resultado seja encontrado mais de uma vez. Devido ao problema do aniversário, esse método pode ser bastante eficiente. Especificamente, se uma função $f(x)$ fornece qualquer dos $H$ diferentes saídas com igual probabilidade e $H$ é suficientemente grande, então esperamos obter um par de diferentes argumentos $x_{1}$ e $x_{2}$ com $f(x_{1})=f(x_{2})$ após calcular a função para cerca de $1.25{\sqrt {H}}$ argumentos diferentes em média.

Consideremos o seguinte experimento. A a partir de um conjunto de H valores escolhemos n valores uniformemente aleatórios permitindo, assim, repetições. Seja p(n; H) a probabilidade que durante esse experimento, pelo menos um valor seja escolhido mais de uma vez. Essa probabilidade pode ser escolhida como

p(n;H)\approx 1-e^{-n(n-1)/(2H)}\approx 1-e^{-n^{2}/(2H)},\,

Seja n(p; H) o menor número de valores que temos para escolher, tal que a probabilidade de encontrar uma colisão seja, pelo menos, p. Pela inversão desta expressão acima, encontramos a seguinte aproximação

n(p;H)\approx {\sqrt {2H\ln {\frac {1}{1-p}}}},

e atribuindo uma probabilidade de colisão 0.5, chegamos em

n(0.5;H)\approx 1.1774{\sqrt {H}}.\,

Seja Q(H) o número esperado de valores que temos para escolher antes de encontrar a primeira colisão. Esse número pode ser aproximado por

Q(H)\approx {\sqrt {{\frac {\pi }{2}}H}}.

Como um exemplo, se um hash de 64-bit é usado, então há aproximadamente 1.8 × 10¹⁹ diferentes saídas. Se todos estes são igualmente prováveis (o melhor caso), deveria-se considerar 'apenas' 5 bilhões de tentativas (5.1 × 10⁹) para gerar uma colisão usando força bruta. Esse valor é chamado limite do aniversário^[2] e para códigos de n bits poderia ser computados como 2^n/2.^[3] Outros exemplos são os seguintes:

Bits	Possíveis saídas (2 s.f.) (H)	Probabilidade desejada de colisão aleatória (2 s.f.) (p)
Bits	Possíveis saídas (2 s.f.) (H)	10⁻¹⁸	10⁻¹⁵	10⁻¹²	10⁻⁹	10⁻⁶	0.1%	1%	25%	50%	75%
16	65,536	<2	<2	<2	<2	<2	11	36	190	300	430
32	4.3 × 10⁹	<2	<2	<2	3	93	2900	9300	50,000	77,000	110,000
64	1.8 × 10¹⁹	6	190	6100	190,000	6,100,000	1.9 × 10⁸	6.1 × 10⁸	3.3 × 10⁹	5.1 × 10⁹	7.2 × 10⁹
128	3.4 × 10³⁸	2.6 × 10¹⁰	8.2 × 10¹¹	2.6 × 10¹³	8.2 × 10¹⁴	2.6 × 10¹⁶	8.3 × 10¹⁷	2.6 × 10¹⁸	1.4 × 10¹⁹	2.2 × 10¹⁹	3.1 × 10¹⁹
256	1.2 × 10⁷⁷	4.8 × 10²⁹	1.5 × 10³¹	4.8 × 10³²	1.5 × 10³⁴	4.8 × 10³⁵	1.5 × 10³⁷	4.8 × 10³⁷	2.6 × 10³⁸	4.0 × 10³⁸	5.7 × 10³⁸
384	3.9 × 10¹¹⁵	8.9 × 10⁴⁸	2.8 × 10⁵⁰	8.9 × 10⁵¹	2.8 × 10⁵³	8.9 × 10⁵⁴	2.8 × 10⁵⁶	8.9 × 10⁵⁶	4.8 × 10⁵⁷	7.4 × 10⁵⁷	1.0 × 10⁵⁸
512	1.3 × 10¹⁵⁴	1.6 × 10⁶⁸	5.2 × 10⁶⁹	1.6 × 10⁷¹	5.2 × 10⁷²	1.6 × 10⁷⁴	5.2 × 10⁷⁵	1.6 × 10⁷⁶	8.8 × 10⁷⁶	1.4 × 10⁷⁷	1.9 × 10⁷⁷

A tabela mostra o número de hashes n(p) necessário para alcançar necessário para alcançar a probabilidade de sucesso dada. Para comparação, de 10⁻¹⁸ a 10⁻¹⁵ representa a taxa de erro de bits incorrigíveis de um típico disco rígido . Na teoria, hashes MD5 ou UUIDs, sendo 128 bits, deveria ficar dentro deste intervalo até cerca de 820 bilhões de documentos, mesmo se suas possíveis saídas são muitos mais que isso.

É fácil ver que se as saídas da função são distribuídas desigualmente, então a colisão poderia ser encontrado ainda mais rápido. A noção de 'equilíbrio' de uma função de hash quantifica a resistência de uma função para o ataque de aniversário (explorando chave de distribuição desigual) e permite a vulnerabilidade dos hashes populares tais como MD e SHA para ser estimado (Bellare and Kohno, 2004).

A subexpressão $\ln {\frac {1}{1-p}}$ na equação para $n(p;H)$ não é precisamente computada para $p$ pequeno quando diretamente traduzido para linguagens de programação comuns como log(1/(1-p)) devido a perda de significância. Quando log1p é disponível (como é em C99) por exemplo, a expressão equivalente -log1p(-p) deveria então ser usada.^[4] Se isso não for feito, a primeira coluna da tabela acima é computada como zero, e vários itens na segunda coluna não tem dígito significativo correto.

Exemplo de código fonte editar

Há uma função em Python que pode precisamente gerar a tabela acima:

def birthday(probability_exponent, bits):
    from math import log1p, sqrt
    probability = 10. ** probability_exponent
    outputs     =  2. ** bits
    return sqrt(2. * outputs * -log1p(-probability))

Se o código é salvo em um arquivo chamado birthday.py, ele pode ser rodado ele pode ser executado de forma interactiva como no exemplo a seguir:

$ python -i birthday.py
>>> birthday(-15, 128)
824963474247.1193
>>> birthday(-6, 32)
92.68192319417072

Aproximação simples editar

Uma boa regra de ouro que pode ser usada para cálculo mental é a relação

p(n)\approx {n^{2} \over 2m}

que também pode ser escrita como

n\approx {\sqrt {2m\times p(n)}}

.

Isso funciona bem para probabilidades menores ou iguais a 0.5.

Esse esquema de aproximação é especialmente fácil para usar quando trabalhar com expoentes. Por exemplo, suponha que você esteja construindo hashes de ( $m=2^{32}$ ) e quer a chance de uma colisão de ser, no máximo, uma em um milhão ( $p\approx 2^{-20}$ ), quantos documentos poderíamos ter no máximo?

n\approx {\sqrt {2\times 2^{32}\times 2^{-20}}}={\sqrt {2^{1+32-20}}}={\sqrt {2^{13}}}=2^{6.5}\approx 90.5

que é próximo da resposta correta, que é 93.

Susceptibilidade da assinatura digital editar

Assinaturas digitais podem ser susceptíveis a um ataque de aniversário. Uma mensagem $m$ é tipicamente assinada computando, primeiro, $f(m)$ , onde $f$ é uma função de hash criptográfica, e em seguida usando alguma chave secreta para assinar $f(m)$ . Suponha que Mallory quer enganar Bob assinando um contrato fraudulento. Mallory prepara um contrato honesto $m$ e um fraudulento $m'$ . Ela então encontra um número de posições onde $m$ pode ser modificado sem alterar o significado, de modo que inserindo vírgulas, linhas vazias, um versus dois espaços após uma sentença, substituindo sinônimos, etc. Pela combinação dessas mudanças, ela pode criar um número enorme de variações sobre $m$ que são todos os contratos justos.

De um modo semelhante, Mallory também cria um enorme número de variações sobre o contrato fraudulento $m'$ . Ela, então, aplica a função de hash para todas essas variações até que ela encontra uma versão do contrato justo e uma versão do contrato fraudulento que têm o mesmo valor de hash, $f(m)=f(m')$ .Ela apresenta a versão hones a Bob para assinar. Depois de Bob assinou, Mallory leva a assinatura e a anexa ao contrato fraudulento. Essa assinatura 'comprova' então que Bob assinou o contrato fraudulento.

As probabilidades diferem ligeiramente do problema aniversário original, embora Mallory nada ganhe por encontrar dois contratos honestos ou dois contratos fraudulentos com o mesmo hash. A estratégia da Mallory é gerar pares de contratos, sendo um justo e um fraudulento. As equações do problema do aniversário se aplicam onde $n$ é o número de pares. O número de hashes que Mallory realmente gera é $2n$ .

Para evitar este ataque, o comprimento da função de hash utilizado para um esquema de assinatura de saída pode ser escolhido suficientemente grande de modo que o ataque de aniversário se torna computacionalmente inviável,ou seja, cerca de duas vezes quantos bits são necessários para evitar um ataque de ataque de força bruta comum.

O algoritmo rho de P para logaritmos é um exemplo para um algoritmo usando um ataque de aniversário para o cálculo de logaritmos discretos.

Ver também editar

Ataque de colisão (do inglês, collision attack)
Ataque do homem no meio (do inglês, meet-in-the-middle attack)
Ataque da preimagem

Notas editar

Referências

↑ «Math Forum: Ask Dr. Math FAQ: The Birthday Problem»
↑ See upper and lower bounds.
↑ Jacques Patarin, Audrey Montreuil (2005). «Benes and Butterfly schemes revisited» (PostScript, PDF). Université de Versailles. Consultado em 15 de março de 2007
↑ «Compute log(1+x) accurately for small values of x»

Ligações externas editar

"What is a digital signature and what is authentication?" from RSA Security's crypto FAQ.
"Birthday Attack" X5 Networks Crypto FAQs

[1] «Math Forum: Ask Dr. Math FAQ: The Birthday Problem»

[2] See upper and lower bounds.

[3] Jacques Patarin, Audrey Montreuil (2005). «Benes and Butterfly schemes revisited» (PostScript, PDF). Université de Versailles. Consultado em 15 de março de 2007

[4] «Compute log(1+x) accurately for small values of x»

[1]

[2]

[3]

[4]