Transformação linear direta

algoritmo que calcula um conjunto de variáveis a partir de um conjunto de relações de semelhança

Transformação linear direta (DLT) é um algoritmo que calcula um conjunto de variáveis a partir de um conjunto de relações de semelhança:

em que e são vetores conhecidos, denota igualdade a menos de uma multiplicação por um escalar desconhecido, e é uma matriz (ou transformação linear) que contém as incógnitas a serem calculadas.

Este tipo de relação aparece frequentemente em geometria projetiva. Exemplos práticos incluem a relação entre pontos 3D em uma cena e a sua projeção sobre o plano da imagem de uma câmera pinhole, e homografias.

Introdução

editar

Uma equação linear ordinária

 
pode ser resolvida, por exemplo, reescrevendo-a como uma equação matricial   na qual as matrizes   e   contêm os vetores   e   em suas respectivas colunas. Dado que existe uma única solução, ela é dada por

 

As soluções também podem ser descritas nos casos em que as equações são sobredeterminadas ou subdeterminadas.

O que torna o problema da transformação linear direta diferente do caso padrão acima é o fato de que os lados esquerdo e direito das equações que o definem podem diferir por um fator multiplicativo desconhecido que é dependente de k. Como consequência,   não pode ser calculada como no caso padrão. Em vez disso, as relações de semelhança são reescritas como equações lineares homogêneas apropriadas que podem então ser resolvidas por um método padrão. A combinação da reescrita das equações de semelhança como equações lineares homogêneas com a sua resolução por métodos padrão é conhecida como algoritmo de transformação linear direta ou algoritmo DLT. A sigla DLT é atribuída a Ivan Sutherland. [1]

Exemplo

editar

Sejam   e   dois conjuntos de vetores conhecidos e o problema é encontrar uma matriz   de ordem   tal que que

 
onde   é o fator escalar desconhecido relacionado à equação k.

Para se livrar dos escalares desconhecidos e obter equações homogêneas, defina a matriz antissimétrica

 
e multiplique ambos os lados da equação pela esquerda por  
 
Como   tem-se as seguintes equações homogêneas, que já não contêm os escalares desconhecidos:
 
A fim de obter   a partir deste conjunto de equações, considere os elementos dos vetores   e   e a matriz  
 
e a equação homogênea acima torna-se
 
Isso também pode ser escrito como
 
em que tanto   quanto   são vetores de 6 dimensões definidos como
 
  e    

Este conjunto de equações homogêneas também pode ser escrito em forma matricial como

 

onde   é uma matriz   que contém os vetores   em suas linhas. Isto significa que   pertence ao espaço nulo de   e pode ser determinado, por exemplo, por meio de uma decomposição em valores singulares de     é um vetor singular à direita de   correspondente a um valor singular nulo. Uma vez que   foi determinado, os elementos de   podem ser encontrados por uma simples reorganização do vetor de 6 dimensões na forma de uma matriz   Note que o fator escalar de   ou   não é importante (exceto por ter que ser diferente de zero) uma vez que as equações que as definem já levam em conta o escalar desconhecido.

Na prática, os vetores   e   pode conter ruído, o que significa que as equações de semelhança são apenas aproximadamente válidas. Como consequência, pode não existir um vetor   que seja uma solução exata da equação homogênea   Nestes casos, uma solução de mínimos quadrados totais pode ser utilizada escolhendo   como um vetor singular à direita correspondente ao menor valor singular de  

Casos mais gerais

editar

O exemplo acima tem   e   mas a estratégia geral para reescrever as relações de semelhança como equações lineares homogêneas pode ser generalizada para casos em que tanto   quanto   têm dimensões arbitrárias.

Se   e   as expressões anteriores ainda podem levar a uma equação

 

onde   agora é   Cada k fornece uma equação nos   elementos desconhecidos de   e juntas, essas equações podem ser escritas na forma   com a matriz B de ordem N x 2q que é conhecida e o vetor de incógnitas   de dimensão 2q. Este vetor pode ser encontrado de forma similar à que foi feita anteriormente.

No caso mais geral,   e   A principal diferença em relação ao caso anterior é que a matriz   agora é   e antissimétrica. Quando   o espaço de tais matrizes não é mais unidimensional, mas sim de dimensão

 

Isso significa que cada valor de k fornece M equações homogêneas do tipo

 
onde   é uma base de dimensão M do espaço de matrizes   antissimétricas.

Exemplo p = 3

editar

No caso em que p = 3, podem ser escolhidas as três matrizes   a seguir

 
Neste caso particular, as equações lineares homogêneas podem ser escritas como
 
onde   é a representação matricial do produto vetorial. Observe que esta última equação é em valores vetoriais; o lado esquerdo é o elemento zero em  

Cada valor de k fornece três equações homogêneas nos elementos desconhecidos de   No entanto, como   tem posto 2, no máximo duas equações são linearmente independentes. Na prática, portanto, é comum usar apenas duas das três matrizes,   por exemplo, para m=1, 2. No entanto, a dependência linear entre as equações é dependente de   o que significa que em certos casos seria melhor escolher, por exemplo, m=2,3. Assim, se o número de equações não é uma preocupação, pode ser melhor usar as três equações ao construir a matriz  

A dependência linear entre as equações lineares homogêneas é uma preocupação geral para o caso p > 2 e tem de ser tratada reduzindo o conjunto de matrizes antissimétricas   ou então permitindo que   se torne maior do que o necessário para determinar  

Referências

  1. Sutherland, Ivan E. (abril de 1974), «Three-dimensional data input by tablet», Proceedings of the IEEE, 62 (4): 453–461, doi:10.1109/PROC.1974.9449 
  • Richard Hartley and Andrew Zisserman (2003). Multiple View Geometry in computer vision. [S.l.]: Cambridge University Press. ISBN 978-0-521-54051-3 

Ligações externas

editar