top of page
  • Foto do escritormirella melo

Câmera Estéreo: triangulação

Atualizado: 8 de jun. de 2022

Câmera estéreo é nada mais que um arranjo composto por dois ou mais sensores de imagem com posicionamentos fixos entre si. O sistema mais popular é, sem dúvidas, o composto por duas câmeras. Sua configuração tenta imitar o par de olho biológico com o principal intuito de recuperar o dado de profundidade.


O sucesso da estimativa da profundidade a partir da técnica de triangulação depende de dois fatores:

  • a definição dos parâmetros do sistema e do modelo das câmeras

  • a correta associação de pontos correspondentes nas duas imagens

A definição dos parâmetro do sistemas podem ser calculados a partir da calibração, onde o processo mais bem adotado é feito a partir da captura de várias imagens de um tabuleiro de xadrez. Para o processo de triangulação, são necessários os parâmetros: comprimento focal 𝑓 das câmeras, e a distância (baseline) 𝑏 entre os centro de projeções 𝐶 das câmeras. Já quanto à associação dos pontos, existem diversas técnicas propostas, porém ainda é um problema amplamente estudado.


O intuito dessa postagem é demonstrar o método de triangulação, e para isso, vamos visualizar esse processo a partir de um sistema estereoscópico de duas câmeras. A figura 1, em conjunto com as equações 1.1 à 1.6, ilustram uma das formas de interpretação do processo de triangulação por meio de duas imagens obtidas de diferentes pontos de vista.

Figura 1: diferentes pontos de vista de 𝑃 no espaço projetado nos planos de imagem. Fonte: autora [1].


Sobre a figura, 𝐶𝐿 e 𝐶𝑅 indicam o centro do sistema de coordenadas das câmeras em questão. O ponto 𝑃(𝑋, 𝑍) está representado em função do sistema de coordenadas da câmera esquerda 𝐶𝐿; 𝑏 representa a distância entre o sistema de coordenadas da câmera esquerda e direita; 𝑢𝐿 e 𝑢𝑅 são pontos de projeção do ponto 𝑃 no plano da imagem esquerda e direita, respectivamente; 𝑓 é a distância de 𝐶𝐿 (ou 𝐶𝑅) até sua projeção ortogonal no plano de imagem respectivo.


Dado os elementos destacados e os triângulos tracejados em verde e azul na figura 1, é possível concluir as equações 1.1 e 1.2 a partir das relações trigonométricas no triângulo retângulo.

Isolando 𝑋 em ambas as equações 1.1 e 1.2, e igualando esta variável, chega-se na equação 1.3.

Sabe-se que 𝑡𝑎𝑛(𝜃) e 𝑡𝑎𝑛(𝛼) também podem ser representados em função da interseção do ponto 𝑃 no plano da imagem (triângulos destacados em rosa claro na figura 1), como mostrado nas Equações 1.4 e 1.5. Por conveniência, vamos adotar a origem do sistema de coordenadas do plano da imagem localizada na projeção perpendicular de 𝐶𝐿 (ou 𝐶𝑅) no plano (ilustrado tridimensionalmente na imagem ao lado). No entanto, sua origem é comumente empregada no canto superior esquerdo.

Finalmente, substituindo na equação 1.3 os respectivos valores de 𝑡𝑎𝑛(𝜃) e 𝑡𝑎𝑛(𝛼) das equações 1.4 e 1.5, chega-se na equação 1.6.



Vale ressaltar que a diferença 𝑢𝐿 - 𝑢𝑅 é chamada de disparidade. Você pode conferir melhor esse conceito e outros em Câmera Estéreo: recuperando a profundidade da cena e dar continuidade nesse desafio da visão computacional! Até a próxima. :)


[1] MELO, Mirella Santos Pessoa de. Mapeamento de região navegável a partir de um sistema SLAM e segmentação de imagem. 2021. Dissertação de Mestrado. Universidade Federal de Pernambuco.


25 visualizações0 comentário

Posts recentes

Ver tudo
bottom of page