Visão do Robô: Uma Análise Abrangente de Princípios, Componentes e Aplicações
Na era atual de rápido desenvolvimento tecnológico, a tecnologia de visão robótica está gradualmente se tornando uma das principais tecnologias no campo da automação. Segundo os dados, o tamanho do mercado global de visão mecânica atingiu US$ 11,4 bilhões em 2021 e, até 2022, esse número deverá crescer para US$ 12 bilhões, indicando uma tendência contínua de aumento. Isto indica que a tecnologia de visão robótica está recebendo cada vez mais atenção e aplicação em todo o mundo.
1, Projeto visual
Funções básicas
Reconhecimento: A função de reconhecimento envolve principalmente a identificação das características do objeto alvo, como sua aparência. Entre eles, a precisão e a velocidade do reconhecimento do código de barras são indicadores importantes para medir a capacidade de reconhecimento.
Medição: A função de medição pode obter a unidade de tamanho da imagem e calcular com precisão as dimensões geométricas do objeto alvo na imagem. Alta precisão e medição de formas complexas são as vantagens da visão mecânica nesta função.
Localização: a localização é atualmente um campo amplamente utilizado que pode obter informações de posição bidimensionais e tridimensionais-de alvos, sendo a precisão e a velocidade os principais indicadores de medição.
Detecção: o campo de detecção é responsável por 50% das funções de visão de máquina, e a implementação de cálculos é um desafio, principalmente envolvendo detecção de aparência pós{1}}montagem e detecção de defeitos de arranhões na aparência.
Cenários de aplicação
A visão mecânica combinada com robôs industriais é usada principalmente para guiar o movimento do robô. Os cenários específicos podem ser divididos em captura, detecção e processamento, etc. A categoria de captura pode ser subdividida em aplicações como carga e descarga, paletização, classificação, etc. A categoria de processo inclui principalmente cenários de aplicação como colagem, polimento, soldagem, etc., e é focada principalmente na captura.
2, Composição e princípios do sistema visual
um. Composição do Sistema
Câmera visual: Sua principal função é capturar imagens e coletar informações da imagem.
Fonte de luz: Fornece uma cena de fonte de luz estável para o sistema visual, para que o robô possa obter imagens mais nítidas.
Hardware de computador: incluindo CPU, memória, disco rígido, etc., principal responsável pelo processamento de imagens, cálculos de algoritmos e armazenamento.
Robôs: recebem dados visuais, obtêm coordenadas físicas e executam tarefas de produção automatizadas com base em instruções visuais.
Dispositivo mecânico: incluindo luminárias, correias transportadoras, assentos elevatórios e outros periféricos, a principal função é auxiliar o robô na realização de operações físicas.
b. Classificação do sistema
Visão monocular: este é um sistema visual comumente usado que usa uma única câmera industrial para aquisição de imagens, normalmente capaz apenas de capturar imagens bidimensionais, e é amplamente utilizado no campo de robôs inteligentes. No entanto, devido a problemas com a precisão da imagem e estabilidade dos dados, muitas vezes é necessário trabalhar em conjunto com outros tipos de sensores.
Visão binocular: composta por duas câmeras, utiliza o princípio da triangulação para obter informações de profundidade da cena, podendo reconstruir a forma tri-dimensional e a posição dos objetos ao redor. O princípio é semelhante ao do olho humano e é relativamente simples.
Multi visão: Ao usar múltiplas câmeras, os pontos cegos podem ser reduzidos e a probabilidade de detecção errônea pode ser reduzida. É amplamente utilizado na área de montagem de robôs industriais e pode identificar e localizar com precisão o objeto medido, melhorando a inteligência e a precisão de posicionamento dos robôs de montagem.
c. Princípio de imagem
A imagem visual converte principalmente o objeto detectado em um sinal de imagem baseado em dispositivos de aquisição de imagem (CMOS e CCD) e o transmite para um sistema de processamento de imagem dedicado. Converta as informações de brilho e cor da distribuição de pixels em sinais digitais. O sistema de processamento de imagem extrai características do alvo com base nesses sinais, como área, quantidade, posição, comprimento, etc., e gera resultados de acordo com a tolerância predefinida e outras condições, incluindo tamanho, ângulo, número, qualificado/não qualificado, presença/ausência, etc., a fim de obter a função de reconhecimento automático e, em seguida, controlar a ação do-equipamento no local com base nos resultados de discriminação.
3. A diferença entre CCD e CMOS
As câmeras CCD usam CCD para converter imagens ópticas em sinais digitais para transmissão. Os sensores de processamento de imagem CCD utilizam um ou mais nós de saída para leitura do sinal, com boa consistência de transmissão e capacidade de ler todas as informações da imagem. No entanto, a largura de banda do sinal de saída precisa ser amplificada, resultando em alto consumo de energia.
As câmeras CMOS usam CMOS para converter imagens ópticas em sinais digitais para transmissão, usando um único pixel para transmissão, o que pode alcançar amplificação de sinal de pixel único e taxa de varredura de imagem extremamente alta, mas há defeitos na consistência do sinal.
A aplicação da tecnologia de visão robótica no campo da automação está em constante expansão e aprofundamento. De vários aspectos, como o crescimento do tamanho do mercado, a diversidade de funções, a complexidade da composição do sistema e a natureza científica dos princípios de imagem, esta tecnologia desempenhará, sem dúvida, um papel mais importante em muitos campos, como a produção industrial e os robôs inteligentes, no futuro.

