Um pequeno passo na área de visão computacional

janeiro 09, 2024

Estive em uma reunião com meu professor de laboratório de programação e outros três colegas. Discutimos um pouco sobre carreira, mercado de trabalho e faculdade. Isso foi extremamente necessário, pois tirou algumas dúvidas a respeito de vários temas como TCC, pesquisa e mestrado. Ao convidar o professor por email, deixei claro que gostaria de iniciar meus estudos em visão computacional para seguir na carreira de robótica colaborativa. Essa decisão vem de muito tempo atrás onde só conseguia descrever a minha área de interesse, ou seja, eu só sabia que queria algo relacionado com programação e robótica. Pesquisando um pouco na internet eu me deparei com o nome em si "robótica colaborativa". Recorri a quem poderia me dar mais informações sobre isso e como iniciar os estudos, o chatgpt. Descobri alguns outros nomes bem interessantes como ROS (Robot Operating System) que se trata de ferramentas e bibliotecas que auxiliam na construção de robôs. Descobri tambem que para ter sucesso em robotica, teria de aprender sobre visão computacional. Procurando mais um pouco na internet fiquei impressionado com o universo de possibilidades nessa área. Bons exemplos na aplicação precisa de visão computacional, estão os carros autonômos, os robôs da Boston Dynamics e o recente robô optimus da tesla. A visão computacional de maneira bem simples se trata de técnicas que façam os robôs perceberem o mundo como os humanos. Por exemplo, temos a capacidade de reconhecer objetos através da nossa visão. Nessa área, existem meios que habilitem os robôs para isso. Justamente essa parte de perceber o mundo através de imagem foi a que mais me interessou e coincidentemente o professor explicava na disciplina o conteúdo de processamento de imagens (e até passou um trabalho sobre filtros) e ali foi meu primeiro contato com o gigantesco iceberg. Essa introdução justifica as minhas pesquisas de hoje que foram a respeito de visão computacional que é sem dúvidas uma parte importante para a área de robótica avançada. Hoje comecei pesquisar sobre uma biblioteca chamada OpenCV, responsável por carregar nas costas esse universo de visão computacional.

Instalação de python

Nas diversas pesquisas que fiz sobre a área, o python foi bem citado então resolvi instalar no meu notebook para poder iniciar os projetos. Descobri que em várias distribuições linux essa linguagem é pré instalada, então não precisei me preocupar. Para verificar se está instalado na sua máquina, basta rodar o comando "python --version". Caso não apareça a versão, então não está instalada.

Criação de um ambiente virtual

Me deparei com esse nome hoje, quando fui aprender instalar a biblioteca no computador. O chatgpt recomendava que eu criasse um "ambiente virtual" antes de instalar a biblioteca. Algumas pesquisas depois entendi a importancia disso. Então coloquei a mão na massa: instalei o pip (outra coisa que eu não conhecia) que se trata de um gerenciador de pacotes para python. Com esse gerenciador, instalei uma ferramenta chamada "virtualenv" responsável por criar o ambiente virtual. Como sou bem esquecido e os conhecimentos estão frescos na minha mente, vou descrever um pouco sobre o processo.

Para criação do ambiente virtual precisamos navegar em um diretório que será o local do nosso ambiente e digitar o comando "virtualenv nome_pasta". Após isso precisamos apenas ativá-lo. Para isso basta rodar o comando "source /caminho_da_pasta/bin/activate". Se tudo estiver corrido bem, então o nome do seu ambiente estará entre parenteses no terminal. Para desativar, basta rodar o comando "deactivate" em qualquer direório no terminal.

Instalação da biblioteca OpenCV

Após criar o ambiente virtual no meu notebook e ativá-lo, parti para instalação da biblioteca. É bem simples, basta rodar o comando "pip install opencv-python" e a versão mais recente será baixada. Para confirmar a instalação, pode usar o interpretador do python e rodar duas linhas de código. Tambem foi uma coisa nova descobrir isso. Basta rodar o comando "python3" e o interpretador será iniciado. Rode o código:

>>>import cv2

>>>print(cv2.__version__)

E veja se a versão da bibliotca aparece na tela.

Eu tive muitas dúvidas durante os procedimentos e apenas perguntava ao chatgpt, então fica dica.

No final das contas, tenho o projeto de visão computacional em um ambiente mais reservado da máquina. Os próximos passos, envolvem estudar a documentação da biblioteca na internet e iniciar projetos meramente simbólicos. Vale destacar que mesmo isso sendo algo grande, ainda se trate de apenas uma parte da robótica avançada, então o que não pode faltar é inspiração e entusiasmo para prosseguir. Não conheço ninguem dessa área em específico, então (temporareamente) sigo sozinho estudando.

Raylan Bruno