Tire suas dúvidas com a Coordenação: Whatsapp Business (21) 3527-2460 / 1634 ou pelo email visaocomputacional@ica.ele.puc-rio.br Conheça o PROGRAMA.
Visão Computacional: Interpretando o Mundo através de Imagens (Computer Vision MASTER) é um curso de pós-graduação lato sensu, destinado a profissionais que desejam conhecer e compreender novas tecnologias de visão computacional e inteligência artificial, e de como estas tecnologias podem ser aproveitadas para melhorar processos nas suas empresas.
A Visão Computacional (VC) é um campo científico interdisciplinar que trata de “como os computadores podem obter um entendimento de alto nível de imagens ou vídeos digitais”. Do ponto de vista da engenharia, a VC busca entender e automatizar tarefas que o sistema visual humano pode realizar. A VC envolve a teoria, design e implementação de algoritmos que podem processar dados visuais automaticamente para reconhecer objetos, rastrear e recuperar sua forma e layout espacial e até mesmo criar imagens e vídeos a partir de uma descrição textual.
As tarefas de visão computacional incluem métodos para aquisição, processamento, análise e compreensão de imagens digitais e extração de dados de alta dimensão do mundo real, a fim de produzir informações numéricas ou simbólicas para, por exemplo, tomar decisões.
As novas ferramentas e frameworks de visão computacional e machine learning tornam mais acessível a extração de conhecimento a partir de imagens para profissionais não técnicos, permitindo o desenvolvimento, em curto período de tempo, de sistemas robustos para otimizar processos e/ou apresentar soluções de acordo com as necessidades do mercado.
Profissionais capazes de analisar imagens estão no foco dos setores público e privado, em especial nas áreas de segurança, meio ambiente e indústria 4.0. O programa deste curso enfatiza a Visão Computacional, combinando de maneira equilibrada, processamento digital de imagens, estatística, aprendizado de máquina e aprendizado profundo. O curso visa dotar os profissionais de habilidades para estruturar projetos no campo da análise e reconhecimento de imagens, desde o estágio de planejamento até a comunicação de resultados estratégicos para as organizações nas mais diversas áreas.
O programa da pós VC está em contínua evolução e já inclui novos temas como, Vision Transformers, Processamento de Linguagem Natural (NLP), Large Language Models (LLM), Modelos Pré-Treinados, Modelos Multimodais (reconhecimento combinando texto e imagem), Video Language Models (VLM), a ferramenta de IA do OpenAI (Sora) que transforma texto em vídeo, Pseudo Labeling e Noisy Labels, Aprendizados auto supervisionado, Aprendizado semi supervisionado, etc.
Na pós VC, os alunos terão a oportunidade de conhecer inúmeras aplicações em áreas como a de meio ambiente: detecção de eventos no leito submarino, detecção de ferrugem em equipamentos, presença de corais, detecção de derramamento de óleo no mar por sinais de satélite SAR, cálculo de biomassa em florestas, e muito mais.
Meio Ambiente
A Visão Computacional tem ampla e decisiva aplicação na área de sensoriamento remoto terrestre, aéreo e por satélite da vegetação com foco especial em características estruturais e fotossintéticas das plantas, superfície da terra e fenologia de absorção de carbono, produtividade primária e verdor do ecossistema terrestre, impacto da mudança global na produtividade do ecossistema terrestre e modelagem do ciclo do carbono terrestre.
Biometria
A visão computacional pode nos ajudar a chegar mais perto do sonho de um futuro verdadeiramente sem papel e sem dinheiro físico, onde todas as transações são feitas digitalmente em um dispositivo inteligente. Dispositivos como telefones celulares e smartwatches podem ser usados para realizar a transação. Melhorias adicionais nesta tecnologia podem levar a um cenário em que as transações podem ser concluídas mesmo sem códigos digitais.
Os dados biométricos, como uma varredura da íris do cliente, podem ser usados para verificar o cliente e autorizar transações. Isso pode melhorar a segurança e abordar questões de privacidade, pois as varreduras da íris são difíceis de replicar. As ocorrências de fraudes bancárias podem ser reduzidas significativamente, proporcionando um ambiente mais seguro e protegido para o usuário.
Marketing
As principais ferramentas de social listening, como Crimson Hexagon, BrandWatch e Talkwalker, estão usando a visão computacional para análise de imagens nas redes sociais. Com mais de 3 bilhões de imagens compartilhadas todos os dias nas mídias sociais, a tecnologia da visão computacional ajuda a identificar menções às marcas, influenciadores visuais, problemas de produto e até mesmo rastrear o ROI (Return On Investment) de patrocínio.
Outras aplicações da visão computacional incluem realidade aumentada, merchandising online mais inteligente, descoberta de produto e conteúdo do mundo real e muito mais.
Indústria do Petróleo
No setor do petróleo e do gás os sistemas de visão agora podem discernir questões tradicionalmente avaliadas por humanos, incluindo questões de segurança como o monitoramento de flares (equipamento de segurança da plataforma, usado para queimar o gás não utilizado) e processos para detectar condições perigosas, como vazamentos ou alterações na composição química do flare, por meio de análise de temperatura e cor.
Os sistemas de visão também podem beneficiar o setor de petróleo e gás, melhorando as métricas operacionais e de confiabilidade através de sistemas de visão para observar as condições de operação, identificando eventos importantes que afetam os equipamentos, o fluxo de tráfego, quando comparadas com a operação normal de uma unidade.
Há ainda inúmeras as aplicações nas áreas de Geociências. Por exemplo, a segmentação semântica de imagens consiste na tarefa de atribuir uma classe com significado semântico a cada pixel da imagem. Isto permite extrair informação valiosa sobre seu conteúdo (o que está presente nela e em qual magnitude). Uma das áreas de aplicação é na indústria do petróleo, através de técnicas de Deep Learning que, de acordo com o contexto geológico, permite segmentar semanticamente e consequentemente analisar imagens típicas de processos de análise exploratória ou caracterização de reservatórios, tais como imagens sedimentológicas (lâminas petrográficas e imagens de MEV), feições em perfis elétricos, feições sísmicas (falhas, mounds em carbonatos e outras), perfis de imagem, havendo aplicações que excedem o campo das geociências, tais como detectar danos em dutos, realização do monitoramento de feições na superfície do mar, identificar corais, etc.