Tire suas dúvidas com a Coordenação: Whatsapp Business (21) 3527-2460 / 1634 ou pelo email visaocomputacional@ica.ele.puc-rio.br. Conheça o PROGRAMA do curso.
Visão Computacional: Interpretando o Mundo através de Imagens é um curso de pós- graduação lato sensu, destinado a profissionais que desejam conhecer e compreender novas tecnologias de visão computacional e inteligência artificial, e de como estas tecnologias podem ser aproveitadas para melhorar processos nas suas empresas. O programa mais abrangente e completo, ao longo de 18 meses, com aulas e oficinas ao vivo, focado na aplicação de ferramentas modernas na solução de problemas de visão computacional do mundo real. Reconhecido por seu experiente corpo docente, o VC MASTER se destaca como a pós- graduação pioneira na América Latina. Saiba porquê.
- AULAS ONLINE E OFICINAS PRÁTICAS AO VIVO (NÃO GRAVADAS)
- CURSO ATUALIZADO E APERFEIÇOADO A CADA TURMA
- TRÊS TURMAS AO ANO PARA VOCÊ ESCOLHER!
- ACESSO DIRETO AOS PROFESSORES PARA TIRAR DÚVIDAS: TEM ALGUMA DÚVIDA?
SOLICITE AULA PARTICULAR POR VÍDEO-CONFERÊNCIA COM PROFESSORES
- APRENDA COM QUEM FAZ ! PROFESSORES SÃO EXPERIENTES DESENVOLVEDORES DE APLICAÇÕES PARA EMPRESAS
- NETWORKING COM ESPECIALISTAS DO MERCADO: PROFESSORES COM TÍTULO DE DOUTOR E NVIDIA E INTEL AMBASSADORS
- GITHUB SHOWCASE: VITRINE DE CÓDIGOS DESENVOLVIDOS POR VOCÊ DURANTE O CURSO, UM CURRÍCULO COM SUA EXPERIÊNCIA EM CIÊNCIA DE DADOS
- SOFTWARE DEPLOYMENT EXPERIENCE: VIVÊNCIA PRÁTICA DESDE A INOVAÇÃO À PRODUÇÃO
- A PRIMEIRA PÓS-GRADUAÇÃO EM VISÃO COMPUTACIONAL DA AMÉRICA LATINA EM 2021
- TURMAS DE NO MÁXIMO DE 40 ALUNOS
A Visão Computacional (VC) é um campo científico interdisciplinar que trata de “como os computadores podem obter um entendimento de alto nível de imagens ou vídeos digitais”. Do ponto de vista da engenharia, a VC busca entender e automatizar tarefas que o sistema visual humano pode realizar. A VC envolve a teoria, design e implementação de algoritmos que podem processar dados visuais automaticamente para reconhecer objetos, rastrear e recuperar sua forma e layout espacial e até mesmo criar imagens e vídeos a partir de uma descrição textual.
As tarefas de visão computacional incluem métodos para aquisição, processamento, análise e compreensão de imagens digitais e extração de dados de alta dimensão do mundo real, a fim de produzir informações numéricas ou simbólicas para, por exemplo, tomar decisões.
As novas ferramentas e frameworks de visão computacional e machine learning tornam mais acessível a extração de conhecimento a partir de imagens para profissionais não técnicos, permitindo o desenvolvimento, em curto período de tempo, de sistemas robustos para otimizar processos e/ou apresentar soluções de acordo com as necessidades do mercado.
Profissionais capazes de analisar imagens estão no foco dos setores público e privado, em especial nas áreas de segurança, meio ambiente e indústria 4.0. O programa deste curso enfatiza a Visão Computacional, combinando de maneira equilibrada, processamento digital de imagens, estatística, aprendizado de máquina e aprendizado profundo. O curso visa dotar os profissionais de habilidades para estruturar projetos no campo da análise e reconhecimento de imagens, desde o estágio de planejamento até a comunicação de resultados estratégicos para as organizações nas mais diversas áreas.
O programa da pós VC está em contínua evolução e já inclui novos temas como, Vision Transformers, Processamento de Linguagem Natural (NLP), Large Language Models (LLM), Modelos Pré-Treinados, Modelos Multimodais (reconhecimento combinando texto e imagem), Video Language Models (VLM), a ferramenta de IA do OpenAI (Sora) que transforma texto em vídeo, Pseudo Labeling e Noisy Labels, Aprendizados auto supervisionado, Aprendizado semi supervisionado, etc.
Na pós VC, os alunos terão a oportunidade de conhecer inúmeras aplicações em áreas como a de meio ambiente: detecção de eventos no leito submarino, detecção de ferrugem em equipamentos, presença de corais, detecção de derramamento de óleo no mar por sinais de satélite SAR, cálculo de biomassa em florestas, e muito mais.
A visão computacional pode nos ajudar a chegar mais perto do sonho de um futuro verdadeiramente sem papel e sem dinheiro físico, onde todas as transações são feitas digitalmente em um dispositivo inteligente. Dispositivos como telefones celulares e smartwatches podem ser usados para realizar a transação. Melhorias adicionais nesta tecnologia podem levar a um cenário em que as transações podem ser concluídas mesmo sem códigos digitais.
Os dados biométricos, como uma varredura da íris do cliente, podem ser usados para verificar o cliente e autorizar transações. Isso pode melhorar a segurança e abordar questões de privacidade, pois as varreduras da íris são difíceis de replicar. As ocorrências de fraudes bancárias podem ser reduzidas significativamente, proporcionando um ambiente mais seguro e protegido para o usuário.
A Visão Computacional tem ampla e decisiva aplicação na área de sensoriamento remoto terrestre, aéreo e por satélite da vegetação com foco especial em características estruturais e fotossintéticas das plantas, superfície da terra e fenologia de absorção de carbono, produtividade primária e verdor do ecossistema terrestre, impacto da mudança global na produtividade do ecossistema terrestre e modelagem do ciclo do carbono terrestre.
As principais ferramentas de social listening, como Crimson Hexagon, BrandWatch e Talkwalker, estão usando a visão computacional para análise de imagens nas redes sociais. Com mais de 3 bilhões de imagens compartilhadas todos os dias nas mídias sociais, a tecnologia da visão computacional ajuda a identificar menções às marcas, influenciadores visuais, problemas de produto e até mesmo rastrear o ROI (Return On Investment) de patrocínio.
Outras aplicações da visão computacional incluem realidade aumentada, merchandising online mais inteligente, descoberta de produto e conteúdo do mundo real e muito mais.
No sector do petróleo e do gás os sistemas de visão agora podem discernir questões tradicionalmente avaliadas por humanos, incluindo questões de segurança como o monitoramento de flares (equipamento de segurança da plataforma, usado para queimar o gás não utilizado) e processos para detectar condições perigosas, como vazamentos ou alterações na composição química do flare, por meio de análise de temperatura e cor.
Os sistemas de visão também podem beneficiar o setor de petróleo e gás, melhorando as métricas operacionais e de confiabilidade através de sistemas de visão para observar as condições de operação, identificando eventos importantes que afetam os equipamentos, o fluxo de tráfego, quando comparadas com a operação normal de uma unidade.
Há ainda inúmeras as aplicações nas áreas de Geociências. Por exemplo, a segmentação semântica de imagens consiste na tarefa de atribuir uma classe com significado semântico a cada pixel da imagem. Isto permite extrair informação valiosa sobre seu conteúdo (o que está presente nela e em qual magnitude). Uma das áreas de aplicação é na indústria do petróleo, através de técnicas de Deep Learning que, de acordo com o contexto geológico, permite segmentar semanticamente e consequentemente analisar imagens típicas de processos de análise exploratória ou caracterização de reservatórios, tais como imagens sedimentológicas (lâminas petrográficas e imagens de MEV), feições em perfis elétricos, feições sísmicas (falhas, mounds em carbonatos e outras), perfis de imagem, havendo aplicações que excedem o campo das geociências, tais como detectar danos em dutos, realização do monitoramento de feições na superfície do mar, identificar corais, etc.
Técnicas de aprendizado de máquina e visão computacional estão sendo aplicadas na área de Saúde e Medicina para a detecção de câncer de mama e pele permitindo que os cientistas identifiquem pequenas diferenças entre imagens cancerosas e não cancerosas e auxiliem no diagnóstico a partir de dados de exames de imagem por ressonância magnética e fotos como malignas ou benignas.
Doenças neurológicas e musculoesqueléticas, como acidentes vasculares cerebrais, equilíbrio e problemas de marcha podem ser detectados usando modelos de aprendizagem profunda e visão computacional, mesmo sem a análise do médico. Os aplicativos de visão computacional que analisam o movimento do paciente ajudam os médicos a diagnosticar um paciente com facilidade e maior precisão.
A visão computacional pode ajudar no gerenciamento da cadeia de suprimentos, gerenciamento automático de inventário, melhorar a eficiência com base nos dados do produto, etc.
O setor de varejo pode localizar seu público-alvo com base em técnicas de análise de sentimentos mediante a avaliação de expressões faciais, contagem e rastreamento de pessoas, e estimação de tempo de permanência do cliente.
As técnicas de visão computacional e inteligência artificial têm sido amplamente utilizadas para solucionar os problemas principais no domínio do transporte rodoviário: segurança, eficiência e aplicação da lei. Neste sentido, são mais comuns sistemas de videovigilância que monitoram as ruas, identificando infratores da lei e controle inteligente de semáforos.
Além disso, a indústria automotiva vem incorporando constantemente novas tecnologias que vão desde assistir à condução de veículos para reduzir acidentes até a condução autônoma dos veículos.