Nos últimos anos, a visão computacional mudou a forma como interagimos com o mundo. Suas aplicações estão sendo essenciais em diversos setores e contribuindo significativamente para avanços sociais. A disseminação de suas aplicações reforça a crescente importância de possuir habilidades especializadas nesta área. Este curso de Visão Computacional foi elaborado para atender às necessidades dos profissionais que desejam ter conhecimentos sobre técnicas avançadas de processamento de imagens e vídeos, assim como em computação gráfica. Abordagens modernas de Machine Learning e Deep Learning serão exploradas e aplicadas a problemas atuais de Visão Computacional. Por meio de disciplinas práticas, os participantes são conduzidos a estudar e experimentar os conceitos, vivenciando a aplicação de técnicas e uso das principais ferramentas do mercado para aprimorar habilidades e competências em processamento de imagens e vídeos. Ao final do curso, os egressos terão adquirido habilidades críticas e conhecimentos avançados para liderar e desenvolver soluções inovadoras em Visão Computacional.
COMO FUNCIONA A MODALIDADE
OBJETIVOS
O Curso de Especialização em Visão Computacional visa:
Desenvolver uma compreensão abrangente dos fundamentos teóricos e práticos da visão computacional e suas aplicações em diversas áreas;
Capacitar os alunos a integrar e aplicar habilidades em processamento de imagem, aprendizado de máquina (incluindo redes neurais convolucionais, recorrentes e generativas), e estatística para resolver problemas complexos de visão computacional;
Preparar os alunos para formular, planejar e desenvolver projetos em visão computacional;
Facilitar a capacidade de análise de informações visuais multimodais e de integrar práticas de robótica e automação com visão computacional;
Praticar o uso métodos para avaliar e otimizar modelos de visão computacional, incluindo técnicas de transferência de aprendizado, fine-tuning, data augmentation, e otimização de hiperparâmetros;
Proporcionar conhecimentos especializados em processamento e análise de imagens biomédicas;
Incentivar a criação de uma cultura de DataOps e MLOps.
Competências a serem desenvolvidas
Ao final do curso, o aluno será capaz de:
Entender e aplicar os conceitos, as principais técnicas e modelos de Visão Computacional, compreendendo suas especificidades e diferenças;
Utilizar as principais ferramentas especializadas para o desenvolvimento de aplicações de Visão Computacional;
Analisar e interpretar dados visuais complexos usando técnicas estatísticas e de inteligência artificial.
Projetar, desenvolver e gerenciar projetos que demandam técnicas atuais de Visão Computacional para resolução de problemas;
Integrar conhecimentos de visão computacional com outras áreas como robótica e biomedicina.
Facilitar a experiência prática em projetos reais abordando aplicações atuais de Visão Computacional.
ÁREA DE ATUAÇÃO DO EGRESSO
O especialista em Processamento de Linguagem Natural poderá atuar como Engenheiro de NLP no desenvolvimento de soluções para análise de grandes volumes de dados textuais, desenvolvimento de sistemas inteligentes, chatbots, assistentes virtuais, sistemas de recomendação e plataformas de geração de conteúdo e em diversos papéis como: Engenheiro de Machine Learning, Cientista de Dados, Cientista de Dados, Especialista em NLP, entre outros. Além disso, ele poderá atuar nos mais diversos tipos de projetos inovadores em TI.
PÚBLICO-ALVO
Profissionais com formação superior:
Que atuam em projetos ou atividades relacionados à análise e gestão de dados e que queiram complementar e aperfeiçoar seus conhecimentos com interesses diversos em tecnologia de visão computacional;
Que desejam aprimorar suas habilidades em visão computacional e inteligência artificial e entender como essas tecnologias podem ser aproveitadas para melhorar processos nas empresas;
Que atuam como desenvolvedores de software e precisam estar familiarizados com algoritmos e técnicas de visão computacional;
Que desejam participar dos processos de transformação digital e que exerçam ou pretendam exercer funções técnicas ou gerenciais em setores nos quais a interpretação de imagens e vídeos sejam estratégicas para o negócio.
PROGRAMA DO CURSO
MÓDULO ONLINE (Aulas ao vivo no ambiente digital Canvas/Microsoft Teams, nos dias e horários do curso):
Python para Ciência de Dados
Processamento Digital de Imagem
Machine Learning
Classificação de Imagens com Redes Neurais Convolucionais
Redes Neurais Recorrentes e Transformadores
Redes Neurais Generativas
Detecção e Segmentação de Objetos em Imagem
Processamento e Análise de Imagens Biomédicas
Processamento e Análise de Vídeo
Análise Visual Multimodal
Robótica e Automação com Visão Computacional
Projetos e Aplicações em Visão Computacional
Humanidades
MÓDULO EAD (Aulas gravadas no ambiente digital Canvas. Você assiste aos vídeos a qualquer momento durante o período de vigência da disciplina. As atividades avaliativas entram no ar a cada segunda-feira e precisam ser enviadas até a segunda-feira seguinte (são 4 atividades):
Arquitetura de Soluções em Nuvem
Estatística Geral - Teoria e Aplicações
Cultura e Práticas DataOps e MLOps
DETALHES DO PROGRAMA
Módulo 1: Recursos Técnicos e Análise de Dados
Python para Ciência de Dados
Ao final da disciplina, os alunos deverão ser capazes de:
Programar em Python, utilizando suas estruturas de controle e dados para manipulação e análise eficazes.
Aplicar bibliotecas de Python para manipulação, visualização de dados e vetorização de matrizes.
Desenvolver soluções de análise de dados, aproveitando as funcionalidades avançadas de Python para ciência de dados.
Estatística Geral - Teoria e Aplicações
Ao final da disciplina, os alunos deverão ser capazes de:
Aplicar conceitos de estatística descritiva e inferencial em análises de dados
Interpretar e utilizar distribuições de probabilidade em problemas práticos
Realizar inferências estatísticas e testes de hipóteses utilizando métodos de regressão linear.
Utilizar softwares estatísticos para aplicar análises estatísticas em casos práticos de gestão.
Interpretar resultados estatísticos para tomar decisões informadas.
Arquitetura de Soluções em Nuvem
Ao final da disciplina, os alunos deverão ser capazes de:
Avaliar diferentes provedores de nuvem (IaaS, SaaS, PaaS) para escolher a melhor solução baseada em necessidades específicas de elasticidade e disponibilidade.
Projetar arquiteturas de nuvem seguras e escaláveis que suportem DevOps, proporcionando uma integração contínua e entrega ágil.
Implementar soluções eficientes de multi-cloud e cloud híbrida, assegurando a interoperabilidade entre nuvens públicas e privadas.
Realizar análises de viabilidade técnica e financeira para justificar o uso de certas tecnologias e abordagens de nuvem.
Módulo 2: Processamento de Imagens e Vídeo
Processamento Digital de Imagem
Ao final da disciplina, os alunos deverão ser capazes de:
Compreender os conceitos de visão computacional e implementá-los em algoritmos de processamento de imagem.
Aplicar transformações geométricas e operacionais morfológicas na manipulação de imagens digitais.
Projetar e implementar sistemas de extração de características e descritores de imagens.
Desenhar soluções que processem imagens em 3D e em tempo real para aplicações avançadas.
Processamento e Análise de Vídeo
Ao final da disciplina, os alunos deverão ser capazes de:
Aplicar técnicas avançadas para processamento e estabilização de vídeos, incluindo correção de cor e redução de ruído.
Implementar técnicas de segmentação temporal para análise de eventos em vídeos.
Criar sistemas de rastreamento de múltiplos objetos em sequências de vídeo.
Desenvolver modelos para reconhecimento de ações e atividades em vídeos.
Implementar técnicas de reconstrução 3D a partir de sequências de vídeo.
Detecção e Segmentação de Objetos em Imagem
Ao final da disciplina, os alunos deverão ser capazes de:
Implementar algoritmos state-of-the-art para detecção de objetos (ex: YOLO, SSD, Faster R-CNN).
Desenvolver modelos de segmentação semântica e instância (ex: Mask R-CNN, U-Net).
Criar pipelines de pré-processamento e aumento de dados para treinamento eficiente de modelos.
Implementar técnicas de rastreamento de objetos em vídeos em tempo real.
Otimizar modelos para execução em dispositivos com recursos limitados (edge computing).
Criar APIs que integrem modelos de visão computacional em plataformas de software.
Conduzir projetos práticos que exigem detecção e segmentação precisa de objetos em tempo real.
Módulo 3: Aprendizado de Máquina e Redes Neurais
Machine Learning
Ao final da disciplina, os alunos deverão ser capazes de:
Compreender os diferentes tipos de aprendizado de máquina (supervisionado, não supervisionado).
Selecionar e aplicar algoritmos adequados para problemas específicos de machine learning.
Projetar e implementar modelos de aprendizado supervisionado e não supervisionado.
Realizar engenharia de features eficaz para otimizar a performance dos modelos.
Avaliar a qualidade dos modelos utilizando métricas apropriadas.
Combinar múltiplos modelos para melhorar a generalização das soluções de aprendizado de máquina.
Interpretar os resultados de modelos de aprendizado de máquina.
Classificação de Imagens com Redes Neurais Convolucionais
Ao final da disciplina, os alunos deverão ser capazes de:
Projetar e treinar modelos de Redes Neurais Convolucionais (CNNs) adaptados a diversas tarefas de classificação de imagem.
Aplicar técnicas de data augmentation e fine-tuning para aprimorar a robustez e precisão dos modelos.
Otimizar hiperparâmetros para maximizar o desempenho das CNNs.
Criar projetos que implementem CNNs em cenários reais, desde a coleta de dados até a avaliação do modelo.
Redes Neurais Recorrentes e Transformadores
Ao final da disciplina, os alunos deverão ser capazes de:
Implementar e treinar diferentes arquiteturas de RNNs (LSTM, GRU) para processamento de sequências de imagens ou vídeos.
Compreender e aplicar modelos baseados em transformadores para tarefas de tradução e processamento de linguagem natural.
Desenvolver modelos baseados em transformadores para tarefas de visão computacional, como análise de cenas complexas.
Aplicar mecanismos de atenção em modelos de visão computacional para melhorar a interpretabilidade.
Otimizar o treinamento de RNNs e transformadores para lidar com sequências longas de dados visuais.
Implementar modelos de linguagem visual utilizando arquiteturas como BERT ou GPT para tarefas de descrição de imagens.
Redes Neurais Generativas
Ao final da disciplina, os alunos deverão ser capazes de:
Construir e treinar Redes Neurais Generativas, incluindo GANs e VAEs, para criação de conteúdo.
Avaliar e melhorar a qualidade dos modelos generativos utilizando técnicas de regularização.
Aplicar modelos generativos para síntese de imagens e reconstrução 3D.
Avaliar a qualidade e diversidade das imagens geradas utilizando métricas apropriadas.
Módulo 4: Análise Multimodal e Aplicações
Processamento e Análise de Imagens Biomédicas
Ao final da disciplina, os alunos deverão ser capazes de:
Aplicar técnicas de processamento de imagem para a análise de diversas modalidades biomédicas.
Desenvolver técnicas para segmentação e registro de imagens biomédicas, assegurando precisão nas aplicações médicas.
Implementar algoritmos de segmentação específicos para estruturas anatômicas em imagens médicas.
Integrar e analisar diferentes modalidades de dados através de fusão multimodal e extração de características em imagens biomédicas.
Criar soluções práticas para análise de imagens biomédicas em tempo real, com aplicações em telemedicina e diagnóstico assistido.
Análise Visual Multimodal
Ao final da disciplina, os alunos deverão ser capazes de:
Projetar arquiteturas de redes neurais para fusão de dados visuais e textuais.
Implementar técnicas de alinhamento entre diferentes modalidades de dados (ex: imagem-texto, áudio-vídeo).
Desenvolver modelos de aprendizado multi-tarefa para análise visual multimodal.
Criar sistemas de recuperação de informação cross-modal (ex: busca de imagens baseada em texto).
Aplicar técnicas de transferência de conhecimento entre diferentes modalidades.
Robótica e Automação com Visão Computacional
Ao final da disciplina, os alunos deverão ser capazes de:
Integrar sistemas de visão computacional em arquiteturas robóticas.Projetar sistemas robóticos que incorporem visão computacional para automação eficiente.
Aplicar conceitos de robot learning e deep reinforcement learning para a integração da visão e controle em robôs.
Desenvolver soluções de manipulação robótica que utilizem dados visuais para interação robusta com o ambiente físico.
Implementar projetos que demonstrem o uso de visão computacional em robótica para aplicações industriais e comerciais.
Módulo 5: Integração, Projeto e Ética
Cultura e Práticas DataOps e MLOps
Ao final da disciplina, os alunos deverão ser capazes de:
Implementar estratégias de DataOps para melhorar a eficiência e qualidade dos processos de análise de dados.
Desenhar pipelines de Machine Learning automatizadas usando MLOps, garantindo a gestão dos ciclos de vida dos modelos.
Aplicar Infraestrutura como Código (IaC) para assegurar a consistência e escalabilidade dos ambientes de desenvolvimento.
Gerenciar o ciclo de vida completo de modelos de machine learning.
Monitorar a performance de modelos em produção.
Projetos e Aplicações em Visão Computacional
Ao final da disciplina, os alunos deverão ser capazes de:
Analisar e definir requisitos para projetos complexos de visão computacional.
Desenvolver propostas técnicas detalhadas para soluções de visão computacional.
Preparar dados, selecionar modelos apropriados e realizar implementações técnicas para resolver desafios específicos na área.
Desenvolver protótipos funcionais de sistemas de visão computacional.
Avaliar o desempenho e sustentabilidade das soluções de visão computacional, garantindo práticas de segurança e governança.
Documentar e comunicar os resultados e impacto dos projetos de forma eficaz, atraindo a atenção de stakeholders.
Humanidades
Ao final da disciplina, os alunos deverão ser capazes de:
Refletir sobre o papel da ética e da espiritualidade no contexto científico e tecnológico.
Avaliar os impactos sociais e humanistas do uso de dados e tecnologia.
Desenvolver uma ética profissional sólida em ambientes de trabalho colaborativos e tecnológicos.
CORPO DOCENTE
Anaile Mendes Rabelo - Mestre
Augusto Nogueira Zadra - Mestre
Cristiano Neves Rodrigues - Mestre
Cristiano Rodrigues de Carvalho - Mestre
Gabriel Oliveira Assunção - Mestre
Henrique Batista da Silva - Mestre
Leandro Figueira Lessa - Mestre
Renan Santos Mendes - Doutor
Ricardo Brito Alves - Mestre
Rodrigo Vitorino Moravia - Mestre
Samuel Almeida Cardoso - Mestre
Zenilton Kleber Gonçalves do Patrocínio -Doutor
O corpo docente poderá sofrer alteração em caso de alguma eventualidade.
INSCRIÇÃO E MATRÍCULA
INSCRIÇÕES ABERTAS
2. MATRÍCULA
FAÇA SUA MATRÍCULA PARA GARANTIR A SUA VAGA!
IMPORTANTE
ATENÇÃO • REQUISITO PREVISTO EM LEI
- Tadeu dos Reis Faria - Mestre
Área do Conhecimento
Tecnologias DigitaisPeríodo de Realização
Início: 07/04/2025Previsão de término: 17/06/2026
Carga Horária
444 horas/aula*.*Hora/aula de 50 minutos (carga horária total equivalente à 370 horas)
Horário
Aulas ao vivo, às segundas e quartas-feiras, das 19h às 22h30. Eventualmente, poderá ocorrer em outro dia da semana.Investimento
24 x R$ 492,00
18 x R$ 643,00
6 x R$ 1.847,00
À vista R$ 10.879,00
Pessoa Jurídica como responsável pelo pagamento das mensalidades
Requisitos Tecnológicos
O aluno deve ter acesso próprio a equipamentos de acordo com as configurações técnicas especificas. Acesse aqui os detalhes.
Trabalho de conclusão de curso
O TCC não é obrigatório para a finalização do curso de pós-graduação. Caso tenha interesse, o aluno pode contratar o serviço de tutoria específica para realizar um TCC. Mais informações, atendimentoiec@pucminas.br
Certificação
Dispensa de Disciplinas
Diploma estrangeiro
Alunos com diploma de graduação emitido fora do território nacional, devem acessar o link oficial do MEC para revalidar ou reconhecer seu diploma no Brasil.
Estágio
Estude na Melhor
Não decidiu qual curso fazer?
Faça um teste de orientação profissional para ajudar você na sua escolha.
Blog Conexão PUC Minas
Informações sobre sua formação profissional e mercado de trabalho.
Por que escolher a Puc Minas
- Inovação
A PUC Minas foi eleita uma das universidades mais inovadoras do país, segundo o RUF.
- Reputação
A maior universidade católica do mundo é também uma das melhores do mundo pela Times Higher Education.
- Intercâmbio
Convênio com mais de 160 instituições pelo mundo para ampliar a experiência acadêmica e criar um ambiente multicultural.
- Pesquisa
Programas de pesquisa que amplicam o conhecimento e a inovação no Estado e estreitam as relações com empresas
- Empregabilidade
Estudar em uma das 10 universidades mais respeitadas pelos empregadores do Brasil faz toda a diferença na sua formação.
- Estrutura de Ponta
Laboratórios com estrutura de ponta para você vivenciar em profundidade e realidade da profissão.
Entre em contato com a nossa central