O crescimento do mercado para as atividades de business analytics e ciência de dados é real e as previsões são ainda mais promissoras. Isso, por consequência, já direciona para uma demanda efetiva por um profissional denominado Cientista de Dados com competências e habilidades para entender bem as estratégias e necessidades do negócio e gerenciar, projetar e desenvolver soluções de análise em grandes volumes de dados. O curso é direcionado para formar esse profissional. Através de disciplinas práticas, os alunos são conduzidos a estudar e experimentar os conceitos, vivenciando a aplicação de técnicas e uso das principais ferramentas do mercado para desenvolvimento de projetos relacionados a Ciência de Dados e Big Data com o intuito de gerar valor para os negócios. Técnicas e métodos de machine learning, redes neurais e deep leaning, processamento de linguagem natural, Spark, Haddop, SGBD NoSQL e os principais cuidados com a modelagem e preparação dos dados formam o núcleo do curso.
COMO FUNCIONA A MODALIDADE
OBJETIVOS
O Curso de Especialização em Ciência de Dados e Big Data visa:
Desenvolver uma compreensão dos fundamentos teóricos e práticos da Ciência de Dados, abrangendo estatística, programação, análise de dados e aprendizado de máquina;
Desenvolver habilidades em amostragem, modelagem estatística e análise de séries temporais para prever tendências e padrões;
Capacitar os alunos a coletar, processar, analisar e interpretar dados utilizando técnicas e ferramentas atuais;
Ensinar técnicas de preparação e integração de dados, de dados, e uso de ferramentas de ETL e ELT;
Explorar diferentes tipos de bancos de dados (relacionais e não relacionais) e sistemas de armazenamento e processamento distribuído;
Ensinar os conceitos e aplicações de aprendizado de máquina, bem como introduzir as arquiteturas mais recentes de redes neurais e deep learning;
Desenvolver habilidades em visualização de dados e comunicação de insights derivados da análise;
Familiarizar os alunos com as práticas de DataOps e MLOps;
Proporcionar experiência prática com ferramentas e plataformas de análise de dados em nuvem.
Explorar aplicações de Inteligência Artificial Generativa e técnicas avançadas de análise.
Proporcionar um entendimento dos algoritmos e técnicas de PLN;
Preparar os alunos para projetar, implementar e gerenciar soluções de Ciência de Dados;
Promover a compreensão das implicações humanas e sociais do trabalho em Ciência de Dados.
Competências a serem desenvolvidas
Ao final do curso, o aluno será capaz de:
Compreender e aplicar conceitos fundamentais de estatística, probabilidade, séries temporais, aprendizagem de máquina, redes neurais e deep learning;
Extrair insights de conjuntos de dados, utilizando técnicas estatísticas e ferramentas de visualização;
Conhecer as ferramentas e plataformas de ciência de dados (Jupyter Notebook, TensorFlow, PyTorch, etc);
Usar de técnicas de ETL/ELT e integração de dados para formar pipelines de dados;
Entender as arquiteturas de bancos de dados relacionais e não relacionais, além de sistemas para processamento massivo e distribuído de dados;
Projetar, implementar e avaliar modelos preditivos e algoritmos de machine learning, incluindo o uso de frameworks para deep learning;
Utilizar frameworks e bibliotecas para construir e operacionalizar aplicações de machine learning, incluíndo as práticas de DataOps e MLOps.
Trabalhar com dados textuais e desenvolver soluções baseadas em PLN;
Planejar, executar e gerenciar projetos de ciência de dados;
Compreender o papel das plataformas em nuvem na ciência de dados e como elas podem ser utilizadas para otimizar a disponibilidade e escalabilidade dos projetos;
Aplicar princípios éticos e considerações humanísticas em projetos de ciência de dados.
ÁREA DE ATUAÇÃO DO EGRESSO
O especialista em Ciência de Dados e Big Data poderá atuar como Cientista de Dados ou variações e em diversos papéis como: Engenheiro de IA e Analista de Dados. Além disso, ele poderá atuar nos mais diversos tipos de projetos inovadores de soluções de dados.
PÚBLICO-ALVO
Profissionais com formação superior:
Em Ciência da Computação, Engenharia de Computação, Engenharia de Software, Sistemas de Informação e tecnólogos da área de Tecnologia da Informação e outros cursos correlatos;
Que atuam em Inteligência de Negócios e TI, analistas de negócios, analistas de redes sociais e mídias e outros profissionais com interesse em tecnologias métodos e técnicas para análise de dados no apoio a tomada de decisão.
Que atuam ou pretendem atuar em pesquisa e desenvolvimento para soluções inovadoras e inteligentes.
PROGRAMA DO CURSO
Python para Ciência de Dados
Banco de Dados Relacionais e Não Relacionais
Armazenamento e Processamento Massivo e Distribuído e Dados
Preparação e Integração de Dados
Técnicas de Amostragem e Modelos de Regressão
Séries Temporais
Machine Learning
Redes Neurais e Deep Learning
Frameworks para Deep Learning
Processamento de Linguagem Natural
Generative AI & Advanced Analytics
Ciência de Dados em Nuvem: práticas e projetos
Humanidades
Data Discovery e Analytics
Estatística Geral - Teoria e Aplicações
Cultura e Práticas DataOps e MLOps
DETALHES DO PROGRAMA
Módulo 1: Fundamentos de Programação e Ciência de Dados
Python para Ciência de Dados
Ao final da disciplina, os alunos deverão ser capazes de:
Programar em Python, utilizando suas estruturas de controle e dados para manipulação e análise eficazes.
Aplicar bibliotecas de Python para manipulação, visualização de dados e vetorização de matrizes.
Desenvolver soluções de análise de dados, aproveitando as funcionalidades avançadas de Python para ciência de dados.
Estatística Geral - Teoria e Aplicações
Ao final da disciplina, os alunos deverão ser capazes de:
Programar em Python, utilizando suas estruturas de controle e dados para manipulação e análise eficazes.
Aplicar bibliotecas de Python para manipulação, visualização de dados e vetorização de matrizes.
Desenvolver soluções de análise de dados, aproveitando as funcionalidades avançadas de Python para ciência de dados.
Data Discovery e Analytics
Ao final da disciplina, os alunos deverão ser capazes de:
Realizar analisar exploratória de dados
Conhecer os diferentes tipos de dados (estruturados, semiestruturados, não estruturados)
Identificar e coletar dados relevantes de diversas fontes.
Aplicar técnicas de visualização de dados para comunicar insights de forma clara e concisa
Utilizar ferramentas de Data Discovery e Self-Service Analytics para realizar análises exploratórias de dados de forma autônoma
Usar modelos de machine learning para aplicar em análise preditiva e prescritiva.
Módulo 2: Engenharia de Dados
Banco de Dados Relacionais e Não Relacionais
Ao final da disciplina, os alunos deverão ser capazes de:
Compreender e aplicar os conceitos fundamentais do modelo relacional de banco de dados
Utilizar a linguagem SQL
Comparar as propriedades dos modelos relacionais e NoSQL
Identificar e utilizar os principais Sistemas de Gerenciamento de Banco de Dados (SGBDs)
Projetar e implementar soluções de banco de dados
Avaliar criticamente quando usar bancos de dados relacionais versus NoSQL.
Armazenamento e Processamento Massivo e Distribuído e Dados
Ao final da disciplina, os alunos deverão ser capazes de:
Compreender os princípios fundamentais dos sistemas distribuídos
Aplicar técnicas de processamento de grandes volumes de dados
Projetar e implementar sistemas de arquivos distribuídos
Utilizar o modelo MapReduce para processamento de dados
Otimizar operações de leitura, escrita e listagem em arquivos distribuídos
Avaliar e implementar soluções de processamento distribuído
Aplicar técnicas de compressão, otimização e particionamento de dados.
Preparação e Integração de Dados
Ao final da disciplina, os alunos deverão ser capazes de:
Realizar processos de limpeza, transformação e enriquecimento de dados.
Executar processos ETL/ELT e integrar dados em ambientes de Data Lake.
Utilizar ferramentas específicas para projetar e desenvolver aplicações de preparação e integração de dados.
Implementar pipelines de ETL e ELT.
Projetar e desenvolver soluções de integração de dados.
Cultura e Práticas DataOps e MLOps
Ao final da disciplina, os alunos deverão ser capazes de:
Desenvolver infraestruturas de dados e machine learning como código (IaC)
Projetar e gerenciar pipelines eficientes para soluções de machine learning
Implementar práticas de DataOps e MLOps para otimizar o ciclo de vida de desenvolvimento e implantação de modelos.
Módulo 3: Modelagem e Análise Estatística
Técnicas de Amostragem e Modelos de Regressão
Ao final da disciplina, os alunos deverão ser capazes de:
Aplicar diferentes técnicas e tipos de amostragem em projetos de pesquisa.
Desenvolver modelos de regressão linear simples e múltipla para análise preditiva.
Utilizar modelos lineares generalizados para análise de dados
Executar análises de diagnóstico e validação de modelos de regressão.
Séries Temporais
Ao final da disciplina, os alunos deverão ser capazes de:
Analisar e modelar séries temporais estacionárias e não estacionárias
Modelar e prever séries temporais utilizando modelos ARMA, ARIMA e SARIMA.
Ajustar modelos de séries temporais não estacionárias por meio de transformações adequadas.
Avaliar estacionariedade em séries temporais
Aplicar métodos de decomposição de séries temporais
Utilizar modelos de tendência determinística e estocástica
Aplicar métodos de médias móveis e alisamento exponencial
Modelar séries temporais estacionárias e não estacionárias.
Módulo 4: Machine Learning e Deep Learning
Machine Learning
Ao final da disciplina, os alunos deverão ser capazes de:
Compreender os diferentes tipos de aprendizado de máquina (supervisionado, não supervisionado)
Capacidade para selecionar e aplicar algoritmos adequados para problemas específicos de machine learning
Capacidade para implementação e otimização de modelos de machine learning
Avaliar a performance de modelos de aprendizado de máquina
Interpretar os resultados de modelos de aprendizado de máquina.
Redes Neurais e Deep Learning
Ao final da disciplina, os alunos deverão ser capazes de:
Compreender os fundamentos de redes neurais artificiais
Entender os princípios e aplicações de Deep Learning
Aplicar diversas técnicas, métodos e arquiteturas de redes neurais
Utilizar redes convolucionais modernas
Implementar aplicações práticas de redes convolucionais e deep learning
Avaliar e otimizar o desempenho de modelos de deep learning
Compreender as diferenças entre diversos tipos de redes neurais e suas aplicações específicas.
Frameworks para Deep Learning
Ao final da disciplina, os alunos deverão ser capazes de:
Utilizar frameworks como Keras, Tensorflow e Pytorch para construir e treinar modelos de deep learning.
Desenvolver soluções de classificação e regressão usando deep learning
Monitorar e avaliar o desempenho de modelos de deep learning
Implementar e gerenciar pipelines de deep learning
Compreender e aplicar conceitos de AutoML.
Módulo 5: Aplicações e Projetos
Processamento de Linguagem Natural
Ao final da disciplina, os alunos deverão ser capazes de:
Aplicar algoritmos de PNL para tarefas de processamento e análise de texto.
Desenvolver modelos de linguagem, exercendo técnicas como tokenização e lematização.
Criar aplicações de PNL para extração de informações e reconhecimento de entidades nomeadas.
Projetar e implementar aplicações práticas de NLP.
Generative AI & Advanced Analytics
Ao final da disciplina, os alunos deverão ser capazes de:
Capacidade de utilizar ferramentas e plataformas de GenAI
Habilidade em desenvolver e ajustar prompts para modelos generativos
Explorar técnicas de recuperação aumentada por geração (RAG)
Utilizar ferramentas e plataformas para análise de dados avançada
Conhecimento em integração e utilização de APIs de modelos externos
Aptidão para implementar e otimizar modelos preditivos usando AutoML
Proficiência em configurar e gerenciar pipelines de AI em ambientes de nuvem
Capacidade de identificar e aplicar as tendências emergentes em análise avançada e IA generativa
Fundamentos de IAs Generativas (GenAI). Plataformas de GenAI. Técnicas de Recuperação Aumentada por Geração (RAG). Princípios e práticas de Prompt Engineering. Estratégias de Fine-tuning. Exploração de modelos preditivos. Utilização de APIs de modelos externos. AutoML. Cloud Analytics. Implementação de pipeline da solução. Conceitos de AI-as-a-Service, AI-as-a-commodity, AI Gateways. Tendencias.
Ciência de Dados em Nuvem: Práticas e Projetos
Ao final da disciplina, os alunos deverão ser capazes de:
Compreender os conceitos fundamentais da ciência de dados em ambiente de nuvem
Utilizar as principais plataformas de computação em nuvem para ciência de dados
Implementar pipelines de preparação de dados em ambientes de nuvem
Realizar ingestão de dados de diversas fontes em plataformas de nuvem
Aplicar técnicas de limpeza e transformação de dados
Criar e treinar modelos de machine learning em plataformas de nuvem
Otimizar hiperparâmetros e selecionar modelos em ambientes de nuvem
Implementar processos de validação e avaliação de modelos
Realizar o deploy e monitoramento de modelos em produção
Gerenciar projetos ráticos de ciência de dados em ambientes de nuvem.
Humanidades
Ao final da disciplina, os alunos deverão ser capazes de:
Refletir sobre o papel da ética e da espiritualidade no contexto científico e tecnológico.
Avaliar os impactos sociais e humanistas do uso de dados e tecnologia.
Desenvolver uma ética profissional sólida em ambientes de trabalho colaborativos e tecnológicos.
CORPO DOCENTE
Anderson da Silva Theobaldo - Mestre
Anaile Mendes Rabelo - Mestre
Gabriel Oliveira Assunção - Mestre
Henrique Batista da Silva - Mestre
Leandro Figueira Lessa - Mestre
Julienne Borges Fujii - Mestre
Renan Santos Mendes - Doutor
Victor Sales Silva - Especialista
Rodrigo Vitorino Moravia - Mestre
Thiago Marques Teixeira de Oliveira - Especialista
Márcio Ribeiro Vianna Neto - Doutor
Zenilton Kleber Gonçalves do Patrocínio - Doutor
O corpo docente poderá sofrer alteração em caso de alguma eventualidade.
INSCRIÇÃO E MATRÍCULA
INSCRIÇÕES ABERTAS
2. MATRÍCULA
FAÇA SUA MATRÍCULA PARA GARANTIR A SUA VAGA!
IMPORTANTE
ATENÇÃO • REQUISITO PREVISTO EM LEI
- Rodrigo Vitorino Moravia - Especialista
- Tadeu dos Reis Faria - Mestre
Área do Conhecimento
Tecnologias DigitaisPeríodo de Realização
Início: 07/04/2025Previsão de término: 17/06/2026
Carga Horária
444 horas/aula*.*Hora/aula de 50 minutos (carga horária total equivalente à 370 horas)
Horário
Aulas ao vivo, às segundas e quartas-feiras, das 19h às 22h30. Eventualmente, poderá ocorrer em outro dia da semana.Investimento
24 x R$ 492,00
18 x R$ 643,00
6 x R$ 1.847,00
À vista R$ 10.879,00
Pessoa Jurídica como responsável pelo pagamento das mensalidades
Requisitos Tecnológicos
O aluno deve ter acesso próprio a equipamentos de acordo com as configurações técnicas especificas. Acesse aqui os detalhes.
Trabalho de conclusão de curso
O TCC não é obrigatório para a finalização do curso de pós-graduação. Caso tenha interesse, o aluno pode contratar o serviço de tutoria específica para realizar um TCC. Mais informações, atendimentoiec@pucminas.br
Certificação
Dispensa de Disciplinas
Diploma estrangeiro
Alunos com diploma de graduação emitido fora do território nacional, devem acessar o link oficial do MEC para revalidar ou reconhecer seu diploma no Brasil.
Estágio
Estude na Melhor
Não decidiu qual curso fazer?
Faça um teste de orientação profissional para ajudar você na sua escolha.
Blog Conexão PUC Minas
Informações sobre sua formação profissional e mercado de trabalho.
Por que escolher a Puc Minas
- Inovação
A PUC Minas foi eleita uma das universidades mais inovadoras do país, segundo o RUF.
- Reputação
A maior universidade católica do mundo é também uma das melhores do mundo pela Times Higher Education.
- Intercâmbio
Convênio com mais de 160 instituições pelo mundo para ampliar a experiência acadêmica e criar um ambiente multicultural.
- Pesquisa
Programas de pesquisa que amplicam o conhecimento e a inovação no Estado e estreitam as relações com empresas
- Empregabilidade
Estudar em uma das 10 universidades mais respeitadas pelos empregadores do Brasil faz toda a diferença na sua formação.
- Estrutura de Ponta
Laboratórios com estrutura de ponta para você vivenciar em profundidade e realidade da profissão.
Entre em contato com a nossa central