Atividades e projetos de Ciência de Dados já são realidades nas estratégias das empresas. Isso, por consequência, mostra uma efetiva necessidade de equipes multidisciplinares com profissionais com habilidades e competências diversas. Esse contexto reforça a necessidade de aprimoramento profissional em estatística e em modelos de Machine Learning. Este curso oferece conhecimentos avançados de métodos estatísticos, a teoria que sustenta esses métodos e os modelos mais usados de Machine Leaning para a atuação na área de projetos de dados das empresas. Através de disciplinas práticas, os alunos são conduzidos a estudar e experimentar os conceitos, vivenciando a aplicação de técnicas e uso das principais ferramentas do mercado para desenvolver habilidades analíticas, lógicas, numéricas e de resolução de problemas, habilidades que estão em alta demanda no mercado.
COMO FUNCIONA A MODALIDADE
OBJETIVOS
O Curso de Especialização em Estatística para Ciência de Dados visa:
Capacitar os alunos a aplicar princípios de governança de dados pertinentes à coleta e análise estatística, assegurando conformidade legal e ética;
Capacitar os alunos a aplicar métodos de análise descritiva e inferencial, incluindo a construção de intervalos de confiança e testes de hipótese.
Ensinar técnicas de amostragem e construção de modelos de regressão linear, permitindo a previsão e interpretação de variáveis dependentes.
Ensinar métodos estatísticos para análise de séries temporais;
Capacitar os alunos a utilizar métodos de análise de sobrevivência e técnicas multivariadas;
Integrar técnicas estatísticas em práticas de machine learning e deep learning;
Ensinar práticas de DataOps e MLOps para otimizar a gestão e implementação de análises estatísticas em projetos de ciência de dados;
Prover habilidades em visualização de dados e comunicação de resultados estatísticos e de modelos preditivos.
Competências a serem desenvolvidas
Ao final do curso, o aluno será capaz de:
Realizar análises estatísticas detalhadas e visualizações claras para comunicar insights de forma eficaz;
Projetar, desenvolver e gerenciar projetos que demandam técnicas atuais para análise de dados;
Aplicar métodos e modelos estatísticos para análise de dados em projetos empresariais;
Realizar planejamento estatístico e desenvolver relatórios gerenciais que permitam apresentar resultados embasados estatisticamente de forma clara e concisa e em linguagem adequada;
Conhecer e aplicar as principais funções e modelos, compreendendo suas especificidades e diferenças;
Aplicar as principais técnicas estatísticas integradas com o uso de modelos de machine learning e deep learning;
Entender e promover a cultura de dados para garantir a geração de valor para o negócio;
Projetar e desenvolver soluções complexas que demandam técnicas atuais de aprendizado de máquina.
ÁREA DE ATUAÇÃO DO EGRESSO
O especialista em Especialista em Estatística para Ciência de Dados poderá atuar como Estatístico, Cientista de Dados, Analista de Dados e nas mais diversas áreas que demandam atividades de análise de dados. Além disso, ele poderá atuar nos mais diversos tipos de projetos inovadores em TI.
PÚBLICO-ALVO
Profissionais com formação superior:
Que atuam em projetos ou atividades relacionados à análise e gestão de dados e que queiram complementar e aperfeiçoar seus conhecimentos em metodologia estatística;
Que atuam em Inteligência de Negócios e TI, gerentes de TI, coordenadores de projetos, analistas de negócios, analistas de redes sociais e mídias e outros profissionais com interesse em tecnologias para análise de dados para apoio a tomada de decisão;
Que atuam ou pretendem atuar no desenvolvimento de soluções inovadoras e inteligentes para favorecer a transformação digital.
PROGRAMA DO CURSO
Python para Ciência de Dados
Análise Descritiva e Probabilidade
Inferência Estatística
Técnicas de Amostragem e Regressão Linear
Modelos de Regressão
Análise de Sobrevivência
Análise Multivariada
Séries Temporais
Machine Learning
Redes Neurais e Deep Learning
Frameworks para Deep Learning
Generative AI & Advanced Analytics
Governança de Dados
Data Discovery e Analytics
Cultura e Práticas DataOps e MLOps
DETALHES DO PROGRAMA
Módulo 1: Métodos Estatísticos e Programação
Python para Ciência de Dados
Ao final da disciplina, os alunos deverão ser capazes de:
Programar em Python, utilizando suas estruturas de controle e dados para manipulação e análise eficazes
Aplicar bibliotecas de Python para manipulação, visualização de dados e vetorização de matrizes
Desenvolver soluções de análise de dados, aproveitando as funcionalidades avançadas de Python para ciência de dados
Análise Descritiva e Probabilidade
Ao final da disciplina, os alunos deverão ser capazes de:
Identificar e classificar diferentes tipos de variáveis estatísticas
Calcular e interpretar medidas de posição (média, mediana, moda) e dispersão (variância, desvio-padrão)Calcular e interpretar medidas de posição e dispersão
Realizar análises bivariadas para identificar relações entre variáveis qualitativas e quantitativas e calcular coeficientes de correlação
Aplicar técnicas de visualização apropriadas para diversos tipos de variáveis
Compreender conceitos fundamentais de probabilidade
Identificar e aplicar modelos de distribuição de probabilidade discretos e contínuos
Entender e aplicar o Teorema do Limite Central e a Lei dos Grandes Números.
Inferência Estatística
Ao final da disciplina, os alunos deverão ser capazes de:
Compreender os princípios fundamentais da inferência estatística
Aplicar métodos de estimação e avaliar propriedades dos estimadores
Realizar e interpretar testes de hipóteses
Aplicar métodos estatísticos não-paramétricos
Conduzir testes para uma, duas e k amostras (relacionadas e independentes)
Calcular e interpretar medidas de correlação e seus testes de significância
Implementar e interpretar métodos de reamostragem como o bootstrap para suporte em inferências estatísticas.
Módulo 2: Modelos Estatísticos
Técnicas de Amostragem e Regressão Linear
Ao final da disciplina, os alunos deverão ser capazes de:
Compreender diferentes tipos de amostragem e suas aplicações
Calcular o dimensionamento adequado de amostras
Identificar e lidar com vieses de amostragem e erros não amostrais
Aplicar técnicas de estimação de variância e distribuição de amostragem
Construir e interpretar intervalos de confiança
Aplicar e interpretar modelos de regressão linear simples e múltipla
Selecionar variáveis, construir modelos, e validar através de intervalos de confiança e testes de hipóteses.
Realizar análise de resíduos e diagnóstico e validação de modelos de regressão.
Modelos de Regressão
Ao final da disciplina, os alunos deverão ser capazes de:
Aplicar modelos lineares generalizados para diferentes tipos de variáveis dependentes
Realizar inferências sobre a regressão linear múltipla
Identificar e resolver problemas comuns em regressão linear múltipla
Utilizar variáveis dummy em modelos de regressão
Compreender e aplicar Modelos Lineares Generalizados
Realizar testes de hipóteses em modelos de regressão avançados
Conduzir análises de diagnóstico em modelos de regressão
Selecionar variáveis relevantes para um modelo de regressão
Construir modelos de regressão não lineares.
Séries Temporais
Ao final da disciplina, os alunos deverão ser capazes de:
Analisar e modelar séries temporais estacionárias e não estacionárias
Compreender conceitos básicos de séries temporais e aplicar modelos como ARMA e ARIMA e SARIMA.
Ajustar modelos de séries temporais não estacionárias por meio de transformações adequadas.
Avaliar estacionariedade em séries temporais
Aplicar métodos de decomposição de séries temporais
Utilizar modelos de tendência determinística e estocástica
Aplicar métodos de médias móveis e alisamento exponencial
Modelar séries temporais estacionárias e não estacionárias.
Análise de Sobrevivência
Ao final da disciplina, os alunos deverão ser capazes de:
Compreender conceitos básicos de análise de sobrevivência
Aplicar métodos não-paramétricos para estimar funções de sobrevivência
Utilizar modelos probabilísticos em análise de sobrevivência
Aplicar modelos de regressão paramétricos em análise de sobrevivência
Realizar análise de resíduos em modelos de sobrevivência
Aplicar e interpretar o modelo de Cox e o modelo de taxa acelerada para análise de sobrevivência
Compreender e aplicar conceitos de testes acelerados e suas aplicações práticas.
Análise Multivariada
Ao final da disciplina, os alunos deverão ser capazes de:
Aplicar métodos multivariados para análise de dados, incluindo análise de variância, agrupamento, fatorial e discriminante.
Trabalhar com dados multivariados e suas representações
Compreender e aplicar distribuições multivariadas
Aplicar técnicas de análise de correlação canônica e análise multidimensional
Utilizar métodos de redução de dimensionalidade.
Módulo 3: Machine Learning, Deep Learning e Anlytics
Data Discovery e Analytics
Ao final da disciplina, os alunos deverão ser capazes de:
Realizar analisar exploratória de dados
Conhecer os diferentes tipos de dados (estruturados, semiestruturados, não estruturados)
Identificar e coletar dados relevantes de diversas fontes.
Aplicar técnicas de visualização de dados para comunicar insights de forma clara e concisa
Utilizar ferramentas de Data Discovery e Self-Service Analytics para realizar análises exploratórias de dados de forma autônoma
Usar modelos de machine learning para aplicar em análise preditiva e prescritiva.
Machine Learning
Ao final da disciplina, os alunos deverão ser capazes de:
Compreender os diferentes tipos de aprendizado de máquina (supervisionado, não supervisionado)
Capacidade para selecionar e aplicar algoritmos adequados para problemas específicos de machine learning
Capacidade para implementação e otimização de modelos de machine learning
Avaliar a performance de modelos de aprendizado de máquina
Interpretar os resultados de modelos de aprendizado de máquina.
Redes Neurais e Deep Learning
Ao final da disciplina, os alunos deverão ser capazes de:
Compreender os fundamentos de redes neurais artificiais
Entender os princípios e aplicações de Deep Learning
Aplicar diversas técnicas, métodos e arquiteturas de redes neurais
Utilizar redes convolucionais modernas
Implementar aplicações práticas de redes convolucionais e deep learning
Avaliar e otimizar o desempenho de modelos de deep learning
Compreender as diferenças entre diversos tipos de redes neurais e suas aplicações específicas.
Frameworks para Deep Learning
Ao final da disciplina, os alunos deverão ser capazes de:
Utilizar frameworks como Keras, Tensorflow e Pytorch para construir e treinar modelos de deep learning.
Desenvolver soluções de classificação e regressão usando deep learning
Monitorar e avaliar o desempenho de modelos de deep learning
Implementar e gerenciar pipelines de deep learning
Compreender e aplicar conceitos de AutoML.
Generative AI & Advanced Analytics
Ao final da disciplina, os alunos deverão ser capazes de:
Capacidade de utilizar ferramentas e plataformas de GenAI
Habilidade em desenvolver e ajustar prompts para modelos generativos
Explorar técnicas de recuperação aumentada por geração (RAG)
Utilizar ferramentas e plataformas para análise de dados avançada
Conhecimento em integração e utilização de APIs de modelos externos
Aptidão para implementar e otimizar modelos preditivos usando AutoML
Proficiência em configurar e gerenciar pipelines de AI em ambientes de nuvem
Capacidade de identificar e aplicar as tendências emergentes em análise avançada e IA generativa.
Módulo 4: Governança de Dados, e Controle de Dados
Governança de Dados
Ao final da disciplina, os alunos deverão ser capazes de:
Analisar e contextualizar a importância da governança de dados no ambiente corporativo
Analisar criticamente situações e problemas
Desenvolver e implementar frameworks de governança de dados alinhados aos objetivos organizacionais
Criar e aplicar políticas, padrões e procedimentos específicos de governança de dados.
Garantir a qualidade, segurança e confiabilidade dos dados
Realizar avaliações de conformidade (compliance) e de risco (risk assessment) em relação à governança de dados
Integrar conceitos de governança de dados com as exigências legais de proteção de dados
Adaptar e inovar em práticas de governança de dados considerando a ética, agilidade e gerência de mudanças.
Comunicar-se de forma eficaz, trabalhar em equipe e adaptar-se a novas situações e desafios de GD.
Cultura e Práticas DataOps e MLOps
Ao final da disciplina, os alunos deverão ser capazes de:
Desenvolver infraestruturas de dados e machine learning como código (IaC)
Projetar e gerenciar pipelines eficientes para soluções de machine learning
Implementar práticas de DataOps e MLOps para otimizar o ciclo de vida de desenvolvimento e implantação de modelos.
Humanidades
Ao final da disciplina, os alunos deverão ser capazes de:
Refletir sobre o papel da ética e da espiritualidade no contexto científico e tecnológico.
Avaliar os impactos sociais e humanistas do uso de dados e tecnologia.
Desenvolver uma ética profissional sólida em ambientes de trabalho colaborativos e tecnológicos.
CORPO DOCENTE
Ana Carolina Fernandes Dias - Mestre
Anaile Mendes Rabelo - Mestre
Gabriel Oliveira Assunção - Mestre
José Aguinaldo Fonseca - Mestre
Leandro Figueira Lessa - Mestre
Lucca Siebra de Pontes - Mestre
Renan Santos Mendes - Doutor
Ricardo Brito Alves - Mestre
Rodrigo Vitorino Moravia - Mestre
Thiago Marques Teixeira de Oliveira - Especialista
Vinícius Silva Osterne Ribeiro - Mestre
Zenilton Kleber Gonçalves do Patrocínio -Doutor
O corpo docente poderá sofrer alteração em caso de alguma eventualidade.
INSCRIÇÃO E MATRÍCULA
INSCRIÇÕES ABERTAS
2. MATRÍCULA
FAÇA SUA MATRÍCULA PARA GARANTIR A SUA VAGA!
IMPORTANTE
ATENÇÃO • REQUISITO PREVISTO EM LEI
- Anaíle Mendes Rabelo - Mestre
- Tadeu dos Reis Faria - Mestre
Área do Conhecimento
Tecnologias DigitaisPeríodo de Realização
Início: 07/04/2025Previsão de término: 17/06/2026
Carga Horária
444 horas/aula*.*Hora/aula de 50 minutos (carga horária total equivalente à 370 horas)
Horário
Aulas ao vivo, às segundas e quartas-feiras, das 19h às 22h30. Eventualmente, poderá ocorrer em outro dia da semana.Investimento
24 x R$ 492,00
18 x R$ 643,00
6 x R$ 1.847,00
À vista R$ 10.879,00
Pessoa Jurídica como responsável pelo pagamento das mensalidades
Requisitos Tecnológicos
O aluno deve ter acesso próprio a equipamentos de acordo com as configurações técnicas especificas. Acesse aqui os detalhes.
Trabalho de conclusão de curso
O TCC não é obrigatório para a finalização do curso de pós-graduação. Caso tenha interesse, o aluno pode contratar o serviço de tutoria específica para realizar um TCC. Mais informações, atendimentoiec@pucminas.br
Certificação
Dispensa de Disciplinas
Diploma estrangeiro
Alunos com diploma de graduação emitido fora do território nacional, devem acessar o link oficial do MEC para revalidar ou reconhecer seu diploma no Brasil.
Estágio
Estude na Melhor
Não decidiu qual curso fazer?
Faça um teste de orientação profissional para ajudar você na sua escolha.
Blog Conexão PUC Minas
Informações sobre sua formação profissional e mercado de trabalho.
Por que escolher a Puc Minas
- Inovação
A PUC Minas foi eleita uma das universidades mais inovadoras do país, segundo o RUF.
- Reputação
A maior universidade católica do mundo é também uma das melhores do mundo pela Times Higher Education.
- Intercâmbio
Convênio com mais de 160 instituições pelo mundo para ampliar a experiência acadêmica e criar um ambiente multicultural.
- Pesquisa
Programas de pesquisa que amplicam o conhecimento e a inovação no Estado e estreitam as relações com empresas
- Empregabilidade
Estudar em uma das 10 universidades mais respeitadas pelos empregadores do Brasil faz toda a diferença na sua formação.
- Estrutura de Ponta
Laboratórios com estrutura de ponta para você vivenciar em profundidade e realidade da profissão.
Entre em contato com a nossa central