Ciência de Dados e Big Data
O crescimento do mercado para as atividades de business analytics e ciência de dados é real e as previsões são ainda mais promissoras. Isso, por consequência, já direciona para uma demanda efetiva por um profissional denominado Cientista de Dados com competências e habilidades para entender bem as estratégias e necessidades do negócio e gerenciar, projetar e desenvolver soluções de análise em grandes volumes de dados. O curso é direcionado para formar esse profissional. Através de disciplinas práticas, os alunos são conduzidos a estudar e experimentar os conceitos, vivenciando a aplicação de técnicas e uso das principais ferramentas do mercado para desenvolvimento de projetos relacionados a Ciência de Dados e Big Data com o intuito de gerar valor para os negócios. Técnicas e métodos de machine learning, redes neurais e deep leaning, processamento de linguagem natural, Spark, Haddop, SGBD NoSQL e os principais cuidados com a modelagem e preparação dos dados formam o núcleo do curso.
COMO FUNCIONA A MODALIDADE
OBJETIVOS
O Curso de Especialização em Ciência de Dados e Big Data visa:
Desenvolver uma compreensão dos fundamentos teóricos e práticos da Ciência de Dados, abrangendo estatística, programação, análise de dados e aprendizado de máquina;
Desenvolver habilidades em amostragem, modelagem estatística e análise de séries temporais para prever tendências e padrões;
Capacitar os alunos a coletar, processar, analisar e interpretar dados utilizando técnicas e ferramentas atuais;
Ensinar técnicas de preparação e integração de dados, de dados, e uso de ferramentas de ETL e ELT;
Explorar diferentes tipos de bancos de dados (relacionais e não relacionais) e sistemas de armazenamento e processamento distribuído;
Ensinar os conceitos e aplicações de aprendizado de máquina, bem como introduzir as arquiteturas mais recentes de redes neurais e deep learning;
Desenvolver habilidades em visualização de dados e comunicação de insights derivados da análise;
Familiarizar os alunos com as práticas de DataOps e MLOps;
Proporcionar experiência prática com ferramentas e plataformas de análise de dados em nuvem.
Explorar aplicações de Inteligência Artificial Generativa e técnicas avançadas de análise.
Proporcionar um entendimento dos algoritmos e técnicas de PLN;
Preparar os alunos para projetar, implementar e gerenciar soluções de Ciência de Dados;
Promover a compreensão das implicações humanas e sociais do trabalho em Ciência de Dados.
Competências a serem desenvolvidas:
Ao final do curso, o aluno será capaz de:
Compreender e aplicar conceitos fundamentais de estatística, probabilidade, séries temporais, aprendizagem de máquina, redes neurais e deep learning;
Extrair insights de conjuntos de dados, utilizando técnicas estatísticas e ferramentas de visualização;
Conhecer as ferramentas e plataformas de ciência de dados (Jupyter Notebook, TensorFlow, PyTorch, etc);
Usar de técnicas de ETL/ELT e integração de dados para formar pipelines de dados;
Entender as arquiteturas de bancos de dados relacionais e não relacionais, além de sistemas para processamento massivo e distribuído de dados;
Projetar, implementar e avaliar modelos preditivos e algoritmos de machine learning, incluindo o uso de frameworks para deep learning;
Utilizar frameworks e bibliotecas para construir e operacionalizar aplicações de machine learning, incluíndo as práticas de DataOps e MLOps.
Trabalhar com dados textuais e desenvolver soluções baseadas em PLN;
Planejar, executar e gerenciar projetos de ciência de dados;
Compreender o papel das plataformas em nuvem na ciência de dados e como elas podem ser utilizadas para otimizar a disponibilidade e escalabilidade dos projetos;
Aplicar princípios éticos e considerações humanísticas em projetos de ciência de dados.
Áreas de atuação do egresso:
O especialista em Ciência de Dados e Big Data poderá atuar como Cientista de Dados ou variações e em diversos papéis como: Engenheiro de IA e Analista de Dados. Além disso, ele poderá atuar nos mais diversos tipos de projetos inovadores de soluções de dados.
ÁREA DE ATUAÇÃO DO EGRESSO
O especialista em Ciência de Dados e Big Data poderá atuar como Cientista de Dados ou variações e em diversos papéis como: Engenheiro de IA e Analista de Dados. Além disso, ele poderá atuar nos mais diversos tipos de projetos inovadores de soluções de dados.
PÚBLICO-ALVO
- Em Ciência da Computação, Engenharia de Computação, Engenharia de Software, Sistemas de Informação e tecnólogos da área de Tecnologia da Informação e outros cursos correlatos;
- Que atuam em Inteligência de Negócios e TI, analistas de negócios, analistas de redes sociais e mídias e outros profissionais com interesse em tecnologias métodos e técnicas para análise de dados no apoio a tomada de decisão.
- Que atuam ou pretendem atuar em pesquisa e desenvolvimento para soluções inovadoras e inteligentes.
PROGRAMA DO CURSO
Módulo 1: Fundamentos de Programação e Ciência de Dados
Python para Ciência de Dados
Ao final da disciplina, os alunos deverão ser capazes de:
- Programar em Python, utilizando suas estruturas de controle e dados para manipulação e análise eficazes;
- Aplicar bibliotecas de Python para manipulação, visualização de dados e vetorização de matrizes;
- Desenvolver soluções de análise de dados, aproveitando as funcionalidades avançadas de Python para ciência de dados.
Estatística Geral - Teoria e Aplicações
Ao final da disciplina, os alunos deverão ser capazes de:
- Programar em Python, utilizando suas estruturas de controle e dados para manipulação e análise eficazes;
- Aplicar bibliotecas de Python para manipulação, visualização de dados e vetorização de matrizes;
- Desenvolver soluções de análise de dados, aproveitando as funcionalidades avançadas de Python para ciência de dados.
Data Discovery e Analytics
Ao final da disciplina, os alunos deverão ser capazes de:
- Realizar analisar exploratória de dados
- Conhecer os diferentes tipos de dados (estruturados, semiestruturados, não estruturados)
- Identificar e coletar dados relevantes de diversas fontes.
- Aplicar técnicas de visualização de dados para comunicar insights de forma clara e concisa
- Utilizar ferramentas de Data Discovery e Self-Service Analytics para realizar análises exploratórias de dados de forma autônoma
- Usar modelos de machine learning para aplicar em análise preditiva e prescritiva
Módulo 2: Engenharia de Dados
Banco de Dados Relacionais e Não Relacionais
Ao final da disciplina, os alunos deverão ser capazes de:
- Compreender e aplicar os conceitos fundamentais do modelo relacional de banco de dados;
- Utilizar a linguagem SQL;
- Comparar as propriedades dos modelos relacionais e NoSQL;
- Identificar e utilizar os principais Sistemas de Gerenciamento de Banco de Dados (SGBDs);
- Projetar e implementar soluções de banco de dados;
- Avaliar criticamente quando usar bancos de dados relacionais versus NoSQL.
Armazenamento e Processamento Massivo e Distribuído e Dados
Ao final da disciplina, os alunos deverão ser capazes de:
- Compreender os princípios fundamentais dos sistemas distribuídos;
- Aplicar técnicas de processamento de grandes volumes de dados;
- Projetar e implementar sistemas de arquivos distribuídos;
- Utilizar o modelo MapReduce para processamento de dados;
- Otimizar operações de leitura, escrita e listagem em arquivos distribuídos;
- Avaliar e implementar soluções de processamento distribuído;
- Aplicar técnicas de compressão, otimização e particionamento de dados.
Preparação e Integração de Dados
Ao final da disciplina, os alunos deverão ser capazes de:
- Realizar processos de limpeza, transformação e enriquecimento de dados;
- Executar processos ETL/ELT e integrar dados em ambientes de Data Lake;
- Utilizar ferramentas específicas para projetar e desenvolver aplicações de preparação e integração de dados;
- Implementar pipelines de ETL e ELT;
- Projetar e desenvolver soluções de integração de dados.
Cultura e Práticas DataOps e MLOps
Ao final da disciplina, os alunos deverão ser capazes de:
- Desenvolver infraestruturas de dados e machine learning como código (IaC);
- Projetar e gerenciar pipelines eficientes para soluções de machine learning;
- Implementar práticas de DataOps e MLOps para otimizar o ciclo de vida de desenvolvimento e implantação de modelos.
Módulo 3: Modelagem e Análise Estatística
Técnicas de Amostragem e Modelos de Regressão
Ao final da disciplina, os alunos deverão ser capazes de:
- Aplicar diferentes técnicas e tipos de amostragem em projetos de pesquisa;
- Desenvolver modelos de regressão linear simples e múltipla para análise preditiva;
- Utilizar modelos lineares generalizados para análise de dados;
- Executar análises de diagnóstico e validação de modelos de regressão.
Séries Temporais
Ao final da disciplina, os alunos deverão ser capazes de:
- Analisar e modelar séries temporais estacionárias e não estacionárias;
- Modelar e prever séries temporais utilizando modelos ARMA, ARIMA, e SARIMA;
- Ajustar modelos de séries temporais não estacionárias por meio de transformações adequadas;
- Avaliar estacionariedade em séries temporais;
- Aplicar métodos de decomposição de séries temporais;
- Utilizar modelos de tendência determinística e estocástica;
- Aplicar métodos de médias móveis e alisamento exponencial;
- Modelar séries temporais estacionárias e não estacionárias.
Módulo 4: Machine Learning e Deep Learning
Machine Learning
Ao final da disciplina, os alunos deverão ser capazes de:
- Compreender os diferentes tipos de aprendizado de máquina (supervisionado, não supervisionado);
- Capacidade para selecionar e aplicar algoritmos adequados para problemas específicos de machine learning;
- Capacidade para implementação e otimização de modelos de machine learning;
- Avaliar a performance de modelos de aprendizado de máquina;
- Interpretar os resultados de modelos de aprendizado de máquina.
Redes Neurais e Deep Learning
Ao final da disciplina, os alunos deverão ser capazes de:
- Compreender os fundamentos de redes neurais artificiais;
- Entender os princípios e aplicações de Deep Learning;
- Aplicar diversas técnicas, métodos e arquiteturas de redes neurais;
- Utilizar redes convolucionais modernas;
- Implementar aplicações práticas de redes convolucionais e deep learning;
- Avaliar e otimizar o desempenho de modelos de deep learning;
- Compreender as diferenças entre diversos tipos de redes neurais e suas aplicações específicas.
Frameworks para Deep Learning
Ao final da disciplina, os alunos deverão ser capazes de:
- Utilizar frameworks como Keras, Tensorflow e Pytorch para construir e treinar modelos de deep learning;
- Desenvolver soluções de classificação e regressão usando deep learning;
- Monitorar e avaliar o desempenho de modelos de deep learning;
- Implementar e gerenciar pipelines de deep learning ;
- Compreender e aplicar conceitos de AutoML;
Módulo 5: Aplicações e Projetos
Processamento de Linguagem Natural
Ao final da disciplina, os alunos deverão ser capazes de:
- Aplicar algoritmos de PNL para tarefas de processamento e análise de texto;
- Desenvolver modelos de linguagem, exercendo técnicas como tokenização e lematização;
- Criar aplicações de PNL para extração de informações e reconhecimento de entidades nomeadas;
- Projetar e implementar aplicações práticas de NLP.
Generative AI & Advanced Analytics
Ao final da disciplina, os alunos deverão ser capazes de:
- Capacidade de utilizar ferramentas e plataformas de GenAI;
- Habilidade em desenvolver e ajustar prompts para modelos generativos;
- Explorar técnicas de recuperação aumentada por geração (RAG);
- Utilizar ferramentas e plataformas para análise de dados avançada;
- Conhecimento em integração e utilização de APIs de modelos externos;
- Aptidão para implementar e otimizar modelos preditivos usando AutoML;
- Proficiência em configurar e gerenciar pipelines de AI em ambientes de nuvem;
- Capacidade de identificar e aplicar as tendências emergentes em análise avançada e IA generativa.
Ciência de Dados em Nuvem: Práticas e Projetos
Ao final da disciplina, os alunos deverão ser capazes de:
- Compreender os conceitos fundamentais da ciência de dados em ambiente de nuvem;
- Utilizar as principais plataformas de computação em nuvem para ciência de dados;
- Implementar pipelines de preparação de dados em ambientes de nuvem;
- Realizar ingestão de dados de diversas fontes em plataformas de nuvem;
- Aplicar técnicas de limpeza e transformação de dados;
- Criar e treinar modelos de machine learning em plataformas de nuvem;
- Otimizar hiperparâmetros e selecionar modelos em ambientes de nuvem;
- Implementar processos de validação e avaliação de modelos;
- Realizar o deploy e monitoramento de modelos em produção;
- Gerenciar projetos ráticos de ciência de dados em ambientes de nuvem.
Humanidades
Ao final da disciplina, os alunos deverão ser capazes de:
- Refletir sobre o papel da ética e da espiritualidade no contexto científico e tecnológico;
- Avaliar os impactos sociais e humanistas do uso de dados e tecnologia;
- Desenvolver uma ética profissional sólida em ambientes de trabalho colaborativos e tecnológicos.
- Data Discovery e Analytics
- Estatística Geral - Teoria e Aplicações
- Cultura e Práticas DataOps e MLOps
- Python para Ciência de Dados
- Banco de Dados Relacionais e Não Relacionais
- Armazenamento e Processamento Massivo e Distribuído e Dados
- Preparação e Integração de Dados
- Técnicas de Amostragem e Modelos de Regressão
- Séries Temporais
- Machine Learning
- Redes Neurais e Deep Learning
- Frameworks para Deep Learning
- Processamento de Linguagem Natural
- Generative AI & Advanced Analytics
- Ciência de Dados em Nuvem: Práticas e Projetos
- Humanidades*
*Atenta as tendências de mercado e visando desenvolver a compreensão do ser humano frente às ambiguidades existenciais e sócio religiosas da contemporaneidade, a PUC Minas Virtual disponibilizará como disciplina bônus, além das disciplinas previstas para cada um de seus cursos, a disciplina Humanidades.
Confira as ementas AQUI.
CORPO DOCENTE
Anaíle Mendes Rabelo - Mestre
Bárbara Silveira Fraga - Mestre
Cláudio Lúcio do Val Lopes - Mestre
Cristiane Neri Nobre - Doutor
Cristiano Rodrigues de Carvalho - Mestre
Diego Roberto Gonçalves de Pontes - Mestre
Henrique Batista da Silva - Doutor
Julienne Borges Fujii - Mestre
Luis Enrique Zárate Gálvez - Doutor
Pedro Kássio Ribeiro Matos Loureiro - Mestre
Renan Santos Mendes - Doutor
Rodrigo Richard Gomes - Doutor
Zenilton Kleber Gonçalves do Patrocínio - Doutor
O corpo docente poderá sofrer alteração em caso de alguma eventualidade.
METODOLOGIA
Para ver a metodologia completa, clique AQUI.
INSCRIÇÃO E MATRÍCULA
O processo é realizado em duas fases:
1. INSCRIÇÃO
- Ao clicar no botão Quero me Inscrever, o candidato deverá seguir as etapas do processo, que acontece dentro do portal de inscrições Vem Pra PUC.
- Na página inicial do curso escolhe a forma de pagamento, parcelada ou à vista;
- Após a conclusão desta fase, o candidato receberá um e-mail com a confirmação da inscrição.
2. MATRÍCULA
O candidato receberá e-mail com o link do Painel do candidato para cumprir três procedimentos:
- atualização dos dados cadastrais;
- upload da documentação necessária. Confira AQUI a lista dos documentos necessários;
- adesão ao termo de matrícula.
PAINEL DO CANDIDATO
Caso não receba o e-mail da matrícula, o candidato poderá acessar o ambiente Painel do candidato e seguir com os passos para a realização do processo por lá. Além disso, ele conseguirá acompanhar as informações da matrícula e consultar o status do curso.
IMPORTANTE
Somente após a realização da inscrição que o candidato estará apto a seguir para a etapa da matrícula.
A realização do upload dos documentos exigidos na fase de matrícula é obrigatória para a continuidade do processo.
Etapas de inscrição e matrícula finalizadas? Agora o candidato deverá aguardar as informações e orientações que serão enviadas por e-mail e também disponibilizadas no Painel do Candidato.
ATENÇÃO • REQUISITO PREVISTO EM LEI
Apenas os candidatos que tenham colado grau na graduação poderão se inscrever para um curso de pós-graduação da PUC Minas. Este é um requisito previsto na Lei nº 9.394 e também no Contrato de Prestação de Serviços (clique AQUI para ter acesso). A conferência desse requisito será feita pela PUC Minas e, caso seja identificada alguma irregularidade, a matrícula será cancelada a qualquer momento (conforme cláusula 4.5.1 do contrato). Neste caso, o candidato não terá direito ao recebimento de reembolso dos valores já pagos.
Migração de cursos:
Caso você tenha realizado a sua inscrição e o pagamento, mas queira mudar de opção de curso, clique aqui e faça a sua solicitação de migração. A nossa equipe irá receber a sua solicitação e dar andamento.
Caso não receba as mensagens da PUC Minas, confira sempre a sua caixa de spam.
Tem alguma dúvida? Acesse o nosso FAQ
ACESSO AO CURSO
RECEBIMENTO DE ORIENTAÇÕES DE ACESSO
REQUISITOS TECNOLÓGICOS
O aluno deve possuir ou ter acesso a um computador com a seguinte configuração mínima:
- Processador com frequência mínima de 2 GHz ou superior e 2 núcleos;
- 4 GB de memória RAM (recomenda-se 8 GB) *;
- Placa de vídeo configurada com resolução mínima de 1024 x 768 pixels;
- Placa de som com caixas acústicas (ou fones de ouvido) e microfone;
- Windows 10 (atualizado para a versão 1903 ou superior), Windows 11, MacOS (versão 10.13 - High Sierra ou superior) ou Linux;
- Google Chrome (versão mais recente) ou Mozilla Firefox (versão mais recente);
- Acesso à Internet, com velocidade mínima de conexão de 2 Mbps;
- Correio eletrônico pessoal (e-mail).
Observação: O aluno com necessidades especiais deverá informar à Universidade no ato da inscrição. Para alunos portadores de necessidades especiais no campo da visão, é necessário acesso a um programa (software) de leitura de tela.
* Alunos dos cursos BIM Manager e BIM PROJETOS PARAMÉTRICOS E DESIGN DIGITAL APLICADOS À CONSTRUÇÃO CIVIL: A universidade não se responsabiliza pela aquisição das licenças comerciais dos softwares a serem utilizados no curso. O aluno deverá obter versões acadêmicas e gratuitas no site dos fabricantes. É recomendável que o computador do usuário possua no mínimo 16 Ghz de memória RAM (recomenda-se 32) para uso de softwares de autoria BIM.
REQUISITOS ACADÊMICOS
Já ter colado grau.
Possuir diploma de curso de graduação (reconhecido pelo Ministério da Educação do Brasil).
Preencher os requisitos básicos de formação de acordo com a necessidade de cada curso.
- Fábio Martins de Oliveira -
Área do Conhecimento
Tecnologias DigitaisPeríodo de Realização
O curso possui carga horária total de 360 horas. A prestação dos serviços é prevista para 18 meses.
Carga Horária
Em breveInvestimento
24 x R$ 260,00
20 x R$ 312,00
15 x R$ 416,00
10 x R$ 624,00
5 x R$ 1248,00
1 parcela - pagamento à vista com desconto 7% - 5.804,00
Pagamento parcelado: a primeira parcela será quitada no ambiente da loja VEM PRA PUC. As demais deverão ser pagas diretamente à própria instituição PUC Minas por meio de boletos gerados pelo aluno no sistema acadêmico (também serão enviados por e-mail mensalmente).
Alunos que residem no exterior: a forma de pagamento deve ser à vista e realizada por transferência bancária ou em 1x no cartão de crédito. Para mais esclarecimentos, gentileza contatar diretamente a Divisão Financeira - ead.financeiro@pucminas.br
Pessoa Jurídica como responsável pelo pagamento das mensalidades
Nos casos em que o candidato será beneficiado por uma pessoa jurídica que arcará no todo ou em parte com as mensalidades dos cursos de pós graduação EAD, será necessário gerar o contrato de coparticipação financeira e preencher todos os dados editáveis do documento, imprimir, assinar e carimbar o respectivo documento e enviar a cópia digitalizada para ead.financeiro@pucminas.br. O processo também se aplica se por ventura o curso for pago à vista.
Trabalho de conclusão de curso
Para os alunos que ingressarem a partir de 2023, o Trabalho de Conclusão de Curso não é mais obrigatório na PUC Minas Virtual*, no entanto, o aluno poderá, opcionalmente, contratar um TCC. Após a contratação, será apresentada ao aluno a proposta de trabalho, bem como designado um orientador individual. As informações que dizem respeito à execução do TCC também serão disponibilizadas por meios de textos e vídeos. A duração prevista para o trabalho é de 60 dias e, ao final, o aluno deverá fazer uma apresentação via Internet.
*Exceto para o curso de Engenharia de Segurança do Trabalho.
Certificação
Você receberá o certificado de especialista emitido em formato digital pela PUC Minas. O documento terá um link e código para verificação de autenticidade e veracidade. O certificado do curso a distância é igual ao de um curso presencial.
Veja o modelo AQUI.
Benefícios
- Estude onde e quando quiser
- Tenha atendimento personalizado
- Utilize material didático exclusivo, com acesso a Bibliotecas virtuais.
- Tenha suporte acadêmico e tecnológico
Diploma Estrangeiro
Alunos com diploma de graduação emitido fora do territorio nacional, devem acessar o link oficial do MEC para revalidar ou reconhecer seu diploma no Brasil
Estágio
Informamos que assinamos e autorizamos a realização de estágio nos cursos de pós-graduação a distância. O estágio não obrigatório poderá ser realizado em qualquer período do Curso, desde que o curso tenha sua oferta confirmada e as aulas tenham iniciadas.
Ademais, as atividades desenvolvidas no estágio deverão visar o aprendizado de competências próprias da atividade profissional e à contextualização curricular, seguindo o previsto na Lei Federal n° 11.788 de 25 de setembro de 2008 (BRASIL, 2008) e Normas Acadêmicas da PUC Minas (2018). *
*Exceto para o curso de EDUCAÇÃO BILÍNGUE E PLURILÍNGUE
Estude na Melhor
Não decidiu qual curso fazer?
Faça um teste de orientação profissional para ajudar você na sua escolha.
Blog Conexão PUC Minas
Informações sobre sua formação profissional e mercado de trabalho.
Por que escolher a Puc Minas
- Inovação
A PUC Minas foi eleita uma das universidades mais inovadoras do país, segundo o RUF.
- Reputação
A maior universidade católica do mundo é também uma das melhores do mundo pela Times Higher Education.
- Intercâmbio
Convênio com mais de 160 instituições pelo mundo para ampliar a experiência acadêmica e criar um ambiente multicultural.
- Pesquisa
Programas de pesquisa que amplicam o conhecimento e a inovação no Estado e estreitam as relações com empresas
- Empregabilidade
Estudar em uma das 10 universidades mais respeitadas pelos empregadores do Brasil faz toda a diferença na sua formação.
- Estrutura de Ponta
Laboratórios com estrutura de ponta para você vivenciar em profundidade e realidade da profissão.
Entre em contato com a nossa central