Certificado de Conclusão do MIT IDSS
Vantagens do MIT IDSS
- Descontos exclusivos em cursos on-line vigentes e futuros oferecidos pelo MIT IDSS.
- Assinatura da newsletter do IDSS.
- Afiliação à lista de e-mails de ex-alunos do MIT IDSS e aviso sobre os próximos cursos, programas e eventos.
- Certificado do Schwarzman College of Computing e do MIT IDSS após a conclusão bem-sucedida do programa.
Posição do MIT no ranking global de universidades
*QS World University Rankings, 2023
Posição do MIT no ranking nacional de universidades
*U.S News & World Report Rankings, 2023
Nota: imagem meramente ilustrativa. O certificado real está sujeito a alterações a critério do MIT IDSS.
Currículo
+225 horas
Conteúdo de ensino
+10
Linguagens e ferramentas
O programa Ciência de Dados e Machine Learning: Tomada de Decisões Orientadas por Dados apresenta um currículo cuidadosamente elaborado pelo corpo docente do MIT, que visa fornecer as habilidades e o conhecimento para aplicar técnicas de ciência de dados para ajudá-lo a tomar decisões orientadas por dados.
Este programa de certificação profissional em ciência de dados foi projetado para as necessidades dos profissionais de dados que buscam crescimento em suas carreiras e melhoria de suas habilidades em ciência de dados para resolver problemas complexos de negócios. Em um período relativamente curto, o programa visa desenvolver sua compreensão das tecnologias mais relevantes do setor hoje, como machine learning e deep learning, análise de rede, sistemas de recomendação, redes neurais gráficas, séries temporais, ChatGPT e Inteligência Artificial (IA) generativa. Portanto, o programa é mais adequado para alunos com exposição prévia ao trabalho com dados usando algumas ferramentas e aplicando algoritmos e métodos básicos.
- Numpy
- Panda
- Visualização de dados
- Estatística descritiva
- Estatística inferencial
- O que é aprendizado não supervisionado e por que é desafiador?
- Exemplos de aprendizado não supervisionado
- O que é agrupamento de dados?
- Quando usar o agrupamento de dados?
- Preliminares do K-means
- O algoritmo K-means
- Como avaliar o agrupamento de dados?
- Para além do K-means: o que forma um cluster (grupo de dados)?
- Para além do K-means: outras noções de distância
- Para além do K-means: dados e pré-processamento
- Para além do K-means: big data e Bayes não paramétrico
- Para além do agrupamento de dados
- E se não tivermos recursos para descrever os dados ou nem todos forem significativos?
- Encontrando os principais componentes em dados e aplicativos
- A magia dos autovetores I
- Agrupamento de dados em grafos e redes
- Recursos dos grafos: a magia dos autovetores II
- Agrupamento espectral de dados
- Agrupamento de dados e modularidade
- Embeddings: novos recursos e seu significado
- Regressão linear com uma e várias variáveis
- Regressão linear para previsão
- Regressão linear para inferência causal
- Logística e outros tipos de regressão não linear
- Fazendo boas previsões com dados de alta dimensão
- Evitando sobreajuste (overfitting) por meio da validação e validação cruzada
- Regularização por Lasso, Ridge e suas modificações
- Árvores de regressão, Random Forest e árvores reforçadas
- Ensaios de controle randomizados
- Estudos observacionais com confusão
- O que são anomalias? O que é fraude? O que são spams?
- Classificação binária: falso positivo/negativo, precisão/recall e F1 score
- Regressão logística e Probit: classificação binária estatística
- Teste de hipóteses: Teste da Razão e valores-p de Neyman-Pearson: confiança
- Máquina de vetores de suporte: classificador não estatístico
- Perceptron: classificador simples com interpretação elegante
- O que é classificação de imagem? Introdução ao ImageNet com exemplos
- Classificação usando um único limite linear (perceptron)
- Representações hierárquicas
- Ajuste de parâmetros usando propagação reversa (backpropagation)
- Funções não convexas
- Quão interpretáveis são seus recursos?
- Manipulação de redes profundas (exemplo do avestruz)
- Aprendizado por transferência (transfer learning)
- Outras aplicações I: reconhecimento de fala
- Outras aplicações II: processamento de linguagem natural (PLN)
- O que faz um sistema de recomendação?
- Então, o que é o problema de previsão da recomendação e que dados temos?
- Uso de médias populacionais
- Uso de comparações e classificações populacionais
- Personalização por meio da filtragem colaborativa usando usuários semelhantes
- Personalização por meio da filtragem colaborativa usando itens semelhantes
- Personalização por meio da filtragem colaborativa usando usuários e itens semelhantes
- Personalização por meio de comparações, classificações e itens do usuário
- Modelo oculto de Markov/redes neurais, grafo bipartido e modelo gráfico
- Usando informações secundárias
- Construindo um sistema: desafios algorítmicos e de sistema
- Introdução às redes
- Exemplos de redes
- Representação de redes
- Medidas de centralidade: grau, autovetor e ranqueamento de página (Page Rank)
- Centralidade de proximidade e intermediação
- Distribuição de grau, agrupamento (clustering) e pequeno mundo
- Modelos de rede: Erdos-Renyi, modelo de configuração e conexão preferencial
- Modelos estocásticos em redes para propagação de vírus ou ideias
- Maximização da influência
- Modelos de grafos não dirigidos
- Modelos de Ising e Gaussiano
- Aprendendo modelos gráficos a partir de dados
- Modelos de grafos dirigidos
- Estruturas em V, princípio 'explaining away' e modelos de grafos dirigidos ao aprendizado
- Inferência em modelos gráficos: marginais e troca de mensagens
- Modelo oculto de Markov (HMM)
- Filtro de Kalman
- Visão geral sobre ChatGPT e OpenAI.
- Linha do tempo da PLN e IA generativa.
- Frameworks para a compreensão do ChatGPT e da IA generativa.
- Implicações para o trabalho, os negócios e a educação.
- Modalidades e limitações de saída.
- Funções no mundo dos negócios para usufruir do ChatGPT.
- Uso de prompt engineering para resultados com ajustes finos.
- Demonstração prática e seção bônus sobre reforço de aprendizado via feedback humano (RLHF).
- Fundamentos matemáticos para a IA generativa.
- Autocodificadores variacionais (VAEs): primeiras redes neurais generativas.
- Redes adversárias generativas (GANs): geração de imagens fotorrealistas.
- GANs condicionais e difusão estável: controle e melhoria da geração de imagens.
- Modelos Transformer: IA generativa para linguagem natural.
- ChatGPT: IA generativa conversacional.
- Criação prática de protótipo do ChatGPT.
- Próximos passos para a continuidade do aprendizado e compreensão do assunto.
Semanas 1–2: Fundamentos da Ciência de Dados
Nas primeiras duas semanas, abordaremos os conceitos fundamentais da ciência de dados, que formam a base do curso e o ajudam a percorrer o resto de sua jornada com facilidade.
Python para Ciência de Dados
Um estudo de caso
Para cientistas de dados e especialistas em machine learning, Python é uma língua franca devido ao imenso potencial dessa linguagem de programação. Para fortalecer sua base em Python, este módulo foca em NumPy, Pandas e visualização de dados.
Numpy é uma biblioteca Python para computação científica que permite trabalhar com arrays e matrizes multidimensionais.
Pandas é uma poderosa biblioteca de código aberto da linguagem Python utilizada para analisar e manipular dados.
Visualização de dados significa lidar com a representação gráfica dos dados, o que gera insights a partir dos dados de maneira eficaz usando bibliotecas matplotlib, seaborn etc.
Estatística para Ciência de Dados
Um estudo de caso
O conteúdo desta semana ajudará você a entender como a estatística auxilia as organizações na tomada de decisões eficazes, aprender suas ferramentas mais utilizadas e como resolver problemas de negócios por meio de análise, interpretação de dados e experimentos. Serão abordados os seguintes tópicos:
Fornece as medidas fundamentais de um resumo estatístico dos dados.
Explora as áreas de distribuições e estimativa de parâmetros, permitindo a você inferir a partir dos dados.
Semana 3: Recesso da Aprendizagem
Semana 4: Compreendendo os Dados Não Estruturados
Nesta semana, você aprenderá como aplicar diferentes técnicas de machine learning em dados não estruturados para revelar padrões e insights.
Introdução
Você aprenderá sobre um dos aspectos essenciais de machine learning: aprendizado não supervisionado.
Algoritmos de aprendizado não supervisionado ajudarão você a analisar e agrupar conjuntos de dados não rotulados. Neste capítulo, você aprenderá sobre aprendizado não supervisionado e os desafios encontrados ao usar esses algoritmos.
Neste capítulo, você compreenderá a implementação de vários algoritmos de aprendizado não supervisionado com exemplos.
Agrupamento de Dados (Clustering)
Dois estudos de caso
O agrupamento de dados é uma técnica de aprendizado não supervisionado usada para agrupar conjuntos semelhantes de pontos de dados. Este módulo do curso de ciência de dados do MIT apresentará as técnicas de agrupamento mais amplamente utilizadas, isto é, o agrupamento K-means.
Discutiremos a base intuitiva por trás do agrupamento de dados e por que ele é significativamente predominante em muitos setores.
Neste capítulo, você aprenderá o procedimento para usar técnicas de agrupamento de dados.
Neste capítulo, você entenderá algumas preliminares antes de iniciar o agrupamento de dados K-means.
O algoritmo de agrupamento de dados K-means é um dos algoritmos de aprendizado não supervisionado mais comumente implementados para resolver problemas de agrupamento em ciência de dados ou machine learning.
Neste capítulo, você se familiarizará com o procedimento para avaliar o agrupamento de dados.
Você aprenderá diversas técnicas de formação de clusters.
Neste capítulo, você se familiarizará com vários outros tipos de métodos de distância de agrupamento de dados e aprenderá os casos de uso para eles.
O pré-processamento de dados é uma técnica utilizada para limpar dados brutos a fim de usá-los em aplicativos de machine learning. É a etapa inicial e mais importante da implementação de um projeto de machine learning.
Neste capítulo, discutiremos por que o pré-processamento é necessário para a ciência de dados e todas as etapas envolvidas nele.
Big data é utilizado para determinar conjuntos de dados grandes e complexos, que podem ser estruturados e não estruturados. Big data pode ser implementado para proteção contra fraudes, machine learning e desenvolvimento de produtos.
Um modelo Bayesiano não paramétrico refere-se a um modelo Bayesiano em um espaço de parâmetros de dimensão infinita.
Neste capítulo, você entenderá todos os tópicos cruciais para além do agrupamento de dados e suas aplicações.
Agrupamento Espectral de Dados (Spectral Clustering), Componentes e Embeddings
Dois casos de estudo
O agrupamento espectral de dados é uma das técnicas mais amplamente implementadas para redes e grafos de clusters. Você aprenderá sobre agrupamento espectral de dados e modularidade, além do algoritmo PCA (Principal Component Analysis [análise de componentes principais]). Neste módulo, discutiremos sobre o agrupamento espectral de dados, seus componentes e embeddings.
Neste capítulo, você aprenderá como fornecer uma solução se não tiver recursos para descrever os dados ou se nem todos forem significativos.
A análise de componentes principais (PCA) é um método para reduzir a complexidade de um modelo de machine learning não supervisionado. Em termos simples, a análise de componentes principais é semelhante à remoção das variáveis de entrada de um modelo preditivo a fim de evitar o sobreajuste (overfitting).
Neste capítulo, você compreenderá o procedimento para implementar autovetores em uma matriz.
Neste capítulo, você obterá uma compreensão sobre o agrupamento de dados em grafos e redes.
Neste capítulo, você compreenderá o procedimento para implementar autovetores em uma matriz usando vários recursos dos grafos.
O agrupamento espectral de dados permitirá a você reduzir conjuntos de dados multidimensionais complexos para clusters de dados idênticos em dimensões mais raras.
A medida da força da divisão de uma rede em clusters é chamada de modularidade.
Um embedding é um espaço de dimensão moderadamente baixa usado para traduzir vetores de alta dimensão, facilitando o aprendizado de máquina de grandes entradas.
Semana 5: Recesso da Aprendizagem com a Primeira Masterclass Prática
Semana 6: Regressão e Previsão
Nesta semana, você explorará os métodos de regressão clássicos e modernos para fins de previsão e inferência.
Regressão Linear e Não Linear Clássica e Extensões
Dois estudos de caso
Você aprenderá sobre regressão linear e não linear junto de suas extensões, incluindo o caso crucial de regressão logística para classificação binária e inferência causal, cujo objetivo é a compreensão dos efeitos da manipulação ativa de uma variável em vez de sua medição passiva.
Você entenderá o procedimento para implementar a regressão linear com uma e várias variáveis.
Neste capítulo, você se familiarizará com o procedimento para implementar a regressão linear visando a análise preditiva.
Neste capítulo, você se familiarizará com o procedimento para implementar a regressão linear visando a inferência causal.
A regressão logística é um algoritmo de classificação simples em machine learning que prediz as variáveis categóricas dependentes usando variáveis independentes.
Neste capítulo, você se familiarizará com todos os fundamentos da regressão logística e de outros tipos de regressão não linear em machine learning.
Regressão Moderna com Dados de Alta Dimensão
Um estudo de caso
Neste módulo do curso de ciência de dados para profissionais atuantes, você aprenderá sobre regressão moderna com dados de alta dimensão, ou como encontrar uma agulha em um palheiro. Para conjuntos de dados volumosos, torna-se necessário separar as variáveis relevantes para previsão das que não são. Os últimos anos testemunharam o desenvolvimento de novas técnicas estatísticas, como Lasso ou Random Forest, que são computacionalmente superiores a grandes conjuntos de dados e selecionam automaticamente os dados relevantes.
Neste capítulo, você aprenderá o processo para fazer boas previsões com dados de alta dimensão.
O sobreajuste ocorre quando um modelo treina os dados excessivamente. Em termos simples, suponha que um modelo aprenda os detalhes e o ruído presentes nos dados de treinamento. Nesse caso, os dados de treinamento afetarão negativamente o desempenho do modelo com novos dados.
Neste capítulo, você aprenderá o processo para evitar o sobreajuste por meio de técnicas de validação e validação cruzada.
Você compreenderá a regularização por Lasso, Ridge e suas modificações.
As árvores de regressão são construídas usando particionamento recursivo binário, um processo iterativo que divide os dados em partições ou ramificações e, posteriormente, divide cada porção em grupos menores à medida que o processo avança em cada ramificação.
Random Forest é um algoritmo predominante de machine learning supervisionado que constitui muitas árvores de decisão nos inúmeros subconjuntos fornecidos de um conjunto de dados. Posteriormente, calculará a média para melhorar a precisão preditiva do conjunto de dados. O boosting (aumento ou reforço) é um meta-algoritmo que transforma classificadores robustos a partir de vários classificadores “fracos” em machine learning.
O boosting pode ser distinguido em gradient boosting (aumento de gradiente) e adaptative boosting (aumento adaptativo), também chamado de ADA.
Uso da Regressão Moderna para Inferência Causal
Dois estudos de caso
Esta parte abordará a regressão e a inferência causal para explicar por que correlação não implica causalidade e como podemos superar essa limitação intrínseca da regressão recorrendo a estudos de controle randomizados ou controlando a confusão.
Neste capítulo, você aprenderá o processo de identificação e trabalho com ensaios controlados randomizados.
A confusão é um risco comum de estudos clínicos observacionais em oposição a experimentos randomizados. No entanto, pode facilmente passar despercebido, embora seu reconhecimento seja essencial para interpretar de forma significativa as relações causais, como avaliar os efeitos do tratamento.
Semana 7: Recesso da Aprendizagem com a Segunda Masterclass Prática
Semana 8: Classificação e Teste de Hipóteses
Nesta semana, você aprenderá os fundamentos da detecção e classificação de anomalias e do teste de hipóteses, que é a formalização da investigação científica. Esta delicada configuração estatística obedece a um conjunto específico de regras que será explicado e contextualizado com a classificação.
Teste de Hipóteses e Classificação
Um estudo de caso
Neste módulo do programa de certificação em ciência de dados do MIT, você aprenderá sobre o teste de hipóteses e vários algoritmos de classificação. O teste de hipóteses é uma técnica usada para conduzir experimentos usando os dados observados ou pesquisados. Como o nome indica, a classificação é uma técnica usada para classificar um conjunto de dados em diferentes categorias, podendo ser aplicada em dados estruturados e não estruturados.
As anomalias ocorrem quando os bancos de dados são planejados de forma inadequada e não normalizados, armazenando todos os dados em uma tabela. Fraude, como o próprio nome sugere, refere-se a um ato fraudulento sem autorização. Spam é a comunicação digital não solicitada, como o envio de mensagens, e-mails etc., para um grande número de pessoas com fins comerciais.
Neste capítulo, você entenderá o procedimento para detectar anomalias, fraudes e filtrar spams em machine learning.
A classificação binária é uma técnica de machine learning supervisionado na qual as categorias são predefinidas e classificadas em novas observações probabilísticas. Quando há duas categorias, chama-se classificação binária.
A regressão Probit é um método no qual a variável dependente assume apenas dois valores. Neste capítulo, discutiremos todos os conceitos essenciais, como regressão logística, regressão Probit e classificação binária estatística.
Você obterá uma compreensão de todos os conceitos críticos do teste de hipóteses.
A máquina de vetores de suporte (SVM: support vector machine) é outro algoritmo de machine learning popular, usado para problemas de regressão e classificação.
Um perceptron é um neurônio artificial, ou simplesmente um modelo matemático de um neurônio biológico. Neste capítulo, você se familiarizará com o perceptron e seus vários conceitos.
Semana 9: Recesso da Aprendizagem com a Terceira Masterclass Prática
Semana 10: Deep Learning
Deep learning surgiu como uma força motriz na atual revolução tecnológica. A essência do deep learning reside na sua capacidade de imitar o cérebro humano no processamento de dados para diversos fins, também sem supervisão humana. As redes neurais estão no centro dessa tecnologia. Nesta semana, você será conduzido para além do machine learning tradicional, entrando no reino das redes neurais e do deep learning. Você aprenderá como o deep learning pode ser aplicado com sucesso a áreas como visão computacional e muito mais.
Deep Learning
Um estudo de caso
Os alunos compreenderão todos os conceitos críticos de deep learning, como classificação de imagem, propagação reversa (backpropagation), aprendizado por transferência (transfer learning), PLN, reconhecimento de fala e muito mais.
A classificação de imagens é um conceito fundamental de deep learning. Com ela, é possível identificar objetos em uma imagem treinando um modelo por meio da experimentação com imagens rotuladas.
Neste capítulo, você aprenderá o processo de identificação de objetos em uma imagem e será introduzido ao ImageNet, com vários exemplos.
Você aprenderá o processo de implementação de técnicas de classificação usando um único limite linear (perceptron).
Você aprenderá o processo de representação de modelos de deep learning em uma estrutura hierárquica.
Neste capítulo, você aprenderá como encontrar coeficientes (parâmetros) para um ou mais modelos visando ajustar os dados.
Neste capítulo, você se familiarizará com as funções de otimização não convexas em deep learning.
Você compreenderá como os recursos podem ser interpretados.
Você compreenderá o processo de manipulação de redes neurais profundas usando o exemplo do avestruz.
O aprendizado por transferência é uma abordagem de deep learning amplamente implementada. É um modelo desenvolvido para uma aplicação que pode ser reutilizado como ponto de partida por um modelo em uma segunda aplicação.
O reconhecimento de fala é uma técnica usada para transformar a fala humana em texto escrito por meio do reconhecimento da voz de um indivíduo.
O processamento de linguagem natural (PLN) é uma técnica que visa a aplicação da linguística computacional para a criação de aplicações reais, trabalhando com linguagens que abrangem diversas estruturas. Com essa técnica, tentamos ensinar um computador a aprender linguagens e, posteriormente, esperamos que ele as analise e compreenda usando algoritmos adequados e eficientes.
Semana 11: Sistemas de Recomendação
À medida que as organizações se inclinam cada vez mais para abordagens orientadas por dados, a compreensão dos sistemas de recomendação pode ajudar não apenas especialistas em ciência de dados, mas também profissionais de outras áreas, como marketing, que hoje espera-se que também tenham conhecimento de dados. Abrangendo modelagem estatística e algoritmos, você aprenderá por que os sistemas de recomendação agora são onipresentes e alguns insights sobre o que é necessário para criar um sistema de recomendação adequado.
Recomendações e Classificação
Um estudo de caso
De maneira simplificada, os algoritmos de sistemas de recomendação sugerem itens relevantes para os usuários, o que explica sua tendência de uso em diversos setores e seu papel central na geração de receita.
Como o nome sugere, os sistemas de recomendação ajudam a prever a preferência futura de qualquer produto e recomendar os itens mais adequados para os usuários.
Neste capítulo, você compreenderá o procedimento para a utilização de um sistema de recomendação visando selecionar os melhores produtos para os usuários.
A técnica na qual o sistema prevê se um indivíduo ou empresa gosta de um produto (problema de classificação) ou suas avaliações e classificações (problema de regressão) é conhecida como problema de previsão da recomendação.
Você compreenderá o procedimento para usar médias populacionais.
Você compreenderá o procedimento para usar comparações e classificações populacionais.
Filtragem Colaborativa
Um estudo de caso
A filtragem colaborativa é um aspecto dos sistemas de recomendação com o qual interagimos com bastante frequência. Ao coletar dados sobre as preferências de vários usuários, a filtragem colaborativa faz previsões sobre as escolhas de um determinado usuário.
Você compreenderá o procedimento para usar a filtragem colaborativa com a ajuda de usuários semelhantes.
Você compreenderá o procedimento para usar a filtragem colaborativa com a ajuda de itens semelhantes.
Você compreenderá o procedimento para usar a filtragem colaborativa com a ajuda de usuários e itens semelhantes.
Recomendações Personalizadas
Um estudo de caso
Como o próprio nome sugere, as recomendações personalizadas funcionam filtrando as recomendações que são particularmente relevantes para um usuário com base em suas tendências de navegação etc.
Você aprenderá como utilizar recomendações personalizadas com a ajuda de comparações, classificações e itens do usuário.
O modelo oculto de Markov (HMM) é um modelo estatístico de Markov no qual o sistema que está sendo modelado é considerado um processo de Markov com estados ocultos/não observados.
Neste capítulo, você se familiarizará com o procedimento de uso de informações secundárias com o auxílio do Meta-Prod2Vec.
Neste capítulo, você se familiarizará com o procedimento de criação de um sistema considerando desafios algorítmicos e de sistema.
Semana 12: Redes e Modelos Gráficos
Nesta semana, você obterá uma visão geral sistemática dos métodos para analisar grandes redes, determinar estruturas importantes nas mesmas e inferir dados ausentes nas redes. Uma ênfase será colocada nos modelos gráficos, tanto como uma maneira poderosa de modelar processos de rede quanto para facilitar computações estatísticas eficientes.
Introdução
Neste módulo do curso de ciência de dados do MIT, você aprenderá o que são redes e como podemos representá-las com seus casos de uso práticos que nos cercam.
Uma rede pode ser definida como um grupo de dois ou mais sistemas de computadores conectados por vários componentes de hardware, como hubs, switches e outros.
Neste capítulo, você compreenderá todos os exemplos de redes.
Neste capítulo, você se familiarizará com o procedimento para representar redes.
Redes
Um caso de estudo
Neste módulo do curso on-line de ciência de dados do MIT, você aprenderá sobre medidas descritivas padrão de uma rede, como centralidade, proximidade e intermediação, e modelos estocásticos padrão para redes, como Erdos-Renyi, conexão preferencial, modelos de infecção, noções de influência etc.
Neste capítulo, você se familiarizará com o procedimento para implementar medidas de centralidade, como grau, autovetor e ranqueamento de página (Page Rank).
Você obterá uma compreensão sobre centralidade de proximidade e de intermediação.
Você obterá uma compreensão sobre distribuição de graus, agrupamento (clustering) e pequeno mundo.
O modelo Erdos-Renyi ajuda a criar redes ou grafos aleatórios em redes sociais. O modelo de configuração é uma técnica para gerar redes aleatórias a partir de uma determinada sequência de graus. A conexão preferencial é um método no qual novos membros da rede tentam estabelecer uma conexão com membros existentes mais frequentes.
Você obterá uma compreensão dos modelos estocásticos em redes para a propagação de vírus ou ideias.
O problema de identificação de um pequeno subconjunto de nodos (seed [semente]) em uma rede social, que pode maximizar a propagação da influência, é chamado de maximização da influência.
Modelos Gráficos
Um estudo de caso
Você aprenderá a usar modelos gráficos para estimar e exibir uma rede de interações.
Neste capítulo, você aprenderá sobre modelos de grafos não dirigidos.
O modelo de Ising especifica a distribuição de probabilidade conjunta de um vetor para entender as transições de fase. Um modelo Gaussiano é uma distribuição normal bidimensional da concentração nos eixos das duas dimensões a partir de um ponto inicial.
Você obterá uma compreensão sobre vários modelos gráficos de dados.
Um modelo de grafo dirigido refere-se à probabilidade de variáveis aleatórias em um produto de probabilidades condicionais, disponível para cada nodo no grafo.
Você compreenderá mais sobre os modelos de grafos dirigidos, estruturas em V e o princípio 'explaining away'.
Neste capítulo, você aprenderá sobre inferência em modelos gráficos, como marginais e troca de mensagens.
Neste capítulo, aprimoraremos seu conhecimento prévio sobre o modelo oculto de Markov (HMM).
O algoritmo do filtro de Kalman é usado para fornecer estimativas de algumas variáveis desconhecidas, dado que as medições são observadas durante um determinado período.
Módulos de Aprendizagem em Ritmo Próprio
Módulo 1: Desmistificando o ChatGPT e Aplicações
O módulo aborda:
Módulo 2: ChatGPT, o Stack de Desenvolvimento
O módulo aborda:
Certificado de Conclusão do MIT IDSS
Após a conclusão bem-sucedida do programa, você receberá um dos melhores certificados profissionais em ciência de dados, uma vez que será fornecido pelo MIT Institute for Data, Systems, and Society (IDSS).
Taxas do programa
Valor total: USD 2,300 USD 1900
Desconto de USD 400 até 30 de Setembro de 2023
Investimento
Até 30 de Setembro de 2023: USD 2300 USD 1900 (Desconto de USD 400)
A partir de 01 de Outubro de 2023: USD 2300
Indicações e Parcelamento
Desconto por Indicação: USD 2300 USD 2150 (Desconto de USD 150)
Parcelamento no cartão de crédito: Pague em até 12 parcelas mensais, sem juros.
OBS: valor apresentado em dólar americano (USD), porém convertido e processado em real brasileiro (BRL) no ato da matrícula
Vantagens de aprender conosco:
- Palestras em vídeo gravadas pelo corpo docente mundialmente renomado do MIT.
- Mentoria ao vivo com especialistas em ciência de dados e machine learning.
- Trabalhe em 3 projetos relevantes para a área e mais de 15 estudos de caso do mundo real.
- Gerente de programa fornecido pela Great Learning para suporte acadêmico e não acadêmico.
Datas de Início de Turmas
Online
A ser anunciado
Ainda tem dúvidas?
Contate-nos
Preencha o formulário e um conselheiro do programa da Great Learning entrará em contato. Você também pode nos contatar em
dsml-pt.mit@mygreatlearning.com ou+55 11 5039 1917
Download Brochure
Check out the program and fee details in our brochure
Obrigado pelo seu interesse!
Nosso consultor de programa entrará em contato com você em breve para responder a quaisquer perguntas.
Em colaboração com
Este programa é ministrado em colaboração com a Great Learning. A Great Learning é uma empresa de aprendizado profissional presente em mais de 140 países. Sua missão é tornar profissionais de todo o mundo proficientes e prontos para o futuro. A Great Learning colabora com o MIT IDSS e fornece especialistas da área, conselheiros estudantis, assistência para o curso e orientação para garantir que os alunos recebam treinamento prático e mentoria personalizada ao vivo sobre a aplicação dos conceitos ensinados pelo corpo docente do MIT IDSS.