Por que ingressar no programa de Ciência de Dados e Machine Learning?

icon

Aprenda com o renomado corpo docente do MIT

  • Palestras em vídeo gravadas pelo corpo docente mundialmente renomado do MIT.
  • Currículo projetado para desenvolver habilidades valorizadas pela indústria.
icon

Mentoria e suporte personalizados

  • Mentoria ao vivo e orientação de profissionais de ciência de dados e machine learning aos fins de semana.
  • Sessões colaborativas e personalizadas em pequenos grupos.
icon

Treinamento prático

  • Trabalhe em 3 projetos relevantes para a área e mais de 15 estudos de caso.
  • Atividades avaliativas e discussões em fóruns da Great Learning.

Certificado de Conclusão do MIT IDSS

Vantagens do MIT IDSS

  • Descontos exclusivos em cursos on-line vigentes e futuros oferecidos pelo MIT IDSS.
  • Assinatura da newsletter do IDSS.
  • Afiliação à lista de e-mails de ex-alunos do MIT IDSS e aviso sobre os próximos cursos, programas e eventos.
  • Certificado do Schwarzman College of Computing e do MIT IDSS após a conclusão bem-sucedida do programa.
ranking icon

Posição do MIT no ranking global de universidades

*QS World University Rankings, 2023

ranking icon

Posição do MIT no ranking nacional de universidades

*U.S News & World Report Rankings, 2023

zoom icon certificate

Nota: imagem meramente ilustrativa. O certificado real está sujeito a alterações a critério do MIT IDSS.

A quem se destina este programa?

  • 1

    Cientistas de dados, analistas de dados e profissionais que desejam transformar grandes volumes de dados em insights executáveis.

  • 2

    Profissionais em início de carreira e gerentes seniores, incluindo gerentes técnicos, analistas de Business Intelligence, profissionais de TI, consultores de gestão e gerentes de negócios.

  • 3

    Aqueles com alguma formação acadêmica ou profissional em matemática aplicada e/ou estatística. Os participantes sem essa experiência precisarão de maior dedicação, tendo suporte fornecido pela Great Learning.

Currículo

+225 horas

Conteúdo de ensino

+10

Linguagens e ferramentas

O programa Ciência de Dados e Machine Learning: Tomada de Decisões Orientadas por Dados apresenta um currículo cuidadosamente elaborado pelo corpo docente do MIT, que visa fornecer as habilidades e o conhecimento para aplicar técnicas de ciência de dados para ajudá-lo a tomar decisões orientadas por dados.

Este programa de certificação profissional em ciência de dados foi projetado para as necessidades dos profissionais de dados que buscam crescimento em suas carreiras e melhoria de suas habilidades em ciência de dados para resolver problemas complexos de negócios. Em um período relativamente curto, o programa visa desenvolver sua compreensão das tecnologias mais relevantes do setor hoje, como machine learning e deep learning, análise de rede, sistemas de recomendação, redes neurais gráficas, séries temporais, ChatGPT e Inteligência Artificial (IA) generativa. Portanto, o programa é mais adequado para alunos com exposição prévia ao trabalho com dados usando algumas ferramentas e aplicando algoritmos e métodos básicos.

    Semanas 1–2: Fundamentos da Ciência de Dados

    Nas primeiras duas semanas, abordaremos os conceitos fundamentais da ciência de dados, que formam a base do curso e o ajudam a percorrer o resto de sua jornada com facilidade.

    Python para Ciência de Dados

    quizz

    Um estudo de caso

      Para cientistas de dados e especialistas em machine learning, Python é uma língua franca devido ao imenso potencial dessa linguagem de programação. Para fortalecer sua base em Python, este módulo foca em NumPy, Pandas e visualização de dados.

    • Numpy
    • Numpy é uma biblioteca Python para computação científica que permite trabalhar com arrays e matrizes multidimensionais.

    • Panda
    • Pandas é uma poderosa biblioteca de código aberto da linguagem Python utilizada para analisar e manipular dados.

    • Visualização de dados
    • Visualização de dados significa lidar com a representação gráfica dos dados, o que gera insights a partir dos dados de maneira eficaz usando bibliotecas matplotlib, seaborn etc.

    Estatística para Ciência de Dados

    quizz

    Um estudo de caso

      O conteúdo desta semana ajudará você a entender como a estatística auxilia as organizações na tomada de decisões eficazes, aprender suas ferramentas mais utilizadas e como resolver problemas de negócios por meio de análise, interpretação de dados e experimentos. Serão abordados os seguintes tópicos:

    • Estatística descritiva
    • Fornece as medidas fundamentais de um resumo estatístico dos dados.

    • Estatística inferencial
    • Explora as áreas de distribuições e estimativa de parâmetros, permitindo a você inferir a partir dos dados.

    Semana 3: Recesso da Aprendizagem

    Semana 4: Compreendendo os Dados Não Estruturados

    Nesta semana, você aprenderá como aplicar diferentes técnicas de machine learning em dados não estruturados para revelar padrões e insights.

    Introdução

      Você aprenderá sobre um dos aspectos essenciais de machine learning: aprendizado não supervisionado.

    • O que é aprendizado não supervisionado e por que é desafiador?
    • Algoritmos de aprendizado não supervisionado ajudarão você a analisar e agrupar conjuntos de dados não rotulados. Neste capítulo, você aprenderá sobre aprendizado não supervisionado e os desafios encontrados ao usar esses algoritmos.

    • Exemplos de aprendizado não supervisionado
    • Neste capítulo, você compreenderá a implementação de vários algoritmos de aprendizado não supervisionado com exemplos.

    Agrupamento de Dados (Clustering)

    quizz

    Dois estudos de caso

      O agrupamento de dados é uma técnica de aprendizado não supervisionado usada para agrupar conjuntos semelhantes de pontos de dados. Este módulo do curso de ciência de dados do MIT apresentará as técnicas de agrupamento mais amplamente utilizadas, isto é, o agrupamento K-means.

    • O que é agrupamento de dados?
    • Discutiremos a base intuitiva por trás do agrupamento de dados e por que ele é significativamente predominante em muitos setores.

    • Quando usar o agrupamento de dados?
    • Neste capítulo, você aprenderá o procedimento para usar técnicas de agrupamento de dados.

    • Preliminares do K-means
    • Neste capítulo, você entenderá algumas preliminares antes de iniciar o agrupamento de dados K-means.

    • O algoritmo K-means
    • O algoritmo de agrupamento de dados K-means é um dos algoritmos de aprendizado não supervisionado mais comumente implementados para resolver problemas de agrupamento em ciência de dados ou machine learning.

    • Como avaliar o agrupamento de dados?
    • Neste capítulo, você se familiarizará com o procedimento para avaliar o agrupamento de dados.

    • Para além do K-means: o que forma um cluster (grupo de dados)?
    • Você aprenderá diversas técnicas de formação de clusters.

    • Para além do K-means: outras noções de distância
    • Neste capítulo, você se familiarizará com vários outros tipos de métodos de distância de agrupamento de dados e aprenderá os casos de uso para eles.

    • Para além do K-means: dados e pré-processamento
    • O pré-processamento de dados é uma técnica utilizada para limpar dados brutos a fim de usá-los em aplicativos de machine learning. É a etapa inicial e mais importante da implementação de um projeto de machine learning.
      Neste capítulo, discutiremos por que o pré-processamento é necessário para a ciência de dados e todas as etapas envolvidas nele.

    • Para além do K-means: big data e Bayes não paramétrico
    • Big data é utilizado para determinar conjuntos de dados grandes e complexos, que podem ser estruturados e não estruturados. Big data pode ser implementado para proteção contra fraudes, machine learning e desenvolvimento de produtos.
      Um modelo Bayesiano não paramétrico refere-se a um modelo Bayesiano em um espaço de parâmetros de dimensão infinita.

    • Para além do agrupamento de dados
    • Neste capítulo, você entenderá todos os tópicos cruciais para além do agrupamento de dados e suas aplicações.

    Agrupamento Espectral de Dados (Spectral Clustering), Componentes e Embeddings

    quizz

    Dois casos de estudo

      O agrupamento espectral de dados é uma das técnicas mais amplamente implementadas para redes e grafos de clusters. Você aprenderá sobre agrupamento espectral de dados e modularidade, além do algoritmo PCA (Principal Component Analysis [análise de componentes principais]). Neste módulo, discutiremos sobre o agrupamento espectral de dados, seus componentes e embeddings.

    • E se não tivermos recursos para descrever os dados ou nem todos forem significativos?
    • Neste capítulo, você aprenderá como fornecer uma solução se não tiver recursos para descrever os dados ou se nem todos forem significativos.

    • Encontrando os principais componentes em dados e aplicativos
    • A análise de componentes principais (PCA) é um método para reduzir a complexidade de um modelo de machine learning não supervisionado. Em termos simples, a análise de componentes principais é semelhante à remoção das variáveis ​​de entrada de um modelo preditivo a fim de evitar o sobreajuste (overfitting).

    • A magia dos autovetores I
    • Neste capítulo, você compreenderá o procedimento para implementar autovetores em uma matriz.

    • Agrupamento de dados em grafos e redes
    • Neste capítulo, você obterá uma compreensão sobre o agrupamento de dados em grafos e redes.

    • Recursos dos grafos: a magia dos autovetores II
    • Neste capítulo, você compreenderá o procedimento para implementar autovetores em uma matriz usando vários recursos dos grafos.

    • Agrupamento espectral de dados
    • O agrupamento espectral de dados permitirá a você reduzir conjuntos de dados multidimensionais complexos para clusters de dados idênticos em dimensões mais raras.

    • Agrupamento de dados e modularidade
    • A medida da força da divisão de uma rede em clusters é chamada de modularidade.

    • Embeddings: novos recursos e seu significado
    • Um embedding é um espaço de dimensão moderadamente baixa usado para traduzir vetores de alta dimensão, facilitando o aprendizado de máquina de grandes entradas.

    Semana 5: Recesso da Aprendizagem com a Primeira Masterclass Prática

    Semana 6: Regressão e Previsão

    Nesta semana, você explorará os métodos de regressão clássicos e modernos para fins de previsão e inferência.

    Regressão Linear e Não Linear Clássica e Extensões

    quizz

    Dois estudos de caso

      Você aprenderá sobre regressão linear e não linear junto de suas extensões, incluindo o caso crucial de regressão logística para classificação binária e inferência causal, cujo objetivo é a compreensão dos efeitos da manipulação ativa de uma variável em vez de sua medição passiva.

    • Regressão linear com uma e várias variáveis
    • Você entenderá o procedimento para implementar a regressão linear com uma e várias variáveis.

    • Regressão linear para previsão
    • Neste capítulo, você se familiarizará com o procedimento para implementar a regressão linear visando a análise preditiva.

    • Regressão linear para inferência causal
    • Neste capítulo, você se familiarizará com o procedimento para implementar a regressão linear visando a inferência causal.

    • Logística e outros tipos de regressão não linear
    • A regressão logística é um algoritmo de classificação simples em machine learning que prediz as variáveis categóricas ​​dependentes usando variáveis ​​independentes.

      Neste capítulo, você se familiarizará com todos os fundamentos da regressão logística e de outros tipos de regressão não linear em machine learning.

    Regressão Moderna com Dados de Alta Dimensão

    quizz

    Um estudo de caso

      Neste módulo do curso de ciência de dados para profissionais atuantes, você aprenderá sobre regressão moderna com dados de alta dimensão, ou como encontrar uma agulha em um palheiro. Para conjuntos de dados volumosos, torna-se necessário separar as variáveis relevantes para previsão das que não são. Os últimos anos testemunharam o desenvolvimento de novas técnicas estatísticas, como Lasso ou Random Forest, que são computacionalmente superiores a grandes conjuntos de dados e selecionam automaticamente os dados relevantes.

    • Fazendo boas previsões com dados de alta dimensão
    • Neste capítulo, você aprenderá o processo para fazer boas previsões com dados de alta dimensão.

    • Evitando sobreajuste (overfitting) por meio da validação e validação cruzada
    • O sobreajuste ocorre quando um modelo treina os dados excessivamente. Em termos simples, suponha que um modelo aprenda os detalhes e o ruído presentes nos dados de treinamento. Nesse caso, os dados de treinamento afetarão negativamente o desempenho do modelo com novos dados.
      Neste capítulo, você aprenderá o processo para evitar o sobreajuste por meio de técnicas de validação e validação cruzada.

    • Regularização por Lasso, Ridge e suas modificações
    • Você compreenderá a regularização por Lasso, Ridge e suas modificações.

    • Árvores de regressão, Random Forest e árvores reforçadas
    • As árvores de regressão são construídas usando particionamento recursivo binário, um processo iterativo que divide os dados em partições ou ramificações e, posteriormente, divide cada porção em grupos menores à medida que o processo avança em cada ramificação.
      Random Forest é um algoritmo predominante de machine learning supervisionado que constitui muitas árvores de decisão nos inúmeros subconjuntos fornecidos de um conjunto de dados. Posteriormente, calculará a média para melhorar a precisão preditiva do conjunto de dados. O boosting (aumento ou reforço) é um meta-algoritmo que transforma classificadores robustos a partir de vários classificadores “fracos” em machine learning.
      O boosting pode ser distinguido em gradient boosting (aumento de gradiente) e adaptative boosting (aumento adaptativo), também chamado de ADA.

    Uso da Regressão Moderna para Inferência Causal

    quizz

    Dois estudos de caso

      Esta parte abordará a regressão e a inferência causal para explicar por que correlação não implica causalidade e como podemos superar essa limitação intrínseca da regressão recorrendo a estudos de controle randomizados ou controlando a confusão.

    • Ensaios de controle randomizados
    • Neste capítulo, você aprenderá o processo de identificação e trabalho com ensaios controlados randomizados.

    • Estudos observacionais com confusão
    • A confusão é um risco comum de estudos clínicos observacionais em oposição a experimentos randomizados. No entanto, pode facilmente passar despercebido, embora seu reconhecimento seja essencial para interpretar de forma significativa as relações causais, como avaliar os efeitos do tratamento.

    Semana 7: Recesso da Aprendizagem com a Segunda Masterclass Prática

    Semana 8: Classificação e Teste de Hipóteses

    Nesta semana, você aprenderá os fundamentos da detecção e classificação de anomalias e do teste de hipóteses, que é a formalização da investigação científica. Esta delicada configuração estatística obedece a um conjunto específico de regras que será explicado e contextualizado com a classificação.

    Teste de Hipóteses e Classificação

    quizz

    Um estudo de caso

      Neste módulo do programa de certificação em ciência de dados do MIT, você aprenderá sobre o teste de hipóteses e vários algoritmos de classificação. O teste de hipóteses é uma técnica usada para conduzir experimentos usando os dados observados ou pesquisados. Como o nome indica, a classificação é uma técnica usada para classificar um conjunto de dados em diferentes categorias, podendo ser aplicada em dados estruturados e não estruturados.

    • O que são anomalias? O que é fraude? O que são spams?
    • As anomalias ocorrem quando os bancos de dados são planejados de forma inadequada e não normalizados, armazenando todos os dados em uma tabela. Fraude, como o próprio nome sugere, refere-se a um ato fraudulento sem autorização. Spam é a comunicação digital não solicitada, como o envio de mensagens, e-mails etc., para um grande número de pessoas com fins comerciais.
      Neste capítulo, você entenderá o procedimento para detectar anomalias, fraudes e filtrar spams em machine learning.

    • Classificação binária: falso positivo/negativo, precisão/recall e F1 score
    • A classificação binária é uma técnica de machine learning supervisionado na qual as categorias são predefinidas e classificadas em novas observações probabilísticas. Quando há duas categorias, chama-se classificação binária.

    • Regressão logística e Probit: classificação binária estatística
    • A regressão Probit é um método no qual a variável dependente assume apenas dois valores. Neste capítulo, discutiremos todos os conceitos essenciais, como regressão logística, regressão Probit e classificação binária estatística.

    • Teste de hipóteses: Teste da Razão e valores-p de Neyman-Pearson: confiança
    • Você obterá uma compreensão de todos os conceitos críticos do teste de hipóteses.

    • Máquina de vetores de suporte: classificador não estatístico
    • A máquina de vetores de suporte (SVM: support vector machine) é outro algoritmo de machine learning popular, usado para problemas de regressão e classificação.

    • Perceptron: classificador simples com interpretação elegante
    • Um perceptron é um neurônio artificial, ou simplesmente um modelo matemático de um neurônio biológico. Neste capítulo, você se familiarizará com o perceptron e seus vários conceitos.

    Semana 9: Recesso da Aprendizagem com a Terceira Masterclass Prática

    Semana 10: Deep Learning

    Deep learning surgiu como uma força motriz na atual revolução tecnológica. A essência do deep learning reside na sua capacidade de imitar o cérebro humano no processamento de dados para diversos fins, também sem supervisão humana. As redes neurais estão no centro dessa tecnologia. Nesta semana, você será conduzido para além do machine learning tradicional, entrando no reino das redes neurais e do deep learning. Você aprenderá como o deep learning pode ser aplicado com sucesso a áreas como visão computacional e muito mais.

    Deep Learning

    quizz

    Um estudo de caso

      Os alunos compreenderão todos os conceitos críticos de deep learning, como classificação de imagem, propagação reversa (backpropagation), aprendizado por transferência (transfer learning), PLN, reconhecimento de fala e muito mais.

    • O que é classificação de imagem? Introdução ao ImageNet com exemplos
    • A classificação de imagens é um conceito fundamental de deep learning. Com ela, é possível identificar objetos em uma imagem treinando um modelo por meio da experimentação com imagens rotuladas.
      Neste capítulo, você aprenderá o processo de identificação de objetos em uma imagem e será introduzido ao ImageNet, com vários exemplos.

    • Classificação usando um único limite linear (perceptron)
    • Você aprenderá o processo de implementação de técnicas de classificação usando um único limite linear (perceptron).

    • Representações hierárquicas
    • Você aprenderá o processo de representação de modelos de deep learning em uma estrutura hierárquica.

    • Ajuste de parâmetros usando propagação reversa (backpropagation)
    • Neste capítulo, você aprenderá como encontrar coeficientes (parâmetros) para um ou mais modelos visando ajustar os dados.

    • Funções não convexas
    • Neste capítulo, você se familiarizará com as funções de otimização não convexas em deep learning.

    • Quão interpretáveis ​​são seus recursos?
    • Você compreenderá como os recursos podem ser interpretados.

    • Manipulação de redes profundas (exemplo do avestruz)
    • Você compreenderá o processo de manipulação de redes neurais profundas usando o exemplo do avestruz.

    • Aprendizado por transferência (transfer learning)
    • O aprendizado por transferência é uma abordagem de deep learning amplamente implementada. É um modelo desenvolvido para uma aplicação que pode ser reutilizado como ponto de partida por um modelo em uma segunda aplicação.

    • Outras aplicações I: reconhecimento de fala
    • O reconhecimento de fala é uma técnica usada para transformar a fala humana em texto escrito por meio do reconhecimento da voz de um indivíduo.

    • Outras aplicações II: processamento de linguagem natural (PLN)
    • O processamento de linguagem natural (PLN) é uma técnica que visa a aplicação da linguística computacional para a criação de aplicações reais, trabalhando com linguagens que abrangem diversas estruturas. Com essa técnica, tentamos ensinar um computador a aprender linguagens e, posteriormente, esperamos que ele as analise e compreenda usando algoritmos adequados e eficientes.

    Semana 11: Sistemas de Recomendação

    À medida que as organizações se inclinam cada vez mais para abordagens orientadas por dados, a compreensão dos sistemas de recomendação pode ajudar não apenas especialistas em ciência de dados, mas também profissionais de outras áreas, como marketing, que hoje espera-se que também tenham conhecimento de dados. Abrangendo modelagem estatística e algoritmos, você aprenderá por que os sistemas de recomendação agora são onipresentes e alguns insights sobre o que é necessário para criar um sistema de recomendação adequado.

    Recomendações e Classificação

    quizz

    Um estudo de caso

      De maneira simplificada, os algoritmos de sistemas de recomendação sugerem itens relevantes para os usuários, o que explica sua tendência de uso em diversos setores e seu papel central na geração de receita.

    • O que faz um sistema de recomendação?
    • Como o nome sugere, os sistemas de recomendação ajudam a prever a preferência futura de qualquer produto e recomendar os itens mais adequados para os usuários.
      Neste capítulo, você compreenderá o procedimento para a utilização de um sistema de recomendação visando selecionar os melhores produtos para os usuários.

    • Então, o que é o problema de previsão da recomendação e que dados temos?
    • A técnica na qual o sistema prevê se um indivíduo ou empresa gosta de um produto (problema de classificação) ou suas avaliações e classificações (problema de regressão) é conhecida como problema de previsão da recomendação.

    • Uso de médias populacionais
    • Você compreenderá o procedimento para usar médias populacionais.

    • Uso de comparações e classificações populacionais
    • Você compreenderá o procedimento para usar comparações e classificações populacionais.

    Filtragem Colaborativa

    quizz

    Um estudo de caso

      A filtragem colaborativa é um aspecto dos sistemas de recomendação com o qual interagimos com bastante frequência. Ao coletar dados sobre as preferências de vários usuários, a filtragem colaborativa faz previsões sobre as escolhas de um determinado usuário.

    • Personalização por meio da filtragem colaborativa usando usuários semelhantes
    • Você compreenderá o procedimento para usar a filtragem colaborativa com a ajuda de usuários semelhantes.

    • Personalização por meio da filtragem colaborativa usando itens semelhantes
    • Você compreenderá o procedimento para usar a filtragem colaborativa com a ajuda de itens semelhantes.

    • Personalização por meio da filtragem colaborativa usando usuários e itens semelhantes
    • Você compreenderá o procedimento para usar a filtragem colaborativa com a ajuda de usuários e itens semelhantes.

    Recomendações Personalizadas

    quizz

    Um estudo de caso

      Como o próprio nome sugere, as recomendações personalizadas funcionam filtrando as recomendações que são particularmente relevantes para um usuário com base em suas tendências de navegação etc.

    • Personalização por meio de comparações, classificações e itens do usuário
    • Você aprenderá como utilizar recomendações personalizadas com a ajuda de comparações, classificações e itens do usuário.

    • Modelo oculto de Markov/redes neurais, grafo bipartido e modelo gráfico
    • O modelo oculto de Markov (HMM) é um modelo estatístico de Markov no qual o sistema que está sendo modelado é considerado um processo de Markov com estados ocultos/não observados.

    • Usando informações secundárias
    • Neste capítulo, você se familiarizará com o procedimento de uso de informações secundárias com o auxílio do Meta-Prod2Vec.

    • Construindo um sistema: desafios algorítmicos e de sistema
    • Neste capítulo, você se familiarizará com o procedimento de criação de um sistema considerando desafios algorítmicos e de sistema.

    Semana 12: Redes e Modelos Gráficos

    Nesta semana, você obterá uma visão geral sistemática dos métodos para analisar grandes redes, determinar estruturas importantes nas mesmas e inferir dados ausentes nas redes. Uma ênfase será colocada nos modelos gráficos, tanto como uma maneira poderosa de modelar processos de rede quanto para facilitar computações estatísticas eficientes.

    Introdução

      Neste módulo do curso de ciência de dados do MIT, você aprenderá o que são redes e como podemos representá-las com seus casos de uso práticos que nos cercam.

    • Introdução às redes
    • Uma rede pode ser definida como um grupo de dois ou mais sistemas de computadores conectados por vários componentes de hardware, como hubs, switches e outros.

    • Exemplos de redes
    • Neste capítulo, você compreenderá todos os exemplos de redes.

    • Representação de redes
    • Neste capítulo, você se familiarizará com o procedimento para representar redes.

    Redes

    quizz

    Um caso de estudo

      Neste módulo do curso on-line de ciência de dados do MIT, você aprenderá sobre medidas descritivas padrão de uma rede, como centralidade, proximidade e intermediação, e modelos estocásticos padrão para redes, como Erdos-Renyi, conexão preferencial, modelos de infecção, noções de influência etc.

    • Medidas de centralidade: grau, autovetor e ranqueamento de página (Page Rank)
    • Neste capítulo, você se familiarizará com o procedimento para implementar medidas de centralidade, como grau, autovetor e ranqueamento de página (Page Rank).

    • Centralidade de proximidade e intermediação
    • Você obterá uma compreensão sobre centralidade de proximidade e de intermediação.

    • Distribuição de grau, agrupamento (clustering) e pequeno mundo
    • Você obterá uma compreensão sobre distribuição de graus, agrupamento (clustering) e pequeno mundo.

    • Modelos de rede: Erdos-Renyi, modelo de configuração e conexão preferencial
    • O modelo Erdos-Renyi ajuda a criar redes ou grafos aleatórios em redes sociais. O modelo de configuração é uma técnica para gerar redes aleatórias a partir de uma determinada sequência de graus. A conexão preferencial é um método no qual novos membros da rede tentam estabelecer uma conexão com membros existentes mais frequentes.

    • Modelos estocásticos em redes para propagação de vírus ou ideias
    • Você obterá uma compreensão dos modelos estocásticos em redes para a propagação de vírus ou ideias.

    • Maximização da influência
    • O problema de identificação de um pequeno subconjunto de nodos (seed [semente]) em uma rede social, que pode maximizar a propagação da influência, é chamado de maximização da influência.

    Modelos Gráficos

    quizz

    Um estudo de caso

      Você aprenderá a usar modelos gráficos para estimar e exibir uma rede de interações.

    • Modelos de grafos não dirigidos
    • Neste capítulo, você aprenderá sobre modelos de grafos não dirigidos.

    • Modelos de Ising e Gaussiano
    • O modelo de Ising especifica a distribuição de probabilidade conjunta de um vetor para entender as transições de fase. Um modelo Gaussiano é uma distribuição normal bidimensional da concentração nos eixos das duas dimensões a partir de um ponto inicial.

    • Aprendendo modelos gráficos a partir de dados
    • Você obterá uma compreensão sobre vários modelos gráficos de dados.

    • Modelos de grafos dirigidos
    • Um modelo de grafo dirigido refere-se à probabilidade de variáveis ​​aleatórias em um produto de probabilidades condicionais, disponível para cada nodo no grafo.

    • Estruturas em V, princípio 'explaining away' e modelos de grafos dirigidos ao aprendizado
    • Você compreenderá mais sobre os modelos de grafos dirigidos, estruturas em V e o princípio 'explaining away'.

    • Inferência em modelos gráficos: marginais e troca de mensagens
    • Neste capítulo, você aprenderá sobre inferência em modelos gráficos, como marginais e troca de mensagens.

    • Modelo oculto de Markov (HMM)
    • Neste capítulo, aprimoraremos seu conhecimento prévio sobre o modelo oculto de Markov (HMM).

    • Filtro de Kalman
    • O algoritmo do filtro de Kalman é usado para fornecer estimativas de algumas variáveis ​​desconhecidas, dado que as medições são observadas durante um determinado período.

    Módulos de Aprendizagem em Ritmo Próprio

    Módulo 1: Desmistificando o ChatGPT e Aplicações

      O módulo aborda:

    • Visão geral sobre ChatGPT e OpenAI.
    • Linha do tempo da PLN e IA generativa.
    • Frameworks para a compreensão do ChatGPT e da IA generativa.
    • Implicações para o trabalho, os negócios e a educação.
    • Modalidades e limitações de saída.
    • Funções no mundo dos negócios para usufruir do ChatGPT.
    • Uso de prompt engineering para resultados com ajustes finos.
    • Demonstração prática e seção bônus sobre reforço de aprendizado via feedback humano (RLHF).

    Módulo 2: ChatGPT, o Stack de Desenvolvimento

      O módulo aborda:

    • Fundamentos matemáticos para a IA generativa.
    • Autocodificadores variacionais (VAEs): primeiras redes neurais generativas.
    • Redes adversárias generativas (GANs): geração de imagens fotorrealistas.
    • GANs condicionais e difusão estável: controle e melhoria da geração de imagens.
    • Modelos Transformer: IA generativa para linguagem natural.
    • ChatGPT: IA generativa conversacional.
    • Criação prática de protótipo do ChatGPT.
    • Próximos passos para a continuidade do aprendizado e compreensão do assunto.

    Certificado de Conclusão do MIT IDSS

    Após a conclusão bem-sucedida do programa, você receberá um dos melhores certificados profissionais em ciência de dados, uma vez que será fornecido pelo MIT Institute for Data, Systems, and Society (IDSS).

Projetos e Estudos de Caso

Seguindo uma pedagogia de “aprender fazendo”, o programa de ciência de dados e machine learning oferece a você a oportunidade de construir sua compreensão por meio da resolução de estudos de caso do mundo real e atividades práticas. Abaixo encontram-se exemplos de possíveis tópicos de projetos e estudos de caso.

  • 1

    Saúde

    Diabetes no povo indígena Pima

    <br><strong>Área do Projeto </strong><br> Análise exploratória de dados (EDA). <br><br> <strong>Resumo </strong><br> Analise os diferentes aspectos da diabetes na tribo indígena Pima. <br><br> <strong>Ferramentas e Técnicas Usadas </strong><br> Python, EDA, estatística descritiva etc.
    Ler mais
  • 2

    Entretenimento

    Sistema de recomendação de filmes

    <br><strong>Área do Projeto </strong><br> Sistemas de recomendação. <br><br> <strong>Resumo </strong><br> Crie um sistema de recomendação próprio capaz de recomendar os melhores filmes para um usuário, como o usado pela Netflix. <br><br> <strong>Ferramentas e Técnicas Usadas </strong><br> Python, algoritmos baseados em conteúdo, filtragem colaborativa, recomendações baseadas em popularidade etc.
    Ler mais
  • 3

    Transporte

    Viagens de táxi em Nova York

    <br><strong>Área do Projeto </strong><br> Análise preditiva. <br><br> <strong>Resumo </strong><br> Preveja o tempo de viagem de um táxi em Nova York, crie diferentes tipos de recursos e avalie-os. <br><br> <strong>Ferramentas e Técnicas Usadas </strong><br> Python, regressão, engenharia de recursos etc.
    Ler mais
  • 4

    Pesquisa

    Previsão de remunerações

    <br><strong>Área do Projeto </strong><br> Regressão e previsão. <br><br> <strong>Resumo </strong><br> Preveja remunerações e avalie o desempenho preditivo usando várias características dos trabalhadores. <br><br> <strong>Ferramentas e Técnicas Usadas </strong><br> Python, regressão etc.
    Ler mais
  • 5

    Mídia

    Agrupamento de notícias

    <br><strong>Área do Projeto </strong><br> Agrupamento (clustering) <br><br> <strong>Resumo </strong><br> Crie um agrupamento próprio para notícias on-line semelhante à maneira como o Google Notícias organiza as histórias por meio de tópicos gerados automaticamente. <br><br> <strong>Ferramentas e Técnicas Usadas </strong><br> Python, agrupamento, PLN etc.
    Ler mais
  • 6

    Espaço

    O desastre do ônibus espacial Challenger

    <br><strong>Área do Projeto </strong><br> Classificação e teste de hipóteses. <br><br> <strong>Resumo </strong><br> Estime a probabilidade de falha do equipamento em um foguete após o lançamento. <br><br> <strong>Ferramentas e Técnicas Usadas </strong><br> Python, classificação, teste de hipóteses etc.
    Ler mais
  • 7

    Indústria

    Limite de decisão de uma rede neural profunda

    <br><strong>Área do Projeto </strong><br> Deep learning. <br><br> <strong>Resumo </strong><br> Pratique com perceptrons de uma ou duas camadas para avaliar seus limites de decisão. <br><br> <strong>Ferramentas e Técnicas Usadas </strong><br> Python, redes neurais etc.
    Ler mais
  • 8

    Saúde

    Identificação de novos genes que causam autismo

    <br><strong>Área do Projeto </strong><br> Redes e modelos gráficos. <br><br> <strong>Resumo </strong><br> Use ideias teóricas de redes para identificar novos possíveis genes que causam autismo. <br><br> <strong>Ferramentas e Técnicas Usadas </strong><br> Python, redes, modelos gráficos etc.
    Ler mais

Corpo Docente do MIT e Especialistas da Área

Aprenda com o vasto conhecimento dos melhores professores da área de ciência de dados e machine learning do MIT e com profissionais experientes dessa indústria de organizações líderes mundiais.

  • faculty

    Munther Dahleh

    Diretor do Corpo Docente do Programa do MIT Institute for Data, Systems, and Society (IDSS)

  • faculty

    John N. Tsitsiklis

    Professor Clarence J. Lebel do Dept. of Electrical Engineering & Computer Science (EECS) no MIT

  • faculty

    Ankur Moitra

    Professor Associado de Desenvolvimento Profissional na Rockwell International, de Matemática e do MIT IDSS

  • faculty

    Caroline Uhler

    Professora Associada na Henry L. & Grace Doherty, do EECS e MIT IDSS

  • faculty

    David Gamarnik

    Professor de Pesquisa Operacional na Nanyang Technological University, da Sloan School of Management e do MIT IDSS

  • faculty

    Devavrat Shah

    Professor do EECS e MIT IDSS

  • faculty

    Guy Bresler

    Professor Associado do EECS e MIT IDSS

  • faculty

    Jonathan Kelner

    Professor de Matemática no MIT

  • faculty

    Kalyan Veeramachaneni

    Principal Cientista Pesquisador do Laboratory for Information and Decision Systems no MIT

  • faculty

    Philippe Rigollet

    Professor de Matemática e do MIT IDSS

  • faculty

    Stefanie Jegelka

    Professora Associada de Desenvolvimento Profissional no X-Consortium, do EECS e MIT IDSS

  • faculty

    Tamara Broderick

    Professora Associada do EECS e MIT IDSS

  • faculty

    Victor Chernozhukov

    Professor de Economia e do MIT IDSS

Mentores do Programa

  • faculty

    Bradford Tuckfield

    Fundador e Consultor em Ciência de Dados

  • faculty

    Vaibhav Verdhan

    Líder de Inteligência Analítica, Inteligência Analítica Avançada Global

  • faculty

    Mayan Murray

    Cientista de Dados Sênior e Consultora de UX

  • faculty

    Vibhor Kaushik

    Cientista de Dados

  • faculty

    Amit Agarwal

    Cientista de Dados Sênior

  • faculty

    Kemal Yilmaz

    Cientista de Dados Sênior

  • faculty

    Xiaojun Su

    Gerente de Produtos de Ciência de Dados

  • faculty

    Juan Castillo

    Engenheiro de Machine Learning

  • faculty

    Andrew Marlatt

    Cientista de Dados, Expansão de Receita

  • faculty

    Rohit Dixit

    Cientista de Dados Sênior

  • faculty

    Srikanth Pyaraka

    Gerente de Produtos de Ciência de Dados

  • faculty

    Angel Das

    Consultor em Ciência de Dados

  • faculty

    Shirish Gupta

    Cientista de Dados Principal

  • faculty

    Vanessa Afolabi

    Cientista de Dados Sênior

  • faculty

    Thinesh Pathmanathan

    Cientista de Dados

  • faculty

    Grivine Ochieng

    Engenheiro de Dados Principal

Sua experiência de aprendizado

O programa Ciência de Dados e Machine Learning: Tomada de Decisões Orientadas por Dados se distingue por sua combinação única de liderança acadêmica do MIT, palestras gravadas pelo corpo docente do MIT, pedagogia baseada na prática e mentoria personalizada de especialistas da área.

APRENDA COM O CORPO DOCENTE DO MIT

Aprenda Ciência de Dados e Machine Learning com o Corpo Docente do MIT

  • Programa com aprendizagem em ritmo próprio contendo palestras gravadas pelo corpo docente de ciência de dados e machine learning do MIT.
  • Currículo e design do programa feito pelo corpo docente mundialmente renomado do MIT.
  • Posicione-se como um líder em ciência de dados adquirindo habilidades valorizadas pela área.

PERSONALIZADO E INTERATIVO

Mentoria e Suporte Personalizados

  • Mentoria on-line semanal com especialistas em ciência de dados e machine learning.
  • Pequenos grupos de alunos para orientação e suporte personalizados.
  • Interação com colegas com interesses semelhantes de diferentes contextos e locais.
  • Gerente de programa dedicado, fornecido pela Great Learning, para dúvidas acadêmicas e não acadêmicas.

EXPERIÊNCIA PRÁTICA

Crie seu Portfólio de Ciência de Dados e Machine Learning

  • Demonstre liderança em ciência de dados criando um portfólio com 3 projetos relevantes para a área e mais de 15 estudos de caso.
  • Aprenda por meio de aplicações práticas para compreender como os conceitos de ciência de dados e machine learning são usados ​​no mundo real.

Por que nossos alunos escolhem o programa de Ciência de Dados e Machine Learning?

Este é o primeiro passo no que espero ser um complemento muito proveitoso para a minha carreira em economia comportamental, promoção da saúde e nutrição. Eu recomendo fortemente este programa para outras pessoas que desejam aprender mais sobre como integrar a ciência de dados e o machine learning em seu campo de estudo. Vale totalmente a pena! Ler mais

Monica Pampell

Analista de Ciências da Saúde na Food and Drug Administration, EUA.

A combinação do currículo e do corpo docente notável que o ministra foi o ponto forte do programa. Gostei muito dos módulos de redes neurais e deep learning, enquanto os módulos de sistemas de recomendação e análise preditiva foram desafiadores e empolgantes ao mesmo tempo. Ler mais

Kaase Gbakon

Analista Sênior do Ministério de Energia e Recursos do Governo de Sasketchewan. (Canada)

Depoimentos dos Alunos

  • Minha experiência com o programa de ciência de dados e machine learning foi excepcional. Os professores foram fenomenais. Eles foram pacientes e deram suporte para o nosso aprendizado com sessões de mentoria e várias sessões de ensino on-line em vídeo ao longo do curso.

    Ler mais
    Avatar

    Lanetta Bronte-Hall

    Presidente e CEO da Foundation for Sickle Cell Disease Research

  • Por ser um programa on-line, pode-se ter todos os benefícios de uma rotina de estudo flexível e acesso instantâneo aos ricos recursos por meio da plataforma avançada de aprendizagem.

    Ler mais
    Avatar

    Rana Risheh

    Desenvolvedora, Diretora e Supervisora de Qualidade da Knowlgica

  • Os instrutores e coordenadores foram incríveis, sempre respondendo às minhas perguntas e tirando minhas dúvidas. Já estou usando algoritmos de machine learning não supervisionados em meus projetos de robótica.

    Ler mais
    Avatar

    Salman Siddiqui

    Integrador de Sistema de Controle da Cherkam

  • Honestamente, fiz vários programas, mas a experiência deste programa é simplesmente diferente por perspectivas multidimensionais. Eu recomendaria este programa reiteradamente a profissionais que desejam aprimorar suas habilidades em ciência de dados e machine learning.

    Ler mais
    Avatar

    Oluwarotimi Williams Samuel

    Pesquisador Científico do Shenzhen Institute of Advanced Technology

Taxas do programa

Valor total: USD 2,300 USD 1900

Desconto de USD 400 até 30 de Setembro de 2023

INSCREVER-SE AGORA
First American

Investimento


Até 30 de Setembro de 2023: USD 2300 USD 1900 (Desconto de USD 400)

A partir de 01 de Outubro de 2023: USD 2300

First American

Indicações e Parcelamento


Desconto por Indicação: USD 2300 USD 2150 (Desconto de USD 150)

Parcelamento no cartão de crédito: Pague em até 12 parcelas mensais, sem juros.

OBS: valor apresentado em dólar americano (USD), porém convertido e processado em real brasileiro (BRL) no ato da matrícula

Vantagens de aprender conosco:

  • Palestras em vídeo gravadas pelo corpo docente mundialmente renomado do MIT.
  • Mentoria ao vivo com especialistas em ciência de dados e machine learning.
  • Trabalhe em 3 projetos relevantes para a área e mais de 15 estudos de caso do mundo real.
  • Gerente de programa fornecido pela Great Learning para suporte acadêmico e não acadêmico.

Processo de Inscrição

1

Preenchimento do formulário de inscrição

Inscreva-se preenchendo o formulário de inscrição on-line.

2

Análise da inscrição

Sua inscrição será revisada para determinar sua adequação ao programa.

3

Admissão no programa

Se você for selecionado, receberá uma oferta para a próxima turma. Garanta sua vaga pagando a taxa.

Datas de Início de Turmas

Online Center

Online

A ser anunciado

Ainda tem dúvidas?
Contate-nos

Preencha o formulário e um conselheiro do programa da Great Learning entrará em contato. Você também pode nos contatar em

dsml-pt.mit@mygreatlearning.com ou
+55 11 5039 1917

Download Brochure

Check out the program and fee details in our brochure

Ops!! Alguma coisa deu errado. Por favor tente outra vez.
Nome
E-mail
Celular

Ao enviar o formulário, você concorda com nossos Termos e Condições e nossa Política de Privacidade.

Término das inscrições: 14 de Março de 2024

Phone Icon

Obrigado pelo seu interesse!

Nosso consultor de programa entrará em contato com você em breve para responder a quaisquer perguntas.

Em colaboração com

gl Logo

Este programa é ministrado em colaboração com a Great Learning. A Great Learning é uma empresa de aprendizado profissional presente em mais de 140 países. Sua missão é tornar profissionais de todo o mundo proficientes e prontos para o futuro. A Great Learning colabora com o MIT IDSS e fornece especialistas da área, conselheiros estudantis, assistência para o curso e orientação para garantir que os alunos recebam treinamento prático e mentoria personalizada ao vivo sobre a aplicação dos conceitos ensinados pelo corpo docente do MIT IDSS.

4.8

rating

Trustpilot

Avaliado por serviços educacionais

rating

4.7

rating

CourseReport

Calificado por estudiantes de todo el mundo

rating