O aluno vai trabalhar com ferramentas de data science, nas quais vai desenvolver desafios que envolvem técnicas de manipulação e tratamento de dados já conhecidas pela comunidade de data scientists.
Este curso vai permitir ao aluno desenvolver, em teoria e na prática, a sua capacidade analítica. Será dada ênfase à importância de permitir que o trabalho realizado seja replicado por outros, o que representa um problema atual, bem como trabalhar na qualidade dos dados e identificar quais as métricas a escolher para avaliar e suportar a solução escolhida.
Objetivos:
Desenvolver conhecimento e capacidade de comunicação dos métodos a diferentes audiências. Em complemento, pretende-se desenvolver problemas de data science. Com base nestes dois objetivos mais abrangentes serão abordados os seguintes subtemas:
Saber:
- Dados que não são perfeitos: valores em falta e duplicados, ruído, outliers, dimensionalidade, bias;
- Escalabilidade: computação distribuída, big data;
- Análise de dados: modelação preditiva, analisar e interpretar resultados;
- Reproducibility, causalidade versus correlação, testes A/B e manutenção de modelos;
Fazer:
- Análise de dados;
- Implementar modelos preditivos, analisar e interpretar resultados;
- Implementar testes A/B;
Soft-Skills:
- Consciencializar para a importância da qualidade de dados;
- Desenvolver capacidades analíticas em análise de dados;
- Trabalhar em equipa com o desenvolvimento de trabalho prático e escrita de relatório cumprindo prazos definidos;