Visão Geral
Este curso foi desenvolvido para capacitar profissionais a identificar, analisar e otimizar gargalos de desempenho em ambientes Databricks. Os participantes aprenderão técnicas avançadas para melhorar a performance de workloads de engenharia de dados, analytics, machine learning e processamento de grandes volumes de dados utilizando Apache Spark, Delta Lake e a arquitetura Lakehouse.
O treinamento aborda desde os fundamentos da execução distribuída do Spark até estratégias avançadas de otimização de consultas, gerenciamento de arquivos, particionamento, caching, cluster tuning, Photon Engine e monitoramento de workloads produtivos.