Curso Databricks Apache Spark for Machine Learning and Data Science

  • DevOps | CI | CD | Kubernetes | Web3

Curso Databricks Apache Spark for Machine Learning and Data Science

16 horas
Publico Alvo
  • Cientistas de dados e profissionais de ML que são novos no Apache Spark e estão interessados ​​em aprender como empregar suas habilidades com a estrutura Apache Spark
  • Analistas de SQL interessados ​​em crescer além de simples consultas SQL e no uso das APIs DataFrame e Spark-ML
  • Analistas de dados e engenheiros de dados com experiência em ciência de dados e que desejam uma compreensão mais profunda dos recursos do Spark-ML
Pre-Requisitos
  • Python or Scala
  • Machine Learning and Data Science principles
Materiais
Inglês + Exercícios + Lab Pratico
Conteúdo Programatico
  • Section 1: About Databricks, Spark
  • Section 2: Types of Machine Learning and Business Applications of ML
  • Section 3: Data cleansing: dealing with null values, outliers, and imputation
  • Section 4: Linear Regression: univariate and multivariate models, evaluating measures of fit
  • Section 5: Adv Linear Regression: categorical variables, pipelines, saving and loading
  • Section 6: Use MLflow to track experiments, log metrics, and compare runs
  • Section 7: ML Algorithms in Spark: Decision trees, Random Forest, XGBoost, LightGBM, Isolation Forest, K-Means
  • Section 8: Deployment Options
  • Section 9: Hyperparameter Tuning: Cross-validation and performance tuning
  • Section 10: Logistic regression
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h

Curso Red Hat DevOps Pipelines and Processes: CI/CD with Jenkins

24h

Curso Cloud Security and DevSecOps Automation

32 horas