이 과정은 Databricks를 활용한 데이터 엔지니어링 학습을 위한 적절한 입문 과정입니다.
아래에서는 본 과정에 포함된 4개의 4시간 모듈을 각각 설명합니다.
1. Lakeflow Connect를 활용한 데이터 인제스트
이 과정은 Data Scientists, 머신러닝 엔지니어 및 가장 인기 있는 최신 프레임워크와 Databricks 기능을 사용하여 제너레이티브 AI 애플리케이션을 구축하려는 기타 데이터 실무자를 대상으로 합니다. 아래에서는 이 과정에 포함된 4시간짜리 4개의 모듈에 ...
본 과정은 Databricks에서 머신 러닝 워크플로를 마스터하기 위한 관문으로 전문 강사의 안내에 따라 데이터 준비, 모델 개발, 배포 및 운영에 대해 자세히 알아봅니다. 또한 데이터 탐색, 모델 훈련 및 배포 전략에 필요한 필수 기술을 Databricks에 맞게 학...
본 교육 과정에서는 Databricks SQL에 대한 포괄적인 소개를 제공합니다. 학습자는 데이터를 수집하고, 쿼리를 작성하고, 시각화 및 대시보드를 만들고, 알림을 구성합니다. 이 과정을 통해 Databricks 공인 데이터 분석가 자격증 시험을 준비할 수 있습니다....
이 과정에서는 비즈니스 인텔리전스 요구 사항을 충족하기 위해 Databricks가 제공하는 기능을 사용하는 방법을 알아봅니다. AI/BI 대시보드 및 AI/BI Genie. Databricks 데이터 애널리스트는 플랫폼 내에서 AI/BI 대시보드와 AI/BI Genie...
이 과정에서는 데이터 분석 및 데이터 웨어하우징에 필수적인 기술을 다루는 Databricks Data Intelligence Platform를 소개합니다. 워크스페이스을 탐색하고, 데이터 개체로 작업하고, SQL 쿼리를 실행하고, Delta Lake 기능을 사용하고, ...
이 과정에서는 머신러닝 라이프사이클과 MLOps에 대한 포괄적인 이해를 제공하며, 데이터 및 모델 관리, 테스트, 그리고 확장 가능한 아키텍처를 위한 모범 사례를 강조합니다. CI/CD, 파이프라인 관리, 환경 분리를 포함한 핵심 MLOps 구성 요소를 다루고, Dat...
대규모 머신러닝
이 과정에서는 Apache Spark 아키텍처와 Databricks 환경에서 머신러닝 워크로드에 적용하는 방법에 대한 이론 및 실무 지식을 습득하게 됩니다. 데이터 준비, 모델 학습 및 배포에 Spark를 언제 사용해야 하는지 배우고, Sp...
이 과정은 Databricks를 활용한 머신러닝 데이터 준비의 기초에 중점을 둡니다. 참가자들은 전통적인 머신러닝 응용에 적합하도록 데이터를 탐색, 정제, 구성하는 데 필요한 핵심 기술을 배우게 됩니다. 주요 학습 내용에는 데이터 시각화, 피처 엔지니어링 (Featur...
이 과정에서는 Databricks Data Intelligence Platform을 사용하여 기본적인 머신 러닝 워크플로를 실행하고 데이터 과학 워크로드를 지원하는 데 필요한 기본 기술을 개발하게 됩니다. Databricks Notebooks를 사용한 기능 엔지니어링과...
이 과정은 세 가지 기본 머신 러닝 배포 전략을 소개하고 각 전략의 Databricks 구현을 설명하기 위해 설계되었습니다. 모델 배포의 기본 사항을 살펴본 후 이 과정에서는 배치 추론을 자세히 살펴보고 고려 사항과 함께 성능 최적화에 대한 배치 추론 시나리오에서 모델...
이 포괄적인 과정은 Databricks에서 전통적인 머신러닝 모델을 개발하는 실용적인 가이드를 제공하며, 널리 사용되는 ML 라이브러리를 활용한 실습 데모와 워크플로우에 중점을 둡니다. 참가자들은 Databricks의 강력한 기능을 활용하면서 회귀 및 클러스터링을 포함...