데이터 엔지니어링 스타터 키트 - 4주차
데이터 엔지니어링 스타터 키트 - 4주차 이번 주의 주제는 ETL/Airflow 소개이다. 드디어 Airflow에 대해 본격적으로 배우는 시간을 갖는다. 그 전에 Airflow를 사용하는 이유라고 할 수 있는 ETL에 대해 맥스님의 경험을 토대로 알아보며 관련 용어들에 대해 설명을 해주셨다. 그리고 Airflow를 사용하며 모르고 사용했을 경우 치명적일 수도 있는 Backfill 방식에 대해 설명해 주셨다. 이번 포스팅에서는 세션에서 다룬 용어 및 Airflow에 대해 간략하게 다뤄보겠다. 데이터 파이프라인이란? ETL: Extract, Transform, Load의 약자 Data Pipeline, Data Workflow, DAG 등의 용어와 호환할 수 있음 Data Source에서 원하는 데이터를 추..
Data Platform/데이터 엔지니어링
2022. 5. 17. 05:10