어느새 마지막 주차가 되었다. 이번 주차에서는 Airflow를 운영하는 관점에서 필요할만한 개념들과 함께 이 스터디 이후에 무엇을 공부하면 좋을지와 앞으로 데이터 엔지니어의 커리어와 관련한 이야기를 해주셨다. 오늘은 전반적인 내용에 대해 간략하게 정리하는 느낌으로 포스팅을 해보겠다.
dag_second_assignment = DAG(
dag_id = 'second_assignment_v4',
start_date = datetime(2022,5,12), # 날짜가 미래인 경우 실행이 안됨
schedule_interval = '0 2 * * *', # 적당히 조절
max_active_runs = 1,
catchup = False,
default_args = {
'retries': 1,
'retry_delay': timedelta(minutes=3),
'on_failure_callback': slack.on_failure_callback,
}
)
하필 일이 바빠지는 시기였기에 원하는 만큼 복습과 과제를 수행하지는 못했지만 프로젝트를 수행하며 SQL과 Airflow를 사용하기에 스터디에서 배운 내용을 나름대로 바로바로 적용할 수 있어서 그런 측면에서는 매우 유익한 스터디였다. 한편으로는 이 스터디를 안했으면 많이 헤맸을것 같다는 아찔한 생각도 들었다.
기술적으로 Data Warehouse를 만들기 위한 SQL, Airflow와 함께 여러 관련 개념들을 정리할 수 있어서 좋았다. 그리고 현재 데이터 엔지니어로 일을 하고 있는데 사실 직무에 대한 정리가 잘 되지 않은 채로 일하고 있었다. 이번 과정을 통해 데이터 엔지니어가 무엇인지에 대해 정리해 볼 수 있었고, 기술적인 것 뿐만 아니라 커리어적으로도 여러 정리를 잘 해주셔서 앞으로의 커리어에 도움이 많이 될것 같다.
[AWS] Airflow 설치 - Rocky Linux (0) | 2022.06.07 |
---|---|
데이터 엔지니어링 스타터 키트 - 6주차 (0) | 2022.05.30 |
데이터 엔지니어링 스타터 키트 - 5주차 (0) | 2022.05.22 |
데이터 엔지니어링 스타터 키트 - 4주차 (0) | 2022.05.17 |
데이터 엔지니어링 스타터 키트 - 3주차 (0) | 2022.05.08 |
댓글 영역