이번 포스팅에선 머신러닝 파이프라인에 대해 알아보도록 하겠습니다.
머신러닝 파이프라인은 학습 데이터를 수집하는 것 ~ 모델에 대한 피드백을 받는 것까지의 단계까지를 말하는데, 이를 life cycle이라고도 한다고 합니다.
머신러닝 모델을 개발하는 Researcher는 최대한 모델의 개발에만 집중할 수 있게 이 외의 모든 과정을 자동화하는 것이 서비스를 제공하는 입장에서 매우 중요합니다. 또한, 양질의 데이터가 많을수록 성능이 좋아지는 머신러닝 모델의 특성 상 데이터를 검증하고, 전처리하여 모델을 재학습시키는 과정을 자동화시킬 필요가 있습니다.
머신러닝 파이프라인의 흐름을 표현하면 아래 그림과 같습니다.
각 단계가 의미하는 바가 무엇인지, 각 단계가 필요한 이유가 무엇인지 간단히 보도록 하겠습니다.
출처 : 인프런 머신러닝 엔지니어 실무 - 링크
[내가 한 거 기록하는 Docker]03. Dockerfile (0) | 2021.07.27 |
---|---|
[내가 한 거 기록하는 Docker]02. 도커 이미지와 docker hub? (0) | 2021.07.24 |
[내가 한 거 기록하는 Docker]01. 도커 설치 (0) | 2021.07.23 |
[머신러닝 엔지니어 실무]01. 머신러닝 파이프라인의 이해 1 (1) | 2021.07.20 |
댓글 영역