AI

학습 데이터의 분포란?

시 내 2024. 4. 7. 19:36

학습 데이터의 분포란,
우리가 모델을 학습시키기 위해 사용하는 데이터가 어떤 특성을 가지고 있는지, 그리고 데이터 포인트들이 어떻게 퍼져있는지를 나타내는 것입니다.

예시:

만약 당신이 사과와 오렌지를 구분하기 위한 모델을 만들고자 한다면, 학습 데이터는 사과 이미지와 오렌지 이미지로 구성됩니다.

여기서, 사과 이미지들은 "사과 데이터 분포"를, 오렌지 이미지들은 "오렌지 데이터 분포"를 형성합니다.

각각의 데이터 분포는 그 과일의 색깔, 모양, 크기 등과 같은 특징들을 반영합니다.