지도 학습
지도 학습은 정답(레이블(label))을 컴퓨터에 미리 알려 주고 데이터를 학습시키는 방법 지도 학습에는 분류와 회귀가 있음
분류(classification)는 주어진 데이터를 정해진 범주에 따라 분류
회귀(regression)는 데이터들의 특성(feature)을 기준으로 연속된 값을 그래프로 표현하여 패턴이나 트렌드를 예측할 때 사용
K-최근접 이웃(K-nearest neighbor KNN)
K-최근접 이웃(K-nearest neighbor)은 새로운 입력(학습에 사용하지 않은 새로운 데이터)을 받았을 때 기존 클러스터 에서 모든 데이터와 인스턴스(instance) 기반 거리를 측정한 후 가장 많은 속성을 가진 클러스터에 할당하는 분류 알 고리즘 즉, 과거 데이터를 사용하여 미리 분류 모형을 만드는 것이 아니라, 과거 데이터를 저장해 두고 필요할 때마다 비교 를 수행하는 방식 K 값의 선택에 따라 새로운 데이터에 대한 분류 결과가 달라질 수 있음에 유의해야 함