운동하는 공대생

K-Mean Clustering ( K- 평균 군집화) 본문

Machine Learning

K-Mean Clustering ( K- 평균 군집화)

운동하는 공대생 2022. 8. 16. 14:17
728x90
반응형
  • 정의

k-평균 알고리즘(K-means clustering algorithm)은 먼저 데이터를 분류하는 군집화 방식중 하나로 간단하게 군집화가 가능한 방식이다.   Clustring 하고 싶은 군집화의 수에 따라 중심점을 지정하고 그 중심점들(Centroids)에서 데이터들 사이의 평균 거리를 이용하는 방식이다. 이후 군집화 수에 따라 데이터를 분류하고 분류된 군집에서 다시 중심점을 정하는 방식으로 알고리즘을 수행한다. 

분산 공식

위의 알고리즘 공식처럼 데이터(x) 와 중심점(u) 의 분산(v) 를 최소화 시키는 것이 이 알고리즘의 방식이다. 

 

 

  • 구현 순서

 

  • 군집화 수 정하기

K-Mean 군집화 방식을 사용하려면 자신이 분류하고자 하는 군집의 수를 지정을 해주어야한다. 

 

-Elbow method 

이전에 설명했던 분산과 군집의 수를 기준으로 시각화를 했을경우 분산의 감소 비율이 적어지는 시점을 Elbow로 지정한다. 그래서 이 지점의 값을 k (군집의 수)값으로 지정한다.

728x90
반응형

'Machine Learning' 카테고리의 다른 글

MLOps 이란?  (0) 2022.10.26
Synthetic Data(합성 데이터)  (0) 2022.10.14
LightGBM Theory  (0) 2022.09.22
XGBoost Theory  (0) 2022.08.20
Time Series Analysis(시계열 분석)  (0) 2022.08.18
Comments