728x90 반응형 KNN3 [머신러닝] 데이터 전처리 개념과 예제 #2 개발 환경 --------------------------------- OS : Mac 개발 툴 : colab 개발 언어 : python --------------------------------- 지난 포스팅에 이어 데이터 전처리 예제를 다뤄보겠다. https://jpointofviewntoe.tistory.com/13 표준편차와 표준점수를 계산해보자 계산하는 방법은 데이터에서 평균을 빼고 표준편차를 나누어주면 된다. np.mean() 함수는 평균을 계산하고 np.std() 함수는 표준편차를 계산한다. 특성마다 값의 스케일이 다를 경우엔 평균과 표준편차를 각 특성별로 계산해야한다. 이를 위해 axis = 0 으로 셋팅했다. 이렇게 하면 행을 따라 열의 통계값을 셋팅한다. mean = np.mean(tr.. 2023. 3. 12. [머신러닝]K-최근접 이웃 알고리즘 - 예제 개발 환경 --------------------------------- OS : Mac 개발 툴 : colab 개발 언어 : python --------------------------------- 이번 포스팅에서는 K-최근접 이웃 알고리즘 예제다. 아래 링크는 K-최근접 이웃 알고리즘 개념이다. 한번 읽고 예제를 보는 것이 도움될 것 같다. https://jpointofviewntoe.tistory.com/127 이번 포스팅을 포함하여 한동안은 사이킷 런 패키지에 대한 글을 다룰것이다. k-최근접 이웃 알고리즘은 사이킷런 패키지에서 구현한 KNeighborClassifier 클래스이다. 1. KNeighborClassifier 클래스를 import한다. from sklearn.neighbors impo.. 2023. 3. 10. K-최근접 이웃 알고리즘 개념 정리하기 K-최근접 이웃(K-Nearest Neighbor)은 머신러닝에서 사용되는 분류(Classification) 알고리즘이며 가장 간단한 머신러닝 알고리즘이다. 훈련 데이터셋을 그냥 저장하는 것이 모델을 만드는 과정의 전부고 유사한 특성을 가진 데이터는 유사한 범주에 속하는 경향이 있다는 가정하에 사용한다 k-최근접 이웃 알고리즘은 n개의 특성을 가진 데이터는 n차원의 공간에 점으로 개념화 할 수 있다. K-최근접 이웃(K-Nearest Neighbor) 그림 예제 간단한 그림을 그려보았다. 그림을 상세히 그리지 않았는데 대충 눈에만 안보이는 x축의 특성 수치와 y축의 특성 수치가 있다고 봅시다. 노랑점과 파랑점으로 표시하여 분류를 나타냈으며 빨간별은 아직 분류가 되지 않은 새로운 데이터이다. k-최근접 이.. 2023. 3. 10. 이전 1 다음 728x90 반응형