본문 바로가기

지도학습

k-최근접 이웃 알고리즘 #k-Nearest Neighbors #k최근접 이웃 알고리즘 #분류 #예측 #회귀 #비모수 #머신러닝 #기계학습 #비지도학습 #지도학습 #KNN k-최근접 이웃 알고리즘(k-Nearest Neighbors, k-NN)은 분류나 회귀에 사용되는 비모수 방식이다. 두 경우 모두 입력이 특징 공간 내 k개의 가장 가까운 훈련 데이터로 구성되어 있다. 출력은 k-NN이 분류로 사용되었는지 또는 회귀로 사용되었는지에 따라 다르다. ● k-NN 분류에서 출력은 소속된 항목이다. 객체는 k개의 최근접 이웃 사이에서 가장 공통적인 항목에 할당되는 객체로 과반수 의결에 의해 분류된다(k는 양의 정수이며 통상적으로 작은 수). 만약 k = 1 이라면 객체는 단순히 하나의 최근접 이웃의 항목에 할당된다. ● k-NN 회귀.. 더보기
데이터 마이닝, 머신러닝(기계학습) 머신러닝(기계 학습, Machine Learning)과 데이터 마이닝(Data Mining)은 종종 같은 방법을 사용하며 상당히 중첩된다. 머신러닝(기계 학습)은 훈련 데이터를 통해 학습된 알려진 속성을 기반으로 예측에 초점을 두고 있다. 데이터마이닝은 데이터의 미처 몰랐던 속성을 발견하는 것에 집중한다. 이는 데이터베이스의 지식발견 부분의 분석 절차에 해당한다. 데이터 마이닝 데이터 마이닝(data mining)은 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 것이다. 다른 말로는 KDD(데이터베이스 속의 지식 발견, knowledge-discovery in databases)라고도 일컫는다. 데이터 마이닝은 통계학에서 패턴 인식에 이르는 다양한 계량 기법을 사용한.. 더보기