일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 회귀
- 인공지능
- 신경망
- 머신러닝
- rnn
- 손실 함수
- GRU
- 인공 신경망
- 자연어 처리
- 강화학습
- q-러닝
- 머신 러닝
- 활성화 함수
- 차원 축소
- Machine Learning
- 데이터 전처리
- reinforcement learning
- Q-Learning
- LSTM
- 교차 검증
- 정규화
- 과적합
- AI
- 지도 학습
- 딥러닝
- 최적화
- python
- Deep learning
- CNN
- 강화 학습
- Today
- Total
목록K-최근접 이웃 (4)
move84
K-최근접 이웃(KNN) 알고리즘은 지도 학습의 한 종류로서, 분류(Classification) 및 회귀(Regression) 문제에 널리 사용된다. 이 알고리즘은 새로운 데이터 포인트가 주어졌을 때, 기존 데이터에서 가장 가까운 K개의 이웃을 찾아 그들의 속성을 기반으로 새로운 데이터의 속성을 예측한다. KNN은 이해하기 쉽고 구현이 간단하다는 장점을 가지며, 복잡한 모델을 학습하기 전에 시도해볼 수 있는 좋은 기준 모델(Baseline Model)이 된다.✨ KNN 알고리즘의 기본 개념 (Basic Concepts of KNN)KNN 알고리즘은 매우 직관적이다. 새로운 데이터 포인트가 주어지면, 알고리즘은 기존의 모든 데이터 포인트와의 거리를 계산한다. 그 후, 가장 가까운 K개의 데이터 포인트를 선..
🧠 인스턴스 기반 학습 방법 소개인스턴스 기반 학습 (Instance-Based Learning)은 기계 학습의 한 종류로, 훈련 데이터를 단순히 저장하고 새로운 데이터 포인트가 주어질 때 유사한 인스턴스를 찾아 예측을 수행하는 방식이다. 이 방법은 모델을 명시적으로 학습하는 대신 훈련 데이터를 활용하여 예측을 수행하므로, '게으른 학습 (Lazy Learning)'이라고도 불린다. 주요 특징은 다음과 같다:게으른 학습 (Lazy Learning): 훈련 단계에서 모델을 구축하지 않고, 예측 시점에 데이터를 처리한다.비모수적 (Non-parametric): 데이터에 대한 어떠한 가정도 하지 않으며, 데이터 자체에 의존한다.메모리 기반 (Memory-Based): 훈련 데이터를 메모리에 저장하여 사용한다..
머신러닝 세계에서 모델은 크게 모수적(parametric) 모델과 비모수적(non-parametric) 모델로 나뉩니다. 이번 블로그 글에서는 비모수적 모델에 대해 자세히 알아보고, 그 특징과 사용 예시를 살펴봅니다.🤔 비모수적 모델이란 무엇인가? (What are Non-Parametric Models?)모수적 모델은 데이터에 대한 특정 가정을 기반으로 하며, 고정된 수의 매개변수(parameters)를 사용합니다. 예를 들어, 선형 회귀(linear regression)는 선형 관계를 가정하고 기울기와 절편과 같은 매개변수를 학습합니다. 반면, 비모수적 모델은 데이터에 대한 어떠한 사전 가정도 하지 않으며, 모델의 복잡성이 데이터의 양에 따라 유연하게 변합니다. 즉, 매개변수의 수가 고정되어 있지 ..
📊 서론: 불균형 데이터 문제와 SMOTE머신러닝 모델을 학습시킬 때 데이터의 양과 분포는 모델의 성능에 큰 영향을 미친다. 특히, 특정 클래스의 데이터가 다른 클래스보다 월등히 적은 불균형 데이터 (Imbalanced Data) 문제는 모델의 예측 성능을 저하시키는 주요 원인 중 하나이다. 예를 들어, 희귀 질병 진단, 사기 거래 탐지, 불량품 검출 등 실제 현실 세계에서는 드문 현상을 예측하는 문제에서 불균형 데이터가 자주 발생한다. 이러한 경우, 모델은 다수 클래스 (Majority Class)의 특징을 주로 학습하고, 소수 클래스 (Minority Class)에 대한 예측 정확도는 낮아지는 경향이 있다.이러한 불균형 데이터 문제를 해결하기 위한 다양한 기법들이 존재하며, 그중 가장 널리 사용되는..