일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 손실 함수
- 딥러닝
- 지도 학습
- CNN
- 데이터 전처리
- Deep learning
- 머신러닝
- GRU
- q-러닝
- 회귀
- 교차 검증
- Machine Learning
- 활성화 함수
- 과적합
- 최적화
- 인공 신경망
- reinforcement learning
- python
- 정규화
- LSTM
- AI
- 머신 러닝
- 강화 학습
- 자연어 처리
- 인공지능
- 차원 축소
- 강화학습
- 신경망
- Q-Learning
- rnn
- Today
- Total
목록데이터 불균형 (2)
move84
머신러닝 프로젝트에서 성공적인 결과를 얻기 위해 탐색적 데이터 분석(EDA)은 필수적인 단계이다. EDA를 통해 데이터의 숨겨진 패턴, 이상치, 관계를 파악하고, 모델링에 필요한 정보를 얻을 수 있다. 이 글에서는 효과적인 EDA를 위한 모범 사례를 소개한다.🔍 EDA란 무엇인가? (What is EDA?)탐색적 데이터 분석(EDA)은 데이터 세트를 시각화하고 요약하여 주요 특성을 파악하는 과정이다. EDA는 데이터를 깊이 이해하고, 데이터의 품질을 평가하며, 머신러닝 모델링에 적합한 데이터를 준비하는 데 도움을 준다. EDA는 가설을 세우고, 데이터의 잠재적 문제점을 발견하며, 후속 분석 방향을 결정하는 데 중요한 역할을 한다. 📊 EDA 모범 사례 (Best Practices for EDA)데이터..
머신러닝 모델의 성능은 훈련 데이터의 품질에 크게 의존한다. 현실 세계의 데이터는 종종 불균형하게 분포되어 있으며, 특히 머신러닝 모델이 특정 클래스를 제대로 예측하지 못하는 '데이터 불균형 (Data Imbalance)' 문제는 매우 흔하게 발생한다. 이 글에서는 데이터 불균형 문제의 개념과 이를 해결하기 위한 리샘플링 기법(Resampling Techniques)에 대해 알아본다. 💡 데이터 불균형이란?데이터 불균형은 머신러닝 데이터셋에서 각 클래스(또는 레이블)에 속하는 데이터의 양이 현저하게 차이가 나는 현상을 의미한다. 예를 들어, 사기 거래 탐지 모델을 훈련한다고 가정해 보자. 대부분의 거래는 정상 거래이지만, 소수의 거래가 사기 거래일 것이다. 이 경우 정상 거래 데이터는 압도적으로 많고,..