일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 지도 학습
- 활성화 함수
- reinforcement learning
- 최적화
- 정규화
- AI
- 교차 검증
- 신경망
- 인공지능
- Q-Learning
- 회귀
- LSTM
- 데이터 전처리
- CNN
- q-러닝
- 강화학습
- rnn
- Machine Learning
- GRU
- 손실 함수
- 강화 학습
- Deep learning
- 자연어 처리
- 과적합
- 머신 러닝
- 머신러닝
- python
- 차원 축소
- 인공 신경망
- 딥러닝
- Today
- Total
목록이상치 (3)
move84
머신러닝에서 이상치는 일반적인 데이터 패턴에서 벗어난 값으로, 모델의 성능에 큰 영향을 미칠 수 있다. 따라서 이상치를 식별하고 적절하게 처리하는 것은 매우 중요하다. 이 글에서는 이상치의 정의, 탐지 방법, 그리고 처리 방법에 대해 자세히 알아본다.🤔 이상치(Outliers)란 무엇인가?이상치(Outliers)는 데이터 세트 내에서 다른 값들과 현저하게 다른 값을 의미한다. 이러한 값들은 측정 오류, 데이터 입력 오류, 또는 실제 현상의 예외적인 경우로 인해 발생할 수 있다. 이상치는 통계 분석 및 머신러닝 모델의 정확성과 신뢰성을 저해할 수 있으므로, 데이터 분석 과정에서 주의 깊게 다뤄야 한다.정의 (Definition): 데이터 세트에서 다른 관측치들과 멀리 떨어진 값.원인 (Causes): 측..
머신러닝 모델의 성능 향상을 위해 스케일링은 필수적인 전처리 과정입니다. 이 글에서는 스케일링이 왜 필요한지, 그리고 다양한 스케일링 방법들을 살펴보고, 실제 코드 예제를 통해 이해를 돕고자 합니다.🎨 스케일링이 필요한 이유머신러닝 모델은 입력 변수(feature)의 스케일에 민감하게 반응할 수 있습니다. 변수들의 스케일이 다르면 다음과 같은 문제들이 발생할 수 있습니다.모델 성능 저하:특정 변수의 값이 다른 변수보다 훨씬 크면, 모델 학습 시 해당 변수의 영향력이 과도하게 커질 수 있습니다. 예를 들어, 집의 크기(단위: 평방미터)와 건축 연도(단위: 년)를 입력 변수로 사용하는 경우, 집의 크기가 모델 학습에 더 큰 영향을 미칠 수 있습니다.경사 하강법(Gradient Descent) 기반의 모델(..
머신러닝 프로젝트에서 성공적인 결과를 얻기 위해 탐색적 데이터 분석(EDA)은 필수적인 단계이다. EDA를 통해 데이터의 숨겨진 패턴, 이상치, 관계를 파악하고, 모델링에 필요한 정보를 얻을 수 있다. 이 글에서는 효과적인 EDA를 위한 모범 사례를 소개한다.🔍 EDA란 무엇인가? (What is EDA?)탐색적 데이터 분석(EDA)은 데이터 세트를 시각화하고 요약하여 주요 특성을 파악하는 과정이다. EDA는 데이터를 깊이 이해하고, 데이터의 품질을 평가하며, 머신러닝 모델링에 적합한 데이터를 준비하는 데 도움을 준다. EDA는 가설을 세우고, 데이터의 잠재적 문제점을 발견하며, 후속 분석 방향을 결정하는 데 중요한 역할을 한다. 📊 EDA 모범 사례 (Best Practices for EDA)데이터..