일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Machine Learning
- 지도 학습
- 머신러닝
- AI
- Deep learning
- 데이터 전처리
- CNN
- q-러닝
- 활성화 함수
- 신경망
- 강화 학습
- reinforcement learning
- LSTM
- 정규화
- rnn
- 강화학습
- 차원 축소
- 딥러닝
- 머신 러닝
- 인공지능
- 자연어 처리
- 회귀
- python
- 교차 검증
- 인공 신경망
- 최적화
- Q-Learning
- 손실 함수
- GRU
- 과적합
- Today
- Total
목록머신러닝 (155)
move84
머신러닝 모델은 복잡성이 증가함에 따라 예측 성능은 향상되었지만, 모델의 내부 작동 방식을 이해하기 어려워지는 문제가 발생했다. 이러한 '블랙 박스' 모델의 예측 과정을 이해하기 위한 다양한 시도들이 이루어졌으며, 그중 LIME (Local Interpretable Model-agnostic Explanations)은 모델의 예측 결과를 해석하는 데 널리 사용되는 방법 중 하나이다. 💡 LIME의 기본 개념LIME은 '지역적으로 해석 가능한 모델 독립적인 설명'이라는 의미를 가진다. 이는 특정 데이터 포인트에 대한 모델의 예측을 해당 데이터 포인트 주변의 지역적인 (local) 영역에서 단순한 모델 (예: 선형 모델)을 사용하여 설명하는 방식이다. 여기서 '모델 독립적 (model-agnostic)'이..
📊 서론: 불균형 데이터 문제와 SMOTE머신러닝 모델을 학습시킬 때 데이터의 양과 분포는 모델의 성능에 큰 영향을 미친다. 특히, 특정 클래스의 데이터가 다른 클래스보다 월등히 적은 불균형 데이터 (Imbalanced Data) 문제는 모델의 예측 성능을 저하시키는 주요 원인 중 하나이다. 예를 들어, 희귀 질병 진단, 사기 거래 탐지, 불량품 검출 등 실제 현실 세계에서는 드문 현상을 예측하는 문제에서 불균형 데이터가 자주 발생한다. 이러한 경우, 모델은 다수 클래스 (Majority Class)의 특징을 주로 학습하고, 소수 클래스 (Minority Class)에 대한 예측 정확도는 낮아지는 경향이 있다.이러한 불균형 데이터 문제를 해결하기 위한 다양한 기법들이 존재하며, 그중 가장 널리 사용되는..
📊 머신러닝의 기본: 계층적 클러스터링 탐험계층적 클러스터링(Hierarchical Clustering)은 머신러닝(Machine Learning)의 클러스터링(Clustering) 기법 중 하나로, 데이터를 계층적인 구조로 묶어주는 알고리즘이다. 이 글에서는 계층적 클러스터링의 기본 개념, 작동 방식, 장단점, 그리고 실제 파이썬(Python) 코드를 활용한 예시를 자세히 알아본다.💡 계층적 클러스터링이란?계층적 클러스터링은 데이터를 유사성에 따라 그룹화하는 무감독 학습(Unsupervised Learning) 방법이다. 데이터 포인트 간의 거리를 기반으로, 가장 가까운 데이터 포인트를 묶어 클러스터를 형성하고, 이러한 클러스터들을 점진적으로 병합하여 계층 구조를 만든다. 결과를 덴드로그램(De..
🧠 머신러닝(Machine Learning)은 데이터를 기반으로 학습하고 예측하는 인공지능의 한 분야이다. 클러스터링(Clustering)은 머신러닝의 비지도 학습(Unsupervised Learning) 기법 중 하나로, 데이터들을 유사한 특징을 가진 그룹으로 묶는 기술이다. 이 글에서는 클러스터링의 기본 개념과 대표적인 알고리즘인 K-평균(K-Means) 알고리즘에 대해 자세히 알아보겠다.✨ 클러스터링은 데이터의 숨겨진 패턴을 찾아내고, 데이터를 의미 있는 그룹으로 분류하는 데 사용된다. 이는 고객 세분화, 이상치 탐지, 이미지 분할 등 다양한 분야에서 활용된다.클러스터링의 종류 (Types of Clustering)분할 클러스터링 (Partitioning Clustering): 데이터를 미리 정해..
🤖 시계열 이상 탐지는 시간 순서대로 정렬된 데이터에서 정상적인 패턴에서 벗어나는 값을 식별하는 머신러닝 기법이다. 이 기술은 금융 사기 탐지, 시스템 이상 감지, 의료 모니터링 등 다양한 분야에서 활용된다.📈 시계열 데이터 (Time Series Data)는 시간의 흐름에 따라 수집된 일련의 데이터 포인트이다. 예를 들어, 주식 가격, 서버의 CPU 사용률, 환자 바이탈 사인 등이 있다. 이러한 데이터는 시간에 따른 변화를 분석하여 이상 징후를 파악하는 데 사용된다.용어:시계열 데이터 (Time Series Data)이상 탐지 (Anomaly Detection)🔍 이상 탐지 (Anomaly Detection)는 데이터 내에서 예상되는 정상 패턴에서 벗어나는 이상값을 찾아내는 과정이다. 이러한 이상..