머신러닝 기초 피드백

머신러닝 입문 피드백

새싹반 모델링 기초 과정

Q. MAE(절댓값) 대신 왜 기꺼이 오차를 '제곱'하는 MSE를 주로 쓸까요?
(힌트: 미분 가능성, 큰 오차에 대한 강한 패널티)

우리의 모델은 도대체 무엇을 하면 좋을까요?

수많은 데이터 점들 사이에서, 과연 어떤 선(모델)이 가장 훌륭한 선일까요?

"모든 머신러닝 모델이 바라는 단 한 가지는,

현실의 데이터 분포를 가장 완벽하게 예측(모방)하는 것"

미분을 활용해 오차(Loss) 곡면을 따라 최소점(최적해)으로 하강
각 단계마다 기울기의 반대 방향으로 가중치 업데이트
$$ w_{new} = w_{old} - \boldsymbol{\alpha} \frac{\partial L}{\partial w} $$
학습률($\boldsymbol{\alpha}$, Learning Rate): 한 번의 업데이트마다 이동할 보폭

전체 데이터(Full Batch): 1 Step 계산이 무겁고, Local Minimum에 빠지기 쉬움
미니 배치(Mini-Batch): 전체 데이터를 잘게 쪼개서 모델에 조금씩 입력하는 방식
- 계산 속도가 빠름
- 지그재그(Noise) 이동이 고립된 곡면(Local Minimum) 탈출을 도움

분류(Classification) 문제에서 선형 회귀를 쓰면 생기는 일

한계 1. 이상치(Outlier) 취약성:
극단적 수치를 가진 데이터 하나가 합격 선(Threshold) 전체를 왜곡시킵니다.
한계 2. 값의 결과 범위($-\infty \sim \infty$):
결과값이 끝없이 뻗어 나가므로 이를 우리가 원하는 '0~1 사이의 확률'로 해석할 길이 없습니다.

확률 대신 승산(Odds): $Odds = \frac{p}{1-p}$ (실패 확률 대비 성공 확률의 비율)
예) 합격 확률($p$)이 $80\%$라면, $Odds = \frac{0.8}{0.2} = 4$ (합격 가능성이 불합격보다 4배 높음)
승산(Odds) 역시 그 범위가 $0 \sim \infty$라서 여전히 음수값을 갖는 선형 회귀($-\infty \sim \infty$)에 대응시킬 수 없습니다.
Log Odds: 여기에 $\log$를 씌우면 값의 범위가 드디어 $(-\infty, \infty)$로 무한히 확장됩니다!

$$ \frac{p}{1-p} = e^{WX + b} \quad \Rightarrow \quad p = \frac{e^{WX + b}}{1 + e^{WX + b}} $$

$$ p = \frac{1}{1 + e^{-(WX + b)}} $$

로지스틱 손실 함수 (이진 크로스 엔트로피 / BCE): 모델 확률 예측에 대한 진짜 오차 공식입니다. (정답 $y$가 0일 때와 1일 때 작동식이 다름)

$$ Loss(BCE) = - \frac{1}{n} \sum_{i=1}^{n} \left[ y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right] $$

$$ Loss(CE) = - \frac{1}{n} \sum_{i=1}^{n} \sum_{k=1}^{C} y_{i,c} \log(\hat{y}_{i,c}) $$