수학적 직관과 모델의 제약 (현업 활용기)
새싹반 피드백: 선형대수, 기하학, 그리고 차원축소
당신은 추천 알고리즘 엔지니어입니다.
$\mathbf{u}^T \mathbf{m}_B = (4 \times 5) + (1 \times 0) + (3 \times 1) = \mathbf{23}$
$\mathbf{u}^T \mathbf{m}_C = (4 \times 2) + (1 \times 2) + (3 \times 4) = \mathbf{22}$
결론: 내적 값이 더 큰 영화 B 추천!
2차원 공간의 데이터 점 $\mathbf{x} = [3, 4]^T$가 있습니다.
1. 이 벡터의 L2 Norm과 L1 Norm을 각각 계산하세요.
2. 우리가 아는 물리적 '최단 거리(직선 거리)'에 적합한 Norm은 무엇일까요?
L2 Norm: $\sqrt{3^2 + 4^2} = \sqrt{25} = \mathbf{5}$ (물리적 최단 거리)
L1 Norm: $|3| + |4| = \mathbf{7}$
두 가지 가중치 모델이 있습니다. (학습 오차는 동일함)
모델 X 가중치: $\mathbf{w}_X = [1, 1, 1]$
모델 Y 가중치: $\mathbf{w}_Y = [3, 0, 0]$
1. 두 모델의 L1 합과 L2 제곱합을 각각 계산하세요.
2. 모델에 L2 규제 알고리즘을 썼을 때, $\mathbf{w}_X$를 선호하는 이유는?
L1 은 둘 다 3. 하지만 L2 제곱합은 $X = 1^2+1^2+1^2 = \mathbf{3}$, $Y = 3^2 = \mathbf{9}$
정답: 한 변수에만 극단적으로 의존하는 Y는 L2 Penalty(9) 폭탄을 맞습니다. L2는 모든 데이터를 고르게 반영하는 안정적 모델(X)을 선호합니다!
질문이 있으신가요? 🙋♂️