기본 콘텐츠로 건너뛰기
# ML : Multiple Features
1. Multivariate linear regression
- 이제까지는 하나의 변수만 영향을 주는 경우에 대해서만 고민해왔다.
- "하지만, 실제 데이터는 절대로 '하나의 변수에 대해서만' 영향을 받지 않는다!"
- 위의 예시만 보더라도 총 4개의 변수(x)가 가격(y)에 영향을 준다.
- n : 변수의 갯수. 여기서는 4개가 되겠지
- x(i) : i번째 인덱스의 값(들)을 나타낸다
- 예시) x(2)인 경우 위에서는 1416, 3, 2, 40이 된다.
- xj(i) : i번째 인덱스의 j 번째 데이터 값을 나타낸다.
- 예시) x1(2)인 경우 위에서는 1416이 된다.
2. Hypothesis function
- 하나의 변수에 대한 가설의 경우에는 굉장히 간단했다.
- 하지만, 변수가 여러 개 존재하게 되면?
- 말 그대로 '대놓고 불가능'
- 우리는 다음과 같은 새로운 식을 유도할 수 있게 된다.
- hθ(x)=θ0+θ1x1+θ2x2+θ3x3+⋯+θnxn
- 총 n+1 개의 변수가 존재하게 될 경우, 0번째 x0은 1로 설정할 수 있다. 이는 linear algebra 계산에서 각 변수가 matrix 형태로 존재해야 하기 때문에 설정한다.
- 각 변수 X, θ를 벡터로 만들었을 때, 각각의 벡터는 n+1개의 데이터를 갖게 된다.
- X, θ는 각각 벡터가 되고, 벡터는 벡터끼리 곱할 수 없기 때문에 θ의 값을 Transpose 해야 한다.
- 이로 인해 최종적으로 만들어지는 식은 다음과 같다.
- 이것이 바로 Multivariate linear regression 이라고 부르는 식이다.
- 사실 내용이 어려운 것은 아니고, 가설이 바뀌면서 인자의 값들이 n+1 행렬로 바뀌었다.
3. Multiple Variables
- 변수가 많아졌다 = Gradient Descent의 θ값이 많아졌다.
- 살짝 정리해서 표현하면 다음과 같다.
- 결국 각각 simultaneously하게 update해야 하는 개체 수만 증가했다고 보면 된다.
- 여담으로 미분해서 직접 계산해보라고 하시던데.. 나 미분이 잘 기억이안나.. 어떡하지;
댓글
댓글 쓰기