2014년 1월 2일 목요일

기본적인 ML 개념 - hypothesis

Classification rule은 hypothesis라고도 불리는데, 이것은 input space X를 class label인 Y에 사상시키는 함수를 말한다.
이것이 binary classification problem이라면, x->1 or -1로 사상된다.
기호꼴로 h(x)로 나타낸다.
그래서 h(x)의 부호가 x의 predicted label로 나타나고,
|h(x)| 크기는 그 prediction의 confidence를 나타낸다.

대문자 H는 hypothesis의 class를 말한다. H에 h1(x) 가 속하는 형태라는 것.

그래서 learning algorithm이라는 것은, labeled 된 example들 집합 S를 받아서 hypothesis h included in H 을 출력하는 알고리즘이다.

Combined classifier H(x)는 convex combination of several hypothesis 이다.

H(x) = summation i=1 to T ( ai * hi(x) )
ai가 0보다 크고, ai가 1에서 T까지의 합이 1이라면 각각 hypothesis hi는 base classifier이다.


댓글 없음:

댓글 쓰기