2013년 12월 26일 목요일

m-cross validation

m-cross validation: 
m개의 subset으로 나누고, m-1개를 가지고 training, 나머지 1개로 validation
이것을 한번씩 번갈아 가며 수행하고, m번으로 평균을 계산한다.


이것을 하는 목적은, 해당 만들어낸 모델이 얼마나 데이터 셋과 무관하게 얼마나 잘 예측을 할 것인지 평가하기 위한 것이다. Predictive model이 실제 환경에서 얼마나 성능이 좋은지 보고자 하는 것

Overfitting

Overfitting문제

Supervised learning을 통해 만들어진 시스템이 학습 데이터 내에서는 데이터 분류를 매우 잘 하지만, 새로운 데이터에서는 그 분류 성능이 많이 떨어지는 상황을 말한다.

보통 그 이유는 학습을 너무 많이 했거나, 지나친 튜닝을 했거나, 데이터 셋이 편향되어 있거나 등이 있다. 데이터를 가지고 만든 모델과 시스템에서의 오버피팅은 어쩔 수 없는 문제.


따라서 가능한 많은 데이터를 가지고 학습을 하여 unseen data의 범위를 좁히거나, cross validation을 많이 하여 보다 general model을 도출하거나, 여러 개의 model을 가지고 비교하거나 하면된다.

2013년 2월 18일 월요일

플렉스터 m5 PRO 128G SSD 설치~

내 오래된 노트북에 새로운 뭔가가 필요하다고 생각되어
그렇게 소문이 대단한 SSD를 장만하게 되었다.


그게 바로 요놈. 플렉스터 M5 PRO 128G이다.
사실 나도 이 브랜드는 잘 모르지만 평이 괜찮고, 워런티 기간이 5년이라는 거에 귀가 팔랑팔랑대서 그만..


이게 개봉하고 난 뒤의 모습. 오른쪽의 때깔좋은 메탈재질의 썸띵이 바로 SSD

설치하는 건 생각보다 간단했다. 노트북 뒤판에 하드부분 나사만 풀고, hdd를 ssd로 바꿔주기만 하면되는거니까.

이게 장착된 모습. 디자인 잘빠졌다.

사용해보니 hdd보다 가벼움에 놀랐고, 조용한 것에 놀랐다.
그리고 성능도 괜찮은듯 하였으나...



거의 모든 영역에서 기준치의 반토막과 같은 모습이었다.
처음에는 내 SSD가 불량인가? 싶었지만 알고보니 내 노트북의 성능과 메인보드가 sata2 방식이기 때문이라는거 ㅠㅠㅠ

그렇지만 체감상으로는 굉장히 빠른것을 느꼈기에 만족하고 있다.
큰 탈이 없기를...