ML 로 문제 표현하기 (프레이밍)

용어

라벨은 예측하는 항목입니다(단순 선형 회귀의 y 변수). 밀의 향후 가격, 사진에 표시되는 동물의 종류, 오디오 클립의 의미 등 무엇이든지 라벨이 될 수 있습니다.

특성은 입력 변수입니다(단순 선형 회귀의 x 변수). 간단한 머신러닝 프로젝트에서는 특성 하나를 사용하지만 복잡한 머신러닝 프로젝트에서는 다음과 같이 수백만 개의 특성을 사용할 수 있습니다.

모델은 특성과 라벨의 관계를 정의합니다

•

학습은 모델을 만들거나 배우는 것을 의미합니다. 즉 라벨이 있는 예를 모델에 보여 주고, 모델이 특성과 라벨의 관계를 점차적으로 학습하도록 합니다

•

추론은 학습된 모델을 라벨이 없는 예에 적용하는 것을 의미합니다. 즉 학습된 모델을 사용하여 유용한 예측(y')을 해냅니다. 예를 들어, 추론하는 동안 라벨이 없는 새로운 예로 medianHouseValue를 예측할 수 있습니다.

회귀모델은 연속적인 값을 예측한다

•

캘리포니아의 주택 가격이 얼마인가요?

•

사용자가 이 광고를 클릭할 확률이 얼마인가요?

분류모델은 불연속적인 값을 예측한다.

•

주어진 이메일 메시지가 스팸인가요, 스팸이 아닌가요?

•

이 이미지가 강아지, 고양이 또는 햄스터의 이미지인가요?

모델을 학습시키려면 라벨이 있는 예를 사용하세요. 스팸 감지 예에서 라벨이 있는 예는 사용자가 명시적으로 '스팸' 또는 '스팸 아님'으로 표시한 개별 이메일입니다.

라벨이 있는 예로 모델을 학습시킨 다음 해당 모델을 사용하여 라벨이 없는 예의 라벨을 예측합니다. 스팸 감지 예에서 라벨이 없는 예는 사람이 라벨을 지정하지 않은 새 이메일입니다.