728x90
๋ฐ์ํ
๐ก
๋ถ๋ฅ(classification) : ์ฃผ์ด์ง ๋ฐ์ดํฐ(X)๋ฅผ ๋ถ๋ฅํ๊ณ ์ ํ๋ ๊ฐ(y)์ ํ ๋นํ๋ ๋ฐฉ๋ฒ.

Definition (from Wiki)
โApplications in which the training data comprises examples of the input vectors along with their corresponding target vectors are known as supervised learning problems. Cases in which the aim is to assign each input vector to one of a finite number of discrete categories, are called classification problems.โ
- ๋ถ๋ฅ๋, ์ฃผ์ด์ง input data๋ฅผ ์ฐพ๊ณ ์ ํ๋ target value์ assignํ๋ ๊ฒ์ ๋งํฉ๋๋ค.
- input data๋ ์ผ๋ฐ์ ์ผ๋ก ๋ฒกํฐ ์ด๋ฉฐ, (feature vector) target value๋ ์ผ๋ฐ์ ์ผ๋ก scalar์ ๋๋ค. (integer)
- ๋น์ทํ ํน์ง์ ๊ฐ์ง๋ ๋ฐ์ดํฐ๊ฐ ๊ฐ์ ๋ถ๋ฅ๋ก ๋๋์ด์ง๋ ๊ฒ์ ์๋ก ์๋์ ์ผ๋ก ๊ฐ๊น์ด feature vector๋ค์ด ๊ฐ์ target value๋ฅผ ๋ถ์ฌ๋ฐ๋ ๊ฒ์ ๋๋ค.
- ์๋ฅผ ๋ค์ด, ๊ณ ์์ด์ ๊ฐ์์ง ์ฌ์ง์ด ์์ฌ์๋ 2000์ฅ์ ์ด๋ฏธ์ง๊ฐ ์๋ค๊ณ ์นฉ์๋ค. (๊ณ ์์ด ์ฌ์ง์ด 1000์ฅ, ๊ฐ์์ง ์ฌ์ง์ด 1000์ฅ์ ๋๋ค.)

- ์์ ์ ๋๋ฉ์ด์ ์ฒ๋ผ, ๊ณ ์์ด ์ฌ์ง์ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ด ํ๋จํด์ โCatโ์ด๋ผ๊ณ Label์ ๋ถ์ฌํฉ๋๋ค.
- ์ฌ๊ธฐ์ ๋ผ๋ฒจ์ 0 ๋๋ 1๋ก ํ๊ธฐํ๋ ๊ฒ์ด ์ผ๋ฐ์ ์ ๋๋ค. e.g. Cat(0), Dog(1)
- ์ฃผ์ด์ง ์ด๋ฏธ์ง๋ feature vector๋ก ํํ์ด ๋ฉ๋๋ค.
- ๋จธ์ ๋ฌ๋ ๋ถ๋ฅ ๋ชจ๋ธ์ ๊ฑฐ์น๋ฉด, inference ๊ฒฐ๊ณผ๋ก 0 ๋๋ 1์ด ๋์ค๋๋ก ํ๋ ๋ฌธ์ ๋ฅผ โ
binary classification
์ด๋ผ๊ณ ํฉ๋๋ค.
- ์์ 2000์ฅ์ ๋ชจ๋ label์ด ์ด๋ฏธ ์์ด์ผ ํ๋ฉฐ(supervised manner) ํด๋น label์ ํตํด์ inference ๊ฒฐ๊ณผ๊ฐ ๋ง์๋์ง ์๋์ง๋ฅผ ํ์ธํ ์ ์์ต๋๋ค.
- ์ด ๋ ๋จธ์ ๋ฌ๋ ๋ถ๋ฅ ๋ชจ๋ธ์๋ ๋ค์๊ณผ ๊ฐ์ ๋ชจ๋ธ๋ค์ด ์์ต๋๋ค.
Classification Model
- Linear Classifier
- Logistic Regression
- Naive Bayes
- KNN
- SVM
- Random Forest
- Neural Network
728x90
๋ฐ์ํ