728x90
반응형

RECAP
- 데이터 마트까지 구성된 데이터를
input vector
라고 부릅니다. (정형화 되어 있는 수치들)
- 이 input vector를 머신러닝 모델에 사용할
feature vector
로 바꾸는 작업이 feature engineering입니다.
- feature vector란 input vector에서 머신러닝 모델이 보아야할 특징(feature)를 정의한 수치값들입니다.
- feature engineering에 따라 머신러닝 모델의 성능이 굉장히 크게 변할 수 있습니다.
- feature engineering을 할 때 체크해야 하는 사항들을 중점적으로 확인해야 합니다.
- feature vector가 표현되는 공간을
feature space
라고 합니다.

- feature engineering을 통해서 input data는 P(performance measure)를 높일 수 있는 좋은 수치정보로 변환이 됩니다.
- 이러한 수치정보(feature vector)를 만드는 방법은
feature extraction algoritm
이라고 합니다.
- 대표적인 feature extraction algorithm에는
PCA(Principal Component Analysis
,AutoEncoder
들이 있습니다.
- 이미지, 텍스트 같은 특정 도메인에 있는 데이터는 해당 도메인의 특성에 맞게 feature extraction 방법들이 발전되어 왔습니다.
- 최근에는 Deep Learning을 사용하여 새롭게 feature를 생성하는
임베딩(Embedding)
방식을 사용합니다.
728x90
반응형
'AI Study > DeepLearning' 카테고리의 다른 글
Chapter.01 머신러닝 기초 개념-07. evaluation metric (0) | 2023.04.14 |
---|---|
Chapter.01 머신러닝 기초 개념-06. loss function (0) | 2023.04.14 |
Chapter.01 머신러닝 기초 개념-06. loss function (0) | 2023.04.11 |
Chapter.01 머신러닝 기초 개념-04. inference (0) | 2023.04.11 |
Chapter.01 머신러닝 기초 개념-03. training (0) | 2023.04.11 |