728x90
반응형

RECAP

  • 데이터 마트까지 구성된 데이터를 input vector라고 부릅니다. (정형화 되어 있는 수치들)
  • 이 input vector를 머신러닝 모델에 사용할 feature vector로 바꾸는 작업이 feature engineering입니다.
  • feature vector란 input vector에서 머신러닝 모델이 보아야할 특징(feature)를 정의한 수치값들입니다.
  • feature engineering에 따라 머신러닝 모델의 성능이 굉장히 크게 변할 수 있습니다.
  • feature engineering을 할 때 체크해야 하는 사항들을 중점적으로 확인해야 합니다.
  • feature vector가 표현되는 공간을 feature space라고 합니다.
  • feature engineering을 통해서 input data는 P(performance measure)를 높일 수 있는 좋은 수치정보로 변환이 됩니다.
  • 이러한 수치정보(feature vector)를 만드는 방법은 feature extraction algoritm이라고 합니다.
  • 대표적인 feature extraction algorithm에는 PCA(Principal Component Analysis, AutoEncoder들이 있습니다.
  • 이미지, 텍스트 같은 특정 도메인에 있는 데이터는 해당 도메인의 특성에 맞게 feature extraction 방법들이 발전되어 왔습니다.
  • 최근에는 Deep Learning을 사용하여 새롭게 feature를 생성하는 임베딩(Embedding) 방식을 사용합니다.
728x90
반응형

+ Recent posts