728x90
반응형

선형대수학

💡
벡터 : 숫자의 나열, 숫자들의 묶음 x = (1,2,3)

x = (1, 2, 3), y = (4, 3, 1)

  • 벡터의 연산 : x + y = (5, 5, 4) // x - y = (-3, -1, 2) // 3 * x = (3, 6, 9)
  • 벡터의 특징 : 원소값, 방향(상대적위치)
  • 벡터의 차원 : 원소의 갯수
  • 벡터의 크기 (norm) : 벡터의 모든 원소를 제곱하고 다 더한뒤, 루트를 씌워준 값. → 원점과의 거리
  • 백터공간 (Vector Space) : 벡터가 정의되는 집합. 연산, 차원, 기저(basis)(=축) …

통계

💡
기술통계량 (descriptive statistics): 데이터에서 측정할 수 있는 요약된 수치값들
  • 평균 : 모든 데이터의 값을 더한 다음 갯수로 나누는 값
  • 분산 : 데이터의 퍼진 정도, 각 데이터에서 평균을 뺀 값을 제곱해서 다 더한 뒤 데이터 개수로 나눈 값
  • 표준편차 : 분산의 양의 제곱근.
  • 중앙값 : 오름차순으로 정렬을 했을 때 한 가운데 있는 값. e.g 1 2 3 4 6 중앙값 3, 평균은 3보다 조금 큼 e.g. 1,2,3,4,6,12 → 중앙값 가운데 두개의 합의 평균
  • 최빈값 : 데이터 중에서 가장 많이 등장한 횟수.
  • 사분위수 : 오름차순으로 정렬해서 4등분한 지점, 25% / 50% / 75%
💡
추론통계량 : (inferential statistics): 모집단에 대해서 예측한 수치값
  • 모집단 : 우리가 알고 싶은 대상.
  • 표본집단 : 모집단에 대상이 될 것 같은 데이터의 일부 (sample)
  • 표본평균 : 표본집단의 평균
  • 표본분산 : 표본집단의 분산
  • 추정(estimation) : 표본집단을 통해서 모집단의 정보를 예측하는 행위
  • 가설 설정(testing hypothesis): 추정할 때 가정하는 명제가 맞는지 틀리는지를 확인하는 작업

정보 이론

💡
정보 이론(Information Theory) : 정보라는 대상에 대해서 다루는 학문
  • Bit : 0 또는 1
  • Byte : 8bits = 1B
  • KB, MB, GB, TB, PB : 1024B = 1KB
  • entropy(엔트로피) : 정보의 차이를 나타낸 값.
  • 데이터(Data) : 관측된 사실.
  • 정보(Information) : 데이터를 가공해서 정형화한 수치 값, 양, 사실


Uploaded by N2T

728x90
반응형

+ Recent posts