728x90
반응형
선형대수학
💡
벡터 : 숫자의 나열, 숫자들의 묶음 x = (1,2,3)
x = (1, 2, 3), y = (4, 3, 1)
- 벡터의 연산 : x + y = (5, 5, 4) // x - y = (-3, -1, 2) // 3 * x = (3, 6, 9)
- 벡터의 특징 : 원소값, 방향(상대적위치)
- 벡터의 차원 : 원소의 갯수
- 벡터의 크기 (norm) : 벡터의 모든 원소를 제곱하고 다 더한뒤, 루트를 씌워준 값. → 원점과의 거리
- 백터공간 (Vector Space) : 벡터가 정의되는 집합. 연산, 차원, 기저(basis)(=축) …
통계
💡
기술통계량 (descriptive statistics): 데이터에서 측정할 수 있는 요약된 수치값들
- 평균 : 모든 데이터의 값을 더한 다음 갯수로 나누는 값
- 분산 : 데이터의 퍼진 정도, 각 데이터에서 평균을 뺀 값을 제곱해서 다 더한 뒤 데이터 개수로 나눈 값
- 표준편차 : 분산의 양의 제곱근.
- 중앙값 : 오름차순으로 정렬을 했을 때 한 가운데 있는 값. e.g 1 2 3 4 6 중앙값 3, 평균은 3보다 조금 큼 e.g. 1,2,3,4,6,12 → 중앙값 가운데 두개의 합의 평균
- 최빈값 : 데이터 중에서 가장 많이 등장한 횟수.
- 사분위수 : 오름차순으로 정렬해서 4등분한 지점, 25% / 50% / 75%
💡
추론통계량 : (inferential statistics): 모집단에 대해서 예측한 수치값
- 모집단 : 우리가 알고 싶은 대상.
- 표본집단 : 모집단에 대상이 될 것 같은 데이터의 일부 (sample)
- 표본평균 : 표본집단의 평균
- 표본분산 : 표본집단의 분산
- 추정(estimation) : 표본집단을 통해서 모집단의 정보를 예측하는 행위
- 가설 설정(testing hypothesis): 추정할 때 가정하는 명제가 맞는지 틀리는지를 확인하는 작업
정보 이론
💡
정보 이론(Information Theory) : 정보라는 대상에 대해서 다루는 학문
- Bit : 0 또는 1
- Byte : 8bits = 1B
- KB, MB, GB, TB, PB : 1024B = 1KB
- entropy(엔트로피) : 정보의 차이를 나타낸 값.
- 데이터(Data) : 관측된 사실.
- 정보(Information) : 데이터를 가공해서 정형화한 수치 값, 양, 사실
Uploaded by N2T
728x90
반응형
'AI Study > DeepLearning' 카테고리의 다른 글
| Chapter.02 데이터 엔지니어링이란?-02. 데이터 엔지니어링 기초 용어 (0) | 2023.03.19 |
|---|---|
| Chapter.02 데이터 엔지니어링이란?-01. Job Description으로 살펴보는 Data Engineering (0) | 2023.03.19 |
| Chapter.01 데이터 사이언스란?-04. 모델링 (0) | 2023.03.19 |
| Chapter.01 데이터 사이언스란?-03. 데이터 분석 레포트 (0) | 2023.03.19 |
| Chapter.01 데이터 사이언스란?-01. Job Description으로 살펴보는 Data Science (1) | 2023.03.19 |