전체 글 6

근원 소비자물가지수

- 물가 : 물건의 가격 - 지수 : 과거의 값에 대비해서 오르내리는 정도를 측정하기 위한 것 - 물가 지수 : 물건 가격이 과거에 비해 얼마나 오르고 내렸는지 조사한 것 - 소비자물가지수(CPI) : '소비자'들이 많이 소비하는 약 480개의 물건(및 서비스) 가격을 가중평균(ex, 쌀 5.5, 껌 0.1)을 내어 지수를 계산 (품목확인 : https://kosis.kr/statHtml/statHtml.do?orgId=101&tblId=DT_1J20112&conn_path=I2) + 생산자물가지수(PPI) : '사장님'들이 많이 쓰는 약 890개 물건(및 서비스) 가격을 가중평균식을 내어 지수를 계산 (품목 확인 : https://kosis.kr/statHtml/statHtml.do?orgId=301&..

주식관련 2023.07.05

시계열 데이터 분석과 기계학습의 차이

확률 과정(Stochastic Process) : 상관 관계를 가지는 무한 개의 변수의 순서열 시계열 데이터(Time Series Data) : 일정한 시간 간격으로 기록된 확률 과정의 샘플 독립변수($x_t$)와 알고자 하는 종속변수($y_t$)가 시간단위($t$)를 포함 모델의 출력(Output)은 $y$의 시간 $t$에서의 예측값($\hat{y_t}$) 기계학습과 시계열예측 간 큰 차이가 존재하기에, 시계열 변수생성은 약간의 조정들을 요구함 본 노트는 패스트캠퍼스 의 강의노트 및 강의를 필기한 개인 노트입니다.

시계열 분석 2022.01.28

A/B Test (가설검정) - 가설검정 정리 및 절차

일단 용어에 대해서 정리를 진행해보겠습니다. - 모집단(Population) : 연구(관심) 대상이 되는 전체 집단 - 표본(Sample) : 모집단에서 선택된 일부 집단 - 전수조사(Population Scale Test) : 모집단 모두를 조사하는 방식으로 시간과 비용이 가장 비효율적인 방식(ex. 인구주택 총조사) - 표본조사(Sample Scale Test) : 표본집단을 조사하는 방식으로 시간과 비용을 크게 줄일 수 있으나 편향성(Bias) 문제가 존재 (ex. 출구조사, 여론조사) * Sample을 편향되게 만드는 방법 * Sampling 과정에서 생기는 Bias 제거하는 방법 - 추론통계(Statistical Inferance) : 모집단에서 샘플링한 표본집단을 가지고 모집단의 특성을 추론하..

데이터 분석 2022.01.19

A/B Test(가설검정) - 가설설정 조건 3가지

A/B Test가 왜 필요해? 필요1 : 대부분의 문제를 정의한다고 할 때 'A/B Test(비교)'를 기반으로 하고 있다. 필요2 : 설명력과 모델복잡도는 반비례하는 경향이 있기 때문에, 설명력이 수반되는 모델들은 가설검정 해석이 필수이다. 이게 뭔 소리냐? 필요1에 대한 설명) 우리가 만든 알고리즘이 있거나 무언가가 좋다라고 얘기를 할 때 가장 쉽게 할 수 있는 것이 비교입니다. 이전 것을 비교한다던지 새롭게 만든게 어떠한 대상보다 좋다라고 어필하며 비교하는 것이 가장 좋은 방법이다. 또한 일상생활속에서도 상대평가 OR 비교와 마찬가지로 가설검정이라는 것도 A/B Test 라는 비교를 기반으로 하고 있습니다. 필요2에 대한 설명) 전통적인 수학을 기반으로 하고 있는 방법론들은 분석의 구현이나 결과에 ..

데이터 분석 2022.01.18

형태 통계량(분포 형태 & 왜곡 수치) (왜도, 첨도, 이상치) (Skewness, Kurtosis, Outlier)

형태통계량은 자표의 분포형태와 왜곡수치를 나타내는 통계량이다. 왜도(Skewness) : 중앙값이 평균을 중심으로 좌우로 데이터가 편향되어 있는 정도 중앙값과 변동통계량(범위, 편차, 변동, 분산, 표준편차 등)만 보더라도 중앙값 퍼짐을 알 수 있을텐데 왜 필요할까? 그럼에도 불구하고 조금 더 알고싶은 것이 있기 때문에 필요하다. 그래서 위에서 왼쪽 그림처럼 Positive하게 되어있는지 Negative하게 되어있는지 바운더리를 경계로 어느쪽으로 치우쳐져 있는 지를 표시하는 것을 의미합니다. 그래서 이게 왜 필요하냐!! 예를들어) 매일 주식투자를 한다고 생각해본다. 그럼 매일 매도와 매수를 거치면서 수익이 발생하게 된다고 생각해보자. 10번의 거래(투자)를 진행했다고 한다. 티모 : -3만원, -2만원,..

데이터 분석 2022.01.18