A/B 테스트: 두 집단 평균 비교, 비율 비교
t테스트: 두 집단 평균 비교
기본가설: 평균의 차이가 없다.
두집단의 평균의 차이가 0근처면
T-test 결과
p-value 유의수준 0.05 보다 작으면 가설이 유의하지 않다.
카이 제곱 테스트: 두 집단 비율 비교
카이 제곱이 크면 p-value 작아짐 (예상치와 측정치 차이가 큼)
군집화: 전체 데이터 중 비슷한 데이터끼리 하위 군집 만들기
k-means 군집화
범위의 다르면 범위의 크기가 큰 것으로만 군집이 이루어지기 때문에
1. 변수 - 최소 / 최대 - 최소
2. 표준정규분포 = (변수의값 - 평균값)/표준분차
계층 군집화
전체 집합이 하나가 될 때까지 군집
원하는 군집이 되는 구간을 자르면 됨
'Programming > Tip&Informaion' 카테고리의 다른 글
[DataScience] pandas의 대안은? modin, dask, vaex 비교하기 (2) | 2020.07.02 |
---|---|
[환경구축] 아치 리눅스, venv 부터 jupyter notebook 까지 (1) | 2020.06.26 |
[java/db/실수] prepareStatement에서 setString 후 결과가 없는 문제 (0) | 2020.01.07 |
[clojure/lein] cider.repl 문제 (0) | 2019.12.22 |
[js] 디버깅 팁 (0) | 2019.12.03 |