범주형/연속형 변수 조합에 따른 가설 검정 방법

1. 기술/통계, 시계열

범주형/연속형 변수 조합에 따른 가설 검정 방법

swsong 2022. 7. 4. 19:05

1. 단일변수
1. 1-1. 연속형
2. 1-2. 범주형
2. 다변수

1. 단일변수

1-1. 연속형

정규성 검정
One Sample T-Test(일표본 평균검정)

# One Sample T-Test : 
## 귀무가설 H0 - 특정 값은 집단의 평균과 다르지 않다. (H0확률 = p-value, 0.05 미만이면 기각)
## 연구가설 H1 - 특정 값은 집단의 평균과 다르다.
stats.ttest_1samp(Series, value) # 집단의 평균(Series) vs 검증하고자 하는 값(value)

1-2. 범주형

비율 검정(ex. 연구가설 H1-집단 내 남녀 비율은 차이가 있다)

2. 다변수

2-1. 범주형 'X' & 연속형(정규분포) 'Y'

Two Sample T-Test(이표본 평균검정), 등분산 검정(Levene Test)
등분산 검정 결과에 따라(이분산, 등분산) Two Sample T-Test를 다르게 수행

# 등분산 검정
## 귀무가설 H0 - 두 집단의 분산은 다르지 않다
## 귀무가설 H0 - 두 집단의 분산은 서로 다르다
stats.levene(Series1, Series2)
stats.fligner(Series1, Series2)
stats.bartlett(Series1, Series2)

# 등분산 조건 충족시
stats.ttest_ind(Series1, Series2, equal_var=True)
# 등분산 조건 불충족시
stats.ttest_ind(Series1, Series2, 
equal_var=False)

2-2. 범주형 'X' & 연속형(비-정규분포) 'Y'

비모수적 검정

2-3. 범주형 'X' & 범주형 'Y'

Chi Square 검정(두 범주형 집단의 독립성 검정)

# 카이제곱 검정
## 귀무가설 H0 - 두 집단은 서로 독립이다
## 연구가설 H1 - 두 집단은 서로 독립이 아니다(의존적이다)
crosstable = pd.crosstab(Series1, Series2) # 빈도 계산 - Contingency Table
stats.chi2_contingency(crosstable)
#-> result : (stats, p-value, 자유도, 모수추정값)
#-> p-value < 0.05 : 귀무가설 기각 - 독립이 아니다. 
#-> ex 자동차 구매 - 계약 유형(Series1)에 따라 제품군(Series2)의 차이가 있다

2-4. 연속형 'X' & 연속형 'Y'

상관분석, 회귀분석

2-5. 연속형 'X' & 범주형 'Y'

로지스틱 회귀분석(분류문제)

저작자표시

현재글범주형/연속형 변수 조합에 따른 가설 검정 방법

Capability, Utility, and Data Analysis.

머신러닝, Django, 파이썬, StarGAN, 통계, 가설검정, Python, 판다스, Javascript, sklearn, 프로그래밍, 자바스크립트, 금융데이터, 딥러닝, 주식데이터, 기계학습, 데이터분석, 시계열분석, 데이터사이언스, 사이킷런,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

관성을 이기는 데이터

범주형/연속형 변수 조합에 따른 가설 검정 방법

1. 단일변수

1-1. 연속형

1-2. 범주형

2. 다변수

2-1. 범주형 'X' & 연속형(정규분포) 'Y'

2-2. 범주형 'X' & 연속형(비-정규분포) 'Y'

2-3. 범주형 'X' & 범주형 'Y'

2-4. 연속형 'X' & 연속형 'Y'

2-5. 연속형 'X' & 범주형 'Y'

'1. 기술/통계, 시계열'의 다른글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

범주형/연속형 변수 조합에 따른 가설 검정 방법

1. 단일변수

1-1. 연속형

1-2. 범주형

2. 다변수

2-1. 범주형 'X' & 연속형(정규분포) 'Y'

2-2. 범주형 'X' & 연속형(비-정규분포) 'Y'

2-3. 범주형 'X' & 범주형 'Y'

2-4. 연속형 'X' & 연속형 'Y'

2-5. 연속형 'X' & 범주형 'Y'

'1. 기술/통계, 시계열'의 다른글

관련글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역