xgboost

1. 기술/머신러닝, 딥러닝

xgboost

swsong 2022. 6. 16. 14:30

XGBoost(eXtreme Gradient Boost)

XGBoost(eXtreme Gradient Boost)

XGBoost는 기존 Gradient Boosting 방식의 느리고, training set에 overfitting되는 문제를 어느 정도 해결한 고성능 ensemble 기법이다.

규제

Overfitting을 방지하도록 하이퍼파라미터를 통해 규제할 수 있다.
reg_alpha : L1 규제
reg_lambda : L2 규제

early stopping

주로 딥러닝 학습에 파라미터로 사용되는 early stopping을 지원한다.
model.fit(X_train, y_train, early_stopping_rounds=n...)

CART

Classification And Regression Tree
분류, 회귀 모두 지원한다.

Common Hyper-parameters

n_estimators : 결정 트리 수
learning_rate : 학습률(학습 보폭)
max_depth : 트리의 깊이

xgboost는 sklearn에서 지원하지 않는다. xgboost library를 별도로 설치하여 사용한다.

from xgboost import XGBClassifier

model = XGBClassifier() # all hyper-parameter : default
model.fit(X_train, y_train)

# Prediction
print('Train Score : {}'.format(model.score(X_train, y_train)))
print('Test Score : {}'.format(model.score(X_test,y_test)))

Train Score : 1.0
Test Score : 0.98

XGBoost는 Classification과 Regression 모두 지원한다. 아래는 Regression 예제이다.

from xgboost import XGBRegressor
model = XGBRegressor() # all hyper-parameter : default
model.fit(X_train, y_train)

# Prediction
print('Train Score : {}'.format(model.score(X_train, y_train)))
print('Test Score : {}'.format(model.score(X_test,y_test)))

Train Score : 0.99
Test Score : 0.97

이처럼 XGBoost는 분류/회귀 유형 모두를 지원하므로 모델 학습 목적에 따라 XGBClassifier 혹은 XGBRegressor를 유연하게 사용할 수 있다.

저작자표시

현재글xgboost

Capability, Utility, and Data Analysis.

딥러닝, 데이터사이언스, 사이킷런, 통계, Python, 데이터분석, StarGAN, sklearn, Javascript, 자바스크립트, 가설검정, 판다스, 파이썬, 시계열분석, Django, 기계학습, 금융데이터, 주식데이터, 프로그래밍, 머신러닝,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

관성을 이기는 데이터

xgboost

XGBoost(eXtreme Gradient Boost)

규제

early stopping

CART

Common Hyper-parameters

'1. 기술/머신러닝, 딥러닝'의 다른글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

xgboost

XGBoost(eXtreme Gradient Boost)

규제

early stopping

CART

Common Hyper-parameters

'1. 기술/머신러닝, 딥러닝'의 다른글

관련글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역