목록Kaggle (4)
나의 개발일지

https://www.kaggle.com/code/yoonjuhan/spaceship-titanic/notebook 📌 제출 결과 1 (Version name : RandomForest) Model : RandomForest

데이터 이해 대회의 데이터를 탐색하고 이해합니다. 데이터의 특성, 변수, 결측치 등을 분석하고 데이터 시각화를 통해 인사이트를 얻을 수 있습니다. 데이터 전처리 데이터를 정제하고 필요한 형식으로 변환합니다. 이 단계에서는 결측치 처리, 이상치 제거, 범주형 변수 인코딩 등을 수행합니다. 특성 공학 기존 변수를 활용하여 새로운 유용한 특성을 생성합니다. 도메인 지식과 창의성을 발휘하여 모델의 성능을 향상시키는 특성을 발견합니다. 모델 선택 및 학습 문제에 맞는 적절한 머신러닝 모델을 선택하고 데이터를 사용하여 모델을 학습시킵니다. 주로 사용되는 알고리즘에는 선형 회귀, 결정 트리, 랜덤 포레스트, 그라디언트 부스팅 등이 있습니다. 모델 평가 학습된 모델을 테스트 데이터에 적용하여 성능을 평가합니다. 대회에..

https://www.kaggle.com/code/yoonjuhan/kaggle-house/notebook Kaggle_house Explore and run machine learning code with Kaggle Notebooks | Using data from House Prices - Advanced Regression Techniques www.kaggle.com 제출 결과 1 평균 제곱 오차 = 0.12748 모델 : 3fold lightGBM 하이퍼파라미터 lgbm_params = { 'objective' : "regression", 'random_seed' : 1234, 'learning_rate' : 0.05, 'n_estimators' : 1000, 'num_leaves': 33, ..

https://www.kaggle.com/code/yoonjuhan/kaggle-titanic/notebook kaggle_titanic Explore and run machine learning code with Kaggle Notebooks | Using data from Titanic - Machine Learning from Disaster www.kaggle.com 캐글 데이터 분석을 통해 데이터 준비, 전처리, 모델링 등 데이터 분석 흐름을 학습 (ADsP 자격증 시험을 치고나니 어느정도 이해가 가능했다.) 제출 결과 1 예측 결과 = 0.77272 = 77.272% 모델 : 3fold lightGBM 하이퍼파라미터 lgbm_params = { "objective" : "binary", "ma..