배우는 것들/팔당댐 홍수 안전운영에 따른 수위 예측7 대회 후기 데이콘의 팔당댐 방류 데이터를 활용해 한강수위를 예측하는 대회이다. 베이스라인을 참고하여 LGBM을 사용한게 가장 점수가 높았다. 도메인지식이 크게 부족하여 파생변수 생성이나 특별한 전처리를 하지는 못했다. 시계열 데이터 특성상 결측치가 생기면 보간했을 때 다양한 시점에 여러번 영향을 주기 떄문에 결측치는 전부 드랍하고, 결측치가 많은 변수는 사용하지 않았다. 이후 파라미터 수정을 거쳐 프라이빗 스코어 22등, 상위 7%로 대회를 마무리했다. 처음 참여한 대회임에도 낮지않은 등수를 받은것에 만족해야겠다. 2022. 10. 5. 2022-08-16 RMSE지표 특성상 1에 가까워 질 수록 성능을 높이기 힘들어진다. 코드를 다시 찬찬히 살펴보니, 결측치 처리가 너무 나이브하게 처리가 되어있다. 데이터의 양 자체는 충분히 많으니 drop.na를 통해 결측치를 싹 도려낼 생각이다. 피처별 na값을 살펴보고 너무 많은것은 사용을 고려해 보아야 할 것 같다. 2022. 8. 16. 20220812 기록 보호되어 있는 글 입니다. 2022. 8. 12. 20220811 6등! 보호되어 있는 글 입니다. 2022. 8. 11. 이전 1 2 다음