** 아직 모든 예선, 본선이 끝나지 않았으므로 대회 문제에 대한 구체적 언급은 하지 않도록 하겠습니다.
** 댓글로 질문주시면 제공 가능한 선에서 댓글 달아드리겠습니다.
K - ICT 빅데이터 센터에서 주관하는 데이터 크리에이터 캠프에 참여했다. 예선진출, 나아가 본선에서는 최우수상이라는 쾌거를 이룰 수 있었다.
이름은 캠프이지만, 해커톤과 같은 형식이다. 데이터 및 테스크가 공개되면 4 ~ 5 시간 동안 짧게 집중해서 분석을 완료해야한다.
우리 팀은 학교 내 동아리(난 속하지 않았던..ㅎㅎ) 에 팀원 모집글을 올려 모였다.
프로젝트에서 늘 팔로워 역할을 했던지라 한번쯤 리더를 해버고 싶었던 나는 팀장에 지원했고, 모두들 승낙해주셔서 팀장을 할 수 있었다.
우리 팀은 7월 말부터 매주 스터디를 했다.
‘ 파이썬 머신러닝 완벽 가이드 ‘ 라는 책으로 매즈 일정 범위를 공부하고 각자 다른 파트를 맡아 발표하였다.
이 책의 장점은 캐글의 데이터 셋을 이용한다는 것이다. 단순히 모델의 이론, 코드를 보는 것이 아니라 데이터 분석 때 실질적으로 어떤 과정이 필요한지 잘 설명하고 있다. 사이킷런을 이용해본 적은 있지만, 공부해 본 적은 없는 사람들에게 추천하고 싶다. 사이킷런의 모델을 이용하는 코드는 공통적인 요소가 많기 때문에 한 번 알아두면, 사용한 적 없는 모델을 쉽게 유추해서 이용할 수 있기 때문이다.
더불어 우리 스터디는 책에서 다룬 예제의 다른 접근방법을 캐글에 올라온 다른 사람의 노트북을 참고하여 리뷰도 하였다. 이게 좀 플러스 알파로 도움이 많이 되지 않았나 싶다.
첵으로 공부를 하는 두 달 동안 정말 비빠 죽을뻔 했다. 이것저것 수행해야 할 프로젝트가 너무 많았기 때문이다. 그래도 내가 팀장이니까, 팀원분들이 너무 적극적으로 임해주시니까, 나도 응당 힘을 내서 열심히 할 수 밖에 없었다. 그래서 더 뜻깊은 경험이기도 하고.
책을 다 공부하고 나선 데이콘의 문제들을 풀었다. 이미 종료된 문제를 풀어서 당시 일위를 했던 사람들의 코드도 함께 뜯어보았다. 개강을 한지라 그렇게 스무스하게 진행하지는 못했지만 여하튼 열심히 했다는 것만 알아두자.
이런 식으로 각자 EDA해온 것을 바탕으로 피쳐를 생성했다.
그리고 그렇게 실습한 것 중에, https://dacon.io/competitions/open/235536/overview/description
이 있었는데 무려 22위라는 쾌거를 이를 수 있었다. ( 그렇게 높은 등수는 아니지만, 여태 내가 했던 데이콘 중 가장 높았다)
그래서 이때부터 내가 정말 성장하고 있다는 생각이 들었고 왠지 예선은 통과할 수 있을 것 같은 기분이 들었다.
그리고 대망의 10/2 예선의 날! 정말 다행으로 본선에 진출할 수 있었다.
우리팀은 2분이 새로운 변수 생성, 그리고 내가 새로운 변수 생성 및 발표 준비, 마지막으로 한 분이 모델링을 맡아 했다.
일단 우리는 리더보드에서 그렇게 좋은 성적을 내지 못했다. 3-4 등을 한 것 같았는데 이게 왜 안 확실하나면 팀명으로 제출 안 한 분이 여럿 있었기 때문이다. 그래서 정확하게 몇 등인지는 잘 모르겠다.
아무래도 해커톤이다 보니 시간에 맞춰서 분석과 발표 준비를 하는 게 꽤나 벅찼다. 그리고 제때 못한 팀도 있었다. 그래서 진행이 안 되고 있을 때 우리팀은 자진해서 먼저 발표하였고, 그게 운영하시는 분들께 좋게 보인 것 같았다. 발표를 한 뒤에는 멘토님으로부터 질문을 받는데, 우리팀은 질문 보다는 칭찬? 을 받았다! ㅎㅎ 공산성을 체크하면서 변수를 넣는 이야기, 새로운 변수를 넣는 시도들 등등.. 하여튼 문제에 따라서 새로운 피쳐를 만들 수 있는지 없는지 다르겠지만 많은 시도를 해보는 게 더 좋은 평가를 받을 것 같다는 생각이 들었다.
+ 다른 팀들 발표를 들으면서 배우는 점도 있었다. 라쏘 회귀는 그냥 정규화를 걸어준 선형 회귀방법으로만 알았는데, 그걸 이용해서 변수를 선택하신 팀도 있었다. 그리고 그게 실제로도 많이 쓰이는 분석 방식이라는 것도.
그리고 시험 준비를 하다가 맞이한 본선.
또다시 우리 팀은 운 좋게도 최우수상을 탔다. 이 정도면 운이 좋은게 아니고, 그냥 능력이 좋은 걸지도! ㅎㅎ
public 리더보드는 2등, private 리더보드는 1등을 했다!
문제를 밝힐 수 없으니 우리가 어떤 기법을 썼는지 언급할 순 없지만.
다른 팀들은 내가 이 블로그에서 리뷰했던 가장 최신 논문과 관련된 모델도 썼었다. 그에 비해서 우리는 기본에 충실한 모델이였어서! 새로운 걸 많이 시도한 다른 팀들이 데이터 분석을 배워가는 경험을 제공하고자 하는 데크캠의 의의와 더 맞지 않을까 굉장히 불안했다. 솔직히 나는 4등으로 예상했다.
그런데..
3등에 우리팀 이름이 안 불리고 다른 팀 이름이 불리자 나는 진짜 포기를 했었는데, 이게 무슨 일! 우리가 다음으로 호명됐다.
아 진짜 너무 기분이 좋았다.
솔직히 말하면 올해 4월 이후로 계속 풀리는 일이 없는 기분이었다. 기껏 학회 합격을 했는데 학회 활동은 모두 최소되었고.
교류학술제 정말 열심히 준비했는데 수상도 못 하고.
이빨도 오지게 썩어서 월급의 반을 쏟아부었고.
나열하자면 끝도 없이 안 좋은 일들이 많이 있었다. 물론 개중엔 좋은 일도 몇 있었겠지.
하여튼 요즘 일이 잘 풀린 적이 없었는데, 그걸 보상 받은 것처럼 기분이 넘나리 좋았다.
그리고 정말 데크캠을 하면서 팔로워의 역할을 배운 것 같다. 그게 제일 큰 것 같다. 너무 좋은 팀원분들이 본보기로서..
적극적으로 의견 내고 답장 보내주고.
팀에 지원했을 때 ‘자진’해서 참여했다는 걸 잊지 않고 끝까지 열심히 해준 사람들.
너무 감사하다.
처음으로 팀장을 해봤지만 팀장으로서도 중요한 건.
회의 안건 준비해서 가기(안 그러면 회의가 산으로 가고, 난 비효율적인 회의는 집중력이 확 떨어져서)
솔직하게 하고 싶은 거 말하기(스터디 하자고 말한거나, 캐글 코드 리뷰하자고 말한거나. 말하기를 너무 잘했다고 생각하는 것)
또 마지막으로 비슷한 수준의 열정을 가진 팀원들을 모으는 것.
생각보다 마지막 요소가 굉장히 중요하다.
난 엄청난 의욕인데 나머지가 안 그러면 나도 지치고 이게 무슨 의미가 있냐 싶어서 관두게 된다.
동일한 의욕을 가진 사람들이 모여서 함께 같은 목표로 나아가는 것이 중요하다고 생각한다.
정말 운 좋게도 나는 그런 팀을 만났고, 이제 상금을 받아서 뒤풀이 하는 일만 남았다.
개인적으로 나는 이 분들과 또 다음 대회도 준비해보고 싶은데, 뒤풀이 가서 말할 계획이다ㅎㅎ
이 대회에서 수상할 수 있었던 건 내가 열심히 노력해온 것도 있고 더불어 팀원분들도 열심히 하신 것도 있다. 절대 나 혼자만 해낸 결과라고 생각하지 않고, 팀원분들의 본받을 점 오래 기억하도록 하겠다. 너무 감사한 대회.
+ 너무 자전적이라 대회 소감도 좀 써야겠다.
일단 멘토분이 있다는 게 너무 좋았던 대회. 우리가 좋은 방향으로 가는지, 혹은 어떤 방향으로는 가다가 멈춰야 하는지. 다 여쭤보면 친절하게 설명해주셔서 너무 감사했다. 마지막에 수상 소감 때 말을 못 했지만 정말 멘토님께도 감사했다.
그리고 다른 팀들이 발표를 들을 수 있는 것도 굉장히 좋았다. 들으며서 만약에 다른 해커톤을 나간다면 그때는 이렇게 해봐야지, 저렇게 해봐야지 하는 좋은 아이디어들을 챙길 수 있어서!
여하튼 사람을 모아서 이번 대회에 참여한 건 너무 좋은 일이었다. 사람도 챙기고 수상도 챙기고 상금도 챙기고ㅎㅎ 상금으로 뒤풀이 할 생각만 해도 너무 재미좋다.
일기처럼 되버렸으니.... 기왕 이렇게 된 거 나가는 말은 이렇게 써야겠다.
오늘의 일기 끝!
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 혹시 관심있으면 이 영상도 봐주라
https://www.youtube.com/watch?v=_OceCKcwRLs
'딥러닝 > 프로젝트' 카테고리의 다른 글
[외부프로젝트] COMPAS 김해시 CCTV 위치 선정 (0) | 2022.09.29 |
---|---|
[외부프로젝트]MAIC 병리영상 부문 (0) | 2022.01.13 |
[Kaggle] CT Medical Image - (6) 결과 정리 및 시각화 (0) | 2021.10.03 |
[Kaggle] CT Medical Image - (5) Augmentation (0) | 2021.10.01 |
[Kaggle] CT Medical Image - (4) 성능지표 계산하기 (0) | 2021.09.30 |
댓글