본문 바로가기

전체 글83

[외부프로젝트] 2021 데이터 크리에이터 캠프 후기 ** 아직 모든 예선, 본선이 끝나지 않았으므로 대회 문제에 대한 구체적 언급은 하지 않도록 하겠습니다. ** 댓글로 질문주시면 제공 가능한 선에서 댓글 달아드리겠습니다. K - ICT 빅데이터 센터에서 주관하는 데이터 크리에이터 캠프에 참여했다. 예선진출, 나아가 본선에서는 최우수상이라는 쾌거를 이룰 수 있었다. 이름은 캠프이지만, 해커톤과 같은 형식이다. 데이터 및 테스크가 공개되면 4 ~ 5 시간 동안 짧게 집중해서 분석을 완료해야한다. 우리 팀은 학교 내 동아리(난 속하지 않았던..ㅎㅎ) 에 팀원 모집글을 올려 모였다. 프로젝트에서 늘 팔로워 역할을 했던지라 한번쯤 리더를 해버고 싶었던 나는 팀장에 지원했고, 모두들 승낙해주셔서 팀장을 할 수 있었다. 우리 팀은 7월 말부터 매주 스터디를 했다. .. 2021. 10. 19.
[TIL] SGD 에 대한 제대로 된 이해 오피스 갔다와서 또 물어본 이야기 부끄러운 말이지만 논문을 그렇게 읽었지만 아직도 SGD를 이해를 못했다. 이번에 물어보면 너무너무 좋을 기회일 것 같아서 같이 물어봤다. 일단 SGD란 확률적 경사하강법인데, 난 여기서 '확률적'이라는 말을 이해할 수 없었다. SGD에서는 batch size가 1인 배치를 이용해서 총 샘플 수 만큼 iteration을 한다. 그러면 결국 계산하는 순서만 랜덤인거라는 생각이 들었다. 그래서 모든 데이터 셋을 한꺼번에 이용하느냐, 하나씩 하느냐가 다른거 아닌가 싶어서 왜 '확률적'이라는 말을 쓰는지 의아했다. 일단 내가 이해한 건 맞다. batch size가 1인 배치를 이용하는 것도 맞고, 샘플 수만큼 iteration 하고 가중치를 업데이트 하는 것도 맞다. 하지만 '확.. 2021. 10. 14.
[TIL] feature map은 대체 뭘 나타내는가? 오늘은 교수님 오피스 아워 때 방문해서 여쭤보고 온 질문을 공유하고자 한다. 우선 내가 의문을 가졌던 의문 먼저 소개하자. 위 이미지에서는 vgg16의 conv 레이어를 시각화한 것이다. conv 레이어의 필터는 레이어가 깊어짐에 따라 더욱 복잡한 형태를 띄고 있음을 위 이미지에서도 확인할 수 있다. 즉 더 복잡한 필터를 통해서 이제 이미지의 본질적인, 혹은 핵심적인 특징을 잡아내는 것이다. 한편 위 이미지는 conv layer의 필터를 거친 후의 feature map들이다. 보시다시피 conv layer를 거쳐감에 따라서 점점 feature map은 interpretable하지 않은 형태를 가진다. 여기서 내가 가졌던 의문은 이것이다. filter가 더 복잡해 짐에 따라 중요한 특성을 잡아내는 것은 명.. 2021. 10. 14.
[Kaggle] CT Medical Image - (6) 결과 정리 및 시각화 CT Medical Image Classification (0) 서론, 액션플랜 (1) DICOM 파일 array로 전환 및 시각화 (2) DataLoader 만들기 (3) 모델 만들기 (4) 성능 지표 만들기 (5) Augmentation model.train() criterion = nn.BCELoss().to(device) optimizer = torch.optim.SGD(model.parameters(), lr=0.001) ############################################## loss_values = [] ############################################## epoch = 10 for i in range(epoch): avg_cost =.. 2021. 10. 3.