** 데이터마이닝 입문 강의 과제를 포스팅한 글입니다.
Diabets Data
x1 = 'relative weight'
x2 = 'fasting plasma glucose'
x3 = 'area under the plasma glucose curve (OGTT)'
x4 = 'area under plasma insulin curve (OGTT)'
x5 = 'steady state plasma glucose (SSPG)'
과제 제출을 위해 만든 pdf를 한 페이지씩 캡쳐했다. 하지만 pdf 이니 가독성은 줄글보다 좋을 것으로 예상한다.
혹시 당뇨병 검색하다가 이 글에 들어온 데이터마이닝입문을 들으시는 분이 있다면 반가우니 댓글 남겨주세요ㅎㅎ
몇 개의 클러스터링이 답인지 몰라서 헤맸던 과제. 하지만 정답은 아직도 무엇인지 모른다.
그래서 클러스터링을 통해서 유의미한 영향을 주는 변수를 밝혀내는 것 보다는, 군집의 갯수를 찾는데 더 초점을 맞춘 과제였다. 당뇨병에 인슐린, 혈당, 체중 이 영향을 준다는 사실은 너무 저명하기 때문이다. 물론 파생변수를 찾는 것이 이 과제의 또 다른 핵심일 수도 있겠지만 배경지식이 없는 관계로 그것을 구상하는 것은 너무 먼 길을 가는 것 같았다.
따라서 본 과제를 볼 때 어떻게 클러스터링 했는가에 초점을 맞추어서 보면 좋을듯 하다.
'딥러닝 > 프로젝트' 카테고리의 다른 글
[Kaggle] CT Medical Image - (4) 성능지표 계산하기 (0) | 2021.09.30 |
---|---|
[Kaggle] CT Medical Image - (3) 모델 만들기 (0) | 2021.09.30 |
[Kaggle] CT Medical Image - (2) DataLoader 만들기 (0) | 2021.09.27 |
[Kaggle] CT Medical Image - (1) DICOM 파일 array로 전환 및 시각화 (0) | 2021.09.26 |
[Kaggle] CT Medical Image - (0) 서론, 액션 플랜 (0) | 2021.09.25 |
댓글