본문 바로가기
딥러닝/프로젝트

[과제] 당뇨병 환자 클러스터링

by 혜 림 2021. 9. 29.

 

** 데이터마이닝 입문 강의 과제를 포스팅한 글입니다. 

 

Diabets Data

    x1 = 'relative weight'
    x2 = 'fasting plasma glucose'
    x3 = 'area under the plasma glucose curve (OGTT)'
    x4 = 'area under plasma insulin curve (OGTT)'
    x5 = 'steady state plasma glucose (SSPG)'

 과제 제출을 위해 만든 pdf를 한 페이지씩 캡쳐했다. 하지만 pdf 이니 가독성은 줄글보다 좋을 것으로 예상한다. 

 혹시 당뇨병 검색하다가 이 글에 들어온 데이터마이닝입문을 들으시는 분이 있다면 반가우니 댓글 남겨주세요ㅎㅎ

 

 

 몇 개의 클러스터링이 답인지 몰라서 헤맸던 과제. 하지만 정답은 아직도 무엇인지 모른다.

 그래서 클러스터링을 통해서 유의미한 영향을 주는 변수를 밝혀내는 것 보다는, 군집의 갯수를 찾는데 더 초점을 맞춘 과제였다. 당뇨병에  인슐린, 혈당, 체중 이 영향을 준다는 사실은 너무 저명하기 때문이다. 물론 파생변수를 찾는 것이 이 과제의 또 다른 핵심일 수도 있겠지만 배경지식이 없는 관계로 그것을 구상하는 것은 너무 먼 길을 가는 것 같았다. 

 따라서 본 과제를 볼 때 어떻게 클러스터링 했는가에 초점을 맞추어서 보면 좋을듯 하다. 

 

 

댓글