본문 바로가기

컴퓨터비전3

[Object Detection] YOLO 들어가는 사족 더보기 우왕 한 1시간 반만에 다 읽었다 짧아서 다행ㅎㅎ 그리고 R-CNN 가족들보다 훨씬 쉬웠다.. 아닌가 경험치가 쌓여서 그런가 예전에 yolo는 아니고 yolact 깃헙에서 다운 받아서 쓸려고 했었는데 슬프게도 그게 도커 컨테이너에서 실행시킨 거라 팝업이라고 해야 하나 하여튼 그게 안 떠서 결과를 확인 못 해봄 (관리자 권한으로 실행하는 법을 몰랐음.. 지금도 모름) 하여튼 되게 깃헙에서도 쓰기 쉽게 되어있으니 혹시 관심있으면 한 번 보시길.. 컴파일러도 안 깔아도 되고 나름 쉬웠던 것 같음 다른 오픈 소스 깔다가 화병날뻔 했던거에 비하면 근데 darknet 사이트가 꽤나 중2병스럽게 생겼음..ㅋㅋ그래서 웃김 You Look Only Once: Unified, Real-Time Obj.. 2021. 8. 3.
[Object Detection] Fast R-CNN 오늘의 논문: https://arxiv.org/pdf/1504.08083.pdf Fast R-CNN은 앞서 리뷰했던 R-CNN의 느린 속도를 개선한 알고리즘이다. 읽어보면 대부분의 디테일, 세팅 같은 것은 R-CNN에서 따와서 새로운 것이 별로 없다. 저자가 같아서 그런가. 논문을 요약하면서 최대한 그 흐름을 지켜볼려고 했다. 하지만 내 마음대로 개조한 부분도 있다. 0. 내 마음대로 하는 요약 전체적인 구조를 요약하자면 1. input으로 전체 이미지와 region proposal 값을 이용한다. 2. conv layer에서 마지막 pooling layer 대신, roi pooling layer를 사용해서 고정된 길이의 벡터를 추출한다. 3. fc 의 마지막 층에서는 classification 과 bb.. 2021. 7. 7.
[Object Detection] R-CNN Rich feature hierarchies for accurate object detection and semantic segmentation 늘 느끼는 거지만... 말로 이해한 걸 표현하는 건 너무 어렵다 말로 느끼는 걸 표현하는 건 쉬운데 이해한 걸 표현하기는 어렵다 특히 전문 용어가 많고 왁왁 그런 경우에는 저번 포스팅을 올린지로 벌써 한 달... 다들 내가 이제 블로그 안 하는 줄 알겠지?? 하지만 이 논문은 정말 갑자기 난이도가 뛴 기분이라 한 달 걸렸대도 이상할 게 없다.... 저번 포스팅한 AlexNet은 그 용도가 image classification에 있다. 즉 주어진 이미지가 있으면 아! 이건 초콜렛(먹고 싶어서 그렇다)아! 이건 우쿨렐레(치고 싶어서 그렇다)를 구분해주는 데 그 역할.. 2021. 6. 5.