목록분석/논문 (8)
공부기록
안녕하세요! 오늘은 EfficientDet 논문을 리뷰해보겠습니다! :-D [Abstract] ▶EfficientNet: Image classification ▶EfficientDet: object detection 먼저 efficientDet는 efficientnet의 저자들이 작성한 논문으로 efficientNet이 image classification 문제를 타겟으로 논문을 작성하였다면 efficientdet는 object detection 문제를 타겟으로 논문을 작성하였습니다. MS COCO의 결과를 볼때 FPN구조와 AutoML로 찾은 무거운 backbond인 amoebaNet을 섞어서 사용한 모델이 좋은 성능을 보이지만 efficientdet이 연산량 과 연산속도 관점에서 효율적이면서도 가장좋..
YOLO는 2015년에 나온 논문으로 Faster R-CNN에 비하여 부려 6배 가량 빠른 속도를 보인다. 정확도는 비록 조금 낮다 하더라고 정말 비약적인 발전이라고 할 수 있다!! www.youtube.com/watch?v=XS2UWYuh5u0 YOLO의 기본 동작 원리 이미지 그리드를 448 x 448로 resize한 후 single convolution을 동작한다. 즉, CNN 동작이다. 그리곤 난 후 그 output의 결과를 NMS를 통해 걸러내서 객체를 탐지하는 것이다. 여기서 NMS란 CNN의 MaxPooling 같은 느낌이다. 정확히는 현재 픽셀을 기준으로 주변의 픽셀과 비교했을 때 최대값인 경우인 경우 그대로 놔두고, 아닐 경우 억제하는 것이다. - Introduction에 나오는 YOLO..
Fast R-CNN은 R-CNN의 복잡한 training/test pipeline을 통합함으로써 눈에띄는 성능향상(속도, 정확도)을 가져왔지만, Real-time object detector에 한 발짝 더 다가가기에는 여전히 속도면에서 아쉬운 부분이 남아있었습니다. Faster R-CNN의 주요 논점은, Fast R-CNN에서 가장 큰 계산부하를 차지하는 regionproposal 생성을 새로운 방식으로 대체하고, 이를 모델 내부로 통합 시키는 것이다. 이이 고안된 것이 바로 아래 그림의 RPN(region proposal networks)입니다. 기존 Fast RCNN 구조를 그대로 계승하면서 selective search를 제거하고 RPN을 통해서 RoI를 계산합니다. 이를 통해서 GPU를 통한 Ro..
이번 논문 리뷰에서는 FAST R-CNN에 대하여 리뷰해보겠습니다. 지난 게시물에서 다루었던 R-CNN은 학습시간이 매우 오래걸리고, detection속도 역시, 이미지 한 장다 47초나 걸린는 등 매우 느린 추론 속도를 보였습니다. 더불어, 3가지의 모델 (AlexNet, linear SVM, Bounding box regressor)을 독립적으로 학습시키 연산을 공유하거나 가중치값을 update하는 것이 불가능하다는 문제도 있었습니다. 이러한 문제점 들을 Fast R-CNN은 개선시킨 모델입니다. Fast R-CNN은 다음 두가지를 통해 한계점들을 극복했습니다. 1. ROI pooling 2. CNN 특징 추출부터 classification, bounding box regression까지 하나의 모델..
R-CNN(Regions with CNN features) 논문 리뷰 먼저 컴퓨터비전의 문제를 크게 4가지로 분류하면 1. Classificaion 2. Object Detection 3. Image Segmentation 4. Visual relationship 으로 나눌 수 있다. Classification : Single object에 대해서 object의 클래스를 분류하는 문제이다. Classification + Localization : Single object에 대해서 object의 위치를 bounding box로 찾고 (Localization) + 클래스를 분류하는 문제이다. (Classification) Object Detection : Multiple objects에서 각각의 object..
안녕하세요! 이어서 계속 VGGNet 논문에 대하여 리뷰해보겠습니다. 4.1 Single scale evaluation table1에서 나온것처럼 논문에서는 개별적인 모델들을 평가합니다. 테스트 이미지의 크기는 고정된 S(=Q)와 Jitter를 사용한 S가 있고 그 성능평가의 결과는 Table 3에 나와있습니다. 논문에서는 몇가지 주목해야할점을 말하는데요! 첫째, 로컬 응답 정규화(A-LRN 네트워크)를 사용하는 것이 표준화 계층이 없는 모델 A에서 개선되지 않는다. 따라서 논문에서 더 깊은 아키텍처(B-E)에서는 정규화를 채택하지 않습니다. 둘째, ConvNet의 깊이가 증가함에 따라 분류 오류가 감소한다. (11층인 A부터 19층인 E까지) 특히, 같은 깊이에도 불구하고 3개의 1*1 Conv층을 가..