본문 바로가기

Computer Vision

(15)
[논문 읽기/2020] Text Detection and Recognition in the Wild: A Review link: arxiv.org/pdf/2006.04305.pdf Abstract 자연 이미지에서 text를 detection하고 recognition 하는 것은 스포츠 비디오, 자율 주행, 산업 자동화 등의 다양한 분석에 적용되는 컴퓨터 비전 분야의 2가지 주요한 문제임. 이들은 여러 환경 조건에 따라 text가 어떻게 표현되고 영향을 받는지에 대한 요인인 일반적이면서도 어려운 문제에 직면을 함. 현재 최신의 scene detection과 recognition 기법들은 딥러닝 아키텍처의 관찰된 발전을 활용하였으며, 여러 해상도와 여러 방향성이 있는 text를 다룸에 있어서 벤치마크 데이터셋 상에서 우수한 성능을 보이는 것으로 보고가 됨. 하지만, 모델이 보이지 않는 데이터로 일반화 할 수 없으며, labe..
[논문 읽기/2021] A Survey of Deep Learning Approaches for OCR and Document Understanding link: arxiv.org/pdf/2011.13534.pdf Abstract 문서는 법률, 금융, 기술 등의 여러 분야에서 많은 비지니스의 핵심적 역할을 하며, 문서를 자동으로 이해하는 것은 여러 새로운 비지니스의 길을 열어줌. 자연어 처리 및 컴퓨터 비전 분야는 딥러닝의 발전을 통해 상당한 진전을 이루었고 현대의 문서를 이해하는 시스템에 도입이 되기 시작함. 본 논문에서는 영어로 작성된 문서 이해를 위한 다양한 기술들을 검토하고 이 분야를 연구하는 연구자들에게 출발점 역할을 하기 위해 현존하는 방법론들을 통합함. 1 Introduction 인간은 정보를 기록하고 보존하기 위해 문서를 작성하며, 정보 운반 수단으로써 문서는 다양한 소비자들을 고려하여 다양한 정보들의 집합을 나타내기 위해 다양한 레이아웃..
[논문 읽기/2004] Robust Real-Time Face Detection link: https://www.face-rec.org/algorithms/Boosting-Ensemble/16981346.pdf OpenCV 에 구현된 Viola&Jones의 face detector 결과 Abstract: 본 논문에서는 높은 검출률을 달성하면서도 극도로 빠르게 영상처리를 할 수 있는 얼굴 검출 프레임워크를 제안함. 본 논문의 주요 기여 1. Integral Image: Integral Image로 image를 표현함으로써, 본 논문의 detector에서 사용하는 features들의 계산을 매우 빠르게 함. 2. AdaBoost learning algorithms: 다수의 잠재적인 feature들의 set으로부터 소수의 중요한 visual feature를 선택하기 위해 AdaBoost를..
[논문 읽기/2010] Survey of Pedestrian Detection for Advanced Driver Assistance Systems link: https://ieeexplore.ieee.org/document/5010438 Abstract Advanced driver assistance systems (ADASs)를 위한 pedestrian protection systems (PPSs)는 안전을 위해 활발하게 연구되고 있는 영역임. PPSs의 주된 challenge는 보드 상에서 신뢰성 있게 동작하는 보행자 검출 시스템을 개발하는 것임. 보행자 형상(appearance)의 변화(예: 서로 다른 옷, 크기 변화, 종횡비, 동적인 shape)와 비구조적인 환경으로 인해, 시스템에서 요구되는 강건함을 만족시키는 것은 상당히 어려운 일임. 보행자 검출 연구 분야에서 다양한 접근들의 비교를 어렵게 만드는 2가지 문제는 공용 벤치마크의 부족과 ..
[논문 읽기/2014] Ten Years of Pedestrian Detection, What Have We Learned? link: https://arxiv.org/pdf/1411.4304.pdf Abstract 지난 10년간의 보행자 검출과 관련된 40개 이상의 detectors들에 대해서 Caltech pedestrian detection benchmark를 기반으로 분석함. 크게 3가지의 부류의 접근방법들이 존재하며, 현재 모든 방법들은 유사한 검출 성능을 보이는 것을 발견함. 다수의 공개된 전략을 결합하여, 가장 우수한 아이디어들의 상호 보완성에 대한 연구를 수행함. 새롭게 제안한 decision forest detector는 Caltech-USA dataset를 이용하여 가장 우수한 성능을 보임. 1 Introduction 객체 검출을 위한 주요 패러다임들은 1) Viola&Jones variants, 2) HOG..
[논문 읽기/2004] Pedestrian Detection for Driving Assistance Systems: Single-frame Classification and System Level Performance Link: https://ieeexplore.ieee.org/document/1336346 Abstract 본 논문에서는 1) 단일 카메라 기반 보행자 검출 시스템의 기능적 구조적 분류에 대해서 설명함. 2) 비교적 단순한 분류기의 set을 이용하여 훈련 set의 cluster 상에서 반복적으로 훈련시킴으로써, 클래스(class)의 변동성(variability)을 분리하는 새로운 전략에 기반한 단일-프레임 분류에 대해 설명함. 3) 낮 시간의 정상적인 기상 조건 상태에서 보호 시스템이 충족해야 할 격차에 대한 논의를 통해, 낮 환경에서 단일-프레임 분류의 성능 결과와 시스템 레벨의 성능 수치에 대해서 설명함. I. INTRODUCTION 본 논문에서는 차량에 장착된 주행 보조 제품의 시장을 목표로, 보행..
[논문 읽기/2019] VisDrone-MOT2019: The Vision Meets Drone Multiple Object Tracking Challenge Results Link: http://openaccess.thecvf.com/content_ICCVW_2019/papers/VISDrone/Wen_VisDrone-MOT2019_The_Vision_Meets_Drone_Multiple_Object_Tracking_Challenge_Results_ICCVW_2019_paper.pdf Abstract - 제출된 12개의 MOT(Multiple Object Tracking) 기법들에 대한 결과를 보고 - 추가로, 6개의 최신 MOT 기법들의 결과를 보고 - Challenge 결과 드론 기반 MOT에서는 아직도 풀어야 할 문제가 많이 있음. - 웹사이트: http://aiskyeye.com/ 1. Introduction - MOT는 비디오 상에서 움직이는 여러 object들에..
[논문읽기/2020] YOLOv4: Optimal Speed and Accuracy of Object Detection 문서 버전 발표 버전 Link: https://arxiv.org/pdf/2004.10934.pdf Abstract Convolutional Neural Network (CNN)의 정확도 개선을 위한 수많은 features들이 존재 이러한 feature들의 조합에 대해 대규모 데이터셋을 이용한 실제적 테스트와 결과에 대한 이론적 정당화가 요구됨 몇몇의 features들은 특정한 model에 국한되어 동작하거나, 특정한 problem에 국한되어 동작하거나, 소규모의 데이터셋에 대해서만 동작 반면에 대부분의 model, task, 데이터셋에 적용이 가능한 universal한 features들도 존재 Weighted-Residual-Connections (WRC), Cross-Stage-Partial-conne..