본문 바로가기

분류 전체보기

(43)
Image Classification Paper List(1998~2021) Image Classificaiton Task와 관련하여 1998년부터 2021년까지 제안된 다양한 딥러닝 기반 논문들에 대해 Years 별로 목록를 만들어봄. Network Name은 저자가 특별히 칭한 경우에는 약어로, 그렇지 않은 경우에는 Full Name으로 표기함. 또한, 논문에서 따로 명시를 하지 않은 경우에는 실험에 사용된 Network Name으로 표기함. 논문들은 https://archive.org/ 를 기준으로 정리했으며, 제출년도가 동일한 논문들은 제출날짜 별로 따로 정렬하지 않았음. 또한, 논문이 여러 버전을 가지고 있는 경우에는 최초에 제출된 버전을 기준으로 제출년도를 기입함. archive로 검색이 안되는 논문들의 경우 검색 가능한 해당 논문의 Link를 기입함. Years Ne..
[논문 읽기/2020] Text Detection and Recognition in the Wild: A Review link: arxiv.org/pdf/2006.04305.pdf Abstract 자연 이미지에서 text를 detection하고 recognition 하는 것은 스포츠 비디오, 자율 주행, 산업 자동화 등의 다양한 분석에 적용되는 컴퓨터 비전 분야의 2가지 주요한 문제임. 이들은 여러 환경 조건에 따라 text가 어떻게 표현되고 영향을 받는지에 대한 요인인 일반적이면서도 어려운 문제에 직면을 함. 현재 최신의 scene detection과 recognition 기법들은 딥러닝 아키텍처의 관찰된 발전을 활용하였으며, 여러 해상도와 여러 방향성이 있는 text를 다룸에 있어서 벤치마크 데이터셋 상에서 우수한 성능을 보이는 것으로 보고가 됨. 하지만, 모델이 보이지 않는 데이터로 일반화 할 수 없으며, labe..
[논문 읽기/2021] A Survey of Deep Learning Approaches for OCR and Document Understanding link: arxiv.org/pdf/2011.13534.pdf Abstract 문서는 법률, 금융, 기술 등의 여러 분야에서 많은 비지니스의 핵심적 역할을 하며, 문서를 자동으로 이해하는 것은 여러 새로운 비지니스의 길을 열어줌. 자연어 처리 및 컴퓨터 비전 분야는 딥러닝의 발전을 통해 상당한 진전을 이루었고 현대의 문서를 이해하는 시스템에 도입이 되기 시작함. 본 논문에서는 영어로 작성된 문서 이해를 위한 다양한 기술들을 검토하고 이 분야를 연구하는 연구자들에게 출발점 역할을 하기 위해 현존하는 방법론들을 통합함. 1 Introduction 인간은 정보를 기록하고 보존하기 위해 문서를 작성하며, 정보 운반 수단으로써 문서는 다양한 소비자들을 고려하여 다양한 정보들의 집합을 나타내기 위해 다양한 레이아웃..
[Computer Vision Researchers] 내가 좋아하는 컴퓨터 비전 연구자들 1. Amnon Shashua(www.cs.huji.ac.il/~shashua/) ADAS를 연구하는 사람들은 누구나 한번쯤 들어봤을 mobileye(www.mobileye.com/)를 만든 창립자로서(지금은 인텔에 인수됨), 현재 이스라엘의 히브리대 교수이자 mobileye의 CEO이자 intel의 부사장으로 일을 하고 있다. 추가로, 많은 사람들에게 알려지진 않았지만 시각 장애인분들을 돕는 웨어러블기기를 만드는 OrCAM(www.orcam.com/ko/)의 Co-CEO이기도 하다. 그는 학교 시절부터 Shimon Ullman 교수와 Tomaso Poggio 교수 등과 같은 대가들로부터 교육을 받았다. 석사 과정 시절에는 이스라엘의 바이츠만연구소(Weizmann Institute of Science)에..
[People Detection and Tracking] Tracking by Detection Approaches 실시간으로 여러 사람을 검출하고 추적해야 할 필요성이 있어서 1080 ti single GPU 환경에서, 적어도 fps 20 이상의 실시간성이 보장되는 접근들의 조합을 이용해서 단순한 테스트를 해보았다. tracking by detection의 접근을 이용하였으며, 사용한 알고리즘들은 아래와 같다. Object Detection YOLOv4: Optimal Speed and Accuracy of Object Detection: 리뷰 링크 Multiple Object Tracking SORT(Simple Online and Realtime Tracking): 리뷰 링크 DeepSORT(Simple Online and Realtime Tracking with a Deep Association Metric):..
Sample Consensus를 위한 Robust Parameter Estimation 기법들 연도별 정리(RANSAC 이후) SRI International AI Center의 Fischler 박사님(http://www.ai.sri.com/people/fischler)이 RANSAC(apps.dtic.mil/dtic/tr/fulltext/u2/a460585.pdf)을 제안한 건 1980년이다. 40년이 지난 알고리즘이지만, 다양한 분야에 적용 가능하기에 RANSAC은 여전히 많은 사랑을 받고 있다. 참고로 내가 관심을 가지고 있는 컴퓨터 비젼 분야의 경우 feature matching이나 motion estimation을 위한 목적으로 그동안 많이 사용되어 왔으며, 영상처리나 컴퓨터 비젼을 하는 사람들은 누구나 한번쯤은 들어봤을만큼 유명한 알고리즘이다. 특히, 올해 CVPR 2020에는 RANSAC과 관련된 튜토리얼(http:..
운전자 졸음 검출 기술 동향 및 개발 가능성 검토 약 5년전에 만들었던 발표 자료
위성 영상에서 객체 검출과 관련된 논문들 목록 정리 Recently Dataset DOTA: A Large-scale Dataset for Object Detection in Aerial Images DIOR: Object Detection in Optical Remote Sensing Images: A Survey and A New Benchmark Review DIOR: Object Detection in Optical Remote Sensing Images: A Survey and A New Benchmark Vessel detection and classification from spaceborne optical images: A literature survey(배 검출 및 분류에 특화) Data Augmentation A Data Augmenta..