본문 바로가기

Computer Vision/Optical Character Recognition

(2)
[논문 읽기/2020] Text Detection and Recognition in the Wild: A Review link: arxiv.org/pdf/2006.04305.pdf Abstract 자연 이미지에서 text를 detection하고 recognition 하는 것은 스포츠 비디오, 자율 주행, 산업 자동화 등의 다양한 분석에 적용되는 컴퓨터 비전 분야의 2가지 주요한 문제임. 이들은 여러 환경 조건에 따라 text가 어떻게 표현되고 영향을 받는지에 대한 요인인 일반적이면서도 어려운 문제에 직면을 함. 현재 최신의 scene detection과 recognition 기법들은 딥러닝 아키텍처의 관찰된 발전을 활용하였으며, 여러 해상도와 여러 방향성이 있는 text를 다룸에 있어서 벤치마크 데이터셋 상에서 우수한 성능을 보이는 것으로 보고가 됨. 하지만, 모델이 보이지 않는 데이터로 일반화 할 수 없으며, labe..
[논문 읽기/2021] A Survey of Deep Learning Approaches for OCR and Document Understanding link: arxiv.org/pdf/2011.13534.pdf Abstract 문서는 법률, 금융, 기술 등의 여러 분야에서 많은 비지니스의 핵심적 역할을 하며, 문서를 자동으로 이해하는 것은 여러 새로운 비지니스의 길을 열어줌. 자연어 처리 및 컴퓨터 비전 분야는 딥러닝의 발전을 통해 상당한 진전을 이루었고 현대의 문서를 이해하는 시스템에 도입이 되기 시작함. 본 논문에서는 영어로 작성된 문서 이해를 위한 다양한 기술들을 검토하고 이 분야를 연구하는 연구자들에게 출발점 역할을 하기 위해 현존하는 방법론들을 통합함. 1 Introduction 인간은 정보를 기록하고 보존하기 위해 문서를 작성하며, 정보 운반 수단으로써 문서는 다양한 소비자들을 고려하여 다양한 정보들의 집합을 나타내기 위해 다양한 레이아웃..