반응형 ocr4 [OCR] [Tesseract - 4] Tesseract로 OCR 수행 후 특정 Text 추출 이전 포스트에서는 Contour를 통해 OCR하고자 하는 영역을 Crop 하고 OCR을 수행하도록 하였고 그런대로 좋은 결과를 얻을 수 있었습니다. 그러나 Image를 Text로 바꾸기만 하였을 뿐 Text Data를 딱히 이용하지는 못했습니다. 이번 포스트에서는 이러한 기능을 구현해 보고자 합니다. 우선, 이전 포스트 내용은 다음 링크를 참고해주세요. [OCR] [Tesseract - 3] Image Processing 진행 후 Tesseract로 OCR 수행 이전 포스트에서 Tesseract를 이용하여 OCR을 수행했습니다. 깨끗한 이미지에서는 OCR이 제대로 수행되었지만 실생활에서 사용되는 이미지들에서는 OCR이 제대로 수행되지 않았습니다. 이번 포스트 mj-thump-thump-story.tist.. 2023. 1. 18. [OCR] [Tesseract - 3] Image Processing 진행 후 Tesseract로 OCR 수행 이전 포스트에서 Tesseract를 이용하여 OCR을 수행했습니다. 깨끗한 이미지에서는 OCR이 제대로 수행되었지만 실생활에서 사용되는 이미지들에서는 OCR이 제대로 수행되지 않았습니다. 이번 포스트에서는 전처리 과정을 수행하여 OCR이 제대로 수행될 수 있도록 해볼 예정입니다. 우선, Tesseract를 통해 간단이 이미지를 OCR 해보았던 이전 포스트는 다음과 같습니다. [OCR] [Tesseract - 2] Python 환경에서 Tesseract 예제 수행 앞서 OCR 수행을 위한 Tesseract 설치를 수행했습니다. 이번 포스트에서는 실제로 Tesseract를 이용해서 OCR를 수행해 볼 것입니다. 우선, Tesseract가 준비되어 있지 않다면, Tesseract 실행을 위한 환경 조 mj-t.. 2023. 1. 17. [OCR] [Tesseract - 2] Python 환경에서 Tesseract 예제 수행 앞서 OCR 수행을 위한 Tesseract 설치를 수행했습니다. 이번 포스트에서는 실제로 Tesseract를 이용해서 OCR를 수행해 볼 것입니다. 우선, Tesseract가 준비되어 있지 않다면, Tesseract 실행을 위한 환경 조성 및 설치 방법에 대해 설명된 포스트를 참고해 주세요. Tesseract 설치 방법 [OCR] Tesseract Windows 환경에 셋업 OCR과 관련된 주제를 다뤄보고자 합니다. OCR을 수행하기 위해 Tesseract라는 것을 이용해 볼 것이며, 이에 대한 내용은 시리즈로 작성될 예정입니다. 우선, Tesseract라는 것은 무엇인지에 대해서 설명 mj-thump-thump-story.tistory.com 이제, 본격적인 Test를 진행해 봅시다. 다음과 같은 이미.. 2023. 1. 12. [OCR] [Tesseract - 1] Tesseract Windows 환경에 셋업 OCR과 관련된 주제를 다뤄보고자 합니다. OCR을 수행하기 위해 Tesseract라는 것을 이용해 볼 것이며, 이에 대한 내용은 시리즈로 작성될 예정입니다. 우선, Tesseract라는 것은 무엇인지에 대해서 설명하도록 하겠습니다. Tesseract(테서랙트)는 광학 문자 인식 엔진입니다. 이 소프트웨어는 1995년 문자 정확도 측면에서 3대 OCR 엔진에 속했으며 때문에 OCR과 관련된 정보를 검색하다 보면 쉽게 찾을 수 있습니다. 다양한 운영체제를 지원하기에 Linux, Mac OS X, Windows에서 사용할 수 있습니다. 또한 다양한 언어(= 100개 이상)를 제공합니다. 다만, GPU를 지원하지 않기 때문에 속도가 좀 느린 편입니다. 이 글을 작성하는 일자를 기준으로 Major가 되는 버전은.. 2023. 1. 12. 이전 1 다음 반응형