J4L OCR µµ±¸ ¼øÀ§ ¹× ¿ä¾à
- °Ô½ÃÀÚ À̸§:
- J4L Components
J4L OCR µµ±¸ ű×
J4L OCR µµ±¸ ¼³¸í
J4L OCR µµ±¸´Â Java ÀÀ¿ë ÇÁ·Î±×·¥¿¡¼ OCR ±â´ÉÀ» Æ÷ÇÔÇϵµ·Ï ¼³°èµÈ °·ÂÇÑ ±¸¼º ¿ä¼Ò ÁýÇÕÀÔ´Ï´Ù. Áï, Æѽº¸¦ ¼ö½ÅÇϰųª ¹®¼¸¦ ½ºÄµÇÏ°í À̹ÌÁö¿¡¼ ºñÁî´Ï½º Á¤º¸¸¦ ÃßÃâ ÇÒ ¼ö ÀÖ½À´Ï´Ù. ÁÖ 2 ±¸¼º ¿ä¼Ò´Â ´ÙÀ½°ú °°½À´Ï´Ù. ¡¤ Tesseract OCR ¿£ÁøÀÇ Java ·¡ÆÛ. OCR ¿£Áø Tesseract ÀÚü´Â Apache 2.0 ¶óÀ̼¾½º·Î ¹è´ÞµÇ¸ç Windows ¿ëÀ¸·Î ÄÄÆÄÀÏ µÈ ¹öÀü ¸¸ Áö¿øÇÕ´Ï´Ù. ¡¤ ÅؽºÆ® ¹®¼ Æļ. µû¶ó¼ À̹ÌÁö ÀÎ½Ä ÇÁ·Î¼¼½º´Â 2 ´Ü°è·Î ³ª´ ¼ö ÀÖ½À´Ï´Ù. ¡¤ ±¸¼º ¿ä¼Ò´Â À̹ÌÁö ÆÄÀÏ (TIF, PNG, JPG µî)À» »ç¿ëÇÏ°í Æ÷ÇÔ µÈ ÅؽºÆ®¸¦ ¹ÝȯÇÕ´Ï´Ù. Java Wrapper´Â Tesseract¸¦ »ç¿ë ÇÏ¿©ÀÌ ÀÛ¾÷À» ¼öÇàÇÕ´Ï´Ù. ¶Ç´Â ´Ù¸¥ OCR ¿£ÁøÀ» »ç¿ëÇÒ ¼ö ÀÖ½À´Ï´Ù. ¡¤ µÎ ¹ø° ´Ü°è¿¡¼ Java ÀÀ¿ë ÇÁ·Î±×·¥Àº OCR ¿£ÁøÀÌ ¹Ýȯ ÇÑ ÅؽºÆ®¸¦ ÀÌÇØÇؾßÇÕ´Ï´Ù. ÀÌ°ÍÀº ¹®¼ Æļ°¡ ¼öÇàÇÕ´Ï´Ù. ¹®¼ Æļ´Â ÅؽºÆ® ¹®ÀÚ¿ (µ¥ÀÌÅÍ) ¹× ¹®¼ÀÇ ±¸Á¶¸¦ ¼³¸íÇÏ´Â XML ÆÄÀÏ·Î ÀÔ·ÂÇÏ°í OUPUT´Â Java °³Ã¼ ¶Ç´Â XML ÆÄÀÏ·Î ºñÁî´Ï½º ¹®¼ÀÔ´Ï´Ù.
J4L OCR µµ±¸ °ü·Ã ¼ÒÇÁÆ®¿þ¾î