ÅؽºÆ® :: ngrams.

TEXT :: NGRAMS´Â À¯¿¬ÇÑ NGRAM ºÐ¼® (¹®ÀÚ, ´Ü¾î µî)ÀÔ´Ï´Ù.
Áö±Ý ´Ù¿î·Îµå

ÅؽºÆ® :: ngrams. ¼øÀ§ ¹× ¿ä¾à

±¤°í

  • Rating:
  • ƯÇã:
  • Perl Artistic License
  • °¡°Ý:
  • FREE
  • °Ô½ÃÀÚ À̸§:
  • Simon Cozens
  • °Ô½ÃÀÚ À¥»çÀÌÆ®:
  • http://search.cpan.org/~simon/Sub-Versive-0.01/Versive.pm

ÅؽºÆ® :: ngrams. ű×


ÅؽºÆ® :: ngrams. ¼³¸í

ÅؽºÆ® :: NGRAMS´Â À¯¿¬ÇÑ NGRAM ºÐ¼® (¹®ÀÚ, ´Ü¾î µî)ÀÔ´Ï´Ù. ÅؽºÆ® :: NGRAMÀº À¯¿¬ÇÑ NGRAM ºÐ¼® (¹®ÀÚ, ´Ü¾î µî)ÀÔ´Ï´Ù. ½Äº°ÀÚÀÇ ±âº» ¹®ÀÚ StringÀÇ N-gram ºÐ¼® : ÅؽºÆ® :: Ngrams; MY $ NG3 = ÅؽºÆ® :: NGRAMS-> NEW; $ NG3-> process_text ( 'abcdefg1235678hijklmnop'); $ NG3-> to_string Àμâ; my @ngramsarray = $ NG3-> get_ngrams; Çϳª´Â ÅäÅ«À» ¼öµ¿À¸·Î °ø±Þ ÇÒ ¼öµµ ÀÖ½À´Ï´Ù. ÅؽºÆ® :: ngrams; MY $ NG3 = ÅؽºÆ® :: NGRAMS-> NEW; $ NG3-> feed_tokens ( 'a'); $ NG3-> feed_tokens ( 'b'); $ NG3-> feed_tokens ( 'c'); $ NG3-> feed_tokens ( 'd'); $ NG3-> feed_tokens ( 'e'); $ NG3-> feed_tokens ( 'f'); $ NG3-> feed_tokens ( 'g'); $ ng3-> feed_tokens ( 'h'); ¿ì¸®´Â ´Ù¾çÇÑ Å©±âÀÇ n- ±×·¥À» ¼±ÅÃÇÒ ¼ö ÀÖ½À´Ï´Ù. ¿¹ : My $ ng = text :: ngrams-> new (windowsize => 6); ¶Ç´Â ´Ù¸¥ À¯ÇüÀÇ n-grams, ¿¹¸¦ µé¾î, : ³» $ ng = text :: ngrams-> new (type => byte); ³» $ ng = text :: ngrams-> new (type => word); $ ng = text :: ngrams-> new (type => utf8); $ ng-> process_files ( 'somefile.txt', 'otherfile.txt', 'otherfile.txt');ÀÌ ¸ðµâÀº ÅؽºÆ®¸¦ ±¸ÇöÇÕ´Ï´Ù n- ±×·¥ ºÐ¼®, ¹®ÀÚ ¹× ´Ü¾î n-grams.The ¸ðµâ ÅؽºÆ®¸¦ Æ÷ÇÔÇÑ ¿©·¯ À¯ÇüÀÇ ºÐ¼®À» Áö¿øÇÕ´Ï´Ù :: NgramÀº ¸Å¿ì À¯¿¬ÇÕ´Ï´Ù. ¿¹¸¦ µé¾î, »ç¿ëÀÚ´Â ¼öµ¿À¸·Î ¸ðµç ÅäÅ« ½ÃÄö½º¸¦ °ø±ÞÇÒ ¼ö ÀÖ½À´Ï´Ù. ¿©·¯ À¯ÇüÀÇ ÅäÅ« (¹®ÀÚ, ´Ü¾î)À» ó¸®Çϸç ÀÚµ¿ ÀÎ½Ä ¹× ÅäÅ«ÀÇ °ø±Þ ¹× N-Gram¿¡¼­ °áÇյǴ ¹æ½ÄÀ¸·Î ¸¹Àº À¯¿¬¼ºÀ» Çã¿ëÇÕ´Ï´Ù. ÃÖ´ë ÁöÁ¤µÈ ±æÀ̱îÁö ¸ðµç n-gram ÁÖÆļö¸¦ °è»êÇÕ´Ï´Ù. Ãâ·Â Çü½ÄÀº ¸Å¿ì ¸¹Àº »ç¶÷ÀÌ ÀÐÀ» ¼öÀÖ´Â ¹Ý¸é¼­ ¸ðµâ¿¡ ÀÇÇصµ ÀûÀ» °¡´ÉÇÕ´Ï´Ù. ÆÐÅ°Áö¿Í ÇÔ²² Á¦°øµÈ ½ºÅ©¸³Æ® ngrams.pl ½ºÅ©¸³Æ®¸¦ ÅëÇØ ¸í·É ÁÙ¿¡¼­ ¸ðµâÀ» »ç¿ëÇÒ ¼ö ÀÖ½À´Ï´Ù. ¡¤ »ç¿ëÀÚ°¡ À¯ÇüÀ» »ç¿ëÀÚ Á¤ÀÇÇÏ´Â °æ¿ì, °á°úÀûÀ¸·Î n-gramÀÌ ¸ðÈ£ÇÏ°Ô µÉ ¼öµµ ÀÖ½À´Ï´Ù. ÀÌ·¯ÇÑ ¹æ½ÄÀ¸·Î, »óÀÌÇÑ n- ±×·¥¿¡ Çϳª¾¿ °è»ê µÉ ¼öÀÖ´Ù. ¹Ì¸® Á¤ÀÇ µÈ À¯ÇüÀÇ n-gramÀ» »ç¿ëÇϸéÀÌ ÀÏÀÌ ÀϾÁö ¾Ê¾Æ¾ßÇÕ´Ï´Ù. ¿¹¸¦ µé¾î »ç¿ëÀÚ°¡ ÅäÅ«À» °ø¹éÀ» Æ÷ÇÔÇÏ°í °ø¹éÀ» n-gram ºÐ¸®±â·Î »ç¿ëÇÏ´Â °æ¿ìÀÌ "x x x x"¿Í °°Àº Æ®¸®±×·¥Àº ¸ðÈ£ÇÕ´Ï´Ù. ¡¤ ¸Þ¼Òµå process_fileÀº ±âº»ÀûÀ¸·Î ´ÙÁß Çà ÅäÅ«À» ó¸®ÇÏÁö ¾Ê½À´Ï´Ù. ÀÌ°ÍÀº ¼öÁ¤ µÉ ¼ö ÀÖÁö¸¸ ÄÚµå ÇÕº´ÁõÀÇ °¡Ä¡°¡ÀÖ´Â °ÍÀ¸·Î º¸ÀÔ´Ï´Ù. ÇϳªÀÇ ÅäÅ«ÀÌ ÇÊ¿äÇϸéÀÌ ÁÖÀ§¿¡ ´Ù¾çÇÑ ¹æ¹ýÀÌ ÀÖ½À´Ï´Ù. ÇÑ °¡Áö ¹æ¹ýÀº ±×µéÀ» Àüó¸®ÇÏ´Â °ÍÀÔ´Ï´Ù. ¶Ç ´Ù¸¥ ¹æ¹ýÀº ¸ÖƼ ¶óÀÎ ÅäÅ«À» ó¸®ÇÏ´Â process_text¸¦ »ç¿ëÇÏ¿© ÇÊ¿äÇÑ °æ¿ì ÇÊ¿ä¿¡ µû¶ó ¸¹Àº ÅؽºÆ®¸¦ Àд °ÍÀÔ´Ï´Ù. ¿ä±¸ »çÇ× : ¡¤ Perl.


ÅؽºÆ® :: ngrams. °ü·Ã ¼ÒÇÁÆ®¿þ¾î