Å׸®¾î

°Ë»ö ¿£ÁøÀ» ±¸ÃàÇϱâÀ§ÇÑ È®·ü ·ÐÀû ÀÚ¹Ù ÅøŶ.
Áö±Ý ´Ù¿î·Îµå

Å׸®¾î ¼øÀ§ ¹× ¿ä¾à

±¤°í

  • Rating:
  • ƯÇã:
  • MPL
  • °¡°Ý:
  • FREE
  • °Ô½ÃÀÚ À̸§:
  • University of Glasgow
  • °Ô½ÃÀÚ À¥»çÀÌÆ®:
  • http://ir.dcs.gla.ac.uk/terrier/

Å׸®¾î ű×


Å׸®¾î ¼³¸í

°Ë»ö ¿£ÁøÀ» ±¸ÃàÇϱâÀ§ÇÑ È®·ü ·ÐÀû ÀÚ¹Ù ÅøŶ. Å׸®¾î ÇÁ·ÎÁ§Æ®´Â ºôµù °Ë»ö ¿£ÁøÀ»À§ÇÑ È®·ü ·ÐÀû Java ToolkitÀÔ´Ï´Ù. Å͸®¾î´Â À¥, ÀÎÆ®¶ó³Ý ¹× µ¥½ºÅ©Å¾ °Ë»ö ¿£ÁøÀÇ ½Å¼ÓÇÑ °³¹ßÀ»À§ÇÑ ¼ÒÇÁÆ®¿þ¾îÀÔ´Ï´Ù. º¸´Ù ÀϹÝÀûÀ¸·Î Àε¦½Ì ¹× È®·ü ·ÐÀû °Ë»ö ±â´ÉÀ» Á¦°øÇÏ´Â ´ë±Ô¸ð Á¤º¸ °Ë»ö ¾ÖÇø®ÄÉÀ̼ÇÀ» ±¸ÃàÇϱâÀ§ÇÑ ¸ðµâ Çü Ç÷§ÆûÀÔ´Ï´Ù. µ¥½ºÅ©Åé °Ë»ö ÀÀ¿ë ÇÁ·Î±×·¥ÀÌ Á¦°øµË´Ï´Ù. Å׸®¾î´Â ¸Å°³ º¯¼ö¾ø´Â È®·ü ·ÐÀû °Ë»ö Á¢±Ù¹ý (ÀÓÀǼº ¸ðµ¨ÀÇ Â÷ÀÌ¿Í °°Àº), ÀÚµ¿ Äõ¸® È®Àå / À籸¼º ¹æ¹ý ¹× È¿À²ÀûÀÎ µ¥ÀÌÅÍ ¾ÐÃà ±â¼úÀ» Æ÷ÇÔÇÑ ´Ù¾çÇÑ ÃÖ÷´Ü ±â´ÉÀ» °®Ãß°í ÀÖ½À´Ï´Ù. Å׸®¾î¿¡´Â AP, WSJ, WT10G, .gov ¹× .gov2¿Í °°Àº Ç¥ÁØ Trec Ä÷º¼ÇÀ» À妽Ì, Äõ¸® ¹× Æò°¡ÇÏ´Â ±â´ÉÀ» Æ÷ÇÔÇÏ¿© °­·ÂÇÑ °³³äÀÇ º¸Àå ¹æÁö µ¥½ºÅ©Åé °Ë»ö ÀÀ¿ë ÇÁ·Î±×·¥ ¹× Àüü Trec ±â´ÉÀÌ Á¦°øµË´Ï´Ù. Å׸®¾î´Â Java ·Î ÀÛ¼ºµÇ¸ç Áß¾Ó ÁýÁᫎ ¶Ç´Â ºÐ»ê µÈ ¼³Á¤¿¡¼­ ADHOC °Ë»ö, À¥ °Ë»ö ¹× Å©·Î½º ¾ð¾î °Ë»ö¿¡ ¼º°øÀûÀ¸·Î »ç¿ëµÇ¾ú½À´Ï´Ù. ÇöÀç ´Ù¾çÇÑ ÀÀ¿ë ÇÁ·Î±×·¥À» ½ÇÇàÇϴµ¥µµ »ç¿ëµÇ°í ÀÖ½À´Ï´Ù. ´ÙÀ½Àº "Å׸®¾î"ÀÇ ÁÖ¿ä ±â´ÉÀÌ ÀÖ½À´Ï´Ù. ¡¤ ¿ÀÇ ¼Ò½º (Mozilla Public License) ¡¤ Å©·Î½º Ç÷§Æû java·Î ÀÛ¼ºµÇ¾ú½À´Ï´Ù ¡¤ °íµµ·Î ¾ÐÃà µÈ µð½ºÅ© µ¥ÀÌÅÍ ±¸Á¶. ¡¤ ´ë±Ô¸ð ¹®¼­ Ä÷º¼Ç ó¸®. ¡¤ È¿À²ÀûÀÎ Äõ¸® È®ÀåÀ»À§ÇÑ Á÷Á¢ ÆÄÀÏ. ¡¤ ¸ðµâ ½Ä ¹× ¿­¸° Àε¦½Ì ¹× API Äõ¸®. ¡¤ Ç¥ÁØ Trec Å×½ºÆ® Ä÷º¼Ç¿¡¼­ Àε¦½Ì ¹× °Ë»öÀ» À§ÇØ Å×½ºÆ® µÊ. ¡¤ ´ëÈ­½Ä Äõ¸® ÀÀ¿ë ÇÁ·Î±×·¥. ¡¤ ´Ù¾çÇÑ À¯ÇüÀÇ ¹®¼­¸¦ °Ë»öÇÏ´Â µ¥½ºÅ©Å¾ °Ë»ö ÀÀ¿ë ÇÁ·Î±×·¥ÀÔ´Ï´Ù. ¡¤ ½ºÆ®¸² ¶Ç´Â ·£´ý ¾×¼¼½º ÆÄÀÏÀ» ¾ÐÃàÇϱâÀ§ÇÑ °¨¸¶, ´ÜÇ× ¹× ÀÌÁø ÀÎÄÚµù µÈ Á¤¼öÀÇ ÀÔÃâ·Â / Ãâ·Â. ¡¤ Trec Ad-Hoc ¹× ¾Ë·ÁÁø Ç׸ñ °Ë»ö °á°úÀÇ Ç¥ÁØ Æò°¡. ¡¤ HTML, PDF ¶Ç´Â Microsoft Word, Excel ¹× PowerPoint ÆÄÀÏ°ú °°Àº ´Ù¾çÇÑ Çü½ÄÀÇ ¹®¼­»Ó¸¸ ¾Æ´Ï¶ó űװ¡ ÁöÁ¤µÈ ¹®¼­ Ä÷º¼ÇÀÇ »öÀÎ »ý¼º. ¡¤ Çʵå Á¤º¸ÀÇ »öÀÎ »ý¼º. ¡¤ ´Ü¾î¿¡ ´ëÇÑ À§Ä¡ Á¤º¸ ¶Ç´Â ºí·Ï ·¹º§ÀÇ »öÀÎ »ý¼º. ¡¤ TF-IDF, BM25 ¹× Ponte-Croft Language Model ¹× RocchioÀÇ Äõ¸® È®Àå°ú °°Àº Ŭ·¡½Ä °Ë»ö ¸ðµ¨À» Áö¿øÇÕ´Ï´Ù. ¡¤ ¹«ÀÛÀ§ ¼º (DFR) ¹®¼­ ¼øÀ§ ¸ðµ¨¿¡¼­ ¿©·¯ °¡Áö ¹ß»êÀ» Á¦°øÇÕ´Ï´Ù. ¡¤ ÀÚµ¿ Äõ¸® È®ÀåÀ»À§ÇÑ ¸Å°³ º¯¼ö¾ø´Â DFR ¿ë¾î °¡ÁßÄ¡ ¸ðµ¨À» Á¦°øÇÕ´Ï´Ù. ¡¤ ¿î¿µÀÚ, ±¸¹® ¹× ±ÙÁ¢ °Ë»öÀ» Áö¿øÇϰųª Áö¿øÇÏÁö ¾Ê´Â °í±Þ Äõ¸® ¾ð¾î. ¡¤ ½ºÅé¿öµå Á¦°ÅÁ¦ ¹× ºÐ¼®±â¿Í °°Àº ±¸¼º ¿ä¼ÒÀÇ ÆÄÀÌÇÁ ¶óÀÎÀ» ÅëÇØ À¯¿¬ÇÑ ¿ë¾îÀÇ À¯¿¬ÇÑ Ã³¸®. ÀÌ ¸±¸®½º¿¡¼­´Â »õ·Î¿î ±â´É : ¡¤ Hadoop¿¡ ´ëÇÑ »õ·Î¿î Áö¿øÀÌ Æ÷ÇÔ µÈ ½ÇÁúÀûÀÎ ¾÷µ¥ÀÌÆ®À̸ç ÁÖ·Î Hadoop ¸ÊÀº Àε¦½Ì ½Ã½ºÅÛÀ» ÁÙÀ̱â À§ÇØ ¸¹Àº ¹®¼­¸¦ ¸Å¿ì ºÐ»ê µÈ ¹æ½ÄÀ¸·Î Àε¦½Ì ÇÒ ¼ö ÀÖ½À´Ï´Ù. ¡¤ IIT CDIP1 (Trec Legal Track) Ä÷º¼ÇÀÇ Çâ»óµÈ Áö¿ø ¹× ´Ù¾çÇÑ ¹ö±× ¼öÁ¤À» Æ÷ÇÔÇÏ¿© ´Ù¾çÇÑ »ç¼ÒÇÑ °³¼± »çÇ×ÀÌ Æ÷ÇԵǾî ÀÖ½À´Ï´Ù. ¡¤ 2.x ½Ã¸®ÁîÀÇ ±Ã±ØÀû ÀÎ ¸±¸®½º°¡µÇ¾î¾ßÇÕ´Ï´Ù.


Å׸®¾î °ü·Ã ¼ÒÇÁÆ®¿þ¾î

Nurpawiki.

Nurpawiki´Â Wiki¸¦ °áÇÕÇÑ °³ÀÎ Á¤º¸ °ü¸®ÀÚ (PIM) ÀÀ¿ë ÇÁ·Î±×·¥ÀÔ´Ï´Ù. ...

147

´Ù¿î·Îµå