Optimal Crawling Strategies for Web Search Engines J.L. Wolf, M.S. Squillante, P.S. Yu IBM Watson Research Center ÐÛÓÐ Ñ Ô ÝÙÙ ºÑºÓÑ J. Sethuraman IEOR Department Columbia University jay@ieor.columbia.edu L. Ozsen OR Department Northwestern University ozsen@yahoo.com ABSTRACT Ï ËÖ ÒÒ ÑÔÐÓÝ ÑÙÐØÔÐ Ó¹ÐÐ ÖÛÐÖ ØÓ ÑÒØÒ ÐÓÐ ÓÔ Ó Û Ô º ÙØ Ø Û Ô Ö ÖÕÙÒØÐÝ ÙÔØ Ý ØÖÓÛÒÖ Ò ØÖÓÖ Ø ÖÛÐÖ ÑÙ Ø ÖÙÐÖÐÝ ÖÚ Ø Ø Û Ô ØÓ ÑÒØÒ Ø Ö Ò Ó ØÖ ÐÓÐ ÓÔ º ÁÒ Ø ÔÔÖ Û ÔÖÓÔÓ ØÛÓ¹ÔÖØ Ñ ØÓ ÓÔØÑÞ Ø ÖÛÐÒ ÔÖÓ º ÇÒ ÓÐ ÑØ Ø ÑÒÑÞØÓÒ Ó Ø ÚÖ ÐÚÐ Ó Øй Ò ÓÚÖ ÐÐ Û Ô Ò Ø Ñ Û ÔÖÓÔÓ Ò ÓÐÚ Ø ÔÖÓÐѺ ÐØÖÒØÚÐÝ Ø Ñ Ñ ÓÙÐ Ù ØÓ ÑÒÑÞ ÔÓ ÐÝ ÑÓÖ ÑÔÓÖØÒØ Ö Ò¹ Ò ÑÖÖ ÑÒØ ÐÚÐ ÑØÖ Ì ÖÕÙÒÝ ÛØ Û ÐÒØ Ñ Ö ÒÒ ÕÙÖÝ Ò ØÒ Ð ÓÒ ÖØÙÖÒ ÙÖÐ ÓÒÐÝ ØÓ Ò ØØ Ø Ö ÙÐØ ÒÓÖÖغ Ì Ö Ø ÔÖØ ÓÙÖ Ñ ØÖÑÒ Ø ÒÖÐݵ ÓÔØÑÐ ÖÛй Ò ÖÕÙÒ ÛÐÐ Ø ØÓÖØÐÐÝ ÓÔØÑÐ ØÑ ØÓ ÖÛÐ Û Ôº ÁØ Ó Ó ÛØÒ Ò ÜØÖÑÐÝ Ò¹ ÖÐ ØÓ Ø ÖÑÛÓÖ ÓÒ Û ÙÔÔÓÖØ Û ÖÒ Ó ÓÑÔÐÜ ÙÔØ ÔØØÖÒ ÓÙÒ Ò ÔÖغ ÁØ Ù Ø¹ ÒÕÙ ÖÓÑ ÔÖÓÐØÝ ØÓÖÝ Ò Ø ØÓÖÝ Ó Ö ÓÙÖ Ð¹ ÐÓØÓÒ ÔÖÓÐÑ Û Ö ÐÝ ÓÑÔÙØØÓÒÐÐÝ ÆÒØ ß ÖÙÐ ÓÖ ÔÖØÐØÝ Ù Ø Þ Ó Ø ÔÖÓÐÑ Ò Ø Û ÒÚÖÓÒÑÒØ ÑÑÒ º Ì ÓÒ ÔÖØ ÑÔÐÓÝ Ø ÖÛÐÒ ÖÕÙÒ Ò Ð ÖÛÐ ØÑ ÒÔÙØ Ò ÖØ Ò ÓÔØÑÐ ÚÐ ÙÐ ÓÖ Ø ÖÛÐÖ º ÇÙÖ ÓÐÙØÓÒ ÓÒ ÒØÛÓÖ ÓÛ ØÓÖÝ ÜØ ÛÐÐ ÐÝ ÆÒغ Ò ÒÐÝ Ó Ø ÙÔØ ÔØØÖÒ ÖÓÑ ÐÝ Ò ÐÝ ÝÒÑ Û Ø Ù ØÓ Ò ÓÑ Ò Ø ÒØÓ Ø ÔÖÓÔÖØ Ó Ô ÙÔØ Ò ÔÖغ ÌÒ ÓÒ Ø ÒÐÝ Û ÔÖÓÖÑ Ø Ó ØÐ ÑÙÐØÓÒ ÜÔÖÑÒØ ØÓ ÑÓÒ ØÖØ Ø ÕÙÐØÝ Ò Ô Ó ÓÙÖ ÔÔÖÓº Categories and Subject Descriptors Àº ÁÒÓÖÑØÓÒ ËÝ ØÑ ÁÒÓÖÑØÓÒ ËØÓÖ Ò Ê¹ ØÖÚÐ º¾ ÅØÑØ Ó ÓÑÔÙØÒ ÖØ ÅØÑØ ÈÖÓÐØÝ Ò ËØØ Ø General Terms ÐÓÖØÑ ÈÖÓÖÑÒ Ò ÌÓÖÝ 1. INTRODUCTION Ï Ö ÒÒ ÔÐÝ ÚØÐ ÖÓÐ ÓÒ Ø ÏÓÖÐ Ï Ï Ò ØÝ ÔÖÓÚ ÓÖ ÑÒÝ ÐÒØ Ø Ö Ø ÔÓÒØÖ ØÓ Copyright is held by the author/owner(s). ÏÏϾ¼¼¾, May 7 11, 22, Honolulu, Hawaii, USA. ACM 1-58113-449-5/2/5. Û Ô Ó ÒØÖ Øº ËÙ Ö ÒÒ ÑÔÐÓÝ ÖÛÐÖ ØÓ ÙÐ ÐÓÐ ÖÔÓ ØÓÖ ÓÒØÒÒ Û Ô Û ØÝ ØÒ Ù ØÓ ÙÐ Ø ØÖÙØÙÖ Ù ÙÐ ØÓ Ø Ö ÔÖÓ¹ º ÓÖ ÜÑÔÐ Ò ÒÚÖØ ÒÜ ÖØ ØØ ØÝÔÐÐÝ ÓÒ Ø Ó ÓÖ ØÖÑ ÓÖØ Ð Ø Ó Ø ÔÓ ØÓÒ Ò Ø ÚÖÓÙ Û Ô º ÇÒ Ø ÓØÖ Ò Û Ô Ö ÖÕÙÒØÐÝ ÙÔØ Ý ØÖ ÓÛÒÖ ¾½ ¾ ÓÑØÑ ÑÓ ØÐÝ Ò ÓÑØÑ ÑÓÖ Ò ÒØÐݺ ÐÖ ØÙÝ Ò ¾ ÒÓØ ØØ ¾ ± Ó Ø Û Ô Ò ÐÝ ÛÐ ¼± Ó ÓÑÑÖÐ Û Ô Ò Ðݺ ËÓÑ Û Ô ÔÔÖ ÓÑÔÐØÐÝ Ò ¾ ÖÔÓÖØ Ð¹Ð Ó ½¼ Ý ÓÖ Û Ô º Ì Ø ØÖ Ý Ö ÒÒ ÙÖÒ Ø ÖÛÐ Ò ØÙ ÕÙÐÝ ÓÑ ØÐ ÓÖ ÓÙØ Ó Øº ËÓ ÖÛÐÖ ÑÙ Ø Ö¹ ÙÐÖÐÝ ÖÚ Ø Ø Û Ô ØÓ ÑÒØÒ Ø Ö Ò Ó Ø Ö ÒÒ³ غ ÁÒ Ø ÔÔÖ Û ÔÖÓÔÓ ØÛÓ¹ÔÖØ Ñ ØÓ ÓÔØÑÞ Ø ÖÛÐÒ ÓÖ ÔÖÔ ÑÓÖ ÔÖ ÐÝ Ø ÖÖÛÐÒµ ÔÖÓ º ÇÒ Ö ÓÒÐ ÓÐ Ò Ù Ñ Ø ÑÒ¹ ÑÞØÓÒ Ó Ø ÚÖ ÐÚÐ Ó ØÐÒ ÓÚÖ ÐÐ Û Ô Ò Ø Ñ Û ÔÖÓÔÓ Ö Ò ÓÐÚ Ø ÔÖÓÐѺ Ï ÐÚ ÓÛÚÖ ØØ ÐØÐÝ «ÖÒØ ÑØÖ ÔÖÓ¹ Ú ÖØÖ ÙØÐØݺ Ì ÒÚÓÐÚ Ó¹ÐÐ ÑÖÖ ¹ ÑÒØ ÑØÖ Ì ÖÕÙÒÝ ÛØ Û ÐÒØ Ñ Ö ÒÒ ÕÙÖÝ Ð ÓÒ ÙÖÐ ÖØÙÖÒ Ý Ø Ö ÒÒ Ò ØÒ Ò ØØ Ø Ö ÙÐØÒ Ô ÒÓÒ ØÒØ ÛØ Ö ÔØ ØÓ Ø ÕÙÖݺ ÁÒ Ø ÓÒØÜØ ÓÓÒ ÛÓÙÐ ÓÖÖ ÔÓÒ ØÓ Ø Ö ÒÒ ÚÒ Ö ÓÔÝ Ó Ø Û Ôº ÀÓÛÚÖ Ò ÑÙ Ø ÔÖØØÓÒ ÒØÓ ÐÙÝ Ò ÙÒÐÙÝ ØÓÖ Ì Ö ÒÒ Ò ÙØ ÐÙÝ Ò ÚÖØÝ ÓÛÝ º ÁÒ ÓÖÖ Ó ÒÖ Ò ÐÙÒ Ø ÔÓ ÐØ Ö ½µ Ì Û Ô ÑØ ØÐ ÙØ ÒÓØ ÖØÙÖÒ ØÓ Ø ÐÒØ Ö ÙÐØ Ó Ø ÕÙÖÝ ¾µ Ì Û Ô ÑØ ØÐ ÖØÙÖÒ ØÓ Ø ÐÒØ Ö ÙÐØ Ó Ø ÕÙÖÝ ÙØ ÒÓØ Ð ÓÒ Ý Ø ÐÒØ Ò µ Ì Û Ô ÑØ ØÐ ÖØÙÖÒ ØÓ Ø ÐÒØ Ö ÙÐØÓ Ø ÕÙÖÝ Ð ÓÒ Ý Ø ÐÒØ ÙØ ÑØ ÓÖÖØ ÛØ Ö ÔØ ØÓ Ø ÕÙÖÝ ÒÝÛݺ ËÓ Ø ÑØÖ ÙÒÖ Ù ÓÒ ÛÓÙÐ ÓÒÐÝ ÓÙÒØ ØÓ ÕÙÖ ÓÒ Û Ø Ö ÒÒ ØÙÐÐÝ ÑÖÖ Ì Û Ô ØÐ ÖØÙÖÒ ØÓ Ø ÐÒØ ÛÓ Ð ÓÒ Ø ÙÖÐ ÓÒÐÝ ØÓ Ò ØØ Ø Ô ØÖ ÒÓÒ ØÒØ ÛØ Ö ÔØ ØÓ Ø ÓÖÒÐ ÕÙÖÝ ÓÖ ÛÓÖ Ýص ÖÓÒ ÐÒº ÓÖÒ ØÓ ½ Ò ÒÓØ Ò ÙÔ ØÓ ½± Ó Ø ÐÒ Ò Ö ÒÒ Ö ÖÓÒ ÒÓØ ÓÓ ØØ Ó «Ö ºµ Ì Ö Ø ÓÑÔÓÒÒØ Ó ÓÙÖ ÔÖÓÔÓ Ñ ØÖÑÒ Ø ÓÔØÑÐ ÒÙÑÖ Ó ÖÛÐ ÓÖ Û Ô ÓÚÖ Ü ÔÖÓ Ó ØÑ ÐÐ Ø ÙÐÒ ÒØÖÚÐ ÛÐÐ ØÖ¹ 136
ÑÒÒ Ø ØÓÖØÐÐÝ ÓÔØÑРе ÖÛÐ ØÑ Øѹ ÐÚ º Ì ØÛÓ ÔÖÓÐÑ Ö ÐÝ ÒØÖÓÒÒغ Ì Ñ Ñ Ò Ù ØÓ ÓÔØÑÞ ØÖ Ø Øй Ò ÓÖ ÑÖÖ ÑÒØ ÑØÖ Ò ÔÔÐÐ ÓÖ Û ÚÖØÝ Ó ØÓ Ø ÙÔØ ÔÖÓ º Ì ÐØÝ ØÓ Ò¹ Ð ÓÑÔÐÜ ÙÔØ ÔÖÓ Ò ÒÖÐ ÙÒ ÖÑÛÓÖ ØÙÖÒ ÓÙØ ØÓ Ò ÑÔÓÖØÒØ ÚÒØ Ò ÓÒØÖÙØÓÒ Ó ÓÙÖ ÔÔÖÓ Ò ØØ Ø ÙÔØ ÔØØÖÒ Ó ÓÑ Ð Ó Û Ô ÔÔÖ ØÓ ÓÐÐÓÛ ÖÐÝ ÓÑÔÐÜ ÔÖÓ Û ÛÐÐ ÑÓÒ ØÖغ ÒÓØÖ ÑÔÓÖØÒØ ÑÓÐ ÙÔÔÓÖØ Ý ÓÙÖ ÒÖÐ ÖÑÛÓÖ ÑÓØÚØ Ý ÓÖ ÜÑÔÐ Ò ÒÓÖÑØÓÒ ÖÚ ØØ ÙÔØ Ø Û Ô Ø ÖØÒ ØÑ Ó Ø Ý Ò ÙÔØ ØÓ Ø Ô Ò Öݺ Ì Û Û ÐÐ ÕÙ ¹ØÖÑÒ Ø ÖØÖÞ Ý Û Ô ÛÓ ÙÔØ ÑØ ÖØÖÞ Óѹ ÛØ ÑÓÖ ØÖÑÒ Ø Ò Ø Ò ØØ ØÖ Ö Ü ÔÓØÒØÐ ØÑ Ø Û ÙÔØ ÑØ ÓÖ ÑØ ÒÓØ Ó¹ ÙÖº Ç ÓÙÖ Û Ô ÛØ ØÖÑÒ Ø ÙÔØ Ö ÔÐ Ó Ø ÕÙ ¹ØÖÑÒ Ø ÑÓк ÙÖØÖÑÓÖ Ø ÖÛÐÒ ÖÕÙÒÝ ÔÖÓÐÑ Ò ÓÐÚ ÙÒÖ ¹ ØÓÒÐ ÓÒ ØÖÒØ Û Ñ Ø ÓÐÙØÓÒ ÑÓÖ ÔÖØÐ Ò Ø ÖÐ ÛÓÖÐ ÓÖ ÜÑÔÐ ÓÒ Ò ÑÔÓ ÑÒÑÙÑ Ò ÑÜÑÙÑ ÓÙÒ ÓÒ Ø ÒÙÑÖ Ó ÖÛÐ ÓÖ ÚÒ Û Ôº Ì ÐØØÖ ÓÙÒ ÑÔÓÖØÒØ Ù ÖÛÐÒ Ò ØÙÐÐÝ Ù ÔÖÓÖÑÒ ÔÖÓÐÑ ÓÖ Û Ø º Ì Ö Ø ÓÑÔÓÒÒØ ÔÖÓÐÑ ÓÖÑÙÐØ Ò ÓÐÚ Ù ¹ Ò ÚÖØÝ ÓØÒÕÙ ÖÓÑ ÔÖÓÐØÝ ØÓÖÝ ¾ ¾ Ò Ø ØÓÖÝ Ó Ö ÓÙÖ ÐÐÓØÓÒ ÔÖÓÐÑ ½¾ ½ º Ï ÒÓØ ØØ Ø ÓÔØÑÞØÓÒ ÔÖÓÐÑ Ö Ö ÑÙ Ø ÓÐÚ ÓÖ Ù Ò ØÒ Ì Þ Ó Ø ÏÓÖÐ Ï Ï ÒÓÛ ØÑØ Ø ÓÚÖ ÓÒ ÐÐÓÒ Ô Ø ÙÔØ ÖØ Ó Ø Û Ô ÐÖ ÒÐ ÖÛÐÖ Ò ÖÛÐ ÑÓÖ ØÒ ÑÐÐÓÒ Ô ÔÖ Ý Ò Ö ÒÒ Ñ¹ ÔÐÓÝ ÑÙÐØÔÐ ÖÛÐÖ º ØÙÐÐÝ ¾ ÒÓØ ØØ ØÖ ÓÛÒ ÖÛÐÖ Ò ÒÐ ¼¹½¼¼ ÖÛÐ ÔÖ ÓÒ ÛÐ ÓØÖ Ò ÒÐ ÚÖÐ ÙÒÖ ÖÛÐ ÔÖ ÓÒº Ï ÓÙÐ ÒÓØ ÓÛÚÖ ØØ ÖÛÐÒ ÓØÒ Ö ØÖØ ØÓ Ð Ù Ý ÔÖÓ Ò Ø Ýºµ ÓÒØÖÙØÓÒ Ó Ø ÔÔÖ Ø Ò¹ ØÖÓÙØÓÒ Ó ØعӹعÖØ Ö ÓÙÖ ÐÐÓØÓÒ ÐÓÖØÑ ØÓ ÓÐÚ Ø ÔÖÓÐÑ º Ì ÓÒ ÓÑÔÓÒÒØ Ó ÓÙÖ Ñ ÑÔÐÓÝ Ø Ò¹ ÔÙØ Ø ÓÙØÔÙØ ÖÓÑ Ø Ö Ø ÓÑÔÓÒÒغ Ò Ø ÓÒ¹ Ø Ó Ø ÓÔØÑÐ ÒÙÑÖ Ó ÖÛÐ Ò Ø Ð ÖÛÐ ØÑ µº ÁØ ØÒ Ò Ò ÓÔØÑÐ ÚÐ ÙÐ ÓÖ Ø ÖÛÐÖ ØÑ ÐÚ º Ì ÔÖÐÐÐ ÑÒ ÙÐÒ ÔÖÓÐÑ ¾¼ Ù Ó Ø ÑÙÐØÔÐ ÖÛÐÖ º ÙÖØÖ¹ ÑÓÖ ÓÑ Ó Ø ÙÐÒ Ø Ú ÖÐ Ø ¹ Ù ÓÖ ÜÑÔÐ Ø ÒÓØ Ù ÙÐ ØÓ ÙÐ ÖÛÐ Ø ÓÒ ÕÙ ¹ØÖÑÒ Ø Û Ô ÓÖ Ø ÔÓØÒØÐ ÙÔØ Ø Ôк ÇÙÖ ÓÐÙØÓÒ ÓÒ ÒØÛÓÖ ÓÛ ØÓÖÝ Ò Ò ÔÓ Ô ÐÐÝ ØÖÒ ÔÓÖØØÓÒ ÔÖÓÐÑ ½ º Ì ÔÖÓÐÑ ÑÙ Ø Ð Ó ÓÐÚ ÓÖ ÒÓÖÑÓÙ Ò ØÒ Ò Ò ØÖ Ö Ø ÐÓÖØÑ ÚÐÐ Ø ÓÙÖ ÔÓ Ðº ÅÓÖÓÚÖ ÓÒ Ò ÑÔÓ ØÓÒÐ ÖйÛÓÖÐ ÓÒ ØÖÒØ Ù Ö ØÖØ ÖÛÐÒ ØÑ ÓÖ ÚÒ Û Ôº Ï ÒÓÛ Ó ÖÐØÚÐÝ Û ÖÐØ ÔÔÖ Ò Ø Ö Ö ÐØÖØÙÖº ÈÖÔ Ø ÑÓ Ø ÖÐÚÒØ º Ë Ð Ó ¾ ÓÖ ÑÓÖ ÒÖÐ ÙÖÚÝ ÖØкµ ÁÒ Ø ÙØÓÖ ÒØÐÐÝ ÒØÖÓÙ Ò ÓÐÚ ÚÖ ÓÒ Ó Ø ÔÖÓÐÑ Ó ÒÒ Ø ÓÔØÑÐ ÒÙÑÖ Ó ÖÛÐ ÔÖ Ôº ÌÝ ÑÔÐÓÝ Øй Ò ÑØÖ Ò ÙÑ ÈÓ ÓÒ ÙÔØ ÔÖÓ º ÌÖ ÐÓÖØÑ ÓÐÚ Ø Ö ÙÐØÒ ÓÒØÒÙÓÙ Ö ÓÙÖ ÐÐÓ¹ ØÓÒ ÔÖÓÐÑ Ý Ø Ù Ó ÄÖÒ ÑÙÐØÔÐÖ º ÁÒ Ø ÙØÓÖ Ð Ó ØÙÝ ÑÐÖ ÔÖÓÐÑ ÈÓ ÓÒ ÙÔØ ÙØ ÛØ ÒÖÐ ÖÛÐ ØÑ ØÖÙØÓÒ µ ÛØ ÛØ ÔÖÓ¹ ÔÓÖØÓÒÐ ØÓ Ø Ô ÙÔØ ÖÕÙÒ º ÌÝ ÔÖ ÒØ ÙÖ Ø ØÓ ÒÐ ÐÖ ÔÖÓÐÑ Ò ØÒ º Ì ÔÖÓÐÑ Ó ÓÔØÑÞÒ Ø ÒÙÑÖ Ó ÖÛÐÖ ØÐ Ò ¾ ÓÒ ÕÙÙÒ¹ØÓÖØ ÒÐÝ Ò ÓÖÖ ØÓ ÚÓ Ø ØÛÓ ÜØÖÑ Ó ØÖÚØÓÒ Ò ØÙÖØÓÒº ÁÒ ÙÑÑÖÝ ØÖ ÓÑ ÐØÖØÙÖ ÓÒ Ø Ö Ø ÓÑÔÓÒÒØ Ó ÓÙÖ ÖÛÐÖ ÓÔع ÑÞØÓÒ Ñ ØÓÙ Û Ú ÒÓØ ÓÚ ÚÖÐ ÔÓØÒ¹ ØÐ ÚÒØ Ó ÓÙÖ ÔÔÖÓº ÌÓ ÓÙÖ ÒÓÛÐ Ø Ø Ö Ø ÔÔÖ ØØ ÑÒÒÙÐÐÝ ÜÑÒ Ø ÓÖÖ ÔÓÒ¹ Ò ÙÐÒ ÔÖÓÐÑ Û Ø ÓÒ ÓÑÔÓÒÒØ Ó ÓÙÖ Ñº ÒÓØÖ ÑÔÓÖØÒØ ÔØ Ó ÓÙÖ ØÙÝ ÓÒÖÒ Ø Ø¹ Ø ØÐ ÔÖÓÔÖØ Ó Ø ÙÔØ ÔØØÖÒ ÓÖ Û Ô º Ì ÐÖÐÝ ÖØÐ Ù ÓÖ Ø ÒÐÝ Ó Ø ÖÛÐÒ ÔÖÓ¹ ÐÑ ÙØ ÙÒÓÖØÙÒØÐÝ ØÖ ÔÔÖ ØÓ ÚÖÝ ÐØØÐ Ò Ø ÐØÖØÙÖ ÓÒ Ø ØÝÔ Ó ÙÔØ ÔÖÓ ÓÙÒ Ò ÔÖ¹ غ ÌÓ Ø Ø Ó ÓÙÖ ÒÓÛÐ Ø ÓÐ ÜÔØÓÒ ÖÒØ ØÙÝ ½ Û Ù Ø ØØ Ø ÙÔØ ÔÖÓ ÓÖ Ô Ø ÒÛ ÖÚ Û Ø Ö ÒÓØ ÈÓ ÓÒº ÚÒ Ø ÙÑÔØÓÒ Ó ÈÓ ÓÒ ÙÔØ ÔÖÓ Ò ÑÓ Ø ÔÖÚÓÙ ØÙ Ò ØÓ ÙÖØÖ ÒÚ ØØ Ø ÔÖÚÐÒ Ó ÈÓ ÓÒ ÙÔØ ÔÖÓ Ò ÔÖØ Û ÒÐÝÞ Ø Ô ÙÔØ Ø ÖÓÑ ÐÝ Û Ø ÖÚÒ ÐÝ ÝÒÑ Ô º ÖÔÖ ÒØØÚ ÑÔÐ Ó Ø Ö ÙÐØ ÖÓÑ ÓÙÖ Òй Ý Ö ÔÖ ÒØ Ò Ù º ÅÓ Ø ÑÔÓÖØÒØÐÝ Ø Ö ÙÐØ ÑÓÒ ØÖØ ØØ Ø ÒØÖÙÔØ ÔÖÓ ÔÒ Û ÖÒ Ó ÓÑÔÐÜ ØØ ØÐ ÔÖÓÔÖØ ÖÓ «ÖÒØ Û Ô Ò ØØ Ø ÔÖÓ Ò «Ö Ò ÒØÐÝ ÖÓÑ ÈÓ ÓÒ ÔÖÓ º Ý ÙÔÔÓÖØÒ Ò ÓÙÖ ÒÖÐ ÙÒ¹ ÔÔÖÓ Ù ÓÑÔÐÜ ÙÔØ ÔØØÖÒ ÒÐÙÒ Ø ÕÙ ¹ØÖÑÒ Ø ÑÓе Ò ØÓÒ ØÓ Ø ÈÓ ÓÒ Û ÐÚ ØØ ÓÙÖ ÓÔØÑÐ Ñ Ò ÔÖÓÚ ÚÒ ÖØÖ Ò Ø Ò ÖйÛÓÖÐ ÒÚÖÓÒÑÒØ º Ì ÖÑÒÖ Ó Ø ÔÔÖ ÓÖÒÞ ÓÐÐÓÛ º ˹ ØÓÒ ¾ Ö ÓÙÖ ÓÖÑÙÐØÓÒ Ò ÓÐÙØÓÒ ÓÖ Ø ØÛÒ ÔÖÓÐÑ Ó ÒÒ Ø ÓÔØÑÐ ÒÙÑÖ Ó ÖÛÐ Ò Ø ÐÞ ÖÛÐ ØÑ º Ï ÐÓÓ ÐÝ ÖÖ ØÓ Ø Ö Ø ÓÑÔÓ¹ ÒÒØ ØÓÔØÑÐ ÖÕÙÒÝ ÔÖÓÐѺ ËØÓÒ ÓÒØÒ Ø ÓÖÑÙÐØÓÒ Ò ÓÐÙØÓÒ ÓÖ Ø ÓÒ ÓÑÔÓÒÒØ Ó ÓÙÖ Ñ ÒÑÐÝ Ø ÙÐÒ ÔÖÓÐѺ ËØÓÒ ¹ Ù ÓÑ Ù Ó ÔÖÑØÖÞÒ ÓÙÖ ÔÔÖÓ ÒÐÙ¹ Ò ÚÖÐ ÑÔÖÐ Ö ÙÐØ ÓÒ ÙÔØ ÔØØÖÒ ØÖÙØÓÒ ÓÖ ÖÐ Û Ô ÓÒ ØÖ ÖÓÑ ÔÖÓÙØÓÒ Û Øº ÁÒ ËØÓÒ Û ÔÖÓÚ ÜÔÖÑÒØÐ Ö ÙÐØ ÓÛÒ ÓØ Ø ÕÙÐØÝ ÓÓÙÖ ÓÐÙØÓÒ Ò ØÖ ÖÙÒÒÒ ØÑ º ËØÓÒ ÓÒØÒ ÓÒÐÙ ÓÒ Ò Ö ÓÖ ÙØÙÖ ÛÓÖº 2. CRAWLING FREQUENCY PROBLEM 2.1 General Framework Ï ÓÖÑÙÐØ Ø ÖÛÐÒ ÖÕÙÒÝ ÔÖÓÐÑ ÛØÒ Ø ÓÒØÜØ Ó ÒÖÐ ÑÓÐ ÖÑÛÓÖ ÓÒ ØÓ Ø ÑÖ ÔÓÒØ ÔÖÓ º Ì Ñ Ø ÔÓ Ð ÓÖ Ù ØÓ ØÙÝ Ø ÔÖÓÐÑ Ò ÙÒ ÑÒÒÖ ÖÓ Û ÖÒ Ó Û ÒÚÖÓÒÑÒØ Ò ÙÑÔØÓÒ º ÖÓÖÓÙ ÓÖÑÐ ÒØÓÒ Ó ÓÙÖ ÒÖÐ ÖÑÛÓÖ Ò Ø ÑÔÓÖØÒØ Ñع ÑØÐ ÔÖÓÔÖØ ÛÐÐ ÖÓÖÓÙ ÓÖÑÐ ÒÐÝ Ó ÚÖÓÙ ÔØ Ó ÓÙÖ ÒÖÐ ÖÑÛÓÖ Ö ÝÓÒ Ø ÓÔ Ó Ø ÔÖ ÒØ ÔÔÖº Ï ØÖÓÖ Ø Ö Ø ÑÓÐ ÖÑÛÓÖ Ò Ò ÒÐÝ Ó Ô Ò ØÒ Ó Ø ÑÓÐ ÖÖÖÒ Ø ÒØÖ Ø ÖÖ ØÓ Ø ÕÙÐ ÓÖ 137
ØÓÒÐ ØÒÐ ØÐ º ÙÖØÖÑÓÖ ¾ ÓÖ ¹ ØÓÒÐ ØÐ ÓÒ ØÓ Ø ÑÖ ÔÓÒØ ÔÖÓ º Ï ÒÓØ Ý Æ Ø ØÓØÐ ÒÙÑÖ Ó Û Ô ØÓ ÖÛÐ Û ÐÐ ÒÜ Ý º Ï ÓÒ Ö Ùй Ò ÒØÖÚÐ Ó ÐÒØ Ì ØÓÑ ÙÒØ Ó ÓÒ ÑÒ ÛÖ Ì ÙÆÒØÐÝ ÐÖ ØÓ ÙÔÔÓÖØ ÓÙÖ ÑÓÐ ÙÑÔØÓÒ ÐÓÛº Ì ØØ Ø ÙÐÒ ÒØÖÚÐ ÖÔØ ÚÖÝ Ì ÙÒØ Ó ØÑ Ò Û ÛÐÐ Ñ ¹ ÓÒ ÓÙØ ÓÒ ÙÐÒ ÒØÖÚÐ Ù Ò ÓØ ÒÛ Ø Ò Ø Ö ÙÐØ ÖÓÑ Ø ÔÖÚÓÙ ÙÐÒ ÒØÖÚк ÄØ Ê ÒÓØ Ø ØÓØÐ ÒÙÑÖ Ó ÖÛÐ ÔÓ Ð Ò ÒÐ ÙÐÒ ÒØÖÚк ÄØ Ù Ò ¾ ÁÊ ÒÓØ Ø ÔÓÒØ Ò ØÑ Ø Û Ø Ò Ø ÙÔØ Ó Ô ÓÙÖ ÛÖ ¼ Ù ½ Ù ¾ Ì ¾½ ¾Æº ÓØ ÛØ Ø Ò Ø ÙÔØ Ó Ô ÑÖ Ò ¾ Áà ÛÖ Ò Ù ØÓ ÖÔÖ ÒØ ÐÐѹ ÔÓÖØÒØ Ò Ù ÙÐ ÒÓÖÑØÓÒ ÓÖ Ø Ò Ø ÙÔØ Ó Ô Ò ÁÃ Ø Ô Ó ÐÐ Ù ÑÖ ÐÐ Ø ÑÖ Ôµº ÜÑÔÐ Ó ÔÓ Ð ÑÖ ÒÐÙ ÒÓÖÑØÓÒ ÓÒ Ø ÔÖÓ¹ ÐØÝ Ó ÛØÖ Ò ÙÔØ ØÙÐÐÝ ÓÙÖ Ø Ø ÓÖ¹ Ö ÔÓÒÒ ÔÓÒØ Ò ØÑ ºº ËØÓÒ ¾º º µ Ò Ø ÔÖÓÐØÝ Ó ÛØÖ Ò ØÙÐ ÙÔØ ÑØØÖ ÖÓÑ Ø ÔÖ ÔØÚ Ó Ø ÖÛÐÒ ÖÕÙÒÝ ÔÖÓÐÑ ºº ÑÒ¹ ÑÐ ÙÔØ Ó Ø Ô ÑÝ ÒÓØÒ Ø Ö ÙÐØ Ó Ø Ö ÒÒ ÑÒ Ñ µº Ì ÓÙÖÖÒ Ó ÙÔØ ØÓ Ô Ö ØÒ ÑÓÐ ØØÓÒÖÝ ØÓ Ø ÑÖ ÔÓÒØ ÔÖÓ Í Ù Ò Òµ Ò ¾ ÁÆ Ò ÓÒ Ø ØØ Ô ÁÊ Áú ÁÒ ÓØÖ ÛÓÖ Í ØÓ Ø ¹ ÕÙÒ Ó ÔÓÒØ Ù ½Ù ¾ Ò ØÑ Ø Û ÙÔØ Ó Ô ÓÙÖ ØÓØÖ ÛØ ÓÖÖ ÔÓÒÒ ÕÙÒ Ó ÒÖÐ ÑÖ ½ ¾ ÓÒØÒÒ ÒÓÖÑØÓÒ ÓÙØ Ø ÙÔØ º ÓÙÒØÒ ÔÖÓ Æ Ù Øµ ÓØ ÛØ Ø ÑÖ ÔÓÒØ ÔÖÓ Í Ò ÚÒ Ý Æ Ù Øµ ÑÜÒ Ù Ò Ø Ø ¾ ÁÊ º Ì ÓÙÒØÒ ÔÖÓ ÖÔÖ ÒØ Ø ÒÙÑÖ Ó ÙÔØ Ó Ô ØØ ÓÙÖ Ò Ø ØÑ ÒØÖÚÐ ¼Ø º Ì ÒØÖÚÐ Ó ØÑ ØÛÒ Ø Ò ½ Ø Ò Ò Ø ÙÔØ Ó Ô ÚÒ Ý Í Ò Ù Ò Ù Ò ½ Ò ¾ ÁÆ ÛÖ Û Ò Ù ¼ ¼ Ò ¼ º Ì ÓÖÖ ÔÓÒÒ ÓÖÛÖ Ò ¹ ÛÖ ÖÙÖÖÒ ØÑ Ö ÚÒ Ý Ù Øµ Ù Æ Ù Øµ ½ Ø Ò Ù Øµ Ø Ù Æ Ù Øµ Ö ÔØÚÐÝ Ø ¾ ÁÊ º ÁÒ Ø ÔÔÖ Û ÐÐ Ñ Ø ÙÑÔØÓÒ ØØ Ø ØÑ ÒØÖ¹ ÚÐ Í Ò ¾ ÁÊ ØÛÒ ÙÔØ Ó Ô Ö ÒÔÒ¹ ÒØ Ò ÒØÐÐÝ ØÖÙØ ºººµ ÓÐÐÓÛÒ Ò Ö¹ ØÖÖÝ ØÖÙØÓÒ ÙÒØÓÒ µ ÛØ ÑÒ ½ ¼ Ò ØÙ Ø ÓÙÒØÒ ÔÖÓ Æ Ù Øµ ÖÒÛÐ ÔÖÓ ¾ ¾ ¾½ ¾Æº ÆÓØ ØØ Ù ¼ Ó ÒÓØ ÖÔÖ ÒØ Ø ØÑ Ó Ò ØÙÐ ÙÔØ Ò ØÖÓÖ Ø ÓÙÒØÒ ÔÖÓ Æ Ù Øµ Ø ¾ ÁÊ ØÖØÒ Ø ØÑ ¼µ ÑÓÖ ÔÖ ÐÝ Ò ÕÙÐÖÙÑ ÖÒÛÐ ÔÖÓ Û Ò Ò ØÒ Ó ¹ ÐÝ ÖÒÛÐ ÔÖÓ µ ¾ ¾ º ËÙÔÔÓ Û ØÓ ÖÛÐ Û Ô ØÓØÐ Ó Ü ØÑ ÙÖÒ Ø ÙÐÒ ÒØÖÚÐ ¼Ì ÛÖ Ü ÒÓÒ¹ ÒØÚ ÒØÖ Ð ØÒ ÓÖ ÕÙÐ ØÓ Êµ Ò ÙÔÔÓ Û ØÓ Ó Ó Ø Ø ÖØÖÖÝ ØÑ ¼ Ø ½ Ø ¾ Ø Ü Ì º ÇÙÖ ÔÔÖÓ Ò Ø ÔÔÖ ÓÒ ÓÑÔÙØÒ ÔÖØÙÐÖ ÔÖÓÐØÝ ÙÒØÓÒ ØØ ÔØÙÖ Ò ÖØÒ Ò ÛØÖ Ø Ö ÒÒ ÛÐÐ Ú ØÐ ÓÔÝÓÛ Ô Ø Ò ÖØÖÖÝ ØÑ Ø Ò Ø ÒØÖÚÐ ¼Ì º ÖÓÑ Ø Û Ò Ò ØÙÖÒ ÓÑÔÙØ ÓÖÖ ÔÓÒÒ ØѹÚÖ Øй Ò ØÑØ Ø ½Ø Ü µýúöò Ø ÔÖÓÐØÝ ÙÒØÓÒ ÓÚÖ ÐÐ Ø ÛØÒ ¼Ì º ËÔ ÐÐÝ Û ÓÒ Ö Ø ÖØÖÖÝ ØÑ Ø ÐÐÒ ÛØÒ Ø ÒØÖÚÐ Í Æ Ù Ø µ ½ Í Æ Ù Ø µ ½ ¹ Ù Ø µ ¹ Ù Ø µ ¹ º º Ù Æ Ù Ø µ Ø Ù Æ Ù Ø µ ½ Ø ½ ÙÖ ½ ÜÑÔÐ Ó ËØØÓÒÖÝ ÅÖ ÈÓÒØ ÈÖÓ¹ ÖÑÛÓÖ ØÛÒ Ø ØÛÓ ÙÔØ Ó Ô Ø ØÑ Ù Æ Ù Ø µ Ò Ù Æ Ù Ø µ ½ Ò ÓÙÖ ÒØÖ Ø Ò ÔÖØÙÐÖ ØѹÚÖ Ñ ÙÖ Ó ØÐÒ ÛØ Ö ÔØ ØÓ Ø ÓÖÛÖ ÖÙÖÖÒ ØÑ Ù Ø µ ÙÒØÐ Ø ÒÜØ ÙÔØ ÚÒ Ø ÛÖ Ö¹ ÙÖÖÒ ØÑ Ù Ø µº ÙÖ ½ ÔØ ÑÔÐ ÜÑÔÐ Ó Ø ØÙØÓÒº ÅÓÖ ÓÖÑÐÐÝ Û ÜÔÐÓØ ÓÒØÓÒÐ ÔÖÓÐØ ØÓ ¹ Ò Ø ÓÐÐÓÛÒ ØѹÚÖ ØÐÒ ØÑØ Ø ½Ø Ü µ ½ Ì Ü Ø ½ ¼ Ø ½ ¼ º È È Ù Úµ Ú Ø ÛÖ Í Ò ½ Ø Ø Ú Í Ò ½ Ú Ò ½ ¾Ã Ø ¼ ¼ Ø Ü ½ Ì Ò Æ Ù Ø µ Ù µ Ø ØØÓÒÖÝ Ò ØÝ ÓÖ Ø ÛÖ ÖÙÖÖÒ ØÑ Ò ÃÁÃ Ø ÑÖ Ø Ó ÒØÖ Ø ÓÖ Ø ØÐÒ ØÑØ ÙÒÖ ÓÒ ÖØÓÒº ÆÓØ ØØ Ø ÚÖÐ Ú Ù ØÓÒØÖØ ÓÚÖ ÐÐ ÔÓ Ð ÚÐÙ Ó Ù Ø µ ¾ ¼ ½µº ÙÖØÖ Ó ÖÚ Ø ÔÒÒ Ó Ø ØÐÒ ØÑØ ÓÒ Ø ÙÔØ ÔØØÖÒ ÓÖ Û Ô º ÏÒ Ã Áà ºº ÐÐ ÑÖ Ö ÓÒ Ö Ò Ø Ò¹ ØÓÒ Ó Ø ØѹÚÖ ØÐÒ ØÑص ØÒ Ø ÒÒÖ ÒØÖÐ ÓÚ ÖÙ ÓÐÐÓÛ ½ Ø Ø Úµ Úµ Ù ¼ ½ Úµ ÚµÚ ½ Ø Ø Úµ ½ Ù ÚµÚ ¾µ Úµ ¼ ÛÖ Øµ ½ ص Ø ØÐ ØÖÙØÓÒ Ó Ø ÒØÖÙÔ¹ Ø ØÑ Í Ò Ò ¾ Áƺ ÖÓÑ ØÒÖ ÖÒÛÐ ØÓÖÝ ¾ ¾ Û Ú Ù Øµ ص Ò ØÙ ØÖ ÓÑ ÑÔÐ ÐÖ ÑÒÔÙÐØÓÒ Û ÓØÒ Ø ½Ø Ü µ Ü ½ Ø ½ ½ Ì ¼ Ø ½ ¼ ½µ Ø Ø Úµ Ú Ø µ ÆØÙÖÐÐÝ Û ÛÓÙÐ Ð Ó Ð Ø ØÑ Ø ½Ø Ü ØÓ Ó Ò Ó ØÓ ÑÒÑÞ Ø ØѹÚÖ ØÐÒ ØÑØ Ø ½Ø Ü µ ÚÒ ØØ ØÖ Ö Ü ÖÛÐ Ó Ô º ÖÖÒ ÓÖ Ø ÑÓÑÒØ Ø ÕÙ ØÓÒ Ó ÓÛ ØÓ Ò Ø ÓÔØÑÐ ÚÐÙ Ø ½Ø Ü ÐØ Ù Ò Ø ÙÒØÓÒ Ý ØØÒ Ü µ Ø ½Ø Ü µ ÌÙ Ø ÓÑÒ Ó Ø ÙÒØÓÒ Ø Ø ¼Êº Ï ÒÓÛÑÙ Ø ÓÛ ØÓ Ò Ø ÓÔØÑÐ ÚÐÙ Ó Ø Ü ÚÖÐ º ÏÐ ÓÒ ÛÓÙÐ Ð ØÓÓÓ Ü ÐÖ ÔÓ Ð ØÖ ÓÑÔØØÓÒ ÓÖ ÖÛÐ ÖÓÑ Ø ÓØÖ Û Ô º ÌÒ ÐÐ Û Ô ÒØÓ ÓÙÒØ Û ØÖÓÖ Û µ 138
ØÓ ÑÒÑÞ Ø ÓØÚ ÙÒØÓÒ Æ ½ ÙØ ØÓ Ø ÓÒ ØÖÒØ Æ ½ Û Ü µ Ü Ê Ü ¾¼Ê ÀÖ Ø ÛØ Û ÛÐÐ ØÖÑÒ Ø ÖÐØÚ ÑÔÓÖØÒ Ó Û Ô º Á ÛØ Û Ó Ò ØÓ ½ ØÒ Ø ÔÖÓÐÑ ÓÑ ÓÒ Ó ÑÒÑÞÒ Ø ØѹÚÖ ØÐÒ ØÑØ ÖÓ ÐÐ Ø Û Ô º ÀÓÛÚÖ Û ÛÐÐ ÓÖØÐÝ Ù ÛÝ ØÓÔ Ø ÛØ Ø ÑÓÖ ÒØÐÐÒØÐÝ ØÖÝ ÑÒÑÞÒ ÑØÖ ØØ ÓÑÔÙØ Ø ÐÚÐ Ó ÑÖÖ ÑÒØ Ø Ö ÒÒ ØÓ ÒÙÖº Ì ÓÔØÑÞØÓÒ ÔÖÓÐÑ Ù Ø ÔÓ ÚÖÝ Ò ÓÖѺ ËÔ ÐÐÝ Ø Ò ÜÑÔÐ Ó Ó¹ÐÐ ÖØ ÔÖ¹ Ð Ö ÓÙÖ ÐÐÓØÓÒ ÔÖÓÐѺ Ì ÔÖÓÐÑ ÔÖÐ Ý Ø ÒØÙÖ Ó Ø ÓØÚ ÙÒØÓÒ ÛÖØØÒ Ø ÙÑѹ ØÓÒ Ó ÙÒØÓÒ Ó Ø ÒÚÙÐ Ü ÚÖÐ º Ì ÔÖÓÐÑ ÖØ Ù Ó Ø ÓÒ ÓÒ ØÖÒØ Ò Ö ÓÙÖ ÐÐÓØÓÒ ÔÖÓÐÑ Ù Ó Ø Ö Ø ÓÒ ØÖÒغ ÓÖ ¹ ØÐ ÓÒ Ö ÓÙÖ ÐÐÓØÓÒ ÔÖÓÐÑ Û ÖÖ Ø ÒØÖ Ø ÖÖ ØÓ ½¾ º Ì ÛÐй ØÙ Ö Ò ÓÔØÑÞØÓÒ ØÓÖÝ Ò Û ÐÐ ÓÖÖÓÛ ÐÖÐÐÝ ÖÓÑ ØØ ÐØÖØÙÖº ÁÒ ÓÒ Ó Û Ö Ø ÔÓÒØ ÓÙØ ØØ ØÖ Ü Ø ÝÒÑ ÔÖÓÖÑÑÒ ÐÓÖØÑ ÓÖ ÓÐÚÒ Ù ÔÖÓÐÑ Û ÓÑÔÙØØÓÒÐ ÓÑÔÐÜØÝ Ç ÆÊ ¾ µº ÓÖØÙÒØÐÝ Û ÛÐÐ ÓÛ ÓÖØÐÝ ØØ Ø ÙÒØÓÒ ÓÒÚÜ Û Ò Ø ÖØ ÓÒØÜØ ÑÒ ØØ Ø Ö Ø «ÖÒ ½µ µ Ö ÒÓÒ¹Ö Ò ÙÒ¹ ØÓÒ Ó º Ì Ö Ø «ÖÒ Ö Ù Ø Ø ÖØ Ò¹ ÐÓÙ Ó ÖÚØÚ ºµ Ì ÜØÖ ØÖÙØÙÖ Ñ Ø ÔÓ Ð ØÓ ÑÔÐÓÝ ÚÒ ØÖ ÐÓÖØÑ ÙØ ÓÖ Û Ò Ó Ó ØÖ ÖÑÒ Û ÑÔÓÖØÒØ Ù º ÓØ Ù Ù Ò ØÐ Ò Ø ÒÜØ ØÖ Ù ØÓÒ Û ÒÚÓÐÚ ½µ ÓÑÔÙØÒ Ø ÛØ Û Ó Ø ÑÖÖ ÑÒØ ÐÚÐ ÑØÖ ÓÖ Û Ô ¾µ ÓÑÔÙØÒ Ø ÙÒ¹ ØÓÒÐ ÓÖÑ Ó Ò ÓÖ Û Ô ÓÒ Ø ÓÖÖ ÔÓÒÒ ÑÖ ÔÓÒØ ÔÖÓ Í Ò µ ÓÐÚÒ Ø Ö ÙÐØÒ ÖØ ÓÒÚÜ ÔÖÐ Ö ÓÙÖ ÐÐÓØÓÒ ÔÖÓÐÑ Ò ÐÝ ÆÒØ ÑÒÒÖº ÁØ ÑÔÓÖØÒØ ØÓÔÓÒØ ÓÙØ ØØ Û Ò ØÙÐÐÝ ÒÐ ÑÓÖ ÒÖÐ Ö ÓÙÖ ÐÐÓØÓÒ ÓÒ ØÖÒØ ØÒ ØØ ÚÒ Ò ÕÙØÓÒ µº ËÔ ÐÐÝ Û Ò ÒÐ ÓØ ÑÒÑÙÑ Ò ÑÜÑÙÑ ÒÙÑÖ Ó ÖÛÐ Ñ Ò Å ÓÖ Ô Ó ØØ Ø ÓÒ ØÖÒØ Ò Ø ÓÑ Ü ¾Ñ Å Ï Ò Ð Ó ÒÐ ÓØÖ ØÝÔ Ó ÓÒ ØÖÒØ ÓÒ Ø ÖÛÐ ØØ ØÒ ØÓ Ö Ò ÔÖØ ÙØ ÓÑØ ØÐ Ö Ò Ø ÒØÖ Ø Ó Ôº 2.2 Computing the Weights Û ÓÒ Ö ÙÖ ¾ Û ÐÐÙ ØÖØ ÓÒ ØÖ ØÖÒ Ø ÔÓ Ð Ö ÙÐØ ÓÖ ÐÒØ ÑÒ Ö ÒÒ ÕÙÖݺ ÄØ Ù Ü ÔÖØÙÐÖ Û Ô Ò ÑÒ Ò ÓÐÐÓÛ Ø ÓÒ ØÖ ÓÛÒ ÖÓÑ Ø ÖÓÓØ ØÓ Ø ÐÚ º Ì Ö Ø ÔÓ ÐØÝ ÓÖ Ø Ô ØÓ Ö ÁÒ Ø Ø Û Ô ÛÐÐ ÒÓØ Ù ÑÖÖ ÑÒØ ØÓ Ø Ö ÒÒº ËÓ ÙÑ Ø Ô Øк Á Ø Ô ÒÚÖ ÖØÙÖÒ Ý Ø Ö ÒÒ ØÖ Ò Ò ÒÓ Ñ¹ ÖÖ ÑÒØ Ì Ö ÒÒ ÑÔÐÝ ÐÙÝ Ò Ø º µ µ µ GOOD: Page fresh Page not returned BAD BUT LUCKY Page stale Page not clicked Query correct Page returned Page clicked UGLY: Query incorrect ÙÖ ¾ ÑÖÖ ÑÒØ ÄÚÐ ÓÒ ÌÖ ÏØ ÔÔÒ Ø Ô ÖØÙÖÒ Ö ÒÒ ÛÐÐ ØÝÔÐÐÝ ÓÖÒÞ Ø ÕÙÖÝ Ö ÔÓÒ ÒØÓ ÑÙÐØÔÐ Ö ÙÐØ Ô Ò Ó Ø Ö ÙÐØ Ô ÛÐÐ ÓÒØÒ Ø ÙÖÐ Ó ÚÖÐ ÖØÙÖÒ Û Ô Ò ÚÖÓÙ ÔÓ ØÓÒ ÓÒ Ø Ôº ÄØ È ÒÓØ Ø ÒÙÑÖ Ó ÔÓ ØÓÒ ÓÒ ÖØÙÖÒ Ô Û ØÝÔÐÐÝ ÓÒ Ø ÓÖÖ Ó ½¼µº ÆÓØ ØØ Ø ÔÓ ØÓÒ Ó ÖØÙÖÒ Û Ô ÓÒ Ö ÙÐØ Ô Ö Ø Ø ÓÖÖ ØÑØ Ó Ø Ö ÒÒ ÓÖ Ø Û Ô ÑØÒ ÛØ Ø Ù Ö ÛÒØ º ÄØ ÒÓØ Ø ÔÖÓ¹ ÐØÝ ØØ Ø Ö ÒÒ ÛÐÐ ÖØÙÖÒ Ô Ò ÔÓ ØÓÒ Ó ÕÙÖÝ Ö ÙÐØ Ô º Ì Ö ÒÒ Ò ÐÝ ØÑØ Ø ÔÖÓÐØ ØÖ Ý ÑÓÒØÓÖÒ ÐÐ ÕÙÖÝ Ö ÙÐØ ÓÖ Ý ÑÔÐÒ ØÑ ÓÖ Ø ÐÒØ ÕÙÖ º Ì Ö ÒÒ Ò ØÐÐ ÐÙÝ ÚÒ Ø Û Ô ØÐ Ò ÖØÙÖÒ ÐÒØ ÑØ ÒÓØ Ð ÓÒØÔ Ò ØÙ ÒÚÖ Ú Ò ØÓ ÐÖÒ ØØ Ø Ô Û Øк ÄØ ÒÓØ Ø ÖÕÙÒÝ ØØ ÐÒØ ÛÐÐ Ð ÓÒ ÖØÙÖÒ Ô Ò ÔÓ ØÓÒ Ó ÕÙÖÝ Ö ÙÐØ Ô º Ì ÖÕÙÒ Ð Ó Ò ÐÝ ØÑØ Ò ØÖ Ý ÑÓÒØÓÖÒ ÓÖ ÑÔÐÒº ÇÒ Ò ÔÙÐØ ØØ Ø ÐÒ ÔÖÓÐØÝ ÙÒØÓÒ ÑØ ØÝÔÐÐÝ Ö ÓØ ÙÒØÓÒ Ó Ø ÓÚÖÐÐ ÔÓ ØÓÒ ½µÈ Ó Ø ÖØÙÖÒ Ô Ò ÙÒØÓÒ Ó Ø Ô ÓÒ Û Ø ÖØÙÖÒº ÙÑÒ Ô¹ Ð ÙÒØÓÒ ¾ ½ ÓÖ Ø Ö Ø ÙÒØÓÒ Ò ÓÑØÖ ÙÒØÓÒ ØÓ ÑÓÐ Ø ÔÖÓÐØÝ Ó ÝÐÒ ØÖÓÙ ½ Ô ØÓ Ø ØÓ ÖØÙÖÒ Ô ÓÒÛÓÙÐ ÓØÒ Ð¹ Ò ÔÖÓÐØÝ ÙÒØÓÒ ØØ ÐÓÓ Ð Ø ÓÒ ÔÖÓÚ Ò ÙÖ º ÓÖÒ ØÓ ØÖ ÓÑ ÚÒ ØØ Ø ÐÒ ÔÖÓÐØ Ò ÙÖ ØÙÐÐÝ Ö ÖØÖ ØÒ ÐÐ ÒÛ Ô Öº Ì Ù ÓÑ ÐÒØ Ó ÒÓØ ÖÓÐÐ ÓÛÒ ß ÓÑ Ó ÒÓØ ÚÒ ÒÓÛ ÓÛØÓÓ Óº ÅÓÖ ÑÔÓÖØÒØÐÝ ÒÓØ ØØ Ø Ø Ò ØÙÐÐÝ ÓÐÐØ Ý Ø Ö ÒÒºµ ÒÐÐÝ ÚÒ Ø Û Ô ØÐ ÖØÙÖÒ Ý Ø Ö ÒÒ Ò Ð ÓÒ Ì Ò ØÓ Ø Ô ÑØ ÒÓØ Ù Ø Ö ÙÐØ Ó Ø ÕÙÖÝ ØÓ ÛÖÓÒº Ì ØÖÙÐÝ ÐÙÝ ÐÓ Ö ÒÖÓ Ò ÑÓÖ ÓÑÑÓÒ ØÒ ÓÒ ÑØ ÒØÐÐÝ Ù ÔØ Ù ÑÓ Ø Û Ô ØÝÔÐÐÝ Ó ÒÓØ Ò Ò ØÖÑ Ó ØÖ ÓÒØÒØ Ò ÑÓ Ø ÐÒØ ÕÙÖ ÛÐÐ ÔÖÓÐÝ ØÖÝ ØÓ Ö Ø ÓÒØÒغ ÁÒ ÒÝ ÐØ ÒÓØ Ø ÔÖÓÐØÝ ØØ ÕÙÖÝ ØÓ ØÐ 139
Probability of Clicking.8.7.6.5.4.3.2.1 Probability of Clicking as Function of Page and Position Page 1 Page 2 Page 3... Page P 5 1 15 2 25 3 35 4 45 5 Position ÙÖ ÈÖÓÐØÝ Ó ÐÒ ÙÒØÓÒ Ó ÈÓ¹ ØÓÒ»È ÚÖ ÓÒ Ó Ô ÝÐ Ò ÒÓÖÖØ Ö ÔÓÒ º ÇÒ Ò Ø ÔÖÑØÖ Ò ÐÝ ØÑغ ÙÑÒ Ñ Ö ÓÒÐ ØØ Ø ØÖ ØÝÔ Ó ÚÒØ Ö ÒÔÒÒØ ÓÒ Ò ÓÑÔÙØ Ø ØÓØÐ ÐÚÐ Ó ÑÖÖ ÑÒØ Ù ØÓ Ø Ö ÒÒ Ý Û Ô Û µ ÆÓØ ØØ ÐØÓÙ Ø ÙÒØÓÒÐ ÓÖÑ Ó Ø ÓÚ ÕÙ¹ ØÓÒ Ø ÒÚÓÐÚ Ø ÚÐÙ Ó Û ÑÔÐÝ ÓÒ ØÒØ ÖÓÑ Ø ÔÖ ÔØÚ Ó Ø Ö ÓÙÖ ÐÐÓØÓÒ ÔÖÓÐѺ 2.3 Computing the Functions and ÔÖÚÓÙ ÐÝ ÒÓØ Ø ÙÒØÓÒ ØÓ ÓÑÔÙØ Ò Ø ØÓÒ ÔÒ ÙÔÓÒ Ø ÖØÖ Ø Ó Ø ÑÖ ÔÓÒØ ÔÖÓ Í Ù Ò Òµ Ò ¾ ÁÆ Û ÑÓÐ Ø ÙÔ¹ Ø ÚÓÖ Ó Ô º Ï ÓÒ Ö ØÖ ØÝÔ Ó ÑÖ ÔÓÒØ ÔÖÓ ØØ ÖÔÖ ÒØ «ÖÒØ Û Ö ÜÔØ ØÓ Ó ÒØÖ Ø Ò ÔÖغ Ì Ö Ø ØÛÓ Ö ÓÒ Ø Ù Ó ÕÙØÓÒ µ ØÓ ÓÑÔÙØ Ø ÙÒØÓÒ Ò ÙÒÖ «ÖÒØ ØÖÙØÓÒÐ ÙÑÔ¹ ØÓÒ ÓÖ Ø ÒØÖÙÔØ ØÑ Í Ò Ó Ø ÑÖ ÔÓÒØ ÔÖÓ Í Ô ÐÐÝ Û ÓÒ Ö µ ØÓ ÜÔÓÒÒ¹ ØÐ Ò ÒÖÐ ØÖÙØÓÒ ÙÒØÓÒ Ö ÔØÚÐÝ ÛÖ Ø ÓÖÑÖ Ò Ø ÔÖÑÖÝ ÓÒ Ö Ò ÔÖÚ¹ ÓÙ ØÙ Ò Ø ÐØØÖ Ù ØÓ ØØ Û ÑÔÓÖØÒØ ÔÖÓÔÖØ Ó Ø ÒÖÐ ÓÖÑ Û Ö Ù Ò ØÙÖÒ ØÓ Ó¹ ØÒ Ø ÜÔÖÑÒØÐ Ö ÙÐØ ÔÖ ÒØ Ò ËØÓÒ µº Ì ØÖ Û ÛÐÐÕÙ ¹ØÖÑÒ Ø ÓÒ ÒØ ÒÙÑÖ Ó Ô ØÑ Ù Ò Ø Û Ô ÑØ ÙÔØ ÛÖ Ø ÓÖÖ ÔÓÒÒ ÑÖ Ò ÖÔÖ ÒØ Ø ÔÖÓÐØÝ ØØ Ø ÙÔØ Ø ØÑ Ù Ò ØÙÐÐÝ ÓÙÖ º 2.3.1 Exponential Distribution Function ÓÒ Ö ÑÔÐ ÙØ ÔÖÓØÓØÝÔÐ ÜÑÔÐ Ø Ò Û Ø ØÑ ÒØÖÚÐ Í Ò ¾ ÁÊ ØÛÒ ÙÔØ Ó Ô Ö ººº ÓÐÐÓÛÒ Ò ÜÔÓÒÒØÐ ØÖÙØÓÒ ÛØ ÔÖÑØÖ ºº ص ½ Ø Ò Øµ Ø ¾ º ÁÒ Ø Û Ð Ó ÙÑ ØØ ÐÐ ÙÔØ Ö Ó ÒØÖ Ø ÖÖ ÔØÚ Ó ØÖ ÓØ ÑÖ ÚÐÙ ºº à Áõº ËÙÔÔÓ ÓÖ ØØ Û ÖÛÐ ØÓØÐ Ó Ü ØÑ Ò Ø ÙÐÒ ÒØÖÚÐ Ø Ø ÖØÖÖÝ ØÑ Ø ½Ø Ü º ÁØ ØÒ ÓÐÐÓÛ ÖÓÑ ÕÙØÓÒ µ ØØ Ø ØѹÚÖ Øй Ò ØÑØ ÚÒ Ý Ø ½Ø Ü µ ½ Ì ½ Ì Ü Ø ½ ¼ Ø Ü Ø ½ ¼ Ø ½ ½ ¼ ½ Ø Ø µ Ø Ø Úµ Ú Ø ØÖ ÓÑ ÑÒÓÖ ÐÖ ÑÒÔÙÐØÓÒ Û ÓØÒ ØØ Ø ØѹÚÖ ØÐÒ ØÑØ ÚÒ Ý Ø ½Ø Ü µ½ ½ Ì Ü ¼ Ø Ø ½ Ø µ µ ½ ½¼µ ÄØØÒ Ì Ø ½ Ø ÓÖ ÐÐ ¼ Ü ØÒ Ø ÔÖÓÐÑ Ó ÒÒ ÖÙ ØÓ ÑÒÑÞÒ ½ ½ Ì ÙØ ØÓ Ø ÓÒ ØÖÒØ Ü ¼ Ì ½ ¼ Ì Ì Ü ¼ Ì Ì ½½µ ½¾µ ½ µ ÅÓÙÐÓ Û ÓÒ ØÒØ Û Ö ÒÓØ ÑÔÓÖØÒØ ØÓ Ø ÓÔØÑÞØÓÒ ÔÖÓÐÑ Ø ÒÓÛ Ø Ø ÓÖÑ Ó ÓÒ¹ ØÒÙÓÙ ÓÒÚÜ ÔÖÐ Ö ÓÙÖ ÐÐÓØÓÒ ÔÖÓÐѺ ÓÖ Ø ÔÖÓÐÑ ÔÖÐ Ý Ø ÒØÙÖ Ó Ø Ó¹ ØÚ ÙÒØÓÒº ÁØ ÓÒØÒÙÓÙ Ù Ó Ø Ö Ø ÓÒ ØÖÒØ Ò Ø Ö ÓÙÖ ÐÐÓØÓÒ ÔÖÓÐÑ Ù Ó Ø ÓÒ ÓÒ ØÖÒØ Ø Ð Ó ÓÒÚÜ ÓÖ Ø Ö ÓÒ ÔÖÓÚ ÐÓÛº Ì Ý ÔÓÒØ ØØ Ø ÓÔØÑÙÑ ÚÐÙ ÒÓÛÒ ØÓ ÓÙÖ Ø Ø ÚÐÙ Ì ½Ì Ü µ ÛÖ Ø ÖÚØÚ Ì ½ Ì Ó Ø ÙÑÑÒ Ò ÕÙØÓÒ ½½µ È Ö ÕÙÐ ÙØ ØÓ Ø ÓÒ ØÖÒØ ¼ Ì Ü Ì Ò Ì ¼ Ì º Ì ÒÖÐ Ö ÙÐØ ÓÖÒÐÐÝ Ù ØÓ Û Ø ÑÒÐ ÔÔÖ Ò Ø ØÓÖÝ Ó Ö ÓÙÖ ÐÐÓØÓÒ ÔÖÓÐÑ Ò ØÖ Ü Ø Ú¹ ÖÐ Ø ÐÓÖØÑ ÓÖ ÒÒ Ø ÚÐÙ Ó Ì º Ë ½¾ ÓÖ ÓÓ ÜÔÓ ØÓÒ Ó Ø ÐÓÖØÑ º ÁÒ ÓÙÖ ÔÐ Ó Ø ÜÔÓÒÒØÐ ØÖÙØÓÒ ÓÛÚÖ Ø ÙÑÑÒ Ö ÐÐ ÒØÐ Ò ØÙ Ø ÓÔØÑÐ ÓÒ ÚÖÐ ÛÐÐ Ò ÓÙÒ Ý Ò ÔØÓÒ ÌÝ ÓÙÖ ÛÒ Ì Ì Ü ½µº ÀÒ Û Ò ÛÖØ Ü µ½ Ü ½ Ì Û ÐÝ ÓÛÒ ØÓ ÓÒÚܺ Ì Ü ½µ ½ ½µ 2.3.2 General Distribution Function ÆÓÛ ÐØ Ù ÓÒ Ö Ø Ñ ÒÖÓ Ø ÔÖÚÓÙ ØÓÒ ÙØ ÛÖ Ø ØÖÙØÓÒ Ó Ø ÒØÖÙÔØ ØÑ Í Ò ¾ ÁÊ ÓÖ Ô Ò ÖØÖÖÝ ØÖÙØÓÒ µ ÛØ ÑÒ ½ º ÌÒ Û Ó ÖÚ ÖÓÑ ÕÙØÓÒ µ Û ÑÔÓÖ¹ ØÒØ ÔÖÓÔÖØ Ó Ø ÒÖÐ ÓÖѺ Ö Ø Ø ÐÖ ÖÓÑ 14
Ø ÓÖÑÙÐ ØØ Ø ÙÑÑÒ ÖÑÒ ÔÖк ÚÒ ØØ ÐÐ Ø ÙÑÑÒ Ö Ð Ó ÒØÐ Ø ÓÔØÑÐ ¹ ÓÒ ÚÖÐ ÓÙÖ ÛÒ Ì Ì Ü ½µ Ò Ø ÜÔÓÒÒØÐ º 2.3.3 Quasi-Deterministic Case ËÙÔÔÓ Ø ÑÖ ÔÓÒØ ÔÖÓ Í ÓÒ Ø Ó ¹ ØÖÑÒ Ø ÕÙÒ Ó ÔÓÒØ Ù ½Ù ¾Ù É Ò¹ Ò ÔÓ Ð ÙÔØ ØÑ ÓÖ Ô ØÓØÖ ÛØ ¹ ÕÙÒ Ó ÑÖ ½ ¾ É ÒÒ Ø ÔÖÓй ØÝ Ó ÛØÖ Ø ÓÖÖ ÔÓÒÒ ÙÔØ ØÙÐÐÝ ÓÙÖ º ÀÖ Û ÐÑÒØ Ø ººº ÙÑÔØÓÒ Ó ËØÓÒ ¾º½ Ò ÓÒ Ö Ò ÖØÖÖÝ ÕÙÒ Ó Ô ØÑ Ù ØØ ¼ Ù ½ Ù ¾ Ù É Ì º ÊÐÐ ØØ Ù ¼ ¼ Ò Ò Ù É Ì ÓÖ ÓÒÚÒÒº Ì ÙÔØ Ø ØÑ Ù ÓÙÖ ÛØ ÔÖÓÐØÝ º Á ½ ÓÖ ÐÐ ¾½É ØÒ Ø ÙÔØ ÔØØÖÒ ÖÙ ØÓ Ò ÔÙÖÐÝ ØÖÑÒ Øº Ï ÐÐ ÙÑ ØØ Ø ÚÐÙ ¼ Ò ÒÖÖ ÖÓÑ Ø ÖÛÐÒ ØÖØÝ ÑÔÐÓÝ Ò Ø ÔÖÚÓÙ ÙÐÒ ÒØÖÚÐ µº ÇÙÖ ÒØÖ Ø Ò ÓÒ ¹ ØÖÑÒÒ Ø ØѹÚÖ ØÐÒ ØÑØ Ü µ ÓÖ Ü ÓÔØÑÐÐÝ Ó Ò ÖÛÐ º Ý Ó ÖÚØÓÒ ØØ ÐÐ ÖÛÐ ÓÙÐ ÓÒ Ø Ø ÔÓØÒØÐ ÙÔØ ØÑ Ù ØÖ ÒÓ Ö ÓÒ ØÓ ÐÝ ÝÓÒ ÛÒ Ø ÙÔØ ÓÙÖÖº Ì Ð Ó ÑÔÐ ØØ Û Ò ÙÑ Ü É ½ ØÖ ÒÓ Ö ÓÒ ØÓ ÖÛÐ ÑÓÖ ÖÕÙÒØÐݺ Ì ÑÜÑÙÑ Ó É ½ ÖÛÐ ÓÖÖ ÔÓÒ ØÓ Ø ØÑ ¼ Ò Ø É ÓØÖ ÔÓØÒØÐ ÙÔØ ØÑ ºµ ÀÒ ÓÒ Ö Ø ÒÖÝ ÓÒ ÚÖÐ ½ ÖÛÐ ÓÙÖ Ø ØÑ Ù Ý ½µ ¼ ÓØÖÛ È É Á Û ÖÛÐ Ü ØÑ ØÒ Û Ú ¼ Ý Üº ÆÓØ ØØ ÓÒ ÕÙÒ Ó Ø ÓÚ ÙÑÔØÓÒ Ò Ó ÖÚØÓÒ Ø ØÛÓ ÒØÖÐ Ò ÕÙØÓÒ ½µ ÖÙ ØÓ ÑÙ ÑÔÐÖ ÓÖѺ ËÔ ÐÐÝ ÐØ Ù ÓÒ Ö ØÐÒ ÔÖÓÐØÝ ÙÒØÓÒ Ô Ý ¼Ý É Øµ Ø Ò ÖØÖÖÝ ØÑ Ø Û ÛÒÓÛ ÓÑÔÙغ ÊÐÐ ØØ Æ Ù Øµ ÔÖÓÚ Ø ÒÜ Ó Ø ÐØ Ø ÔÓØÒØÐ ÙÔØ ØÑ ØØ ÓÙÖ Ø ÓÖ ÓÖ ØÑ Ø Ó ØØ Æ Ù Øµ É º ËÑÐÖÐÝ Ò Â Øµ ÑÜ Ù Ø Ý ½ ¼ É ½µ Û Ø ÒÜ Ó Ø ÐØ Ø ÔÓØÒØÐ ÙÔØ ØÑ Ø ÓÖ ÓÖ ØÑ Ø ØØ ØÙÐÐÝ ÓÒ ØÓ ÖÛк ÐÖÐÝ Û Ò Ð Ó ÙÒÑÙÓÙ ÐÝ Ù Â ØÓ ÖÚØ Ø ÚÐÙ Ó Â Øµ ØÒÝ ØÑ Ø ÓÖ Û Æ Ù Øµº ÆÓÛ ÛÚ Ô Ý ¼Ý É Øµ ½ Æ Ù Øµ  ص ½ ½ µ ½µ ÛÖ ÔÖÓÙØ ÓÚÖ Ø ÑÔØÝ Ø ÔÖ ÒÓÖÑÐ ÓÒÚÒ¹ ØÓÒ ÙÑ ØÓ ½º ÙÖ ÐÐÙ ØÖØ ØÝÔÐ ØÐÒ ÔÖÓÐØÝ ÙÒ¹ ØÓÒ Ôº ÓÖ Ú ÙÐ ÐÖØÝ Û ÔÐÝ ØÖ Ò ÙÒØÓÒ ½ Ô ÖØÖ ØÒ Ø ØÐÒ ÙÒØÓÒ Ò Ø ÙÖºµ ÀÖ Ø ÔÓØÒØÐ ÙÔØ ØÑ Ö ÒÓØ Ý ÖÐ ÓÒ Ø Ü¹ Ü º ÌÓ Û Ö ØÙÐÐÝ ÖÛÐ Ö ÔØ ÐÐ ÖÐ ÛÐ ØÓ ØØ Ö ÒÓØ ÖÛÐ Ö ÐØ ÙÒ Ðк Ì Ö Ò ÙÒØÓÒ ÙÑÔ ØÓ ½ ÙÖÒ ÒØÖÚРѹ ÑØÐÝ ØÓ Ø ÖØ ÓÖÛÐ ØÑ Ò ØÒ Ö ÒØÖÚÐ Ý ÒØÖÚÐ ÑÓÖ ØÖÑ Ö ÑÙÐØÔÐ ÒØÓ Ø ÔÖÓÙØ ÕÙØÓÒ ½µµº Ì ÙÒØÓÒ ÓÒ ØÒØ ÙÖ¹ 1 PROBABILITY TIME T ÙÖ Ö Ò ÈÖÓÐØÝ ÙÒØÓÒ ÓÖ ÉÙ ¹ ØÖÑÒ Ø Ï È Ò ÒØÖÚÐ ß ØØ ÔÖ ÐÝ ÛÝ Â Ò Òº ÆÓÛÛ Ò ÓÑÔÙØ Ø ÓÖÖ ÔÓÒÒ ØѹÚÖ ÔÖÓ¹ ÐØÝ ØÑØ Ý ¼Ý É µ É Ù ½ ¼  ½ ½ µ ½µ Ì ÕÙ ØÓÒ Ó ÓÛ ØÓÓÓ Ø ÓÔØÑÐ Ü ÖÛÐ ØÑ ÔÖÔ Ø ÑÓ Ø ÙØÐ Ù Ò Ø ÔÔÖº Ï Ò ÛÖØ Ø ÖØ Ö ÓÙÖ ÐÐÓØÓÒ ÔÖÓÐÑ ÒÑÐÝ Ø ÑÒÑÞØÓÒ Ó ÕÙØÓÒ È ½µ ÙØ ØÓ Ø ÓÒ ØÖÒØ É Ý ¾ ¼ ½ Ò ¼ Ý Üº Ì ÔÖÓÐÑ ÛØ Ø ØØ Ø ÓÒ ÚÖÐ Ý Ö ÐÝ ÒØÖØÛÒ Ò Ø ÓØÚ ÙÒØÓÒº ÏÐ ÓÙÖ ÓÔØÑÞØÓÒ ÔÖÓÐÑ Ò ÓÐÚ ÜØÐÝ Ý Ø Ù Ó Ó¹ÐÐ ÒÓÒ¹ ÖÐ ÝÒÑ ÔÖÓÖÑÑÒ ÐÓÖØÑ ÓÛÒ Ò ½¾ ÓÖ Ò ÓÐÚ ÒÖÐ ÒØÖ ÔÖÓÖÑ Ù ÑÒ ØÓ ÓØÒ Ø ÔÖÓ¹ ÐÑ ÓÐÙØÓÒ ÛÐÐ ÒÓØ Ú ÓÓ ÔÖÓÖÑÒº ÀÒ ÓÖ Ö ÓÒ Û ÐÐ Ö ÑÓÑÒØÖÐÝ ÛÓÓ ØÓ ÑÔÐÓÝ ÖÝ ÐÓÖØÑ ÓÖ Ø ÓÔØÑÞØÓÒ ÔÖÓÐÑ ÌØ Û Ö Ø ØÑØ Ø ÚÐÙ Ó ½µ Ý ÔÒ ØØ ÒÜ ¼ É ÓÖ Û Ø ÓØÚ ÙÒØÓÒ ÛÐÐ Ö Ø ÑÓ Ø ÛÒ Ý ØÙÖÒ ÖÓÑ ¼ ØÓ ½º ÁÒ Ø ÒÖÐ ÒÙØÚ ØÔÛ ÙÑ ØØ Û Ö ÚÒ Ò ØÑØ ÓÖ Ü ½µº ÌÒ ØÓ ÓÑÔÙØ Ü µ Û Ô ØØ ÒÜ ¼ É ÛØ Ý ¼ ÓÖ Û Ø ÓØÚ ÙÒ¹ ØÓÒ Ö Ø ÑÓ Ø ÙÔÓÒ ØØÒ Ý ½º ÁØ Ò ÓÛÒ ØØ Ø ÖÝ ÐÓÖØÑ Ó ÒÓØ Ò ÒÖÐ Ò Ø ÓÔØÑÐ ÓÐÙØÓÒº ÀÓÛÚÖ Ø ÚÖ Ö Ò Ò ÐÝ ÓÛÒ ØÓ Ò ÒÖ Ò ÙÑÓÙÐÖ ÙÒØÓÒ Ò Ø ÒÙÑÖ Ó ÖÛÐ µ Ò Ó Ø ÖÝ ÐÓÖØÑ ÙÖ¹ ÒØ ØÓ ÔÖÓÙ ÓÐÙØÓÒ ÛØ ÚÖ Ö Ò Ø Ð Ø ½ ½µ Ó Ø Ø ÔÓ Ð ½ º ÓÖ Ø ÔÐ Û ÓÒ Ö Û ÐÚ ØÛÓÖ Ø¹ ÔÖÓÖÑÒ ÙÖÒØ Ó Ø ÖÝ ÐÓÖØÑ ØÖØÐÝ ØØÖº Ï ØÖÓÖ Ð Ù Ø Ò Ù ØÒ Ø ÖÝ ÐÓÖØÑ ÙÖ Ø ØÓ 141
Ò Ò ÒÖк ÅÓÖÓÚÖ Ø ØÖÚÐ ØÓ ØØ Ø ÙÒØÓÒ ÛÒ ØÑØ Ò Ø ÛÝ ÓÒÚÜ Á ÚÒ ØÛÓ Ù Ú ÖÝ Ó Ø Ö Ø «ÖÒ Ö ØÒ Ø ÓÒ ÖÝ Ó ÛÓÙÐ ÚÒÓ Ò ÓÖ Ø Ö Ø ÓÒº 2.4 Solving the Discrete Separable Convex Resource Allocation Problem ÒÓØ Ø ÓÔØÑÞØÓÒ ÔÖÓÐÑ Ö ÓÚ ÔÐ Ó ÖØ ÓÒÚÜ ÔÖÐ Ö ÓÙÖ ÐÐÓ¹ ØÓÒ ÔÖÓÐѺ Ì ÔÖÓÐÑ Ó ÑÒÑÞÒ ÙØ ØÓ Ø ÓÒ ØÖÒØ Ò Æ ½ Æ ½ Ü µ Ü Ê Ü ¾Ñ Å ½µ ¾¼µ ¾½µ ÛØ ÓÒÚÜ ÚÖÝ ÛÐÐ ØÙ Ò Ø ÓÔØÑÞØÓÒ Ðع ÖØÙÖº Ï ÔÓÒØ Ø ÖÖ ØÓ ½¾ ÓÖ ØÐ ÓÒ Ø ÐÓÖØÑ º Ï ÓÒØÒØ ÓÙÖ ÐÚ Ö ÛØ Ö ÓÚÖÚÛº Ì ÖÐ Ø ÒÓÛÒ ÐÓÖØÑ ÓÖ ÖØ ÓÒÚÜ Ô¹ ÖÐ Ö ÓÙÖ ÐÐÓØÓÒ ÔÖÓÐÑ ÒØÐÐÝ Ù ØÓ ÓÜ º ÅÓÖ ÔÖ ÐÝ ÓÜÐÓÓ Ø Ø ÓÒØÒÙÓÙ ÒÓØÒ ØØ Ø ÄÖÒ ÑÙÐØÔÐÖ ÓÖ ÃÙÒ¹ÌÙÖ ÓÒØÓÒ µ ÑÔÐ ØØ Ø ÓÔØÑÐ ÚÐÙ ÓÙÖÖ ÛÒ Ø ÖÚØÚ ÛÖ ÕÙÐ ÔÓ Ð ÙØ ØÓ Ø ÓÚ ÓÒ ØÖÒØ º Ì Ú Ö ØÓ ÖÝ ÐÓÖØÑ ÓÖ Ø ÖØ Û Ù ÙÐÐÝ ØØÖÙØ ØÓ Óܺ ÇÒ ÓÖÑ ÑØÖÜ Ò Û Ø µø ØÖÑ Ò ØÓ Ø Ö Ø «Ö¹ Ò ½µ µº Ý ÓÒÚÜØÝ Ø ÓÐÙÑÒ Ó Ø ÑØÖÜ Ö ÙÖÒØ ØÓ ÑÓÒÓØÓÒ Ò Ô ÐÐÝ ÒÓÒ¹Ö Òº Ì ÖÝ ÐÓÖØÑ ÒØÐÐÝ Ø Ü ØÓ Ñ º ÁØ ØÒ Ò Ø ÒÜ ÓÖ Û Ü ½ Å Ò Ø ÚÐÙ Ó Ø ÒÜØ Ö Ø «ÖÒ Ü ÑÒÑк ÓÖ Ø ÒÜ ÓÒ ÒÖÑÒØ Ü Ý ½º ÌÒ Ø ÔÖÓ ÖÔØ ÙÒØÐ ÕÙØÓÒ ¾¼µ Ø ÓÖ ÙÒØÐ Ø Ø Ó ÐÐÓÛÐ Ò ÑÔØ º ÁÒ ØØ ØÖ ÒÓ ¹ Ð ÓÐÙØÓÒºµ ÆÓØ ØØ Ø Ö Ø «ÖÒ Ö Ù Ø Ø ÖØ ÒÐÓ Ó ÖÚØÚ ÓÖ Ø ÓÒØÒÙÓÙ Ò ØØ Ø ÖÝ ÐÓÖØÑ Ò ÓÐÙØÓÒ Ò Û ÑÓÙÐÓ ÓÒ ØÖÒØ ¾½µ ÐÐ Ö Ø «ÖÒ Ö ÕÙÐ ÔÓ Ðº Ì ÓÑÔÐÜØÝ Ó Ø ÖÝ ÐÓÖØÑ Ç Æ Ê ÐÓ Æµº ÌÖ ØÖ ÐÓÖØÑ ÓÖ ÓÙÖ ÔÖÓÐÑ Ù ØÓ ÐÐ Ò ÅÓ ½½ Û ÓÑÔÐÜØÝ Ç Æ ÐÓ Êµ ¾ µº Ì Ø Ø ÐÓÖØÑ Ù ØÓ ÖÖ ÓÒ Ò ÂÓÒ ÓÒ ½¼ Ò Ø ÓÑÔÐÜØÝ Ç ÑÜÆ Æ ÐÓ ÊƵµº Ì Ð¹ ÓÖØÑ ÐÝ ÓÑÔÐÜ ÓÒ ØÒ Ó ØÖ ÓÑÔÓÒÒØ º Ì Ö Ø ÓÑÔÓÒÒØ ÐÑÒØ ÐÑÒØ Ó Ø ÑØÖÜ ÖÓÑ ÓÒ ÖØÓÒ ÐÚÒ Ç Êµ ÐÑÒØ Ò ØÒ Ç Æµ ØѺ Ì ÓÒ ÓÑÔÓÒÒØ ØÖØ Ç ÐÓ ÊƵµ ØÑ ØÖØÓÒ ØÒ Ç Æµ ØѺ Ø Ø Ò Ó Ø ÓÑÔÓ¹ ÒÒØ ÓÒÐÝ Ç Æµ ÐÑÒØ Ó Ø ÑØÖÜ ÖÑÒº ÒÐÐÝ Ø ØÖ ÓÑÔÓÒÒØ ÐÒÖ ØÑ ÐØÓÒ ÐÓÖØÑ ÒÒ Ø ÓÔØÑÐ ÚÐÙ Ò Ç Æµ ØѺ ÓÖ ÙÐÐ ØÐ ÓÒ Ø ÐÓÖØÑ ½¾ º Ï ÑÔÐÓÝ Ø ÖÖ ÓÒ Ò ÂÓÒ ÓÒ ÐÓÖØÑ Ò Ø ÔÔÖº ÌÖ Ó Ü Ø ÓÑ ÐØÖÒØÚ ÐÓÖØÑ Û ÓÙÐ ÓÒ Ö ÓÖ ÓÙÖ ÔÖØÙÐÖ ÓÔØÑÞØÓÒ ÔÖÓÐѺ ÓÖ ÜÑÔÐ Ø ÕÙ ¹ØÖÑÒ Ø Û Ô ÔÓÖØÓÒ Ó Ø ÓÔØÑÞØÓÒ ÔÖÓÐÑ ÒÖÒØÐÝ ÖØ ÙØ Ø ÔÓÖØÓÒ ÓÖÖ ÔÓÒÒ ØÓ ÓØÖ ØÖÙØÓÒ Ò ÓÒ Ö ÚÒ Ö ØÓ ÓÒØÒÙÓÙ ÔÖÓÐÑ Û ÓÒ Ò µº ÁÒ Ø Ó ØÖÙØÓÒ ÓÖ Û Ø ÜÔÖ ÓÒ ÓÖ «ÖÒØÐ Ò ÓÖ Û Ø ÖÚØÚ ÐÓ ÓÖÑ ÜÔÖ ÓÒ ØÖ Ó Ü Ø ÚÖÝ Ø ÐÓÖØÑ ÓÖ µ ÓÐÚÒ Ø ÓÒØÒÙÓÙ Ò µ ÖÐÜÒ Ø ÓÒØÒÙÓÙ ÓÐÙØÓÒ ØÓ ÖØ ÓÐÙØÓÒº ËÓ ÐÐ Û Ô Ù ØÖÙØÓÒ Ø ÓÚ ÔÔÖÓ ÓÙÐ ØØÖØÚº ÁÒ ÑÓ Ø Û Ô Ù ØÖÙØÓÒ ÓÒ ÓÙÐ ÔÖØØÓÒ Ø Ø Ó Û Ô ÒØÓ ØÛÓ ÓÑÔÓÒÒØ º Ì Ö Ø Ø ÓÙÐ ÓÐÚ Ý ÓÒØÒÙÓÙ ÖÐÜØÓÒ ÛÐ Ø ÓÑÔÐÑÒØÖÝ Ø ÓÙÐ ÓÐÚ Ý ÖØ ÐÓÖØÑ Ù ØØ ÚÒ Ý ½¼ º Ø ÑÓÙÒØ Ó Ö ÓÙÖ ÚÒ ØÓ ÓÒ Ø Ó ÙÔ Ø ÑÓÙÒØ ÚÒ ØÓ Ø ÓØÖ Ø ÛÓÙÐ Ó ÓÛÒº ËÓ ÖØ Ò ØÓÒ ÐÓÖØÑ ¾¾ Û ÐÓÖØÑ Ò ÓÑÔÐÜØÝ ÓÙÐ ÕÙØ Øº Ï ÐÐ ÒÓØ ÔÙÖ Ù Ø ÙÖØÖ Öº 3. CRAWLER SCHEDULING PROBLEM ÚÒ ØØ Û ÒÓÛÓÛÑÒÝÖÛÐ ÓÙÐ Ñ ÓÖ Û Ô Ø ÕÙ ØÓÒ ÒÓÛ ÓÑ ÓÛ ØÓ Ø ¹ ÙÐ Ø ÖÛÐ ÓÚÖ ÙÐÒ ÒØÖÚÐ Ó ÐÒØ Ì º Ò Û ÐÐ ØÒ Ò ØÖÑ Ó ÙÐÒ ÒØÖÚÐ Ó ÐÒØ Ì º Ï Ö ØÖÝÒ ØÓ ÓÔØÑÐÐÝ ÙÐ Ø ÙÖÖÒØ ÙÐÒ ÒØÖÚÐ Ù Ò ÓÑ ÒÓÖÑØÓÒ ÖÓÑ Ø Ð Ø ÓÒºµ Ï ÐÐ ÙÑ ØØ ØÖ Ö ÔÓ ÐÝ ØÖÓÒÓÙ ÖÛÐÖ Ò ØØ ÖÛÐÖ Ò ÒÐ Ë ÖÛÐ Ø Ò ØÑ Ì º ÌÙ Û È Ò Ý ØØ Ø ØÓØÐ ÒÙÑÖ Ó ÖÛÐ Ò ØÑ Ì Ê Ë ½ º Ï ÐÐ Ñ ÓÒ ÑÔÐÝÒ ÙÑÔ¹ ØÓÒ ØØ ÖÛÐ ÓÒ ÖÛÐÖ Ø ÔÔÖÓÜÑØÐÝ Ø Ñ ÑÓÙÒØ ÓØѺ ÌÙ Û Ò Ú Ø ØÑ ÒØÖ¹ ÚÐ Ì ÒØÓ Ë ÕÙÐ Þ ØÑ ÐÓØ Ò ØÑØ Ø ØÖØ ØÑ Ó Ø ÐØ ÐÓØ ÓÒ ÖÛÐÖ Ý Ì Ð Ð ½µÌ ÓÖ ½ Ð Ë Ò ½ º Ï ÒÓÛ ÖÓÑ Ø ÔÖÚÓÙ ØÓÒ Ø Ö ÒÙÑÖ Ó ÖÛÐ Ü ÓÖ Û Ô º ËÒ Û Ú ÐÖÝ Óѹ ÔÙØ Ø ÓÔØÑÐ ÙÐ ÓÖ Ø Ð Ø ÙÐÒ ÒØÖÚÐ Û ÙÖØÖ ÒÓÛ Ø ØÖØ ØÑ Ø ¼ Ó Ø ÒÐ ÖÛÐ ÓÖ Û Ô ÛØÒ Ø Ð Ø ÙÐÒ ÒØÖÚк ÌÙ Û Ò Óѹ ÔÙØ Ø ÓÔØÑÐ ÖÛÐ ØÑ Ø ½Ø Ü ÓÖ Û Ô ÙÖ¹ Ò Ø ÙÖÖÒØ ÙÐÒ ÒØÖÚк ÓÖ Ø ØÓ Ø Ø ÑÔÓÖØÒØ ÓÖ Ø ÙÐÖ ØÓ ÒØØ Ó Ø ÖÛÐ Ø Ø ÔÔÖÓÜÑØÐÝ Ø ÔÖÓÔÖ ØÑ ÙØ Ò Ø ÖÐÝ ÓÖ Ø ÐØ ÓÙÐ Ú ÒÓ ÖÓÙ ÑÔØ ÓÖ ÑÓ Ø Ó Ø ÙÔØ ÔÖÓÐØÝ ØÖÙØÓÒ ÙÒØÓÒ Û ÒÚ ÓÒº ÌÙ Ø Ö ÓÒÐ ØÓ ÙÑ ÙÐÖ Ó Ø ÙÒØÓÒ ÓÖ Ø Ø ÖÛÐ Ó Ô ÛÓ ÙÔØ ÔØØÖÒ ÓÐÐÓÛ ØÓ ¹ Ø ÔÖÓ ØØ Ø Ø ÓÖÑ Ë Øµ Ø Ø º ÇÒ Ø ÓØÖ Ò ÓÖ Û Ô ÛÓ ÙÔØ ÔØØÖÒ ÓÐÐÓÛ ÕÙ ¹ØÖÑÒ Ø ÔÖÓ Ò Ø ÐØ ÔØÐ ÙØ Ò ÖÐÝ ÒÓØ Ù Ùк ËÓ Ò ÔÔÖÓÔÖØ ÙÐÖ Ó Ø ÙÒØÓÒ ÓÖ Ø Ø ÖÛÐ Ó ÕÙ ¹ØÖÑÒ Ø Ô ÑØ Ú Ø ÓÖÑ Ë Øµ ½ ØØ Ø Ø ÓØÖÛ ¾¾µ ÁÒ ØÖÑ Ó ÙÐÒ ÒÓØØÓÒ Ø ÓÚ ÖÛÐ Ø ØÓ Ú ÖÐ ØÑ Ó Ø º Ë ÓÖ ÑÓÖ ÒÓÖÑØÓÒ ÓÒ ÙÐÒ ØÓÖݺ ÎÖØÙÐÐÝ ÒÓ ÛÓÖ Ñ ØÓ Ú Ò ÓÒ ÓÒ Ø Ùй Ò ÔÖÓÐÑ Ò Ø Ö Ö ÐØÖØÙÖ ÓÒ ÖÛÐÖ º Ø ØÖ 142
CRAWL TASK 1 SUPPLY=1 SLOT 1 SLOT S DEMAND=1 CRAWLER 1 ÐØÓÙ ÒÓØ ÓÚÓÙ Ø Ö Ø ÐÒ Ø ÒØÙÖ Ó Ø ØÖÒ ÔÓÖØØÓÒ ÔÖÓÐÑ ÓÖÑÙÐØÓÒ Ò ÙÖ ØØ ØÖ Ü Ø Ò ÓÔØÑÐ ÓÐÙØÓÒ ÛØ ÒØÖÐ ÓÛ Ò Ø ØÒÕÙ Ò Ø ÐØÖØÙÖ Ò Ù ÓÐÙØÓÒº Ò ½ ÓÖ ØÐ º Ì ÑÔÐ ØØ ÒÖݺ Á ½ ØÒ ÖÛÐ Ó Û Ô Ò ØÓ Ø Ø ÖÛÐ Ó ÖÛÐÖ º Á Ø ÖÕÙÖ ØÓ Ü ÓÖ Ö ØÖØ ÖØÒ ÖÛÐ Ø ÖÓÑ ÖØÒ ÖÛÐÖ ÐÓØ Ø Ò ÐÝ ÓÒ ÇÒ ÑÔÐÝ Ò Ø Ó Ø Ó Ø Ö ØÖØ ÖØ Ö ØÓ Ò Òغ ÜÒ ÖÛÐ Ø ØÓ Ù Ø Ó ÖÛÐÖ ÐÓØ Ø Ñ Ö ØÖØÒ Ø ÖÓÑ Ø ÓÑÔÐÑÒØÖÝ ÖÛÐÖ ÐÓØ ºµ CRAWL TASK R CRAWLER C ÙÖ ÌÖÒ ÔÓÖØØÓÒ ÈÖÓÐÑ ÆØÛÓÖ ÑÔÐ ÜØ ÓÐÙØÓÒ ÓÖ Ø ÔÖÓÐѺ ËÔ ÐÐÝ Ø ÔÖÓÐÑ Ò ÔÓ Ò ÓÐÚ ØÖÒ ÔÓÖØØÓÒ ÔÖÓÐÑ Û ÐÐ Û ÒÓÛ Öº Ë ½ ÓÖ ÑÓÖ ÒÓÖÑØÓÒ ÓÒ ØÖÒ ÔÓÖØØÓÒ ÔÖÓÐÑ Ò ÒØÛÓÖ ÓÛ Ò ÒÖк Ï Ö ÓÙÖ ÙÐÒ ÔÖÓÐÑ Ò ØÖÑ Ó ÒØÛÓÖº Ï Ò ÔÖØØ ÒØÛÓÖ ÛØ ÓÒ ÖØ Ö ÖÓÑ ÙÔÔÐÝ ÒÓ ØÓ ÑÒ ÒÓº Ì Ê ÙÔÔÐÝ ÒÓ ÒÜ Ý ÓÖÖ ÔÓÒ ØÓ Ø ÖÛÐ ØÓ ¹ Ùк Ó Ø ÒÓ ÙÔÔÐÝ Ó ½ ÙÒغ ÌÖ ÛÐÐ ÓÒ ÑÒ ÒÓ ÔÖ ØÑ ÐÓØ Ò ÖÛÐÖ ÔÖ Ó Û ÑÒ Ó ½ ÙÒغ Ï ÒÜ Ø Ý ½ Ð Ë Ò ½ º Ì Ó Ø Ó Ö Ð ÑÒØÒ ÖÓÑ ÙÔÔÐÝ ÒÓ ØÓ ÑÒ ÒÓ Ð Ë Ì Ð µº ÙÖ ÓÛ Ø ÙÒÖÐÝÒ ÒØÛÓÖ ÓÖ Ò ÜÑÔÐ Ó Ø ÔÖØÙÐÖ ØÖÒ ¹ ÔÓÖØØÓÒ ÔÖÓÐѺ ÀÖ ÓÖ ÑÔÐØÝ Û ÙÑ ØØ Ø ÖÛÐÖ Ö ÓÑÓÒÓÙ Ò ØÙ ØØ Ò ÖÛÐ Ø Ñ ÒÙÑÖ Ë Ë Ó Ô Ò Ø ÙÐÒ ÒØÖÚÐ Ì º ÁÒ Ø ÙÖ Ø ÒÙÑÖ Ó ÖÛÐ Ê Û ÕÙÐ Ø ÒÙÑÖ Ó ÖÛÐÖ ØÑ ÐÓØ º Ì ÒÙÑÖ Ó ÖÛÐÖ ¾ Ò Ø ÒÙÑÖ Ó ÖÛÐ ÔÖ ÖÛÐÖ Ë ¾º ÀÒ Ê Ëº Ì Ô ÐÒÖ ÓÔØÑÞØÓÒ ÔÖÓÐÑ ÓÐÚ Ý Ø ØÖÒ ÔÓÖØØÓÒ ÔÖÓÐÑ Ò ÓÖÑÙÐØ ÓÐÐÓÛ º Å ½ ÅÒÑÞ Å Æ Å ½ ½ ½ Ù ØØ Ê Ì µ ½ ½ Æ Ò ½ Å Æ Å ½ ½ ½ ½ Å ¼ ½ Å Ò ½ Æ ¾ µ ¾µ ¾µ ¾µ Ì ÓÐÙØÓÒ Ó ØÖÒ ÔÓÖØØÓÒ ÔÖÓÐÑ Ò Óѹ ÔÐ ÕÙÐݺ Ë ÓÖ ÜÑÔÐ ½ º 4. PARAMETERIZATION ISSUES Ì Ù Ó ÓÙÖ ÓÖÑÙÐØÓÒ Ò ÓÐÙØÓÒ Ò ÔÖØ Ö¹ ÕÙÖ ÐÙÐØÒ ØÑØ Ó Ø ÔÖÑØÖ Ó ÓÙÖ Ò¹ ÖÐ ÑÓÐ ÖÑÛÓÖº ÁÒ Ø ÒØÖ Ø Ó Ô Û Ø Ö ÓÑ Ó Ø Ù ÒÚÓÐÚ Ò Ö Ò Ø ÔÖÓÐÑ Ò ÖÖ Ø ÒØÖ Ø ÖÖ ØÓ Ø ÕÙÐ ÓÖ ØÓÒÐ ØÐ º ÆÓØ ØØ ÛÒ Ô ÖÛÐ Û Ò ÐÝ Ó¹ ØÒ Ø Ð Ø ÙÔØ ØÑ ÓÖ Ø Ôº ÏÐ Ø Ó ÒÓØ ÔÖÓÚ ÒÓÖÑØÓÒ ÓÙØ ÒÝ ÓØÖ ÙÔØ ÓÙÖÖÒ Ò Ø Ð Ø ÖÛÐ Ó Ô Û Ò Ù Ø ÒÓÖÑØÓÒ ØÓØÖ ÛØ Ø Ø Ò ÑÓÐ ÓÖ Ô ÖÓÑ ÔÖÚÓÙ ÙÐÒ ÒØÖÚÐ ØÓ ØØ ØÐÐÝ ÒÖ Ý ÔÖÓÔÖØ Ó Ø ÙÔØ ÔÖÓ ÓÖ Ø Ôº Ì ØÒ Ù Ò ØÙÖÒ ØÓ ÓÒ ØÖÙØ ÔÖÓÐØÝ ØÖÙØÓÒ ÒÐÙÒ ÕÙ ¹ØÖÑÒ Ø ØÖÙØÓÒµ ÓÖ Ø ÒØÖÙÔØ ØÑ Ó Ô º ÒÓØÖ ÑÔÓÖØÒØ ÔØ Ó ÓÙÖ ÔÔÖÓ ÓÒÖÒ Ø ØØ ØÐ ÔÖÓÔÖØ Ó Ø ÙÔØ ÔÖÓ º Ì ÒÐÝ Ó ÔÖÚÓÙ ØÙ ÒØÐÐÝ ÙÑ ØØ Ø ÙÔØ ÔÖÓ ÈÓ ÓÒ ¾ ºº Ø ÒØÖÙÔØ ØÑ ÓÖ Ô ÓÐÐÓÛ Ò ÜÔÓÒÒØÐ ØÖÙØÓÒº ÍÒÓÖØÙÒØÐÝ ÚÖÝ ÐØØÐ Ò ÔÙÐ Ò Ø Ö Ö ÐØÖØÙÖ ÓÒ Ø ÔÖÓÔÖØ Ó ÙÔØ ÔÖÓ ÓÙÒ Ò ÔÖØ ÛØ Ø ÓÐ ÜÔØÓÒ ØÓ ÓÙÖ ÒÓÛе Ó ÖÒØ ØÙÝ ½ Ù ØÒ ØØ Ø ÒØÖÙÔØ ØÑ Ó Ô Ø ÒÛ Ö¹ Ú Û Ø Ö ÒÓØ ÜÔÓÒÒØк ÌÓ ÙÖØÖ ÒÚ ØØ Ø ÔÖÚÐÒ Ó ÜÔÓÒÒØÐ ÒØÖÙÔØ ØÑ Ò ÔÖØ Û ÒÐÝÞ Ø Ô ÙÔØ Ø ÖÓÑ ÒÓØÖ Û Ø ÒÚÖÓÒ¹ ÑÒØ ÛÓ ÓÒØÒØ ÐÝ Ò ÐÝ ÝÒѺ ËÔ ÐÐÝ Û ÓÒ Ö Ø ÙÔØ ÔØØÖÒ ÓÙÒ Ø Ø Û Ø ÓÖ Ø ½ ÆÒÓ ÇÐÝÑÔ Ñ ÖÖÖÒ Ø ÒØÖ Ø ÖÖ ØÓ ½ ¾ ÓÖ ÑÓÖ ØÐ ÓÒ Ø ÒÚ¹ ÖÓÒÑÒغ ÙÖ ÔÐÓØ Ø ØÐ ØÖÙØÓÒ Ó Ø ØÑ ØÛÒ ÙÔØ ÓÖ Ó Ø Ó ½ ÒÚÙÐ ÝÒÑ Ô Û Ö ÖÔÖ ÒØØÚ Ó Ø ÙÔØ ÔØØÖÒ ¹ ÚÓÖ ÓÙÒ Ò ÓÙÖ ØÙÝ Ó ÐÐ ÝÒÑ Ô ØØ ÛÖ ÑÓ Ö ÑÓÙÒØ Ó ØѺ ÁÒ ÓØÖ ÛÓÖ Ø ÙÖÚ ÐÐÙ ØÖØ Ø ÔÖÓÐØÝ ØØ Ø ØÑ ØÛÒ ÙÔØ ØÓ ÚÒ Ô ÖØÖ ØÒ Ø ÙÒØÓÒ Ó ØÑ Øº Ï Ö Ø Ó ÖÚ ÖÓÑ Ø Ö ÙÐØ ØØ Ø ÒØÖÙÔØ ØÑ ØÖÙØÓÒ Ò «Ö Ò ÒØÐÝ ÖÓÑ Ò ÜÔÓÒÒ¹ ØÐ ØÖÙØÓÒº ÅÓÖ ÔÖ ÐÝ ÓÙÖ Ö ÙÐØ Ù Ø ØØ Ø ÒØÖÙÔØ ØÑ ØÖÙØÓÒ ÓÖ ÓÑ Ó Ø Û Ô Ø ÆÒÓ Ú ØÐ ØØ Ý Ø ÙÜÔÓÒÒØÐ ÖØ Ò Ò ÐÓ ÐÝ ÔÔÖÓÜÑØ Ý Ù Ø Ó Ø ÏÙÐÐ ØÖÙØÓÒ ºº Ø ØÐ Ó Ø ÐÓÒ¹ØÐ ÏÙÐÐ ÒØÖÙÔ¹ Ø ØÖÙØÓÒ ÚÒ Ý Øµ Ø«ÛÖ Ø ¼ ¼ Ò ¼ «½º Ï ÙÖØÖ Ò ØØ Ø ÒØÖÙÔØ ØÑ ØÖÙØÓÒ ÓÖ ÓÑ Ó Ø ÓØÖ Û Ô Ø ÆÒÓ Ú ÚÝ ØÐ Ò Ò ÐÓ ÐÝ ÔÔÖÓÜÑØ Ý Ø 143
1 Tail Distribution of Update Process 1 Tail Distribution of Update Process Prob. time between updates > t.8.6.4.2 web page 1 web page 2 web page 3 web page 4 web page 5 web page 6 web page 7 web page 8 web page 9 Prob. time between updates > t.8.6.4.2 web page 1 web page 11 web page 12 web page 13 web page 14 web page 15 web page 16 web page 17 web page 18 5 1 15 2 Time t (in seconds) 5 1 15 2 Time t (in seconds) ÙÖ ÌÐ ØÖÙØÓÒ Ó ÍÔØ ÈÖÓ Ð Ó ÈÖØÓ ØÖÙØÓÒ ºº Ø ØÐ Ó Ø ÈÖØÓ Ò¹ ØÖÙÔØ ØÑ ØÖÙØÓÒ ÚÒ Ý Øµ صµ «ÛÖ Ø ¼ ¼Ò¼«¾º ÅÓÖÓÚÖ ÓÑ Ó Ø ÔÖÓ ÚÓÖ Ó ÖÚ Ò Ø ÙÔØ ÔØØÖÒ ÓÖ ÓÑ Û Ô Ò Ö ÛØ ÓÙÖ ÕÙ ¹ØÖÑÒ Ø ØÖÙØÓÒº Ì ÓÚ ÒÐÝ ÒÓØ ÒØÒ ØÓ Ò ÜÙ ØÚ ØÙÝ ÝÒÝ ÑÒ º ÇÙÖ Ö ÙÐØ ØÓØÖ ÛØ ØÓ Ò ½ Ù Ø ØØ ØÖ Ö ÑÔÓÖØÒØ Û Ø ÒÚÖÓÒÑÒØ Ò Û Ø ÒØÖÙÔØ ØÑ Ó ÒÓØ ÓÐÐÓÛ Ò ÜÔÓÒÒØÐ ØÖÙØÓÒº Ì ÒÐÙ Ø ÕÙ ¹ØÖÑÒ Ø Ò ØÒ Ó ÓÙÖ ÒÖÐ ÑÓÐ Û ÑÓØÚØ Ý ÒÓÖÑØÓÒ ÖÚ Ù ÓÚº Ì Ý ÔÓÒØ ØØ ØÖ ÐÖÐÝ Ö Û ÒÚÖÓÒÑÒØ Ò Û Ø ÙÔØ ÔÖÓ ÓÖ ÒÚÙÐ Û Ô Ò ÑÙ ÑÓÖ ÓÑÔÐÜ ØÒ ÈÓ ÓÒ ÔÖÓ Ò ÓÙÖ ÒÖÐ ÓÖÑÙÐØÓÒ Ò ÓÐÙØÓÒ Ó Ø ÖÛÐÖ ÙÐÒ ÔÖÓÐÑ Ñ Ø ÔÓ Ð ÓÖ Ù ØÓ ÒÐ Ù Û ÖÒ Ó Û ÒÚÖÓÒÑÒØ ÛØÒ Ø ÙÒ ÖÑÛÓÖº 5. EXPERIMENTAL RESULTS Í Ò Ø ÑÔÖÐ Ø Ò ÒÐÝ Ó Ø ÔÖÚÓÙ ¹ ØÓÒ Û ÒÓÛ ÐÐÙ ØÖØ Ø ÔÖÓÖÑÒ Ó ÓÙÖ Ñº Ï ÛÐÐ ÓÙ ÓÒ Ø ÔÖÓÐÑ Ó ÒÒ Ø ÓÔØÑÐ ÒÙÑÖ Ó ÖÛÐ ÓÑÔÖÒ ÓÙÖ Ñ ÛØ ØÛÓ ÑÔÐÖ ÐÓÖØÑ º ÓØ Ó Ø ÐÓÖØÑ ÛÖ ÓÒ Ö Ò Ò ØÝ Ö ÖØÒÐÝ ÒØÙÖÐ ÐØÖÒØÚ º Ì Ö Ø Ñ ÑØ ÐÐ ÔÖÓÔÓÖØÓÒк Ï ÑÔÐÝ ÐÐÓØ Ø ØÓØÐ ÑÓÙÒØ Ó ÖÛÐ Ê ÓÖÒ ØÓ Ø ÚÖ ÙÔØ ÖØ Ó Ø ÚÖ¹ ÓÙ Û Ô º ÅÓÙÐÓ ÒØÖÐØÝ ÓÒÖÒ Ø ÑÒ ØØ Û ÓÓ Ü» º Ì ÓÒ Ñ ÑÔÐÖ ÝØ ÐÐÓ¹ ØÒ Ø ÒÙÑÖ Ó ÖÛÐ ÚÒÐÝ ÔÓ Ð ÑÓÒ Ø Ø Û Ô º Ï ÐÐ Ø Ø ÙÒÓÖÑ Ñº Ó Ø Ñ Ò ÑÒ ØÓ ÒÐ ÓÙÖ ÑÖÖ ÑÒØ ÑØÖ ÛØ º ÏÒ ÔÒ Ó Ø ÚÖÒØ Û ÛÐÐ Ù Ø ØÖÑ ÛØ ÔÖÓÔÓÖØÓÒÐ Ò ÛØ ÙÒÓÖѺ Ì ÓÖÑÖ ÓÓ Ü» Û º Ì ÐØØÖ ÓÑØÒ Ó Ñ ¹ ÒÓÑÖ Ï Ö ÓÓ Ò Ü» Û Ó Ø ÒØÐÐÝ ÐØÐÝ «ÖÒØ ÔÖÓÔÓÖØÓÒРѺ Ï Ò Ð Ó ØÒ Ó ÓÙÖ ÓÔØÑÐ Ñ È ÛØ ÓÐÚÒ ÓÖ Ø ÑÐÐ Ø Æ ÓØÚ ÙÒØÓÒ Ûº ½ Á Û ÓÐÚ Ò Ø ÓÖ Ø È Æ ÑÐÐ Ø ÓØÚ ÙÒØÓÒ ½ Û Ø Ò ÙÒÛØ ÓÔØÑÐ ÐÓÖØѺ Ì ÒØÐÐÝ Ø Ñ ÔÖÓÐÑ ÓÐÚ Ò ÔÖÓÚ Ó ÓÙÖ ØØ ÐÐ Û Ô Ö ÙÔØ ÓÖÒ ØÓ ÈÓ ÓÒ ÔÖÓ º ÙØ ÓÙÖ Ñ ÛÐÐ Ú ÑÙ ÖØÖ Ôº ÚÒ ØÓÙ Ø ÐÓÖØÑ ÓÑØ Ø ÛØ Ò Ø ÓÖÑÙÐØÓÒ Ó Ø ÔÖÓÐÑ ÛÑÙ Ø ÓÑÔÖ Ø ÕÙÐØÝ Ó Ø ÓÐÙØÓÒ ÓÒ Ø ÛØ ÓØÚ ÙÒØÓÒ ÚÐÙº ÁÒ ÓÙÖ ÜÔÖÑÒØ Û ÓÒ Ö ÓÑÒØÓÒ Ó «ÖÒØ ØÝÔ Ó Û Ô ÙÔØ ØÖÙØÓÒ º ÁÒ ÒÙÑÖ Ó Û Ù ÑÜØÙÖ Ó ¼± ÈÓ ÓÒ ¼± ÈÖØÓ Ò ½¼± ÕÙ ¹ØÖÑÒ Ø ØÖÙØÓÒ º ÁÒ Ø ÜÔÖÑÒØ Û ÓÓ Ì ØÓ ÓÒ Ý ØÓÙ Û Ú Ñ ÖÙÒ ÓÖ Û ÛÐк Ï ØÆ ØÓ ÓÒ ÑÐÐÓÒ Û Ô Ò ÚÖ Ê ØÛÒ ½º Ò ÑÐÐÓÒ ÖÛÐ º Ï ÙÑ ØØ Ø ÚÖ ÖØ Ó ÙÔØ ÓÚÖ ÐÐ Ô Û ½º Ò Ø ÙÔØ ÛÖ Ó Ò ÓÖÒ ØÓ Ô¹Ð ØÖÙØÓÒ ÛØ ÔÖÑØÖ Æ Ò Ø ÐØØÖ Ó Ò ØÛÒ ¼ Ò ½ ¾ ½ º ËÙ ØÖÙØÓÒ ÖÙÒ Ø ÔØÖÙÑ ÖÓÑ ÐÝ Û ÛÒ ¼µ ØÓ ØÓØÐÐÝ ÙÒÓÖÑ ÛÒ ½µº Ï ÓÒ Ö ÓØ Ø ØÐÒ Ò ÑÖÖ ÑÒØ ÑØÖ º ÏÒ ÓÒ ÖÒ Ø ÑÖÖ ÑÒØ ÑØÖ Û ÖÚ Ø ÛØ Ò ÕÙØÓÒ µ Ý ÓÒ ÖÒ Ö ÒÒ Û ÖØÙÖÒ Ö ÙÐØ Ô ÔÖ ÕÙÖÝ Ûؽ¼ÙÖÐ ÓÒ Ôº Ì ÔÖÓÐØ ÛØ Û Ø Ö ÒÒ ÖØÙÖÒ Ô Ò ÔÓ ØÓÒ Ó ÕÙÖÝ Ö ÙÐØ Ô ÛÖ Ó Ò Ý ÐÒÖÞÒ Ø ¼ ÔÓ ØÓÒ ÔÒ ÖÒÓÑÐÝ Ó Ò ÒØÖ Ò ÑÔÓ Ò ØÖÙÒØ ÒÓÖÑÐ ØÖÙØÓÒ ÓÙØ ØØ ÒØÖº Ì ÐÒ ÖÕÙÒ ÓÖ ÔÓ ØÓÒ Ó ÕÙÖÝ Ô Ö Ó Ò Ö Ò ËØÓÒ ¾º¾ Ú Ô¹Ð ÙÒØÓÒ ÛØ ÔÖÑØÖ ¼ Ò ¼ ÛØ Ó¹ ÑØÖ ÙÒØÓÒ ÓÖ ÝÐÒ ØÖÓÙ Ø Ô º Ï ÙÑ ØØ Ø ÐÒØ ÛÒØ ÖÓÑ ÓÒ Ö ÙÐØ Ô ØÓ Ø ÒÜØ ÛØ ÔÖÓÐØÝ ¼ºº Ï ÓÓ Ø ÐÙÝ ÐÓ Ö ÔÖÓÐØÝ Ó Û Ô ÝÐÒ Ò ÒÓÖÖØ Ö ÔÓÒ ØÓ Ø ÐÒØ ÕÙÖÝ Ý ÔÒ ÙÒÓÖÑ ÖÒÓÑ ÒÙÑÖ ØÛÒ ¼ Ò ½º ÐÐ ÙÖÚ Ò ÓÙÖ ÜÔÖÑÒØ ÔÐÝ Ø ÒÐÝØÐÐÝ ÓÑÔÙØ ÓØÚ ÙÒØÓÒ ÚÐÙ Ó Ø ÚÖÓÙ Ñ º ÙÖ ÓÛ ØÛÓ ÜÔÖÑÒØ Ù Ò Ø ÑÖÖ ÑÒØ ÑØÖº ÁÒ Ø ÐØ¹Ò Ó Ø ÙÖ Û ÓÒ Ö Ø Ö ÙÐØ ÙÒÖ «ÖÒØ ÑÜØÙÖ Ó ÙÔØ ØÖÙØÓÒ Ý 144
1 9 Embarassment as Function of Crawl/Web Page Ratio Optimal Proportional Uniform 12 Embarassment as Function of Zipf like Parameter 8 1 Embarassments per 1 Queries 7 6 5 4 3 Embarassments per 1 Queries 8 6 4 Optimal Schemes Proportional Schemes Uniform Schemes 2 2 1 1.5 2 2.5 3 3.5 4 4.5 5 R/N.1.2.3.4.5.6.7.8.9 1 Theta ÙÖ ÌÛÓ ÑÖÖ ÑÒØ ÅØÖ ÜÑÔÐ ÚÖÝÒ Ø ÖØÓ Ó Ê ØÓ Æ ÖÓÑ ½º ØÓ º Ï ÓÒ Ö Ö ØÖÙ Ô ØÖÙØÓÒ ÓÖ Ø ÙÔØ ÖÕÙÒ ß Ò ÓØÖ ÛÓÖ Û ÓÓ Ô¹Ð ÔÖÑØÖ ¼º ÌÖ Ö Ü ÙÖÚ ÒÑÐÝ ÓÔØÑÐ ÔÖÓÔÓÖØÓÒÐ Ò ÙÒÓÖÑ Ò ÓØ ÛØ Ò ÙÒÛØ ÚÖ ÓÒ º Ì ÙÒÛØ ÓÔØÑÐ ÙÖÚ Ø Ö ÙÐØ Ó ÑÔÐÓÝÒ ÙÒØ ÛØ ÙÖÒ Ø ÓÑÔÙØØÓÒ Ô ÙØ ÔÐÝÒ Ø ÛØ ÓÔع ÑÐ ÓØÚ ÙÒØÓÒºµ Ý ÒØÓÒ Ø ÙÒÛØ ÓÔع ÑÐ Ñ ÛÐÐ ÒÓØ ÔÖÓÖÑ ÛÐÐ ØÛØ ÓÔع ÑÐ Ñ Û Ò Ø Ø ÔÓ Ð ÓÐÙØÓÒº ÁÒ ÐÐ ÓØÖ ÓÛÚÖ Ø ÙÒÛØ ÚÖÒØ Ó ØØÖ ØÒ Ø ÛØ ÚÖÒغ ËÓ Ø ØÖÙ ÙÒÓÖÑ ÔÓÐÝ Ó Ø Ø ÑÓÒ Ø ÐÐ Ó Ø ÙÖ Ø Ø Ð Ø ÓÖ Ø ÜÔÖ¹ ÑÒØ ÓÒ Ö Ò ÓÙÖ ØÙݺ Ì ÓÑÛØ ÙÖÔÖ Ò ØØ Ó «Ö Û ÒÓØ Ò ÛÐк ÓØ ÙÒÓÖÑ ÔÓÐ Ó ØØÖ ØÒ ØÖ ÔÖÓÔÓÖØÓÒÐ ÓÙÒØÖÔÖØ º ÆÓ¹ Ø ØØ Ø ÛØ ÓÔØÑÐ ÙÖÚ Ò Ø ÓÒÚÜ ÙÒØÓÒ Ó ÒÖ Ò Êº Ì ÛÐÐ ÐÛÝ ØÖÙº ÁÒ Ø ÖØ¹Ò Ó ÙÖ Û ÓÛ ÓÑÛØ «ÖÒ ÑÜØÙÖ Ó ØÖÙØÓÒ º ÁÒ Ø Û ÚÖÝ Ø Ô¹Ð ÔÖÑØÖ ÛÐ ÓÐÒ Ø ÚÐÙ Ó Ê ØÓ ¾º ÑÐÐÓÒ Ó ØØ ÊÆ ¾µº ÒÖ ØÙ ÝÐÒ Ð Û Ø ÓØÚ ÙÒØÓÒ ÒÖÐÐÝ ÒÖ ÛÐк Ì ÔÔÐÒ Ù Ø ÓÛ Ò ÔÖØÙÐÖ ØØ Ø ÓÔØÑÐ Ñ Ó ÚÖÝ ÛÐÐ Ò ÐÝ Û ÒÖÓ ÛÛ ÐÚ Ö ÑÓÖ ÖÔÖ ÒØØÚÓÖÐÛ ÒÚÖÓÒ¹ ÑÒØ º ÅÓÖÓÚÖ ÒÓØ ØØ Ø ÙÖÚ ÒØÐÐÝ ÓÒÚÖ ØÓ ÓØÖ ÒÖ º Ì ÒÓØ ØÓÓ ÙÖÔÖ Ò Ò Ø ÓÔØÑÐ ÔÖÓÔÓÖØÓÒÐ Ò ÙÒÓÖÑ Ñ ÛÓÙÐ ÐÐ Ö¹ ÙÐØ Ò Ø Ñ ÓÐÙØÓÒ ÔÖ ÐÝ Ò Ø Ò Ó ÛØ ÛÒ ½º ÁÒ ÒÖÐ Ø ÙÒÓÖÑ Ñ Ó ÖÐØÚÐÝ ØØÖ Ò Ø ÙÖ ØÒ Ø Ò Ø ÔÖÚÓÙ ÓÒº Ì ÜÔÐÒØÓÒ ÓÑÔÐÜ ÙØ Ø ÒØÐÐÝ ØÓ Ó ÛØ Ø ÓÖÖÐØÓÒ Ó Ø ÛØ Ò Ø ÙÔØ ÖÕÙÒ º ÁÒ Ø Û ÓÛ Ø ÜÑÔÐ Ù Ø ÔÙØ ÙÒÓÖÑ Ò Ø Ø ÔÓ Ð Ðغ ÁÒ ÙÖ Û ÓÛ ÓÙÖ ÜÔÖÑÒØ ÛÖ Û ÚÖ Ø ÖØÓ Ó Ê ØÓ Æº Ì ÙÖ ÔØ Ø ÚÖ Øй Ò ÑØÖ Ò Ó Û ÓÒÐÝ Ú ØÖ ÙÒÛص ÙÖÚ ÔÖ ÙÖº Ì ØÓÔ ÐØ¹Ò ÙÖ ÔØ ÑÜØÙÖ Ó ÙÔ¹ Ø ØÖÙØÓÒ ØÝÔ Ò Ø ÓØÖ ØÖ ÙÖ ÔØ Ò ØÙÖÒ ÔÙÖ ÈÓ ÓÒ ÈÖØÓ Ò ÕÙ ¹ØÖÑÒ Ø ØÖÙ¹ ØÓÒ º ÆÓØ ØØ Ø ÙÖÚ Ö ÐÒÖ ØÒ ØÓ Ò ¹ ÙÖ º Ì ÛØÒ ÛÐ ÑÔÓÖØÒØ ÒØÖÓÙ Ö Ó ÒÓ ÒØÓ Ø ÓØÚ ÙÒØÓÒ ÚÐÙ º ÓÖ Ø Ö ÓÒ Û ÛÐÐ ÓÙ ÓÒ Ø ÒÓÒ¹ÛØ ÖÓÑ Ö ÓÒº Ì Ý¹ Ü ÖÒ «Ö ÓÒ Ó Ø ÓÙÖ ÙÖ ÙØ Ò ÐÐ Ø ÓÔØÑÐ Ñ ÝÐ ÓÒÚÜ ÙÒØÓÒ Ó ÊÆ Ò ØÙ Ó Êµº Ì ÙÒÓÖÑ Ñ ÔÖÓÖÑ ØØÖ ØÒ Ø ÔÖÓÔÓÖØÓÒÐ Ñ ÓÒ Òº ÁØ Ó ÖÐØÚÐÝ Ð ÛÐÐ Ò Ø ÈÓ ÓÒ ÙÔØ ÒÖÓº ÁÒ Ø ÕÙ ¹ØÖÑÒ Ø ÙÖ Ø ÓÔØÑÐ Ñ ØÙÐÐÝ Ð ØÓ ÖÙ ÚÖ ØÐÒ ØÓ ¼ ÓÖ ÙÆÒØÐÝ ÐÖ Ê ÚÐÙ º ÁÒ ÙÖ Û ÜÔÐÓÖ Ø Ó ÈÖØÓ ÒØÖÙÔØ ¹ ØÖÙØÓÒ Ò ÑÓÖ Øк ÇÒ Ò Ø ÚÖ ØÐÒ ÑØÖ ÔÐÓØØ ÙÒØÓÒ Ó Ø ÔÖÑØÖ «Ò Ø ÈÖØÓ ØÖÙØÓÒ ÖÖ ØÓ ËØÓÒ º Ì ØÖÙØÓÒ ØÓÚ ÚÝ ØÐ ÛÒ ¼ «¾ Û ÕÙØ ÒØÖ ØÒ Ù Ø ÓÚÖ Ø ÖÒ Ó ÔÖÑØÖ ÚÐÙ ØØ Ø ÓÔØÑÐ ÓÐÙØÓÒ ÑÓ Ø Ò ØÚº ÁÒ ÔÖØÙÐÖ Û Ó ÖÚ ØØ Ø ÓÔØÑÐ ÓÐÙØÓÒ ÚÐÙ ÖØÖ Ø ÓÖ Úй Ù Ó «ÖÒÒ ÖÓÑ ØÓÛÖ ¾º ÀÓÛÚÖ «ÔÔÖÓ ¾ Ø ÓÔØÑÐ ÚÖ ØÐÒ ÚÐÙ ØÖØ ØÓ Ö Û ÓÒØÒÙ ØÓ ÒÖ Ò Ò ÜÔÓÒÒØÐ ÑÒÒÖ «ÖÒ ÖÓÑ ¾ ØÓÛÖ ¼º Ì ØÖÒ ÔÔÖ ØÓ ÓÐ ÓÖ ÐÐ ØÖ Ñ ÛØ ÓÙÖ ÓÔØÑÐ Ñ ÓÒØÒÙÒ ØÓ ÔÖÓÚ Ø Ø ÔÖÓÖÑÒ Ò ÙÒÓÖÑ ÓÒØÒÙÒ ØÓ ÓÙØÔÖÓÖÑ Ø ÔÖÓÔÓÖØÓÒРѺ ÇÙÖ Ö ÙÐØ Ù Ø Ø ÑÔÓÖØÒ Ó ÙÔÔÓÖØÒ ÚݹØÐ ØÖÙØÓÒ ÛÒ ØÝ Ü Ø Ò ÔÖØ Ò ÓÙÖ Ö ÙÐØ Ó Ø ÔÖÚÓÙ ØÓÒ ÑÓÒ ØÖØ ØØ ØÝ Ó Ò Ü Ø Ò ÔÖصº Ì ÔÔÐÒ ¹ Ù Ø ÓÛ Ò ÔÖØÙÐÖ ØØ Ø ÓÔØÑÐ Ñ Ó ÚÖÝ ÛÐÐ Ò Ø ÓÑÔÐÜ ÒÚÖÓÒÑÒØ Û ÑÝ ÑÓÖ ÖÔÖ ÒØØÚ ÓÖÐÛ ÒÚÖÓÒÑÒØ ØÒ ØÓ ÓÒ ¹ Ö Ò ÔÖÚÓÙ ØÙ º Ì ØÖÒ ÔÓÖØØÓÒ ÔÖÓÐÑ ÓÐÙØÓÒ ØÓ Ø ÙÐÒ ÔÖÓÐÑ ÓÔØÑÐ Ó ÓÙÖ º ÙÖØÖÑÓÖ Ø ÕÙÐØÝ Ó Ø ÓÐÙØÓÒ Ñ ÙÖ Ò ØÖÑ Ó Ø ÚØÓÒ Ó Ø ¹ ØÙÐ ØÑ ÐÓØ ÓÖ Ø ÚÖÓÙ Ø ÖÓÑ ØÖ Ð ØÑ ÐÓØ ÛÐÐ ÒÖÐÝ ÐÛÝ ÓÙØ ØÒÒº ÙÖ ½¼ ÓÛ Ò ÐÐÙ ØÖØÚ ÜÑÔк Ì ÜÑÔÐ ÒÚÓÐÚ Ø ÙÐÒ Ó ÓÒ Ý ÛØ ½¼ ÓÑÓÒÓÙ ÖÛÐÖ Ò ½ ÑÐÐÓÒ ÖÛÐ ÔÖ ÖÛÐÖº ËÓ ØÖ Ö ½¼ ÑÐÐÓÒ ÖÛÐ Ò Ðк ÎÖØÙÐÐÝ ÐÐ ÖÛÐ ÓÙÖ ÛØÒ ÛÒÓÛ Ó ÔÐÙ ÓÖ Ñ¹ 145
.25 Average Staleness as Function of Crawl/Web page ratio Optimal Scheme Proportional Scheme Uniform Scheme.12 Average Staleness as Function of Crawl/Web page ratio, Poisson Updates Optimal Scheme Proportional Scheme Uniform Scheme.2.1.8 Average Staleness.15.1 Average Staleness.6.4.5.2 1.5 2 2.5 3 3.5 4 4.5 5 R/N 1.5 2 2.5 3 3.5 4 4.5 5 R/N Average Staleness as Function of Crawl/Web page ratio, Pareto Updates Average Staleness as Function of Crawl/Web page ratio, Quasi Deterministic Updates.3 Optimal Scheme Proportional Scheme Uniform Scheme.5 Optimal Scheme Proportional Scheme Uniform Scheme.25.4 Average Staleness.2.15 Average Staleness.3.2.1.5.1 1.5 2 2.5 3 3.5 4 4.5 5 R/N 1.5 2 2.5 3 3.5 4 4.5 5 R/N ÙÖ ÓÙÖ ÚÖ ËØÐÒ ÅØÖ ÜÑÔÐ ÅÜ ÈÓ ÓÒ ÈÖØÓ Ò ÉÙ ¹ØÖÑÒ Ø.5.45 Average Staleness as Function of Pareto Parameter Optimal Scheme Proportional Scheme Uniform Scheme 35 3 Distribution of Actual/Ideal Task Time Slots Poisson, Pareto Quasi Deterministic.4.35 25 Average Staleness.3.25.2 Percent 2 15.15 1.1.5 5 1.5 2 2.5 3 3.5 4 Average alpha ÙÖ ÈÖØÓ ÜÑÔÐ 2 15 1 5 5 1 15 2 Deviation from Optimal Time Slot ÙÖ ½¼ ÌÖÒ ÔÓÖØØÓÒ ÈÖÓÐÑ ÜÑÔÐ 146
ÒÙ ¾¼ ØÑ ÐÓØ º Ï Ð Ó ÐØ Ø ÕÙ ¹ØÖÑÒ Ø Ø ØÓ ÒÓØ ØØ ØÝ ÓÙÖ ÓÒ ÓÖ ØÖ ØÖ Ð ØÑ ÐÓØ ÖÕÙÖº Ì ÕÙ ¹ØÖÑÒ Ø ÖÛÐ ÑÓÙÒØ ØÓ ¾¼± Ó Ø ÓÚÖÐÐ ÖÛÐ Ò Ø ÜÑÔк Ì ÓØØÓÑ ÐÒ ØØ Ø ÙÐÒ ÔÖÓÐÑ ÛÐÐ ÒÖÐÝ ÐÛÝ ÝÐ ÓÔØÑÐ ÓÐÙØÓÒ Ó ÚÖÝ ÓÐÙØ ÕÙÐØݺ Ì ÖÛÐÒ ÖÕÙÒÝ Ñ Û ÑÔÐÑÒØ Ò Ò ÖÙÒ ÓÒ Ò ÁÅ ÊË»¼¼¼ ÅÓÐ ¼º ÁÒ ÒÓ Ø Ð¹ ÓÖØÑ ÖÕÙÖ ÑÓÖ ØÒ ÑÒÙØ Ó ÐÔ ØѺ Ì ÖÛÐÖ ÙÐÒ ÐÓÖØÑ Û ÑÔÐÑÒØ Ù Ò Áų ÇÔØÑÞØÓÒ ËÙÖÓÙØÒ ÄÖÖÝ ÇËĵ Ô ½ Û Ò ÓÐÚ ÒØÛÓÖ ÓÛ ÔÖÓÐÑ º ÈÖÓÐÑ Ó ÓÙÖ Þ ÖÙÒ Ò ÔÔÖÓÜÑØÐÝ ØÛÓ ÑÒÙØ º 6. CONCLUSION ÚÒ Ø ÑÔÓÖØÒØ ÖÓÐ Ó Ö ÒÒ Ò Ø ÏÓÖÐ Ï Ï Û ØÙ Ø ÖÛÐÒ ÔÖÓ ÑÔÐÓÝ Ý Ù Ö ÒÒ ÛØ Ø ÓÐ Ó ÑÔÖÓÚÒ Ø ÕÙÐØÝ Ó Ø ÖÚ ØÝ ÔÖÓÚ ØÓ ÐÒØ º ÇÙÖ ÒÐÝ Ó Ø ÓÔØÑÐ ÖÛÐÒ ÔÖÓ ÓÒ Ö ÓØ Ø ÑØÖ Ó Øй Ò ÓÒ Ý Ø Û ØÙ Ò Ø Ö Ò Ø Ñع Ö Ó ÑÖÖ ÑÒØ Û ÛÒØÖÓÙ ÔÖÖÐ Óк Ï ÔÖÓÔÓ ÒÖÐ ØÛÓ¹ÔÖØ Ñ ØÓ ÓÔØÑÞ Ø ÖÛÐÒ ÔÖÓ ÛÖ Ø Ö Ø ÓÑÔÓÒÒØ ØÖÑÒ Ø ÓÔØÑÐ ÒÙÑÖ Ó ÖÛÐ ÓÖ Ô ØÓØÖ ÛØ Ø ÓÔØÑÐ ØÑ Ø Û Ø ÖÛÐ ÓÙÐ Ø ÔÐ ØÖ ÛÖ ÒÓ ÔÖØÐ ÓÒ ØÖÒØ º Ì ÓÒ ÓÑÔÓÒÒØ Ó ÓÙÖ Ñ ØÒ Ò Ò ÓÔØÑÐ ÚÐ ÙÐ ÓÖ Ø Ó ÖÛÐÖ ØÓ ÓÐÐÓÛº Ò ÑÔÓÖØÒØ ÓÒØÖÙØÓÒ Ó Ø ÔÔÖ Ø ÓÖÑÙÐØÓÒ Û Ñ Ø ÔÓ Ð ÓÖ Ù ØÓ ÜÔÐÓØ ÚÖÝ ÆÒØ ÐÓÖØÑ Ì ÐÓÖØÑ Ö ¹ Ò ÒØÐÝ ØÖ ØÒ ØÓ ÓÒ Ö Ò ÔÖÚÓÙ ØÙ º ÇÙÖ ÓÖÑÙÐØÓÒ Ò ÓÐÙØÓÒ Ð Ó ÑÓÖ ÒÖÐ ØÒ ÔÖ¹ ÚÓÙ ÛÓÖ ÓÖ ÚÖÐ Ö ÓÒ ÒÐÙÒ Ø Ù Ó ÛØ Ò Ø ÓØÚ ÙÒØÓÒ Ò Ø ÒÐÒ Ó Ò ÒØÐÝ ÑÓÖ ÒÖÐ ÙÔØ ÔØØÖÒ º ÚÒ Ø Ð Ó ÔÙÐ Ø ÓÒ Û Ô ÙÔØ ÔØØÖÒ Ò ÚÒ Ø ÙÑÔØÓÒ Ó ÜÔÓÒÒØÐ ÒØÖÙÔØ ØÑ Ò Ø ÒÐÝ Ó Ø Û ÔÖÚÓÙ ØÙ Û ÒÐÝÞ Ø Ô ÙÔØ Ø ÖÓÑ ÐÝ Û Ø ÖÚÒ ÐÝ ÝÒÑ Ô º Ì ÓÖÖ ÔÓÒÒ Ö ÙÐØ ÐÖÐÝ ÑÓÒ ØÖØ Ø Ò Ø Ó ÓÙÖ ÒÖÐ ÙÒ ÔÔÖÓ Ò ØØ Ø ØÖÙØÓÒ Ó Ø ØÑ ØÛÒ ÙÔØ ØÓ ÓÑ Û Ô ÐÖÐÝ ÔÒ Û ÖÒ Ó ÓÑÔÐÜ ÚÓÖ º Ý ÓÑÑÓØÒ Ù ÓÑÔÐÜ ÙÔØ ÔØØÖÒ Û ÐÚ ØØ ÓÙÖ ÓÔØÑÐ Ñ Ò ÔÖÓÚ ÚÒ ÖØÖ Ò Ø Ò ÖйÛÓÖÐ ÒÚ¹ ÖÓÒÑÒØ ØÒ ÔÖÚÓÙ ÛÓÖ Ò Ø Öº ÒÓÛÐÑÒغ Ï ØÒ ÐÐÒ ÓÛÒÝ ÓÖ ÔÓÒØÒ Ù ØÓ ½ º 7. REFERENCES ½ ʺ ٠̺ ÅÒÒØ Ò Âº ÇÖÐÒ ÆØÛÓÖ ÐÓÛ ÈÖÒØ ÀÐÐ ½ º ¾ º Ö Ù Âº Ó Àº Ö¹ÅÓÐÒ º ÈÔ Ò Ëº ÊÚÒ ËÖÒ Ø Ï Å ÌÖÒ ØÓÒ ÓÒ ÁÒØÖÒØ ÌÒÓÐÓÝ ½ ½µ ¾¼¼½º º ÐÞÛÞ Ãº Ö º ËÑØ Ò Âº ÏÐÖÞ ËÙÐÒ Ò ÓÑÔÙØÖ Ò ÅÒÙØÙÖÒ ËÝ ØÑ ËÔÖÒÖ¹ÎÖÐ ½ º º ÖÓÖ ÈÖ ÓÒÐ ÓÑÑÙÒØÓÒº º ÐÐÒÖ Èº ÒØÞ º ÁÝÒÖ Åº ˺ ËÕÙÐÐÒØ Ò Äº Òº ÆÒØÐÝ ÖÚÒ ÝÒÑ Ø Ø ÐÝ Û Ø º ÈÖÔÖÒØ ÅÝ ¾¼¼½º º Ó Ò Àº Ö¹ÅÓÐÒ ËÝÒÖÓÒÞÒ Ø ØÓ ÁÑÔÖÓÚ Ö Ò Å ËÁÅÇ ÓÒÖÒ ¾¼¼¼º º Ó«ÑÒ º ÄÙ Ò Êº ÏÖ ÇÔØÑÐ ÊÓÓØ ËÙÐÒ ÓÖ Ï ËÖ ÒÒ ÁÆÊÁ Ê Ö ÊÔÓÖØ ½º º ÓÙÐ º ÐÑÒÒ Ò º ÃÖ ÒÑÙÖØÝ ÊØ Ó Ò Ò ÓØÖ ÅØÖ ÄÚ ËØÙÝ Ó Ø ÏÓÖÐ Ï Ï ÍËÆÁ ËÝÑÔÓ ÙÑ ÓÒ ÁÒØÖÒØÛÓÖÒ ÌÒÓÐÓ Ò ËÝ ØÑ ½º º ÓÜ ÖØ ÇÔØÑÞØÓÒ Ú ÅÖÒÐ ÒÐÝ ÅÒÑÒØ ËÒ ½ ¾½¼¹¾½ ½º ½¼ º ÖÖ ÓÒ Ò º ÂÓÒ ÓÒ Ì ÓÑÔÐÜØÝ Ó ËÐØÓÒ Ò ÊÒÒ Ò Ò ÅØÖ ÛØ ËÓÖØ ÓÐÙÑÒ ÂÓÙÖÒÐ Ó ÓÑÔÙØÖ Ò ËÝ ØÑ ËÒ ¾½¹¾¼ ½¾º ½½ º ÐÐ Ò Æº ÅÓ Ø ËÐØÓÒ ÐÓÖØÑ Ò Ø ÈÖÓÐÑ Ó ÇÔØÑÙÑ ØÖÙØÓÒ Ó «ÓÖØ ÂÓÙÖÒÐ Ó Ø Å ¾¹ ½½º ½¾ ÁÖ Ìº Ò ÃØÓ Æº Ê ÓÙÖ ÐÐÓØÓÒ ÈÖÓÐÑ ÐÓÖØÑ ÔÔÖÓ ÅÁÌ ÈÖ ÑÖ Å ½º ½ ÁÒØÖÒØÓÒÐ Ù Ò ÅÒ ÓÖÔÓÖØÓÒ ÇÔØÑÞØÓÒ ËÙÖÓÙØÒ ÄÖÖÝ Ù Ò ÊÖÒ ÁÅ ½º ½ ƺ ÃØÓ Ò Ìº ÁÖ Ê ÓÙÖ ÐÐÓØÓÒ ÈÖÓÐÑ Ò ÀÒÓÓ Ó ÓÑÒØÓÖÐ ÇÔØÑÞØÓÒ ¹º Ù Ò Èº ÈÖÐÓ ØÓÖ ÃÐÙÛÖ Ñ ÈÖ ¾¼¼¼º ½ º ÃÒÙØ Ì ÖØ Ó ÓÑÔÙØÖ ÈÖÓÖÑÑÒ ÚÓк ¾ ÓÒ Ï ÐÝ ½ º ½ º ÁÝÒÖ Åº ËÕÙÐÐÒØ Ò Äº Ò ÒÐÝ Ò ÖØÖÞØÓÒ Ó ÄÖ¹ËÐ Ï ËÖÚÖ ÈØØÖÒ Ò ÈÖÓÖÑÒ ÏÓÖÐ Ï Ï ¾¹½¼¼ ½º ½ ˺ ÄÛÖÒ Ò º Ð ÐØÝ Ó ÁÒÓÖÑØÓÒ ÓÒ Ø Ï ÆØÙÖ ¼¼½¼¹½¼ ½º ½ º ÆÑÙ Ö Ò Äº ÏÓÐ Ý ÁÒØÖ Ò ÓÑÒØÓÖÐ ÇÔØÑÞØÓÒ Âº ÏÐÝ ½º ½ κ ƺ ÈÑÒÒ Ò Äº ÉÙº Ì ÓÒØÒØ Ò ÝÒÑ Ó Ù Ý Ï ËØ ÒÒ Ò ÁÑÔÐØÓÒ Å ËÁÇÅÅ ³¼¼ ÓÒÖÒ ¾¼¼¼º ¾¼ ź ÈÒÓ ËÙÐÒ ÌÓÖÝ ÐÓÖØÑ Ò ËÝ ØÑ ÈÖÒعÀÐÐ ½º ¾½ º ÈØÓÛ Ò Èº ÈÖÓÐÐ Ä Ø Ò ÄÛÙÐÒ ÓÒ Ø ÐØÖÓÒ ÖÓÒØÖ ÀÁ ÓÒÖÒ ÓÒ ÀÙÑÒ ØÓÖ Ò ÓÑÔÙØÒ ËÝ ØÑ ½º ¾¾ Ϻ ÈÖ º ÐÒÒÖÝ ËºÌÙÓÐ Ý Ò Ïº ÎØØÖÐÒ ÆÙÑÖÐ ÊÔ ÑÖ ÍÒÚÖ ØÝ ÈÖ ½º ¾ ˺ ź ÊÓ º ËØÓ Ø ÈÖÓ º ÂÓÒ ÏÐÝ Ò ËÓÒ ËÓÒ ØÓÒ ½º ¾ ú ËÑÒº ËØØÓÒÖÝ ÅÖ ÈÓÒØÈÖÓ Ò ÁÒØÙØÚ ÔÔÖÓº ÔÑÒ Ò ÀÐÐ ½º ¾ ź ËÕÙÐÐÒØ º Ó Ò Äº Ò Ï ÌÖÆ ÅÓÐÒ Ò Ï ËÖÚÖ ÈÖÓÖÑÒ ÒÐÝ Á ÓÒÖÒ ÓÒ ÓÒ Ò ÓÒØÖÓÐ ½º ¾ º ÌÐÑ º Ä٠Ⱥ ÆÒ Ò º Ó«ÑÒ ÇÔØÑÞÒ Ø ÆÙÑÖ Ó ÊÓÓØ ÓÖ Ï ËÖ ÒÒ ÌÐÓÑÑÙÒØÓÒ ËÝ ØÑ ÂÓÙÖÒÐ ½ ½¹¾µ¾ ¹¾ ¾¼¼½º ¾ º ÏÐÐ Ò Åº ÅÐÓÚ ÌÓÛÖ ØØÖ ÍÒÖ ØÒÒ Ó Ï Ê ÓÙÖ Ò ËÖÚÖ Ê ÔÓÒ ÓÖ ÁÑÔÖÓÚ Ò ÏÏÏ ÓÒÖÒ ½º ¾ ʺ Ϻ ÏÓЫº ËØÓ Ø ÅÓÐÒ Ò Ø ÌÓÖÝ Ó ÉÙÙ º ÈÖÒØ ÀÐÐ ½º ¾ º Ô ÀÙÑÒ ÚÓÖ Ò Ø ÈÖÒÔÐ Ó Ä Ø «ÓÖØ ÓÒ¹Ï ÐÝ ½º 147