ACL 2019 | AI2µÈÌá³ö×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨Ä£ÐÍCOMET£¬½Ó½üÈËÀà±íÏÖ

ÎÂÄá²®Õ¾ · ·¢±íÓÚ 2019-7-8 10:54:02

Ñ¡×ÔarXiv
×÷Õß£ºAntoine Bosselut¡¢Hannah RashkinµÈ
»úÆ÷Ö®ÐÄ±àÒë
²ÎÓë£ºÒ»Ãù¡¢Â·Ñ©

ÖªÊ¶Í¼Æ×ÊÇÈË¹¤ÖÇÄÜÑÐ¾¿µÄÈÈÃÅÁìÓò¡£ËüÄÜ¹»Ìá¹©ÏÈÑéÖªÊ¶£¬Ê¹»úÆ÷Ñ§Ï°ÔÚ³£Ê¶µÄ»ù´¡ÉÏ¸ü¼ÓÖÇÄÜ¡£È»¶ø£¬×Ô¶¯»¯µÄÖªÊ¶Í¼Æ×¹¹½¨Ò»Ö±ÊÇ¸ÃÁìÓòÐèÒª½â¾öµÄÄÑÌâ¡£´«Í³µÄ³éÈ¡·½·¨£¨extractive method£©±»ÈÏÎªÐ§¹û²»¼Ñ£¬ÐèÒª´óÁ¿ÈËÁ¦Í¶ÈëºÍµ÷Õû¡£½üÆÚ£¬°¬Â×ÈË¹¤ÖÇÄÜÊµÑéÊÒºÍÎ¢ÈíµÄÑÐ¾¿ÈËÔ±Ìá³öÁËÒ»ÖÖÀûÓÃÔ¤ÑµÁ·ÓïÑÔÄ£ÐÍ×Ô¶¯¹¹½¨³£Ê¶ÐÍÖªÊ¶Í¼Æ×µÄ·½·¨£¬ÒÑ½Ó½üÈËÀàµÄ±íÏÖ¡£ÂÛÎÄÒÑ±» NLP ¶¥»á ACL 2019 ½ÓÊÕ¡£

ACL 2019 | AI2µÈÌá³ö×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨Ä£ÐÍCOMET£¬½Ó½üÈËÀà±íÏÖ

Á´½Ó£ºhttps://arxiv.org/pdf/1906.05317v1.pdf
×Ô¶¯ÖªÊ¶Í¼Æ×µÄ¹¹½¨Ò»°ã¹Ø×¢°Ù¿ÆÖªÊ¶£¬´Ó¶ø±»ÏÞ¶¨ÔÚÒ»¸ö¶¨ÒåºÃµÄÊµÌåºÍ¿É½¨Ä£¹ØÏµµÄ¿Õ¼äÄÚ¡£µ«ÊÇ£¬³£Ê¶ÖªÊ¶²¢²»ÄÜºÜºÃµØ·ûºÏ¡¸ÊµÌå 1-¹ØÏµ-ÊµÌå 2¡¹ÕâÑù³£ÓÃµÄÖªÊ¶Í¼Æ×¹¹½¨½á¹¹¡£
Í¬Ê±£¬½üÆÚÉî¶ÈÓï¾³ÓïÑÔÄ£ÐÍ£¨¼´Ô¤ÑµÁ·ÓïÑÔÄ£ÐÍ£©µÄÑÐ¾¿½øÕ¹ÓÐÖúÓÚÌ½Ë÷ÐÂµÄÄ£Ê½¡ª¡ªÒ»ÖÖ³¬Ô½´«Í³³éÈ¡·½·¨£¨extractive method£©µÄ³£Ê¶ÖªÊ¶Í¼Æ×¹¹½¨·½·¨¡£ÕâÐ©´ó¹æÄ£ÓïÑÔÄ£ÐÍÔÚµ÷Õûµ×²ãÓïÑÔ±íÊ¾À´½â¾öÄ©¶ËÈÎÎñÊ±Õ¹ÏÖ³öÁË×¿Ô½ÐÔÄÜ£¬ÔÚ¶à¸ö¸´ÔÓÎÊÌâÉÏ´ïµ½µ±Ç°×î¼Ñ±íÏÖ¡£
ÑÐ¾¿ÈËÔ±½«×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨ÊÓÎª³£Ê¶Éú³ÉÈÎÎñ£¬²¢Ì½Ë÷ÁË´óÐÍÓïÑÔÄ£ÐÍÉú³É×Ô¶¯¹¹½¨³£Ê¶ÖªÊ¶Í¼Æ×ËùÐèÖªÊ¶µÄÄÜÁ¦¡£ËûÃÇÌá³öÁË COMmonsEnse Transformers (COMET)£¬¿ÉÒÔ¸ù¾Ý×ÔÈ»ÓïÑÔÉú³É·á¸»¶àÑùµÄ³£Ê¶ÃèÊö¡£COMET Ê¹ÓÃÏÖÓÐµÄÈýÔª×é×÷ÎªÖªÊ¶µÄÖÖ×Ó¼¯½øÐÐÑµÁ·¡£»ùÓÚÕâÐ©ÖÖ×Ó¼¯£¬Ô¤ÑµÁ·ÓïÑÔÄ£ÐÍµ÷ÕûÆäÑ§µÃÓïÑÔ±íÊ¾£¬ÓÃÓÚÉú³ÉÖªÊ¶£¬²¢Êä³ö¸ßÖÊÁ¿µÄÐÂÐÍÈýÔª×é¡£ÑÐ¾¿±íÃ÷£¬Éî¶ÈÔ¤ÑµÁ·ÓïÑÔÄ£ÐÍ¿ÉÒÔÉú³É³£Ê¶ÖªÊ¶Í¼Æ×ËùÐèµÄÏÔÊ½ÖªÊ¶£¬²¢È¡µÃÁËºÜºÃµÄ½á¹û¡£ÊµÑéÏÔÊ¾£¬COMET ¿ÉÒÔÉú³É±»ÈËÀàÆÀ¼ÛÎª¡¸¸ßÖÊÁ¿¡¹µÄÖªÊ¶£¬ÔÚ ATOMIC ÉÏ¿ÉÒÔ´ïµ½ 77.5% µÄ¾«È·¶È£¬ÔÚ ConceptNet ÉÏ¿ÉÒÔ´ïµ½ 91.7% µÄ¾«È·¶È£¬ÒÑ¾½Ó½üÈËÀàÔÚÕâÐ©×ÊÔ´ÖÐµÄ±íÏÖ¡£ÑÐ¾¿½á¹ûËµÃ÷£¬Ê¹ÓÃÉú³É³£Ê¶Ä£ÐÍ½øÐÐ×Ô¶¯³£Ê¶ÖªÊ¶Í¼Æ×²¹È«ºÜ¿ì¿ÉÒÔ³ÉÎª³éÈ¡Ä£ÐÍµÄÓÐÐ§Ìæ´ú·½·¨¡£

ACL 2019 | AI2µÈÌá³ö×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨Ä£ÐÍCOMET£¬½Ó½üÈËÀà±íÏÖ

Í¼ 1£ºCOMET ´ÓÒ»¸öÒÑÓÐÖªÊ¶Í¼Æ×ÖÐÑ§Ï°£¨ÊµÏß£©£¬²¢Éú³ÉÐÂµÄ½ÚµãºÍ±ß£¨ÐéÏß£©¡£
Ä£ÐÍ¼Ü¹¹
ÈÎÎñ
COMET Ê¹ÓÃÖªÊ¶ÈýÔª×é×÷ÎªÖÖ×Ó¼¯½øÐÐÔ¤ÑµÁ·£¬²¢Ê¹ÓÃÑµÁ·ºÃµÄÓïÑÔÄ£ÐÍ¹¹½¨³£Ê¶ÖªÊ¶Í¼Æ×¡£ÈýÔª×éÏò COMET Ìá¹©ÖªÊ¶Í¼Æ×µÄ½á¹¹ºÍ¹ØÏµÐÅÏ¢£¬COMET Ôòµ÷ÕûÔ¤ÑµÁ·ÓïÑÔÄ£ÐÍµÄÓïÑÔ±íÊ¾£¬´Ó¶øÔÚÖÖ×ÓÖªÊ¶Í¼Æ×ÖÐÌí¼ÓÐÂµÄ½ÚµãºÍ±ß¡£
¾ßÌåÀ´Ëµ£¬¼ÙÉè COMET »ñµÃµÄÑµÁ·ÖªÊ¶Í¼Æ×ÊÇ×ÔÈ»ÓïÑÔÈýÔª×é£¬ÐÎÊ½Èç {s,r,o}¡£ÔÚÕâ¸öÈýÔª×éÖÐ£¬s ÊÇÈýÔª×éµÄ subject£¬r ÊÇÊµÌå¹ØÏµ£¬o ÊÇÈýÔª×éµÄ object¡£ÀýÈç£¬ºÍ¡¸taking a nap¡¹£¨Ë¯Ò»Ð¡»á¶ù£©ÓÐ¹ØµÄ ConceptNet ÈýÔª×éÊÇÕâÑùµÄ£ºs=¡¸take a nap¡¹£¬r=Causes£¬o=¡¸have energy¡¹¡£×Ô¶¯¹¹½¨ÖªÊ¶Í¼Æ×µÄÈÎÎñ¾ÍÊÇ¸ù¾Ý s ºÍ r Éú³É o¡£
Transformer
ÑÐ¾¿ÈËÔ±Ê¹ÓÃ Radford et al. (2018) (GPT) ÖÐµÄ Transformer ÓïÑÔÄ£ÐÍ¼Ü¹¹£¬GPT Ê¹ÓÃÁË¾ß±¸¶àÍ·Ëõ·Åµã³Ë×¢ÒâÁ¦»úÖÆµÄ¶à¸ö transformer Ä£¿é¡£
ÊäÈë±àÂë
ÔÚÄ£ÐÍµÄÊäÈë²¿·Ö£¬ÑÐ¾¿ÈËÔ±½«ÈýÔª×é {s, r, o} ±íÊ¾ÎªÈýÔª×éÖÐÃ¿Ò»ÏîËù°üº¬µ¥´ÊµÄÐòÁÐ£¬ÈçÏÂËùÊ¾£¨X ±íÊ¾ÊäÈëµ¥´Ê£©£º

ACL 2019 | AI2µÈÌá³ö×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨Ä£ÐÍCOMET£¬½Ó½üÈËÀà±íÏÖ

ÓÉÓÚ transformer ÖÐÃ»ÓÐ token Ë³ÐòµÄ¸ÅÄî£¬Òò´Ë£¬¶ÔÓÚÐòÁÐÖÐÃ¿¸ö token µÄ¾ø¶ÔÎ»ÖÃ½¨Ä£ÁËÎ»ÖÃÇ¶ÈëÏòÁ¿ p_t¡£¶ÔÓÚÈÎÒâÊäÈë´Ê x_t ¡Ê X£¬ÊäÈë±àÂëÊÇÆä´ÊÇ¶ÈëÏòÁ¿ e_t ºÍÔÚÐòÁÐÖÐµÄ¾ø¶ÔÎ»ÖÃÇ¶ÈëÏòÁ¿ p_t µÄºÍ£º

ACL 2019 | AI2µÈÌá³ö×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨Ä£ÐÍCOMET£¬½Ó½üÈËÀà±íÏÖ

COMET Ä£ÐÍ¼Ü¹¹
¸ÃÄ£ÐÍ×ñÑ Radford et al.(2018) µÄGPTÄ£ÐÍ¼Ü¹¹£¬ÑÐ¾¿ÈËÔ±ÓÃ 12 ²ã¡¢768 ¸öÒþ²Ø²ãÎ¬¶È¡¢12 ¸ö×¢ÒâÁ¦Í·³õÊ¼»¯ COMET¡£Dropout ÂÊÎª 0.1£¬Ê¹ÓÃ GeLU ×÷Îª¼¤»îº¯Êý¡£ÑµÁ·Åú´óÐ¡Îª 64¡£

ACL 2019 | AI2µÈÌá³ö×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨Ä£ÐÍCOMET£¬½Ó½üÈËÀà±íÏÖ

Í¼ 2£ºÄ£ÐÍ¼Ü¹¹Í¼Ê¾¡£a£©¶àÍ·×¢ÒâÁ¦Ä£¿é£»b£©Transformer Ä£¿éÄÚ²¿µÄ¼ÆËã·½·¨£»c£©¶ÔÃ¿¸ö token ½øÐÐ´¦ÀíµÄ·½Ê½¡£
Ä£ÐÍÑµÁ·
COMET ÓÃÓÚ¸ù¾Ý¸ø¶¨µÄ subject s ºÍ¹ØÏµ r£¬Éú³ÉÈýÔª×éÖÐµÄ object o¡£¾ßÌåÀ´Ëµ£¬¸ø¶¨¹¹³É s ºÍ r µÄ token [X^s,X^r] ×÷ÎªÊäÈë£¬COMET Ä£ÐÍÐèÒªÉú³ÉËùÓÐ×é³É o µÄ token X^o¡£
ËðÊ§º¯Êý
COMET ÐèÒª×î´ó»¯Ô¤²â X^o µÄÌõ¼þËÆÈ»£º

ACL 2019 | AI2µÈÌá³ö×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨Ä£ÐÍCOMET£¬½Ó½üÈËÀà±íÏÖ

ÏÂÍ¼ 3 Õ¹Ê¾ÁËÔÚ²»Í¬ÑµÁ·ÈÎÎñÖÐ£¬s¡¢r ºÍ o ÖÐ token µÄ×éÖ¯ÐÎÊ½¡£

ACL 2019 | AI2µÈÌá³ö×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨Ä£ÐÍCOMET£¬½Ó½üÈËÀà±íÏÖ

Í¼ 3£ºÊäÈë token ÉèÖÃ¡£¶ÔÓÚ ATOMIC Êý¾Ý¼¯£¬ÊäÈëµÄË³ÐòÎª£ºÏÈÊÇÈýÔª×é subject µÄ token X^s£¬½ô½Ó×ÅÊÇ [MASK] token£¬È»ºóÊÇ¹ØÏµ token X^r£¬×îºóÊÇÈýÔª×é object µÄ token X^o¡£¶ÔÓÚ ConceptNet Êý¾Ý¼¯£¬ÔòÐèÒªÔÚ¹ØÏµÊµÌå X^r ºÍ object token X^o Ö®¼äÔÙ¼ÓÈëÒ»¸ö [MASK] token£¬ÒòÎª X^r ÔÚ ConceptNet ÖÐ¿ÉÄÜÓÐºÜ¶à¸ö token¡£
Êý¾Ý¼¯
COMET Ê¹ÓÃÏÖÓÐµÄÈýÔª×é×÷ÎªÖªÊ¶µÄÖÖ×Ó¼¯½øÐÐÑµÁ·£¬À´Ñ§Ï°¹¹½¨³£Ê¶ÖªÊ¶Í¼Æ×¡£¸ÃÑÐ¾¿Ê¹ÓÃÁË ATOMIC ºÍ ConceptNet ×÷ÎªÖªÊ¶ÖÖ×Ó¼¯¡£
ATOMIC Êý¾Ý¼¯ÓÐ 87 Íò¸öÈýÔª×é£¬°üÀ¨Î§ÈÆÒ»Ð©ÌØ¶¨ÊÂ¼þÌáÊ¾£¨Èç¡¸X È¥ÉÌµê¡¹£©µÄ´óÁ¿Éç»á³£Ê¶ÖªÊ¶¡£¾ßÌåÀ´Ëµ£¬ATOMIC ½«³£Ê¶·ÖÎª¾Å¸öÎ¬¶È£¬°üÀ¨ÊÂ¼þµÄÆðÒò£¨ÀýÈç£¬¡¸X ÐèÒª¿ª³µµ½ÄÇÀï¡¹£©¡¢ÊÂ¼þ¶ÔÖ÷ÌåµÄÓ°Ïì£¨ÀýÈç£¬¡¸»ñµÃÊ³Îï¡¹£©£¬ÒÔ¼°Æä¶ÔÁíÒ»²ÎÓë·½µÄÖ±½Ó»ò¼ä½ÓÓ°Ïì£¨ÀýÈç£¬¡¸ÆäËûÈË¿ÉÒÔ³Ô±¥¡¹£©¡£
ÔÚ¸Õ²ÅµÄÀý×ÓÖÐ£¨¡¸X È¥ÉÌµê¡¹£©ÊÇ s£¬¶øÎ¬¶È£¨¡¸X Òª...¡¹£©ÊÇÊµÌå¹ØÏµ r£¬¶øÆðÒò/Ó°Ïì£¨¡¸»ñµÃÊ³Îï¡¹£©ÊÇ o¡£¸ÃÑÐ¾¿Ê¹ÓÃÁË 710k ¸öÈýÔª×é×÷ÎªÑµÁ·¼¯£¬80k ×÷ÎªÑéÖ¤¼¯£¬87k ×÷Îª²âÊÔ¼¯¡£
ConceptNet ÊÇÓÉ Open Mind Common Sense£¨OMCS£©¹¹³ÉµÄÊý¾Ý¼¯¡£ÈýÔª×éÊÇµäÐÍµÄ¡¸s-r-o¡¹½á¹¹£¨ÀýÈç£¬¡¸Ë¯Ò»»á¶ù-µ¼ÖÂ-»ñµÃÄÜÁ¿¡¹£©¡£×î¿ÉÐÅµÄ 1200 ¸öÈýÔª×é±»ÓÃÓÚ¹¹½¨²âÊÔ¼¯£¬ÁíÍâ 1200 ¸ö¹¹³ÉÁ½¸öÑéÖ¤¼¯£¬»¹ÓÐ 100k µÄÑµÁ·¼¯¡£Õâ¸öÊý¾Ý¼¯×Ü¹²ÓÐ 34 ¸ö¹ØÏµÀàÐÍ¡£
ÊµÑé½á¹û
ATOMIC ÊµÑé½á¹û

ACL 2019 | AI2µÈÌá³ö×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨Ä£ÐÍCOMET£¬½Ó½üÈËÀà±íÏÖ

±í 1£º¶Ô¸÷¸öÄ£ÐÍÉú³É ATOMIC ³£Ê¶µÄÖÊÁ¿ºÍÐÂÓ±³Ì¶È½øÐÐ×Ô¶¯ÆÀ¹ÀµÄ½á¹û¡£

ACL 2019 | AI2µÈÌá³ö×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨Ä£ÐÍCOMET£¬½Ó½üÈËÀà±íÏÖ

±í 2£º¶Ô¸÷¸öÄ£ÐÍÉú³É ATOMIC ³£Ê¶µÄÈËÀà´ò·Ö½á¹û¡£

ACL 2019 | AI2µÈÌá³ö×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨Ä£ÐÍCOMET£¬½Ó½üÈËÀà±íÏÖ

±í 5£º´Ó ATOMIC ÑéÖ¤¼¯ÖÐËæ»ú³éÈ¡µÄÐÂÉú³É¡£ÐÂÉú³ÉÖ¸µÄÊÇ²»ÔÚÑµÁ·¼¯ÖÐµÄÈýÔª×é¡£Ã¿¸öÈýÔª×é¶¼ÓÉÈËÀàÆÀ¹À²¢ÅÐ¶ÏÊÇ·ñºÏÀí¡£
ConceptNet ÊµÑé½á¹û

ACL 2019 | AI2µÈÌá³ö×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨Ä£ÐÍCOMET£¬½Ó½üÈËÀà±íÏÖ

±í 6£ºConceptNET Éú³É½á¹û¡£

ACL 2019 | AI2µÈÌá³ö×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨Ä£ÐÍCOMET£¬½Ó½üÈËÀà±íÏÖ

±í 7£º´Ó ConceptNet µÄÑéÖ¤¼¯Ëæ»ú³éÈ¡µÄÐÂÉú³É¡£

		×Ô¶¯µÇÂ¼	ÕÒ»ØÃÜÂë
ÃÜÂë			×¢²áÓÃ»§

[×ÛºÏ×ÊÑ¶] ACL 2019 | AI2µÈÌá³ö×Ô¶¯ÖªÊ¶Í¼Æ×¹¹½¨Ä£ÐÍCOMET£¬½Ó½üÈËÀà±íÏÖ

ä¯ÀÀ¹ýµÄ°æ¿é