DeepMindµÇÉÏScience£ººÍAIÏà±È£¬ÈËÀà¶¼ÊÇÖí¶ÓÓÑ

ÎÂÄá²®Õ¾ · ·¢±íÓÚ 2019-6-1 10:27:42

Àõ×Ó ·¢×Ô °¼·ÇËÂ
Á¿×ÓÎ» ±¨µÀ | ¹«ÖÚºÅ QbitAI

DeepMindµÇÉÏScience£ººÍAIÏà±È£¬ÈËÀà¶¼ÊÇÖí¶ÓÓÑ

AI×é¶Ó£¬±ÈÈËÀàÕ½¶ÓµÄ³É¼¨ºÃ¡£
AIÓëÈËÀà×é¶Ó£¬»¹ÊÇÔ¶³¬ÈËÀà¡£
DeepMindÎªÁËÑµÁ·Ç¿»¯Ñ§Ï°AIµÄÍÅ¶ÓÐ×÷ÄÜÁ¦£¬Ñ¡ÔñÁËÀ×ÉñÖ®´¸3¾º¼¼³¡µÄ¶áÆìÓÎÏ·¡£
´ÓÈ¥Äêµ½½ñÄê£¬AI²»¶Ï½ø»¯£º
Èç½ñ£¬°Ñ·´Ó¦ËÙ¶È½µµ½ºÍÈËÀàË®Æ½£¬°Ñ±ê¼Ç×¼È·ÂÊÒ²½µÏÂÀ´£¬Ê¤ÂÊÒÀÈ»³¬¹ýÈËÀà¡£

DeepMindµÇÉÏScience£ººÍAIÏà±È£¬ÈËÀà¶¼ÊÇÖí¶ÓÓÑ

¶øAIÑ§Ï°µÄ×ÊÔ´£¬Ò²Ö»ÓÐµÚÒ»ÊÓ½Ç¿´µ½µÄÓÎÏ·³¡¾°£¬ÒÔ¼°±È·Ö£¬Ã»ÓÐ±ÈÈËÀà»ñµÃ¸ü¶àÐÅÏ¢¡£
µ±AIÓ®ÁË¿Â½à£¬ÎÒÃÇËµAI²»»áºÏ×÷£»µ±AIÓ®ÁËµ¶Ëþ2ÊÀ½ç¹Ú¾ü£¬ÎÒÃÇËµÊÇ¹Ú¾üÌ«Óã·´Ó¦ËÙ¶È²»¹«Æ½¡£
µ«ÏÖÔÚ£¬ÎÒÃÇÖ»ÄÜ¿´×ÅDeepMindµÇÉÏ×îÐÂÒ»ÆÚµÄScience¡£
È»ºó£¬¹Û²ìÒ»ÏÂÕâÐ©¼È¶®µÃÏà»¥Ð×÷¡¢ÓÖ¶®µÃºÍÈËÀàÐ×÷µÄAI£¬ÊÇÔõÑùÐÞÁ¶³öÀ´µÄ£º
ÑÏ¿áµÄÑµÁ·³¡
¶áÆìÓÎÏ· (Capture the Flag) ÊÇÕâÑùµÄ£º
Á½¶Ó¸÷ÓÐ×Ô¼ºµÄ´ó±¾Óª£¬Ä¿±êÊÇ°Ñ¼º·½µÄÆìÊØÔÚ´ó±¾Óª£¬²¢°Îµô¶Ô·½µÄÆì¡£

DeepMindµÇÉÏScience£ººÍAIÏà±È£¬ÈËÀà¶¼ÊÇÖí¶ÓÓÑ

Èç¹ûÎÒÊÇÀ¶·½£¬¿´¼ûµÐÈË¿¸×ÅÀ¶ÆìÅÜ£¬¾ÍÒªÓÃ¼¤¹â±ê¼ÇËü¡£
ÕâÑù£¬À¶Æì»áÊ§¶ø¸´µÃ£¬µÐÈËÒ²»á±»ËÍ»ØËüµÄÀÏ¼Ò¡£
Îå·ÖÖÓÄÚ£¬ÄÄÒ»¶Ó°Îµô¶Ô·½¸ü¶àµÄÆì£¬ÕâÒ»¶Ó¾ÍÓ®ÁË¡£
Ô±¾£¬À×ÉñÖ®´¸3¾º¼¼³¡ÀïÖ»ÓÐ5ÕÅµØÍ¼£»ÍÅ¶Ó¾º¼¼³¡£¬Ò²Ö»ÓÐ¼¸Ê®ÕÅµØÍ¼¡£
ÎªÁËÈÃAIÊÜµ½¸ü¼ÓÑÏ¸ñµÄÑµÁ·£¬DeepMindËæ»úÉú³ÉÁËÐí¶àÓÎÏ·ÀïÔ±¾Ã»ÓÐµÄµØÍ¼£º

DeepMindµÇÉÏScience£ººÍAIÏà±È£¬ÈËÀà¶¼ÊÇÖí¶ÓÓÑ

¾ÍÔÚÕâÑùµÄ¾º¼¼³¡Àï£¬DeepMindÍ¬Ê±ÑµÁ·ÁË30Ö»ÖÇÄÜÌå£¬Ö÷ÒªÔÀíÊÇLSTM¡£
Õâ30Ö»AIÑ¡ÊÖ£¬Ò»¹²´òÍêÁË45Íò³¡ÓÎÏ·¡£
ÔÚÕâ¸ö¹ý³ÌÖÐ£¬»¹Òª²»Ê±ÌÔÌµô±íÏÖ²»¼ÑµÄAI£¬ÓÃ¶¥¼âAIÑ¡ÊÖµÄ±äÒì°æ±¾ (Mutations) ´úÌæ¡£ÕâÊÇ½ø»¯Ëã·¨µÄË¼Â·¡£
×îÖÕ£¬Ñ¡³ö×îÓÅÐãµÄÒ»Ö»AI£¬È¡ÃûFor the Win (FTW) ¡£
³ýÁËÄëÑ¹ÈËÀà£¬»¹»áÀûÓÃÓÎÏ·bug
È»ºó£¬¾Í¸Ã²âÊÔFTWµÄÊµÁ¦ÁË¡£
Ê×ÏÈ£¬ÊÇÈË»ú»ìÕ½£ºDeepMindÕÒÀ´40¸öÈËÀà£¬ÓëAIËæ»ú×é¶Ó¡£
½á¹û£¬AIÑ¡ÊÖµÄ¸öÈËÊ¤ÂÊÔ¶³¬ÈËÀà£º

DeepMindµÇÉÏScience£ººÍAIÏà±È£¬ÈËÀà¶¼ÊÇÖí¶ÓÓÑ

ÑÐ¾¿ÈËÔ±·¢ÏÖ£¬AI²»µ«ÄÜÍ¬ÈËÀà/AIÐ×÷£¬»¹ÐÎ³ÉÁË¾µäµÄÍÅÕ½²ßÂÔ£º
±ÈÈç£¬¸úÔÚ¶ÓÓÑÉíºó£¬ÕâÑùÒ»µ©ÓëµÐÈË½»»ð£¬±ãÄÜÔÚÈËÊýÉÏ³¬¹ý¶ÔÊÖ¡£
»¹ÓÐ£¬ÔÚµÐÈË´ó±¾Óª¸½½üÓÎµ´£¬µ±¶ÓÓÑÄÃµ½Æì×ÓµÄÊ±ºò¿ÉÒÔÑ¸ËÙ½ÓÊÖÍù»ØÅÜ¡£
³ýÁËÕâÐ©ÈËÀà³£ÓÃÌ×Â·Ö®Íâ£¬AI»¹·¢Ã÷ÁËÈ«ÐÂ²ßÂÔ£º
ÀûÓÃÓÎÏ·ÀïµÄÒ»¸öbug£¬´Ó±³ºóÏò¶ÓÓÑÉä»÷£¬ÄÜ¼Ó¿ì¶ÓÓÑµÄËÙ¶È¡£
³ýÁË¿´µ½ÏÖÏó£¬ÍÅ¶Ó»¹ÏëÖªµÀ£¬AIÎªÊ²Ã´»áÐÞÁ¶³öÕâÐí¶à¼¼ÄÜ¡£
ÓÚÊÇ£¬ÑÐ¾¿ÁËAIµÄÐÐÎªÄ£Ê½£¬¹Û²ìËüÃÇÊÇÈçºÎÀí½â±ÈÈü£º

DeepMindµÇÉÏScience£ººÍAIÏà±È£¬ÈËÀà¶¼ÊÇÖí¶ÓÓÑ

¸÷ÖÖÑÕÉ«µÄµãµã£¬·Ö±ð´ú±í£ºÆìÔÚÕóµØ£¬¶ÓÓÑ¿¸×ßÁËµÐ·½´óÆì£¬×Ô¼º´¦ÔÚµÐ·½ÕóµØµÈµÈ¡£
²»Í¬Õ½¿öÖ®ÏÂ£¬AIµÄ·´Ó¦Ã÷ÏÔ²»Í¬¡£°²È«ºÍÎ£ÏÕ£¬·ÖµÃÇåÇå³þ³þ¡£
µ÷ÖÁÍ¬Ò»ÆðÅÜÏß
ËäÈ»£¬AIÔÚ³õ´Î»ìÕ½ÖÐÄëÑ¹ÈËÀà£¬µ«DeepMindÍÅ¶ÓÊ®·ÖÀíÖÇµØÒÔÎª£º
AIÖ®ËùÒÔ³¬¹ýÈËÀà£¬Ö÷ÒªÓÅÊÆÒ»ÊÇ·´Ó¦ËÙ¶È¿ì£¬¶þÊÇÉäµÃ×¼ (¸Ð¾õÄÄÀï²»¶Ô) ¡£

DeepMindµÇÉÏScience£ººÍAIÏà±È£¬ÈËÀà¶¼ÊÇÖí¶ÓÓÑ

ËùÒÔ£¬ÍÅ¶ÓÊÖ¶¯°Ñ·´Ó¦ËÙ¶Èµ÷Âýµ½ÈËÀàË®Æ½267ºÁÃë×óÓÒ£¬°Ñ80%µÄÉä»÷×¼È·¶È½µµÍµ½ºÍÈËÀàÏàµ±µÄ48%×óÓÒ
È»ºóÖØÆô±ÈÈü£¬Õâ´ÎÊÇÕæÕýµÄÈË»ú¶ÔÕ½¡£
ÈËÀàÕ½¶Ó·ÖÎªÆÕÍ¨ÈËÀà (Average Human) ºÍÇ¿´óÈËÀà (Strong Human) ¡£

DeepMindµÇÉÏScience£ººÍAIÏà±È£¬ÈËÀà¶¼ÊÇÖí¶ÓÓÑ

½á¹û£¬Ç¿´óÈËÀà×é³ÉµÄÕ½¶Ó£¬¶ÔÕ½AIµÄÊ¤ÂÊÒ²½öÓÐ21%¡£
¶ÔÈËÀàÀ´Ëµ£¬Î¨Ò»ÖµµÃÇìÐÒµÄÊÇ£º
µ±ÓÐAI¼ÓÈëÈËÀàÕ½¶Ó£¬Óë´¿AIÕ½¶Ó»¥´òµÄÊ±ºò£¬ÈËÀàÕ½¶ÓµÄÊ¤ÂÊÖÕÓÚ³¬¹ýÁËAIÕ½¶Ó¡£
ÒÜ²âÒ»ÏÂ£¬Õâ¸ö´ó¸ÅÊÇËµ£ºÈËÀàÊÇÖí¶ÓÓÑ£¬°É£¿
ScienceÂÛÎÄ´«ËÍÃÅ£º
https://science.sciencemag.org/content/364/6443/859
Science±¨µÀ´«ËÍÃÅ£º
https://www.sciencemag.org/news/2019/05/artificial-intelligence-learns-teamwork-deadly-game-capture-flag
OpenAI²©¿Í´«ËÍÃÅ£¬ÄÚÈÝ¸Õ¸Õ¸üÐÂ£º
https://deepmind.com/blog/capture-the-flag-science/
¡ª Íê ¡ª
³ÏÖ¿ÕÐÆ¸
Á¿×ÓÎ»ÕýÔÚÕÐÄ¼±à¼/¼ÇÕß£¬¹¤×÷µØµãÔÚ±±¾©ÖÐ¹Ø´å¡£ÆÚ´ýÓÐ²ÅÆø¡¢ÓÐÈÈÇéµÄÍ¬Ñ§¼ÓÈëÎÒÃÇ£¡Ïà¹ØÏ¸½Ú£¬ÇëÔÚÁ¿×ÓÎ»¹«ÖÚºÅ(QbitAI)¶Ô»°½çÃæ£¬»Ø¸´¡°ÕÐÆ¸¡±Á½¸ö×Ö¡£
Á¿×ÓÎ» QbitAI ¡¤ Í·ÌõºÅÇ©Ô¼×÷Õß
?'?' ? ×·×ÙAI¼¼ÊõºÍ²úÆ·ÐÂ¶¯Ì¬

		×Ô¶¯µÇÂ¼	ÕÒ»ØÃÜÂë
ÃÜÂë			×¢²áÓÃ»§

[×ÛºÏ×ÊÑ¶] DeepMindµÇÉÏScience£ººÍAIÏà±È£¬ÈËÀà¶¼ÊÇÖí¶ÓÓÑ