µÚ5ÕÂ¡þÉñ¾­ÍøÂçÖÐµÄÌØÕ÷ÌáÈ¡

5.1Éñ¾­ÍøÂç¼ò½é

ÌØÕ÷ÌáÈ¡ÊÇÖ¸½«Ô­Ê¼Êý¾Ý×ª»»Îª¾ßÓÐÍ³¼ÆÒâÒåºÍ»úÆ÷¿ÉÊ¶±ðµÄÌØÕ÷¡£ÔÚ×ÔÈ»ÓïÑÔ´¦ÀíÖÐ£¬ÓÉÓÚ»úÆ÷Ñ§Ï°ÎÞ·¨Ö±½Ó´¦ÀíÎÄ±¾£¬ÐèÒª½«ÎÄ±¾×ª»»ÎªÊýÖµÌØÕ÷(ÈçÏòÁ¿»¯)¡£ÔÚÍ¼Ïñ´¦ÀíÁìÓò£¬½«ÏñËØÌØÕ÷ÌáÈ¡ÎªÂÖÀªÐÅÏ¢Ò²ÊÇÒ»ÖÖÌØÕ÷ÌáÈ¡µÄÓ¦ÓÃ¡£Òò´Ë£¬ÌØÕ÷ÌáÈ¡¹Ø×¢µÄÊÇÌØÕ÷µÄ×ª»»·½Ê½£¬ÒÔ·ûºÏ»úÆ÷Ñ§Ï°Ëã·¨µÄÒªÇó¡£´ËÍâ£¬¿ÉÒÔÍ¨¹ý¶ÔÏÖÓÐÌØÕ÷½øÐÐ¼Ó¹¤µÄ·½Ê½À´´´½¨ÐÂµÄÌØÕ÷£¬¼´ÌØÕ÷ÌáÈ¡¿ÉÄÜÊÇÔ­ÌØÕ÷µÄÄ³ÖÖ»ìºÏ¡£½ÓÏÂÀ´½«½éÉÜÈçºÎÊ¹ÓÃ²»Í¬ÀàÐÍµÄÉñ¾­ÍøÂç½øÐÐÌØÕ÷ÌáÈ¡¡£

ÈË¹¤Éñ¾­ÍøÂç(Artificial Neural Network£¬ANN)Ò²±»³ÆÎªÉñ¾­ÍøÂç¡£ËüÊÇÒ»ÖÖ¹ã·ºÓ¦ÓÃÓÚ½â¾ö¸´ÔÓÈË¹¤ÖÇÄÜÎÊÌâµÄ´ó¹æÄ£²¢ÐÐ¼ÆËãÄ£ÐÍ¡£ÈË¹¤Éñ¾­ÍøÂçÓÉÐí¶àÈË¹¤Éñ¾­Ôª×é³É£¬²¢Í¨¹ý·Ö²ã×éÖ¯ÐÎ³É´ó¹æÄ£Æ½ÐÐ»¥ÁªÍøÂç¡£ÕâÐ©Éñ¾­ÔªÍ¨¹ý¼ÓÈ¨Á¬½ÓÏà»¥×÷ÓÃ£¬ÒÔ´ïµ½ÐÅÏ¢´¦ÀíµÄÄ¿µÄ¡£ÈË¹¤Éñ¾­ÍøÂç¾ßÓÐÁ¼ºÃµÄÑ§Ï°ºÍ·º»¯ÄÜÁ¦¡£ÆäÉè¼ÆÁé¸ÐÔ´×ÔÈËÀà´óÄÔ£¬´óÄÔ¿ÉÒÔ¿´×÷Ò»¸ö¸ß¶È¸´ÔÓ¡¢·ÇÏßÐÔºÍ²¢ÐÐµÄÐÅÏ¢´¦ÀíÏµÍ³¡£Ëü¿ÉÒÔ×éÖ¯Æä½á¹¹³É·Ö¡ª¡ªÉñ¾­Ôª£¬²¢Ö´ÐÐÒ»Ð©¼ÆËãÈÎÎñ£¬ÈçÄ£Ê½Ê¶±ð¡¢¸ÐÖªºÍÔË¶¯¿ØÖÆ¡£Óëµ±½ñ×î¿ìµÄÊý×Ö¼ÆËã»úÏà±È£¬´óÄÔµÄ´¦ÀíËÙ¶ÈÒª¿ìµÃ¶à¡£Éñ¾­ÍøÂçÒÔÓëÉúÎïÉñ¾­ÏµÍ³ÏàÍ¬µÄ·½Ê½ÓëÏÖÊµÊÀ½çµÄ¶ÔÏó½øÐÐ»¥¶¯£¬Ëü±»Éè¼ÆÓÃÀ´Ä£Äâ´óÄÔÖ´ÐÐÌØ¶¨ÈÎÎñ»ò¸ÐÐËÈ¤µÄ¹¦ÄÜµÄ·½Ê½£¬µ«ÈË¹¤Éñ¾­ÍøÂçÖÐÊ¹ÓÃµÄ´¦ÀíÔªËØºÍ¼Ü¹¹ÒÑ¾­Ô¶Ô¶³¬¹ýÁËÉúÎïÁé¸Ð¡£Éñ¾­ÍøÂçÊÇÒ»¸öÅÓ´óµÄÑ§¿Æ£¬±¾ÊéÖ»Éæ¼°ËüÓë»úÆ÷Ñ§Ï°µÄ½»»ãµã¡£

5.1.1ÉúÎïÉñ¾­ÍøÂç

ÉúÎïÉñ¾­ÍøÂç(biological neural network) ÄÜ¹»Òý·¢¶¯Îï²úÉúÒâÊ¶²¢ÇýÊ¹ËüÃÇ²ÉÈ¡ÐÐ¶¯¡£ÔÚÉúÎï´óÄÔÖÐ£¬ÊýÒÔÇ§ÒÚ¼ÆµÄÉñ¾­ÔªÏà»¥Á¬½Ó£¬ÒÔ²¢ÐÐ´¦ÀíÐÅÏ¢¡£Ã¿¸öÉúÎïÉñ¾­Ôª¿ÉÒÔ¿´×÷ÉúÎïÉñ¾­ÍøÂçÖÐµÄÒ»¸ö½ÏÐ¡µÄ´¦Àíµ¥Ôª¡£ÉúÎïÉñ¾­ÔªÊÇÒ»ÖÖÌØÊâµÄÉúÎïÏ¸°û£¬ËüÔÚÒ»Ð©µçºÍ»¯Ñ§±ä»¯µÄ°ïÖúÏÂ£¬½«ÐÅÏ¢´ÓÒ»¸öÉñ¾­Ôª´«µÝµ½ÁíÒ»¸öÉñ¾­Ôª¡£µ±Ã¿¸öÉñ¾­Ôª½ÓÊÕÐÅºÅµÄÀÛ»ýÐ§¹û³¬¹ýÉñ¾­ÔªµÄ¡°ãÐÖµ¡±Ê±£¬Ëü¾Í»á±»¼¤»î£¬ÏòÏàÁ¬µÄÉñ¾­Ôª·¢ËÍ¡°ÐË·Ü¡±»ò¡°ÒÖÖÆ¡±µÄ»¯Ñ§ÎïÖÊ£¬´Ó¶øÓ°ÏìÏÂÒ»¸öÉñ¾­ÔªµÄ×´Ì¬¡£Òò´Ë£¬Éñ¾­Ôª´«µÝµÄÐÅÏ¢¼È¿ÉÒÔÆð´Ì¼¤×÷ÓÃ£¬ÓÖ¿ÉÒÔÆðÒÖÖÆ×÷ÓÃ¡£ÉúÎïÉñ¾­ÍøÂçµÄ¹¤×÷Á÷³ÌÈçÍ¼5ª²1ËùÊ¾¡£



Í¼5ª²1ÉúÎïÉñ¾­ÍøÂçµÄ¹¤×÷Á÷³Ì


5.1.2ÈË¹¤Éñ¾­Ôª

ÈË¹¤Éñ¾­ÔªÊÇÉñ¾­ÍøÂçÔËÐÐµÄ»ù´¡Ö®Ò»£¬Ëü±»ÓÃ×÷ÐÅÏ¢´¦Àíµ¥Ôª¡£ÓëÉúÎïÉñ¾­ÔªÀàËÆ£¬ÈË¹¤Éñ¾­Ôª½ÓÊÕÆäËûÈË¹¤Éñ¾­Ôª´«µÝ¹ýÀ´µÄÊäÈëÐÅºÅ£¬½«ÕâÐ©ÊäÈëÐÅºÅ½øÐÐ¼ÓÈ¨ÇóºÍ£¬È»ºóÍ¨¹ý¼¤»îº¯Êý½øÐÐ×ª»»£¬ÒÔ²úÉúÊä³öÐÅºÅ¡£Ã¿¸öÈË¹¤Éñ¾­Ôª¿ÉÒÔ½ÓÊÕ¶à¸öÊäÈëÐÅºÅ£¬µ«Ö»ÄÜ²úÉúÒ»¸öÐÅºÅ¡£Éñ¾­ÔªÄ£ÐÍµÄ»ù±¾ÒªËØÍ¨³£°üÀ¨ÒÔÏÂ4²¿·Ö¡£


(1) Á¬½Ó£º Ã¿¸öÁ¬½Ó¶¼°éËæÒ»¸öÈ¨ÖØ£¬Õâ¸öÈ¨ÖØÏµÊý·´Ó³ÁË¸ÃÁ¬½ÓÔÚÉñ¾­ÍøÂçÖÐµÄÖØÒªÐÔ³Ì¶È¡£¾ßÌåÀ´Ëµ£¬Ã¿¸öÊäÈëµ½Éñ¾­ÔªjµÄÐÅºÅxj»á³ËÒÔÈ¨ÖØwj¡£

(2) ÀÛ¼ÓÆ÷£º ÓÃÓÚ½«Éñ¾­ÔªµÄ¸÷¸öÁ¬½Ó¼ÓÈ¨µÄÊäÈëÐÅºÅÀÛ¼Ó¡£

(3) ¼¤»îº¯Êý£º ÎªÉñ¾­ÔªÒýÈë·ÇÏßÐÔÒòËØ¡£

(4) Æ«ÖÃ£º ´ú±íÃ¿¸öÉñ¾­ÔªµÄÆ«ºÃÊôÐÔ¡£

Éñ¾­ÍøÂçÍ¨¹ýÑ§Ï°À´»ñÈ¡ÖªÊ¶£¬ÕâÐ©ÖªÊ¶ÔÌº¬ÔÚÁ¬½ÓÈ¨ÖØÓëÆ«ÖÃÖÐ£¬Ò»¸öÉñ¾­ÔªµÄÄ£ÐÍÈçÍ¼5ª²2ËùÊ¾¡£



Í¼5ª²2Éñ¾­ÔªµÄÄ£ÐÍ


ÓÃÊýÑ§ÊõÓï£¬¿ÉÒÔÕâÑùÀ´ÃèÊöÒ»¸öÉñ¾­Ôª£º 


y=f¡Æni=1wixi+¦Èi(5ª²1)

ÆäÖÐ£¬xi±íÊ¾µÚi¸öÊäÈëÐÅºÅ£» yÊÇÉñ¾­ÔªµÄÊä³öÐÅºÅ£» wi±íÊ¾µÚi¸öÊäÈëÐÅºÅµÄÈ¨ÖØ£» ¦ÈiÊÇµÚi¸öÉñ¾­ÔªµÄÆ«ÖÃ£» ¡Æ±íÊ¾ÇóºÍ·ûºÅ£¬¶ÔËùÓÐÊäÈëÐÅºÅ½øÐÐ¼ÓÈ¨ÇóºÍ£» fÎª·ÇÏßÐÔº¯Êý£¬Ò²¿ÉÒÔ³Æ×÷¼¤»îº¯Êý¡£Éñ¾­Ôª½ÓÊÕ¶à¸öÐÅºÅxi£¬Ã¿¸öÊäÈëÐÅºÅ¶¼³ËÒÔ¶ÔÓ¦µÄÈ¨ÖØwi£¬²¢¼ÓÉÏÆ«ÖÃ¦Èi£¬È»ºó½«ËüÃÇÀÛ¼ÓºóµÄ½á¹ûÊäÈë¼¤»îº¯Êýf(¡¤)ÖÐ½øÐÐ·ÇÏßÐÔ±ä»»£¬µÃµ½×îÖÕµÄÊä³öy¡£ÕâÖÖÉñ¾­Ôª¾ßÓÐãÐÖµÀàÐÍµÄ¼¤»îº¯Êý£¬±»³ÆÎªMPÄ£ÐÍ£¬×Ô1943ÄêÌá³öÒÔÀ´ÑØÓÃÖÁ½ñ¡£

Ê¹ÓÃ¼¤»îº¯ÊýÖ÷ÒªÓÐÒÔÏÂÁ½¸öÄ¿µÄ¡£

(1) Èç¹û²»Ê¹ÓÃ¼¤»îº¯Êý£¬Éñ¾­ÍøÂçÃ¿Ò»²ãÊä³ö¶¼ÊÇÉÏÒ»²ãÊäÈëµÄÏßÐÔ×éºÏ£¬Òò´Ë£¬ÎÞÂÛÉñ¾­ÍøÂçÓÐ¶àÉÙ²ã£¬ÆäÊä³ö¶¼¿ÉÒÔÍ¨¹ýËùÓÐÊäÈëµÄÏßÐÔ×éºÏÀ´±íÊ¾¡£

(2) ¼¤»îº¯ÊýÒýÈëÁË·ÇÏßÐÔÒòËØ£¬Ê¹µÃÉñ¾­ÍøÂç¿ÉÒÔ±Æ½üÈÎºÎ·ÇÏßÐÔº¯Êý£¬´Ó¶øÀ©Õ¹Éñ¾­ÍøÂçµÄÓ¦ÓÃµ½¸ü¶àµÄ·ÇÏßÐÔÄ£ÐÍÖÐ¡£

¼¤»îº¯Êý±ØÐë¾ß±¸ÒÔÏÂ3¸öÌØÕ÷¡£

(1) ¼¤»îº¯ÊýÓ¦¸ÃÊÇÁ¬Ðø¿Éµ¼µÄ·ÇÏßÐÔº¯Êý(ÔÊÐíÔÚÉÙÊýµãÉÏ¿ÉÒÔ²»¿Éµ¼)¡£¿Éµ¼µÄ¼¤»îº¯Êý¿ÉÒÔÍ¨¹ý²ÎÊýÓÅ»¯µÄ·½·¨À´Ñ§Ï°ÍøÂç²ÎÊý¡£

(2) ¼¤»îº¯Êý¼°Æäµ¼º¯ÊýÒª¾¡¿ÉÄÜµØ¼òµ¥£¬ÕâÑù¿ÉÒÔÌá¸ßÍøÂç¼ÆËãÐ§ÂÊ¡£

(3) ¼¤»îº¯ÊýµÄµ¼º¯ÊýµÄÖµÓòÒªÔÚÒ»¸öºÏÊÊµÄ·¶Î§ÄÚ£¬Ì«´ó»òÕßÌ«Ð¡»áÓ°ÏìÄ£ÐÍÑµÁ·µÄÐ§ÂÊºÍÎÈ¶¨ÐÔ¡£

³£¼ûµÄ¼¸¸ö¼¤»îº¯ÊýÓÐÒÔÏÂ3ÖÖ£¬·Ö±ðÊÇSigmoidº¯Êý¡¢Tanhº¯ÊýºÍReLUº¯Êý¡£



Í¼5ª²3Sigmoidº¯Êý

(1) Sigmoidº¯Êý¡£Sigmoidº¯ÊýµÄÍ¼Ïñ³ÊÏÖÎªSÐÎ×´£¬ÊÇÆù½ñÎªÖ¹ÔÚ¹¹½¨ÈË¹¤Éñ¾­ÍøÂçÖÐ×î³£ÓÃµÄ¼¤»îº¯ÊýÖ®Ò»¡£ËüµÄÖ÷ÒªÌØµãÊÇ½«Éñ¾­ÔªµÄÊä³öÓ³Éäµ½0~1£¬Òò´Ë·Ç³£ÊÊÓÃÓÚÒÔÔ¤²â¸ÅÂÊ×÷ÎªÊä³öµÄÄ£ÐÍ£¬Èç¶þÔª·ÖÀàÎÊÌâ¡£Sigmoidº¯Êý¿É±íÊ¾ÎªÊ½£¨5ª²2£©£¬ÆäÇúÏßÈçÍ¼5ª²3ËùÊ¾¡£


y=F(x)=11+ex(5ª²2)


(2) Tanhº¯Êý¡£Tanhº¯ÊýÓÖ³ÆÎªË«ÇúÕýÇÐº¯Êý¡£ÓëSigmoidº¯ÊýÀàËÆ£¬Tanhº¯ÊýÒ²½«ÊäÈëÓ³Éäµ½Ò»¸öÌØ¶¨·¶Î§ÄÚ£¬¼´-1~1¡£Ëü¿Ë·þÁËSigmoidº¯Êý²»ÒÔ0ÎªÖÐÐÄÊä³öµÄÎÊÌâ¡£ËüµÄ¶¨ÒåÓÉÊ½(5ª²3)¸ø³ö£¬ÆäÇúÏßÈçÍ¼5ª²4ËùÊ¾¡£


Tanh(x)=ex-e-xex+e-x(5ª²3)


(3) ReLUº¯Êý¡£ReLUº¯Êý¼´ÐÞÕýÏßÐÔµ¥Ôª(Rectified Linear Unit)¡£µ±ÊäÈëÎªÕýÊ±£¬¸Ãº¯ÊýÖ±½ÓÊä³ö¸ÃÊäÈëÖµ£¬²»´æÔÚÌÝ¶È±¥ºÍÎÊÌâ£» µ±ÊäÈëÐ¡ÓÚ»òµÈÓÚ0Ê±£¬¸Ãº¯ÊýÊä³ö0¡£ÒòÎªReLU º¯ÊýÖÐÖ»´æÔÚÏßÐÔ¹ØÏµ£¬ËùÒÔËüµÄ¼ÆËãËÙ¶È±ÈSigmoidº¯ÊýºÍTanhº¯Êý¸ü¿ì¡£ReLUº¯Êý¿ÉÒÔ±íÊ¾ÎªÊ½(5ª²4)£¬ÆäÇúÏßÈçÍ¼5ª²5ËùÊ¾¡£

ReLU(x)=max(0,x)(5ª²4)



Í¼5ª²4Tanhº¯Êý




Í¼5ª²5ReLUº¯Êý




5.1.3ÈË¹¤Éñ¾­ÍøÂç

ÈË¹¤Éñ¾­ÔªÒÔ²ãµÄÐÎÊ½×éÖ¯£¬¹¹³ÉÈË¹¤Éñ¾­ÍøÂç¡£ËäÈ»Éñ¾­ÍøÂçÓÐÐí¶à²»Í¬µÄÀàÐÍ£¬µ«ËüÃÇ¶¼×ñÑ­ÏàËÆµÄ»ù±¾Ô­Àí¡£´ÓÔ­ÀíÉÏ½²£¬Éñ¾­ÍøÂç¿ÉÒÔ±»ÊÓÎªÍ¨ÓÃ±Æ½üÆ÷£¬¼´¿ÉÒÔÊµÏÖ´ÓÒ»¸öÏòÁ¿¿Õ¼äµ½ÁíÒ»¸öÏòÁ¿¿Õ¼äµÄÈÎÒâÓ³Éä¡£´ËÍâ£¬Éñ¾­ÍøÂçµÄÁíÒ»¸öÓÅÊÆÔÚÓÚÆäÄÜ¹»²¶»ñÒþº¬ÔÚÊý¾ÝÖÐµÄÒ»Ð©ÏÈÑé»òÎ´ÖªÐÅÏ¢£¬ÕâÐ©ÐÅÏ¢¿ÉÄÜÄÑÒÔÍ¨¹ý´«Í³·½·¨ÌáÈ¡³öÀ´¡£Õâ¸ö¹ý³Ì±»³ÆÎª¡°Éñ¾­ÍøÂçÑ§Ï°¡±»ò¡°Éñ¾­ÍøÂçÑµÁ·¡±¡£ÈË¹¤Éñ¾­ÍøÂçÀûÓÃÔ¤ÏÈÌá¹©µÄÊäÈëÊä³öÊý¾Ý£¬Í¨¹ý·ÖÎöºÍÑÐ¾¿Á½ÕßÖ®¼ä´æÔÚµÄ¸´ÔÓÁªÏµºÍ±ä»¯¹æÂÉ£¬×îÖÕÍ¨¹ýÍÚ¾ò³öÀ´µÄ¹æÂÉÐÎ³ÉÒ»¸ö¸´ÔÓµÄ·ÇÏßÐÔº¯Êý¡£ÑµÁ·¹ý³ÌÖ÷ÒªÓÐÁ½ÖÖÀàÐÍ£º ÓÐ¼à¶½ºÍÎÞ¼à¶½¡£ÓÐ¼à¶½µÄÑµÁ·ÒâÎ¶×ÅÉñ¾­ÍøÂçÖªµÀÕæÊµµÄÊä³ö±êÇ©£¬È»ºóÍ¨¹ý¼ÆËãÍøÂçÊä³öºÍÕæÊµ±êÇ©µÄÎó²îÀ´µ÷ÕûÈ¨ÖØÏµÊý¡£ÎÞ¼à¶½ÑµÁ·Ôò±íÃ÷ÕæÊµµÄÊä³öÊÇÎ´ÖªµÄ£¬Æä±¾ÖÊÉÏ¿ÉÒÔ¿´×÷Ò»¸öÍ³¼Æ·½·¨£¬ÊÇÔÚÈ±·¦±êÇ©µÄÇ°ÌáÏÂÕÒµ½Êý¾ÝÖÐÇ±ÔÚÌØÕ÷µÄÒ»ÖÖÑµÁ··½Ê½¡£ÕâÁ½ÖÖÑµÁ··½Ê½ÔÚ²»


Í¼5ª²6µ¥²ã¸ÐÖªÆ÷


Í¬³¡¾°ÏÂ¶¼¾ßÓÐÖØÒªµÄÓ¦ÓÃ£¬¿ÉÒÔ¸ù¾ÝÈÎÎñµÄÐÔÖÊºÍÊý¾ÝµÄ¿ÉÓÃÐÔÀ´Ñ¡ÔñÊÊµ±µÄÑµÁ··½·¨¡£

Éñ¾­ÍøÂçÖÁÉÙÓÉÁ½²ã×é³É£º Ò»¸öÊäÈë²ãºÍÒ»¸öÊä³ö²ã¡£ÊäÈë²ãÖÐµÄÔ´½ÚµãÖ÷Òª¸ºÔð½ÓÊÕºÍ´«µÝÊäÈëÊý¾Ý£¬²»½øÐÐ¼ÆËã¡£¶øÊä³ö²ãÊÇÍøÂçµÄ×îºóÒ»²ã£¬¸Ã²ãÖÐµÄ¡°Êä³öµ¥Ôª¡±ÐèÒª¶ÔÇ°Ò»²ãµÄÊäÈë½øÐÐ¼ÆËã£¬ÓÃÓÚÉú³É×îÖÕµÄÊä³ö¡£Ö»°üº¬µ¥²ã¼ÆËãµ¥ÔªµÄÇ°ÏòÉñ¾­ÍøÂç±»³ÆÎªµ¥²ã¸ÐÖªÆ÷£¬ÈçÍ¼5ª²6ËùÊ¾¡£µ¥²ã¸ÐÖªÆ÷ÊÇÄ£Ê½·ÖÀàÉñ¾­ÍøÂçÖÐ×î¼òµ¥µÄÒ»ÖÖ¡£µ±Ò»¸öÓÐÏÞµÄÑù±¾¼¯ÊÇÏßÐÔ¿É·ÖÊ±£¬Ëü¿ÉÒÔ±»µ¥²ã¸ÐÖªÆ÷ÕýÈ··ÖÀà¡£



5.2¶à²ãÉñ¾­ÍøÂç


¶à²ãÉñ¾­ÍøÂçÒ²±»³ÆÎª¶à²ã¸ÐÖª»ú(Multilayer Perceptron£¬MLP)¡£ÓÉÓÚµ¥²ã¸ÐÖª»úµÄ±í´ïÄÜÁ¦ÓÐÏÞ£¬ÒªÊµÏÖ¸ü¼Ó¸´ÔÓµÄº¯ÊýÄâºÏ»òÌØÕ÷ÌáÈ¡£¬ÐèÒªÊ¹ÓÃ¶à²ãÉñ¾­ÍøÂç¡£¶à²ãÉñ¾­ÍøÂçÓÉ¶à¸öÉñ¾­ÍøÂç²ã×é³É£¬Í¨³£°üÀ¨ÊäÈë²ã¡¢Òþº¬²ãºÍÊä³ö²ã£¬Ã¿¸ö²ã¶¼°üº¬¶à¸öÉñ¾­Ôª¡£Î»ÓÚÊäÈë²ãºÍÊä³ö²ãÖ®¼äµÄ²ã±»³ÆÎªÒþº¬²ã£¬Æä¼ÆËã½ÚµãÒ²ÏàÓ¦µØ±»³ÆÎªÒþº¬Éñ¾­Ôª»òÒþº¬µ¥Ôª¡£Í¨¹ýÌí¼ÓÒ»¸ö»ò¶à¸öÒþº¬²ã£¬Éñ¾­ÍøÂç¿ÉÑ§Ï°²¢ÌáÈ¡¸ü¸ß½×µÄÌØÕ÷±íÊ¾¡£Éñ¾­ÍøÂçÊÇÍêÈ«Á¬½ÓµÄ£¬¼´ÍøÂçµÄÃ¿Ò»²ãµÄÃ¿¸ö½Úµã¶¼Á¬½Óµ½ÏàÁÚµÄÇ°Ïò²ãµÄÆäËû½Úµã¡£ÔÚÉñ¾­ÍøÂçµÄÉè¼ÆÖÐ£¬ÊäÈë²ãÓëÊä³ö²ãµÄ½ÚµãÊýÒÀ¾ÝÈÎÎñ¾ö¶¨£¬Òò´ËÍùÍùÊÇ¹Ì¶¨µÄ¡£È»¶ø£¬Òþº¬²ãµÄÉè¼ÆÐèÒª¸ù¾Ý¾ßÌåÎÊÌâµÄ¸´ÔÓÐÔ½øÐÐµ÷Õû£¬ÕâÊÇ¹¹½¨Éñ¾­ÍøÂçµÄ¹Ø¼üÖ®Ò»¡£Í¼5ª²7Õ¹Ê¾ÁËÒ»¸ö¶à²ã¸ÐÖª»úµÄÄ£ÐÍ¼Ü¹¹£¬Æä°üº¬ÒÔÏÂ3²¿·Ö£¬·Ö±ðÊÇÊäÈë²ã¡¢Êä³ö²ãºÍÒþº¬²ã(2²ã)¡£



Í¼5ª²7¶à²ã¸ÐÖª»úµÄÄ£ÐÍ¼Ü¹¹



(1) ÊäÈë²ã£º ÓÉÊäÈëÊý¾ÝµÄÌØÕ÷ÊýÁ¿¾ö¶¨£¬Í¨³£Çé¿öÏÂ£¬Ã¿¸öÊäÈëÌØÕ÷¶ÔÓ¦Ò»¸öÉñ¾­Ôª¡£ÒÔÔ¤²â³µÁ¾ÐÐÎªÎªÀý£¬Èç¹ûÎÒÃÇÐèÒª¿¼ÂÇ³µÁ¾µÄËÙ¶È¡¢¼ÓËÙ¶È¡¢Î»ÖÃºÍ·½ÏòÕâ4¸ö¹Ø¼üÌØÕ÷£¬ÄÇÃ´ÎÒÃÇ»áÉè¼ÆÒ»¸ö°üº¬4¸öÉñ¾­µ¥ÔªµÄÊäÈë²ã¡£Ã¿¸öÉñ¾­µ¥Ôª¸ºÔð½ÓÊÕºÍ´¦ÀíÆäÖÐÒ»¸öÌØÕ÷µÄÐÅÏ¢£¬ÕâÓÐÖúÓÚÉñ¾­ÍøÂçÓÐÐ§µØÀí½âºÍÀûÓÃÊäÈëÊý¾ÝµÄ¸÷·½Ãæ¡£

(2) Êä³ö²ã£º ¸ù¾ÝÈÎÎñÐèÒªÊä³öµÄ½á¹ûÖÖÀà¶ø¶¨¡£ÀýÈç£¬Èç¹ûÐèÒªÅÐ¶ÏÊäÈëÍ¼Æ¬ÊÇÐ¡Ã¨»¹ÊÇÐ¡¹·£¬ÕâÊÇÒ»¸ö¶þ·ÖÀàÎÊÌâ£¬Òò´ËÊä³ö²ã½«°üº¬Á½¸öÉñ¾­µ¥Ôª£¬Ã¿¸öÉñ¾­µ¥Ôª¶ÔÓ¦Ò»¸ö¿ÉÄÜµÄÀà±ð(Ð¡Ã¨»òÐ¡¹·)¡£

(3) Òþº¬²ã£º ÐèÒª¹¤³ÌÊ¦¾«ÐÄÉè¼ÆºÍ²âÊÔ£¬ÒÔ»ñµÃÒ»¸ö½ÏºÃµÄÄ£ÐÍ¡£

5.2.1Ç°Ïò´«²¥

Ç°Ïò´«²¥¹ý³Ì¿ÉÒÔ¼òµ¥Àí½âÎªÐÅÏ¢´ÓÉñ¾­ÍøÂçµÄÊäÈë²ãÖð²ãÏòÇ°´«µÝ£¬Ã¿Ò»²ã¶¼Í¨¹ý¼ÓÈ¨ºÍ¼¤»î²Ù×÷¶ÔÐÅÏ¢½øÐÐ´¦Àí£¬È»ºó½«´¦ÀíºóµÄÐÅÏ¢´«µÝ¸øÏÂÒ»²ã£¬Ö±µ½Êä³ö²ãÉú³É×îÖÕµÄÄ£ÐÍÔ¤²â½á¹û¡£Í¼5ª²8Õ¹Ê¾ÁËÒ»´ÎÇ°Ïò´«²¥¹ý³Ì£¬x±íÊ¾Ò»¸öÑµÁ·Ñù±¾£¬y±íÊ¾ÆÚÍûµÄÊä³ö¡£WºÍb·Ö±ð´ú±íÃ¿Ò»²ãµÄÈ¨ÖØ¾ØÕóºÍÆ«ÖÃÏòÁ¿¡£



Í¼5ª²8Ò»´ÎÇ°Ïò´«²¥¹ý³Ì



5.2.2·´Ïò´«²¥Ëã·¨

¼ÙÉèÒª¹¹½¨Ò»¸öÍ¼Æ¬·ÖÀàÏµÍ³£¬Ä¿±êÊÇ¶ÔÃ¨¡¢¹·ºÍÂí½øÐÐ·ÖÀà¡£Ê×ÏÈ£¬ÐèÒªÊÕ¼¯´óÁ¿¹ØÓÚÕâÐ©¶¯ÎïµÄÍ¼Æ¬£¬²¢ÎªÃ¿ÕÅÍ¼Æ¬±ê×¢ÕýÈ·µÄÀà±ð±êÇ©¡£ÔÚÑµÁ·¹ý³ÌÖÐ£¬Ã¿ÕÅÍ¼Æ¬±»ÊäÈëÄ£ÐÍÖÐ£¬Ä£ÐÍ»áÉú³ÉÒ»¸ö·ÖÊýÏòÁ¿£¬ÆäÖÐÃ¿¸öÀà±ð¶¼ÓÐÒ»¸öÏàÓ¦µÄµÃ·Ö£¬ÎÒÃÇµÄÄ¿±êÊÇÊ¹Ä£ÐÍÄÜ¹»×¼È·µØÔ¤²â×î¸ßµÃ·Ö¶ÔÓ¦µÄÀà±ð¡£µ«ÔÚÃ»ÓÐ¾­¹ýÑµÁ·µÄÇé¿öÏÂ£¬Ä£ÐÍÍ¨³£ÎÞ·¨×öµ½ÕâÒ»µã¡£Òò´Ë£¬ÒýÈëÒ»¸öÄ¿±êº¯Êý£¬ÓÃÀ´ºâÁ¿Ä£ÐÍµÄÊä³ö·ÖÊýÓëÆÚÍû·ÖÊýÖ®¼äµÄ²î¾à£¬È»ºóÍ¨¹ýµ÷ÕûÄÚ²¿¿Éµ÷²ÎÊý(È¨ÖØ)À´ËõÐ¡Õâ¸ö²î¾à¡£»úÆ÷Ñ§Ï°µÄºËÐÄÈÎÎñ¾ÍÊÇÍ¨¹ý·´¸´µÄÑµÁ·À´ÕÒµ½ºÏÊÊµÄÈ¨ÖµºÍÆ«ÖÃ£¬Ê¹µÃÏµÍ³µÄÊä³öÂú×ãÈÎÎñµÄÐèÇó¡£

µ±Éè¼ÆºÃÉñ¾­ÍøÂçµÄ½á¹¹£¬ÇÒÓÐÑµÁ·Ñù±¾Ê±£¬ÔÚ¸ø¶¨ËðÊ§º¯ÊýµÄÇé¿öÏÂ£¬×îÖÕµÄÄ¿±êÊÇÍ¨¹ýÓÅ»¯Éñ¾­ÍøÂçÖÐµÄ²ÎÊýÈ¨ÖØWºÍÆ«ÖÃb£¬ÒÔÊ¹Ä£ÐÍÄÜ¹»¸ü×¼È·µØ½øÐÐÔ¤²â¡£ÎªÁËÊµÏÖÕâÒ»Ä¿±ê£¬ÎÒÃÇÊ¹ÓÃµÄÖ÷ÒªËã·¨ÊÇÌÝ¶ÈÏÂ½µ·¨£¬Ò²³Æ×÷BP(Back Propagation)Ëã·¨£¬ËüÊÇÉñ¾­ÍøÂçÁìÓò×î³É¹¦¼°×î³£ÓÃµÄÓÅ»¯Ëã·¨¡£±¾½ÚÖ÷Òª½éÉÜBPËã·¨µÄÍÆµ¼¹ý³Ì¡£ÔÚ¿ªÊ¼ÍÆµ¼Ö®Ç°£¬Ê×ÏÈ»Ø¹ËÒ»ÏÂÁ´Ê½·¨Ôò¡£


·¨Ôò1£º y=g(x),z=h(y)
¦¤x¡ú¦¤y¡ú¦¤z
dzdx=dzdydydx
·¨Ôò2£º x=g(s),y=h(s),z=k(x,y)
¦¤ªµzªµs=ªµzªµxªµxªµs+ªµzªµyªµyªµs




Í¼5ª²9µÚl-1²ãÓëµÚl²ãµÄÉñ¾­ÍøÂç

¸ø¶¨ÑµÁ·Ñù±¾¼¯ºÏ{(x1,y^1),¡­,(xr,y^r),¡­,(xR,y^R)}£¬¼Ù¶¨ËðÊ§º¯ÊýÎª


C(¦È)=1R¡Ær¡¬yr-y^r¡¬2=1R¡ÆrCr(¦È)(5ª²5)
«ýC(¦È)=1R¡Ær«ýCr(¦È)(5ª²6)

ÆäÖÐ£¬¦ÈÎªËðÊ§º¯ÊýÖÐµÄ²ÎÊýÏòÁ¿£¬°üº¬ÁËÉñ¾­ÍøÂçÖÐµÄWºÍb£¬ÕâÀïµÄÄ¿±ê¾ÍÊÇÇó³öªµCr/ªµWlijºÍªµCr/ªµbli¡£Í¼5ª²9ËùÊ¾ÎªµÚl-1²ãÓëµÚl²ãµÄÉñ¾­ÍøÂç¡£

¸ù¾ÝÁ´Ê½·¨Ôò£¬¦¤Wlij¡ú¦¤zli¡­¡ú¦¤Cr£¬ªµCr/ªµWlijÆäµ¼ÖÂÓÉÁ½²¿·ÖÏà³ËËùµÃ£º


ªµCrªµWlij=ªµzlidWlijªµCrªµzli(5ª²7)

µÚÒ»Ïîªµzli/ªµWlijµÄ¼ÆËã¹ý³ÌÈçÏÂ¡£

µ±l>1£¬¼´ÕâÀïµÄ¹Û²ì¶ÔÏóÊÇÉñ¾­ÍøÂçÖÐ¼äµÄÁ½¸öÒþº¬²ãÊ±


zli=¡ÆjWlijal-1j+bliªµzliªµWlij=al-1j(5ª²8)

µ±l=1£¬¼´Éñ¾­ÍøÂçÖ»°üº¬Ò»¸öÒþº¬²ãÊ±


zli=¡ÆjWlijxrj+bliªµzliªµWlij=xrj(5ª²9)

¹éÄÉ¿ÉµÃ


ªµzliªµWlij=xrj,l=1al-1j£¬l>1(5ª²10)

µÚ¶þÏî¿ÉÒÔ¶¨ÒåÎª¦Äli=ªµCrªµzli,µ±l<LÊ±£¬¹Û²ìµÄ¶ÔÏóÊÇÖÐ¼äµÄÒþº¬²ã£¬¸ù¾ÝÁ´Ê½·¨Ôò£¬¦ÄliÓë¦Äl+1iµÄ¹ØÏµÈçÏÂ£º 


¦Äli=ªµCrªµzli=ªµaliªµzliªµCrªµali=ªµaliªµzli¡Ækªµzl+1kªµaliªµCrªµzl+1k(5ª²11)

ÆäÖÐµÄÃ¿Ò»Ïî¿ÉÒÔ±íÊ¾Îª


¦Ò¡ä(zli)=ªµaliªµzliWl+1ki=ªµzl+1kªµali¦Äl+1k=ªµCrªµzl+1k(5ª²12)

¿ÉµÃ


¦Äli=¦Ò¡ä(zli)¡ÆkWl+1ki¦Äl+1k(5ª²13)

µ±l=LÊ±£¬¹Û²ìµÄ¶ÔÏóÊÇÊä³ö²ã£º 


¦ÄLi=ªµCrªµzLi=ªµyriªµzLiªµCrªµyri=¦Ò¡ä(zLi)ªµCrªµyri(5ª²14)

¸ù¾ÝCr=¡¬yr-y^r¡¬,ÓÐ


¦Äl=(Wl+1)T¦Äl+1¡Ñ¦Ò¡ä(zl),l<L
«ýyrCr¡Ñ¦Ò¡ä(zl),l=L(5ª²15)

´ËÍâ£¬»¹ÐèÒª¼ÆËãªµCr/ªµbli£¬ÆäÍÆµ¼¹ý³ÌÈçÏÂ£º 


ªµCrªµbli=ªµzlidbliªµCrªµzli=¦Äli(5ª²16)


Òò´Ë£¬Õû¸ö·´Ïò´«²¥µÄ¹ý³Ì±¾ÖÊ¾ÍÊÇÏÈµÚÒ»²ãÕýÏò¼ÆËãªµzli/ªµWlij£¬ÔÙ´Ó×îºóÒ»²ã·´Ïò¼ÆËãªµCr/ªµzli£¬×îºóÇó³öªµCr/ªµWlijºÍªµCr/ªµbli¡£


×ÛÉÏËùÊö¾ÍÊÇBPËã·¨µÄÁ÷³Ì£¬Îó²î·´Ïò´«²¥Ëã·¨Ê¹ÓÃÁ´Ê½Çóµ¼·¨Ôò½«Êä³ö²ãµÄÎó²î·´Ïò´«»ØÍøÂç£¬È»ºó¸ù¾ÝÎó²îÐÅÏ¢À´µ÷ÕûÈ¨ÖØ²ÎÊý£¬Ê¹µÃÉñ¾­ÍøÂçµÄÈ¨Öµ¾ßÓÐ½Ï¼òµ¥µÄÌÝ¶È¼ÆËã·¨¡£´Ë¹ý³Ì´ÓÊä³ö²ã¿ªÊ¼£¬¼ÆËã¸Ã²ãÖÐµÄ¸÷¸öÉñ¾­ÔªÈ¨ÖµµÄÌÝ¶È£¬ÒÔÈ·¶¨ËüÃÇ¶ÔÎó²îµÄ¹±Ï×¡£È»ºó»ùÓÚÉÏÒ»²ãµÄÌÝ¶ÈÖµ£¬¼ÆËãµ±Ç°²ã²ÎÊýµÄÌÝ¶ÈÖµ£¬²¢²»¶ÏÖØ¸´´Ë¹ý³Ì£¬Ö±µ½ÌÝ¶ÈÐÅÏ¢´«²¥ÖÁÍøÂçµÄµÚÒ»²ã¡£

5.2.3Éñ¾­ÍøÂçÖ®ÌØÕ÷ÌáÈ¡ Word2Vec

ÔÚ½éÉÜWord2VecÖ®Ç°£¬ÐèÒªÏÈ½âÊÍÒ»ÏÂ´ÊÇ¶Èë(word embedding)¡£´ÊÇ¶ÈëÊÇÒ»ÖÖÎÄ±¾±íÊ¾·½·¨£¬Ëü½«ÎÄÖÐµÄ´ÊÓï×ª»»Îª¿É¼ÆËã¡¢½á¹¹»¯µÄÏòÁ¿±íÊ¾¡£ÓÉÓÚÎÄ±¾ÊÇÒ»ÖÖ·Ç½á¹¹»¯Êý¾Ý£¬Òò´Ë²»ÄÜÖ±½Ó¼ÆËãºÍ·ÖÎö¡£´ÊÇ¶ÈëµÄ×÷ÓÃ¾ÍÊÇ½«ÕâÐ©´ÊÓï×ª»»ÎªÏòÁ¿£¬ÒÔ±ãÓÚÔÚ¼ÆËã»úÉÏ½øÐÐ¸÷ÖÖ×ÔÈ»ÓïÑÔ´¦ÀíÈÎÎñ£¬ÈçÎÄ±¾·ÖÀà¡¢Çé¸Ð·ÖÎöµÈ¡£ÏÂÃæ½éÉÜ3ÖÖ³£¼ûµÄÎÄ±¾±íÊ¾·½·¨¡£

1. oneª²hot±àÂë

¼ÙÈçÒª¼ÆËãµÄÎÄ±¾ÖÐ°üº¬4¸ö´Ê£º ÎÒ¡¢°®¡¢´ó¡¢¼Ò¡£¿ÉÒÔ½«Ã¿¸ö´Ê±íÊ¾ÎªÏòÁ¿ÖÐµÄÒ»¸öÎ»ÖÃ¡£Òò´Ë£¬ÓÃoneª²hot±àÂëÀ´±íÊ¾¾Í»áµÃµ½Ò»¸öÏòÁ¿£º 

ÎÒ£º (1£¬0£¬0£¬0)°®£º (0£¬1£¬0£¬0)
´ó£º (0£¬0£¬1£¬0)¼Ò£º (0£¬0£¬0£¬1)


Ã¿¸ö´Ê¶¼±»±íÊ¾ÎªÒ»¸öÎ¨Ò»µÄÏòÁ¿£¬ÆäÖÐÖ»ÓÐÒ»¸öÔªËØÎª1£¬ÆäÓàÔªËØÎª0£¬ÕâÖÖ±íÊ¾·½·¨·Ç³£Ö±¹ÛºÍÒ×ÓÚÀí½â¡£È»¶ø£¬ÔÚ´¦Àí´óÐÍ´Ê»ã±íÊ±£¬oneª²hot±àÂë»áÉú³É·Ç³£¸ßÎ¬µÄÏ¡ÊèÏòÁ¿¡£Õâ²»½öÀË·ÑÁË´æ´¢¿Õ¼ä£¬»¹Ôö¼ÓÁË¼ÆËãµÄ¸´ÔÓÐÔ¡£´ËÍâ£¬ÕâÖÖ±àÂë·½Ê½ÎÞ·¨²¶»ñ´ÊÓïÖ®¼äµÄÓïÒå¹ØÏµ£¬ÒòÎªÃ¿¸ö´ÊÓï¶¼±»ÊÓÎª±Ë´Ë¶ÀÁ¢µÄ¡£

2. ÕûÊý±àÂë

ÕâÖÖ±àÂë·½Ê½Ò²·Ç³£ºÃÀí½â£¬ËüÓÃÒ»ÖÖÊý×ÖÀ´´ú±íÒ»¸ö´Ê£¬¼ÌÐøÊ¹ÓÃÉÏÃæµÄÀý×Ó£¬ÔòÕâ4¸ö´Ê·Ö±ð±»±àÂëÎª£º 

ÎÒ£º 1°®£º 2´ó£º 3¼Ò£º 4

½«¾ä×ÓÀïµÄÃ¿¸ö´ÊÆ´ÆðÀ´¾ÍÊÇ¿ÉÒÔ±íÊ¾Ò»¾ä»°µÄÏòÁ¿¡£ÕâÖÖ±àÂë·½Ê½Ïà¶ÔÓÚoneª²hot±àÂëÀ´Ëµ¿ÉÒÔÏÔÖø½µµÍÎ¬¶È£¬µ«ÈÔÎÞ·¨²¶»ñ´ÊÓïÖ®¼äµÄÓïÒå¹ØÏµ¡£

3. ´ÊÇ¶Èë

´ÊÇ¶ÈëÒ²ÊÇÎÄ±¾±íÊ¾µÄÒ»Àà·½·¨£¬Ëü²¢²»ÌØÖ¸Ä³¸ö¾ßÌåµÄËã·¨£¬¶øÊÇÖ¸½«ÎÄ±¾ÖÐµÄ´ÊÓïÓ³ÉäÎªÁ¬ÐøµÄµÍÎ¬ÏòÁ¿µÄÍ¨ÓÃ·½·¨¡£Ïà½ÏÓÚÇ°ÃæÌáµ½µÄÁ½ÖÖ·½Ê½£¬ËüÓÐ¼¸¸öÃ÷ÏÔµÄÓÅÊÆ£º ¿ÉÒÔÊ¹ÓÃµÍÎ¬ÏòÁ¿À´±íÊ¾ÎÄ±¾£¬Óëoneª²hot±àÂëÏà±È£¬Õâ²»½ö½ÚÊ¡ÁË´æ´¢¿Õ¼ä£¬»¹½µµÍÁË¼ÆËã¸´ÔÓÐÔ£» ÔÚ´ÊÇ¶ÈëµÄÏòÁ¿¿Õ¼äÉÏ£¬ÓïÒåÏàËÆµÄ´Ê»á±È½Ï½Ó½ü£» Í¨ÓÃÐÔÇ¿£¬ÊÊÓÃÓÚ¸÷ÖÖ×ÔÈ»ÓïÑÔ´¦ÀíÈÎÎñ¡£

Word2VecÊÇÒ»ÖÖ»ùÓÚÍ³¼Æ·½·¨À´»ñµÃ´ÊÏòÁ¿µÄ´ÊÇ¶Èë·½·¨£¬ÓÉ¹È¸èµÄMikolovÓÚ2013ÄêÊ×´ÎÌá³ö¡£ËäÈ»ÔÚ2018ÄêÖ®Ç°£¬Word2Vec·½Ê½±È½ÏÖ÷Á÷£¬µ«Ëæ×Å BERT¡¢GPTµÈÄ£ÐÍµÄ³öÏÖ£¬Word2Vec²»ÔÙÊÇÐ§¹û×îºÃµÄ·½·¨¡£¼ò¶øÑÔÖ®£¬Word2VecÊÇÒ»ÖÖ½«Ï¡ÊèµÄoneª²hotÐÎÊ½µÄ´ÊÏòÁ¿Í¨¹ýÒ»¸öÒ»²ãµÄÉñ¾­ÍøÂçÓ³ÉäÎªÒ»¸ön(Ò»°ãÎª¼¸°Ù)Î¬µÄ³íÃÜÏòÁ¿µÄ¹ý³Ì¡£Word2Vec°üÀ¨Á½¸öÖØÒªµÄÄ£ÐÍ£º CBOW(Continuous Bagª²ofª²Word)Ä£ÐÍÓëSkipª²gramÄ£ÐÍ£¬ÕâÁ½¸öÄ£ÐÍ·Ö±ðÈçÍ¼5ª²10ºÍÍ¼5ª²11ËùÊ¾¡£



Í¼5ª²10CBOWÄ£ÐÍ




Í¼5ª²11Skipª²gramÄ£ÐÍ






Í¼5ª²12CBOWÄ£ÐÍµÄÑµÁ·¹ý³Ì


CBOWÄ£ÐÍÍ¨¹ýÉÏÏÂÎÄÀ´Ô¤²âµ±Ç°´Ê»ã£¬ÊÔÍ¼´ÓÒ»¾ä»°ÖÐÉ¾³ýÒ»¸öµ¥´Ê£¬È»ºóÔ¤²â±»É¾³ýµÄµ¥´ÊÊÇÊ²Ã´¡£ÓëÖ®²»Í¬£¬Skipª²gramÄ£ÐÍÔòÒÔµ±Ç°µ¥´ÊÀ´Ô¤²âÖÜÎ§¿ÉÄÜ³öÏÖµÄÉÏÏÂÎÄµ¥´Ê£¬¼´²Â²âÇ°ÃæºÍºóÃæ¿ÉÄÜ»á³öÏÖÄÄÐ©µ¥´Ê¡£CBOWÄ£ÐÍµÄÑµÁ·¹ý³ÌÈçÍ¼5ª²12ËùÊ¾¡£

(1) ÊäÈë²ãÊÇÉÏÏÂÎÄµ¥´ÊµÄoneª²hot¡£¼ÙÉèµ¥´ÊÏòÁ¿¿Õ¼äµÄÎ¬¶ÈÎªV£¬¼´Õû¸ö´Ê¿âµÄ´Êµä´óÐ¡ÎªV£¬ÉÏÏÂÎÄµ¥´Ê´°¿ÚµÄ´óÐ¡ÎªC¡£

(2) ¼ÙÉè×îÖÕ´ÊÏòÁ¿µÄÎ¬¶È´óÐ¡ÎªN£¬ÔòÍ¼ÖÐµÄÈ¨Öµ¹²Ïí¾ØÕóÎªW¡£WµÄ´óÐ¡ÎªV¡ÁN£¬²¢ÇÒ³õÊ¼»¯¡£

(3) ¼ÙÉèÓïÁÏÖÐÓÐÒ»¾ä»°¡°ÎÒ°®´ó¼Ò¡±¡£Èç¹ûÏÖÔÚ¹Ø×¢¡°°®¡±Õâ¸ö´Ê£¬ÁîC=3£¬ÔòÆäÉÏÏÂÎÄÎª¡°ÎÒ¡±¡°´ó¡±¡°¼Ò¡±¡£Ä£ÐÍ°Ñ¡°ÎÒ¡±¡°´ó¡±¡°¼Ò¡±µÄoneª²hotÐÎÊ½×÷ÎªÊäÈë¡£Ò×ÖªÆä´óÐ¡Îª1¡ÁV¡£C¸ö´óÐ¡Îª1¡ÁVµÄÏòÁ¿·Ö±ð¸úÍ¬Ò»¸ö´óÐ¡Îª V¡ÁNµÄÈ¨Öµ¹²Ïí¾ØÕóWÏà³Ë£¬µÃµ½µÄÊÇC¸ö´óÐ¡Îª 1¡ÁNµÄÒþº¬²ã¡£

(4) ½«C¸ö´óÐ¡Îª 1¡ÁNµÄÒþº¬²ãÈ¡Æ½¾ù£¬µÃµ½Ò»¸ö´óÐ¡Îª1¡ÁNµÄÏòÁ¿£¬¼´Í¼5ª²12ÖÐµÄhi¡£

(5) Êä³öÈ¨ÖØ¾ØÕóW¡äµÄ´óÐ¡ÎªN¡ÁV£¬²¢½øÐÐÏàÓ¦µÄ³õÊ¼»¯¡£

(6) ½«µÃµ½µÄÒþº¬²ãÏòÁ¿ÓëÊä³öÈ¨ÖØ¾ØÕóÏà³Ë£¬²¢Ê¹ÓÃ¼¤»îº¯Êý¼ÆËãµÃµ½´óÐ¡Îª 1¡ÁVµÄÏòÁ¿¡£´ËÏòÁ¿µÄÃ¿Ò»Î¬´ú±íÓïÁÏ¿âÖÐµÄÒ»¸öµ¥´Ê¡£¸ÅÂÊÖÐ×î´óµÄË÷ÒýËù´ú±íµÄµ¥´ÊÎªÔ¤²â³öµÄÖÐ¼ä´Ê¡£

(7) ½«Ô¤²â½á¹ûÓëÕæÊµÖµÖÐµÄoneª²hot±àÂë½øÐÐ±È½Ï£¬ÇóËðÊ§º¯ÊýµÄ¼«Ð¡Öµ¡£

Word2VecµÄÊµÏÖ·½·¨¿ÉÒÔ×Ü½áÎª£º Ê×ÏÈ»ùÓÚÑµÁ·Êý¾Ý¹¹½¨Ò»¸öÉñ¾­ÍøÂç¡£µ±Õâ¸öÍøÂçÑµÁ·Íê³Éºó£¬²»Ö±½Ó½«ÆäÓÃÓÚ´¦ÀíÐÂÈÎÎñ£¬¶øÊÇÐèÒªÊ¹ÓÃ¸ÃÄ£ÐÍÍ¨¹ýÑµÁ·Êý¾ÝËùÑ§µÃµÄ²ÎÊý£¬ÈçÒþº¬²ãÖÐµÄÈ¨ÖØ¾ØÕóW¡£ÕâÐ©È¨ÖØÊµ¼ÊÉÏ´ú±íÁËÎÒÃÇÊÔÍ¼Ñ§Ï°µÄ´ÊµÄÌØÕ÷±íÊ¾¡£



5.3¾í»ýÉñ¾­ÍøÂç


½üÄêÀ´£¬Ëæ×ÅÈË¹¤Éñ¾­ÍøÂçµÄÐËÆð£¬»úÆ÷Ñ§Ï°ÁìÓò·¢ÉúÁËºÜ´óµÄ±ä»¯¡£ÕâÐ©ÊÜÉúÎïÆô·¢µÄ¼ÆËãÄ£ÐÍÔÚ³£¹æ»úÆ÷Ñ§Ï°ÈÎÎñÖÐµÄÐÔÄÜÃ÷ÏÔ³¬Ô½ÁËÒÔÍù¸÷ÖÖÐÎÊ½µÄÈË¹¤ÖÇÄÜ¡£ÆäÖÐ×îÒýÈËÖõÄ¿µÄÈË¹¤Éñ¾­ÍøÂç¼Ü¹¹ÐÎÊ½Ö®Ò»ÊÇ¾í»ýÉñ¾­ÍøÂç(Convolutional Neural Networks£¬CNN)¡£×î³õ£¬¾í»ýÉñ¾­ÍøÂçÖ÷ÒªÓÃÓÚ¼ÆËã»úÍ¼Ïñ´¦Àí,µ«Ëæ×ÅÈËÃÇµÄ²»¶ÏÌ½Ë÷ºÍ´´ÐÂ,ËüÒ²±»¹ã·ºÓ¦ÓÃÓÚÊÓÆµÊý¾Ý·ÖÎö¡¢×ÔÈ»ÓïÑÔ´¦Àí¡¢Ò©Îï·¢ÏÖµÈÁìÓò¡£¾í»ýÉñ¾­ÍøÂçµÄÔË×÷·½Ê½Óë±ê×¼µÄÉñ¾­ÍøÂç·Ç³£ÏàËÆ£¬ÓÉÍ¨¹ýÑ§Ï°×ÔÎÒÓÅ»¯µÄÉñ¾­Ôª×é³É¡£Ã¿¸öÉñ¾­ÔªÈÔÈ»»á½ÓÊÕÒ»¸öÊäÈë²¢Ö´ÐÐÒ»¸ö²Ù×÷(ÈçÒ»¸ö±êÁ¿»ýºÍÒ»¸ö·ÇÏßÐÔº¯Êý)¡ª¡ªÕâÊÇÎÞÊýÈË¹¤Éñ¾­ÍøÂçµÄ»ù´¡¡£´ÓÊäÈëµÄÔ­Ê¼Í¼ÏñÏòÁ¿µ½×îÖÕµÄÀà±ð·ÖÊýÊä³ö£¬Õû¸öÍøÂçÈÔÈ»½«±íÊ¾Ò»¸öµ¥Ò»µÄ¸ÐÖª·ÖÊýº¯Êý(È¨ÖØ)¡£×îºóÒ»²ã°üº¬ÓëÀà±ðÏà¹ØÁªµÄËðÊ§º¯Êý£¬´«Í³ÈË¹¤Éñ¾­ÍøÂç¿ª·¢µÄËùÓÐÍ¨ÓÃ¼¼ÇÉºÍÇÏÃÅÈÔÈ»ÊÊÓÃ¡£¾í»ýÉñ¾­ÍøÂçºÍ´«Í³µÄÈË¹¤Éñ¾­ÍøÂçÖ®¼äÎ¨Ò»µÄÏÔÖøÇø±ðÊÇ£¬¾í»ýÉñ¾­ÍøÂçÖ÷ÒªÓÃÓÚÍ¼ÏñÄÚµÄÄ£Ê½Ê¶±ðÁìÓò¡£ÕâÔÊÐí½«ÌØ¶¨ÓÚÍ¼ÏñµÄÌØÐÔ±àÂëµ½¼Ü¹¹ÖÐ£¬Ê¹ÍøÂç¸üÊÊºÏÓÚÒÔÍ¼ÏñÎªºËÐÄµÄÈÎÎñ£¬²¢½øÒ»²½¼õÉÙÄ£ÐÍ¹¹½¨ËùÐèµÄ²ÎÊý¡£

¾í»ýÉñ¾­ÍøÂç¸ÅÄîµÄ²úÉú¿ÉÒÔ×·ËÝµ½20ÊÀ¼Í60Äê´ú³õÆÚ£¬µ±Ê±HubelºÍWieselÍ¨¹ý¶ÔÃ¨µÄ´óÄÔÊÓ¾õÆ¤²ã½øÐÐÑÐ¾¿£¬Ê×´ÎÌá³öÁË¡°¸ÐÊÜÒ°¡±Õâ¸öÐÂ¸ÅÄî¡£¸ÐÊÜÒ°Ö¸µÄÊÇ¾í»ýÉñ¾­ÍøÂçÔÚÃ¿Ò»²ãÊä³öµÄÌØÕ÷Í¼(feature map)ÉÏµÄÏñËØµãÔÚÊäÈëÍ¼Æ¬ÉÏµÄÓ³ÉäÇøÓò¡£¸üÍ¨Ë×µÄ½âÊÍÊÇ£¬ÌØÕ÷Í¼ÉÏµÄÒ»¸öµã¶ÔÓ¦ÊäÈëÍ¼ÉÏµÄÒ»¸öÇøÓò¡£1989Äê£¬LeCun½«·´Ïò´«²¥Ëã·¨ÓëÈ¨Öµ¹²Ïí½áºÏ£¬Ìá³öÁË¾í»ýÉñ¾­ÍøÂç£¬²¢Ê×´Î³É¹¦µØ½«ÆäÓ¦ÓÃµ½ÃÀ¹úÓÊ¾ÖµÄÊÖÐ´×Ö·ûÊ¶±ðÏµÍ³ÖÐ¡£1998Äê£¬LeCun ÓÖÌá³öÁË¾í»ýÉñ¾­ÍøÂçµÄ¾­µäÍøÂçÄ£ÐÍLeNetª²5£¬´Ó¶ø½øÒ»²½Ìá¸ßÊÖÐ´×Ö·ûÊ¶±ðµÄ×¼È·¶È¡£

Í¨³££¬ÈËÃÇ¶ÔÍâ½çµÄ¸ÐÖªÊÇ´Ó²¿·Öµ½ÕûÌåµÄ¹ý³Ì¡£ÔÚÍ¼ÏñÖÐ£¬ÏñËØµãÖ®¼äµÄÎ»ÖÃÁªÏµÊÇ¾Ö²¿µÄ£¬¼´¿Õ¼äÎ»ÖÃ½ÏÔ¶µÄÏñËØµãÖ®¼äµÄÏà¹ØÐÔ½ÏÈõ¡£¶ø¾í»ýÉñ¾­ÍøÂçµÄÃ¿¸öÉñ¾­ÔªÖ»Ðè¶Ô¾Ö²¿Í¼Ïñ½øÐÐ¸ÐÖª£¬È»ºóÔÚ¸ü¸ß²ã½«ÕâÐ©¾Ö²¿µÄÐÅÏ¢×ÛºÏÆðÀ´£¬´Ó¶ø»ñÈ¡È«¾ÖÐÅÏ¢¡£

¾í»ýÉñ¾­ÍøÂç¼Ü¹¹¿ÉÓÃÓÚÊÖÐ´Êý¾Ý¼¯µÄ·ÖÀà£¬ÈçÍ¼5ª²13ËùÊ¾¡£´ÓÕâ¸öÊ¾Àý¿ÉÒÔ·¢ÏÖ¾í»ýÉñ¾­ÍøÂçµÄ»ù±¾¹¦ÄÜ¿ÉÒÔ·Ö½âÎª4¸ö¹Ø¼üÁìÓò£º ÊäÈë²ã¡¢¾í»ý²ã(convolution layer)¡¢³Ø»¯²ã(pooling layer)¼°È«Á¬½Ó²ã(fullyª²connected layer)¡£ÓëÆäËûÐÎÊ½µÄÈË¹¤Éñ¾­ÍøÂçÀàËÆ£¬ÊäÈë²ãÌá¹©Í¼ÏñµÄÔ­Ê¼ÏñËØÐÅÏ¢¡£¾í»ý²ãºÍ³Ø»¯²ãÍ¨³£»áÉèÖÃ¶à¸ö£¬²¢²ÉÓÃ½»Ìæ·½Ê½ÅÅÁÐ£¬¼´Ò»¸ö¾í»ý²ãÁ¬½ÓÒ»¸ö³Ø»¯²ã£¬ÔÙ½ÓÒ»¸ö¾í»ý²ã£¬ÒÔ´ËÀàÍÆ¡£Í¨¹ýÕâÖÖ¼òµ¥µÄ²ã´Î½á¹¹£¬¾í»ýÉñ¾­ÍøÂç¿ÉÒÔÊ¹ÓÃ¾í»ýºÍ½µ²ÉÑù¼¼Êõ¶ÔÔ­Ê¼ÊäÈë½øÐÐÖð²ã×ª»»£¬´Ó¶ø½øÐÐÌØÕ÷ÌáÈ¡£¬²¢×îÖÕÍ¨¹ýÁ¬½ÓÈ«Á¬½Ó²ã½øÐÐ·ÖÀà´¦Àí¡£¾í»ýÉñ¾­ÍøÂçÍ¨¹ý¾í»ý²Ù×÷ºÍ³Ø»¯²Ù×÷Ñ§Ï°ÊäÈëÌØÕ÷µÄ¾Ö²¿Ä£Ê½¡£Ëæ×ÅÍøÂç²ãÊýµÄµþ¼Ó£¬¾í»ýÉñ¾­ÍøÂç½«²»¶ÏµØ¶ÔÕâÐ©¾Ö²¿ÐÅÏ¢½øÐÐ×éºÏºÍ³éÏó£¬×îÖÕ¿ÉÒÔÑ§Ï°µ½¸ü¸ß¼¶µÄÌØÕ÷¡£



Í¼5ª²13LeNetª²5¾í»ýÉñ¾­ÍøÂç



½ÓÏÂÀ´½«ÏêÏ¸ÃèÊöÃ¿¸ö²ã£¬²¢½áºÏÊµ¼ÊµÄÀý×ÓÀ´Àí½â¾í»ýÉñ¾­ÍøÂçÊÇÈçºÎÀûÓÃ¸÷¸ö²ãÔÚÍ¼Æ¬ÖÐ½øÐÐÌØÕ÷ÌáÈ¡µÄ¡£

5.3.1¾í»ý²ã

¾í»ý²ãÔÚ¾í»ýÉñ¾­ÍøÂçµÄÔË×÷·½Ê½ÖÐÆð×ÅÖÁ¹ØÖØÒªµÄ×÷ÓÃ¡£¸Ã²ãµÄ²ÎÊýÖ÷ÒªÊÇ¿ÉÑ§Ï°µÄ¾í»ýºË¡£µ±Êý¾Ýµ½´ï¾í»ý²ãÊ±£¬¾í»ý²ã½«¼ÆËãÉñ¾­ÔªµÄÈ¨ÖØÓëÁ¬½Óµ½ÊäÈëÇøÓòµÄ±êÁ¿µÄ³Ë»ý£¬ÒÔÈ·¶¨Á¬½Óµ½ÊäÈëµÄ¾Ö²¿ÇøÓòµÄÉñ¾­ÔªµÄÊä³ö¡£µ±ÊäÈëÊý¾ÝÎªÍ¼Æ¬Ê±,Êµ¼ÊÉÏÊäÈëÉñ¾­ÍøÂçµÄ²¢²»ÊÇ²ÊÉ«Í¼Æ¬,¶øÊÇÒ»ÏµÁÐÊý×Ö¡£ÈçÍ¼5ª²14ËùÊ¾£¬Í¼ÏñÉÏÓÐÒ»¸ö»ÒÉ«·½¿é×é³ÉµÄXÐÎ£¬ÆäÖÐ»ÒÉ«·½¿é±íÊ¾ÖµÎª1µÄÏñËØµã£¬°×É«·½¿é±íÊ¾ÖµÎª0µÄÏñËØµã¡£µ±Éñ¾­ÍøÂçÒª´¦ÀíÕâÃ´¶àÊý¾ÝÐÅÏ¢Ê±,¾í»ýÉñ¾­ÍøÂç¾ÍÄÜ¹»³ä·Ö·¢»ÓÆäÓÅÊÆ¡£Èç¹ûÒªÊ¶±ð³öÕâ¸öX£¬Ö»ÐèÒªÍ¨¹ý¾í»ýÉñ¾­ÍøÂçÊ¶±ð³ö×óÏÂºÍÓÒÏÂµÄÐ±Ïß¼´¿É¡£



Í¼5ª²14¾í»ýºË



¾í»ý¼ÆËãµÄ½á¹ûÈçÍ¼5ª²15ËùÊ¾£¬¿ÉÒÔ¿´µ½Í¼ÖÐÊýÖµÔ½´ó£¬±íÊ¾Ô½·ûºÏ¾í»ýºÍÓÒÏÂÐ±ÏßµÄÌØÕ÷£¬Òò´ËÊýÖµ½Ï´óµÄÇøÓò»ù±¾ÉÏ¶ÔÓ¦×ÅÔ­Í¼ÉÏÓÐÐ±ÏßµÄ²¿·Ö¡£Í¬Àí£¬Èç¹ûÏëÒª¼ÆËã×óÏÂÐ±ÏßµÄ²¿·Ö£¬¿ÉÒÔÓÃ×óÏÂÐ±ÏßµÄ¾í»ýºË½øÐÐÏàÓ¦µÄ¼ÆËã¡£



Í¼5ª²15¾í»ý¼ÆËãµÄ½á¹û



´«Í³µÄÉñ¾­ÍøÂçºÍ»úÆ÷Ñ§Ï°·½·¨Í¨³£ÐèÒª¶ÔÍ¼Ïñ½øÐÐ¸´ÔÓµÄÔ¤´¦Àí£¬ÒÔ±ãÌáÈ¡ÌØÕ÷£¬È»ºó½«µÃµ½µÄÌØÕ÷ÊäÈëÉñ¾­ÍøÂçÖÐ¡£Í¨¹ýÒýÈë¾í»ý²Ù×÷£¬ÎÒÃÇÄÜ¹»ÀûÓÃÍ¼Æ¬¿Õ¼äÉÏµÄ¾Ö²¿Ïà¹ØÐÔ£¬´Ó¶ø×Ô¶¯ÌáÈ¡ÌØÕ÷¡£Ò»°ãÇé¿öÏÂ£¬¾í»ý²ã°üº¬¶à¸ö¾í»ýºË£¬¶ÔÓ¦¶à¸öÍ¨µÀ¡£ÕâÊÇÓÉÓÚÈ¨Öµ¹²Ïí£¬Ã¿¸ö¾í»ýºËÖ»¸ºÔð²¶»ñÒ»ÖÖÌØÕ÷¡£Èç¹ûÏëÒªÌá¸ß¾í»ýÉñ¾­ÍøÂçµÄ±í´ïÄÜÁ¦£¬¾ÍÐèÒªÉèÖÃ¸ü¶àµÄ¾í»ýºË¡£ÈçÍ¼5ª²16ËùÊ¾£¬¾í»ý²Ù×÷ÓÐÒÔÏÂ3¸öÖØÒªµÄ²ÎÊý¡£

(1) ¾í»ýºË³ß´ç£º ¸ÐÊÜÒ°µÄ´óÐ¡£¬Ò»°ãÖ¸¾í»ýºËµÄ³¤ºÍ¿í£¬Èç3¡Á3µÄ¾í»ýºË¡£

(2) ¾í»ýºË²½³¤£º ¾í»ýºËÔÚºË¿í¶È·½ÏòÉÏÃ¿´ÎÒÆ¶¯µÄ¾àÀë¡£ÀýÈç£¬²½³¤Îª1±íÊ¾Ã¿´ÎÒÆ¶¯1¸ñ£¬²½³¤Îª3Ôò±íÊ¾Ã¿´ÎÒÆ¶¯3¸ñ¡£

(3) ¾í»ýºËµÄÊýÁ¿£º ¶ÔÓ¦¾í»ýºËÊä³öÌØÕ÷µÄÉî¶È¡£Ã¿¸ö¾í»ýºËµÄÊä³öÎªÒ»¸öÍ¨µÀ£¬¶à¸ö¾í»ýºË¶Ñµþ¾Í»áÐÎ³ÉÒ»¸öÌØÕ÷Á¢·½Ìå¡£ÀýÈç£¬Èç¹ûÓÐ4¸ö²»Í¬µÄ¾í»ýºË£¬ÄÇÃ´¾Í»áÐÎ³ÉÓÉ4¸öÌØÕ÷Æ½Ãæ×é³ÉµÄÁ¢·½Ìå¡£



Í¼5ª²16¾í»ýºËµÄ²ÎÊý



5.3.2³Ø»¯²ã

½ÓÏÂÀ´½øÈë³Ø»¯²ã¡£Êµ¼ÊÉÏ£¬Ò»ÕÅÍ¼µÄÏñËØ·Ç³£¶à£¬Òò´Ë¼ÆËãËüÃÇµÄÐÅÏ¢ÐèÒª´óÁ¿Ê±¼ä¡£ÎªÁË¼õÉÙ¼ÆËã¸ºµ££¬ÐèÒª¶ÔÍ¼Æ¬½øÐÐÑ¹Ëõ£¬¶øÕâÕýÊÇ³Ø»¯²ãµÄ×÷ÓÃ¡£Í¼Ïñ¾ßÓÐÒ»ÖÖ¡°¾²Ì¬ÐÔ¡±µÄÊôÐÔ£¬¼´Ä³¸öÍ¼ÏñÇøÓòÓÐÓÃµÄÌØÕ÷¼«ÓÐ¿ÉÄÜÔÚÆäËûÇøÓòÒ²ÊÊÓÃ¡£³Ø»¯²ãµÄÈÎÎñÊÇ¸ù¾Ý²»Í¬Î»ÖÃµÄÌØÕ÷½øÐÐ¾ÛºÏºÍÍ³¼Æ¡£ÆäÄ¿µÄÊÇÖð²½½µµÍ±íÊ¾µÄÎ¬¶È£¬´Ó¶ø½øÒ»²½½µµÍ²ÎÊýÊýÁ¿ºÍÄ£ÐÍµÄ¼ÆËã¸´ÔÓ¶È¡£³£¼ûµÄ³Ø»¯·½·¨°üÀ¨ÒÔÏÂ3ÖÖ¡£

(1) ×î´ó³Ø»¯(max pooling)£º Í¨¹ýÑ¡È¡Í¼ÏñÇøÓòÉÏÄ³¸öÌØÕ÷µÄ×î´óÖµÀ´´ú±íÕâ¸öÍ¼ÏñÇøÓòµÄÌØÕ÷¡£

(2) ×îÐ¡³Ø»¯(min pooling)£º Í¨¹ýÑ¡È¡Í¼ÏñÇøÓòÉÏÄ³¸öÌØÕ÷µÄ×îÐ¡ÖµÀ´´ú±íÕâ¸öÍ¼ÏñÇøÓòµÄÌØÕ÷¡£

(3) Æ½¾ù³Ø»¯(average pooling)£º Í¨¹ý¼ÆËãÍ¼ÏñÇøÓòÉÏÄ³¸öÌØÕ÷µÄÆ½¾ùÖµÀ´´ú±íÕâ¸öÍ¼ÏñÇøÓòµÄÌØÕ÷¡£

ÈçÍ¼5ª²17ËùÊ¾£¬ÕâÀï²ÉÓÃÁË×î´ó³Ø»¯·½·¨¡£¸Ã¹ý³Ì·Ç³£¼òµ¥£¬Ö»Ðè´Ó4¸öÏñËØµãÖÐ±£Áô×î´óÖµ¡£Í¨¹ý¶à´Îµü´ú¼ÆËã£¬×îÖÕ¿ÉÒÔµÃµ½Ò»¸ö¸üÐ¡µÄÍ¼Ïñ¡£¿ÉÒÔ¿´µ½£¬Ñ¹ËõºóµÄÍ¼ÏñÈÔÈ»±£ÁôÁËÔ­ÓÐµÄÌØÕ÷¡£



Í¼5ª²17³Ø»¯²Ù×÷



5.3.3È«Á¬½Ó²ã

³Ø»¯²ãµÃµ½µÄ½á¹ûËäÈ»ÒÑ¾­ÌáÈ¡ÁËÌØÕ÷£¬¼ÆËã»úÈÔÈ»ÎÞ·¨Ö±½ÓÊ¶±ðÕâÐ©ÌØÕ÷¡£ÕâÊ±ÐèÒªÊ¹ÓÃÈ«Á¬½Ó²ã¡£ÈçÍ¼5ª²18ËùÊ¾£¬½«Á½¸ö3¡Á3µÄÍ¼ÏñÕ¹¿ª²¢Æ´½Ó³ÉÒ»Î¬Êý×é¡£Õâ¸öÊý×éÊÇ´ÓÍ¼Æ¬ÖÐÌáÈ¡µÄÌØÕ÷±íÊ¾¡£ÔÚÊ¶±ðÍ¼Æ¬µÄÀà±ðÖ®Ç°£¬¼ÆËã»ú»áÍ¨¹ýÑµÁ·Ñù±¾½øÐÐÑµÁ·¡£Íê³ÉÑµÁ·ºó£¬¼ÆËã»ú»áÎªÃ¿¸öÌØ¶¨µÄÍ¼Ïñ±£´æÒ»¸öÌØÕ÷ÏòÁ¿¡£È»ºó£¬¼ÆËã»ú½«ÓÃÓÚÊ¶±ðÍ¼ÏñµÄÌØÕ÷ÏòÁ¿ÓëÑµÁ·ºóµÃµ½µÄÌØÕ÷ÏòÁ¿½øÐÐ±È½Ï£¬¸ù¾ÝÏàËÆ¶È½øÐÐÊ¶±ð¡£Êµ¼ÊÉÏ£¬È«Á¬½Ó²ã¿ÉÒÔ¿´×÷Ò»¸ö´óÐ¡Îª1¡Á1µÄ¾í»ýºËµÄ¾í»ý²ã¡£È«Á¬½Ó²ãÖÐµÄÃ¿¸öµ¥Ôª¶¼ÓëÇ°Ò»²ãµÄËùÓÐµ¥Ôª½ôÃÜÏàÁ¬¡£ÔÚµäÐÍµÄ¾í»ýÉñ¾­ÍøÂçÌåÏµ½á¹¹ÖÐ£¬È«Á¬½Ó²ãÍ¨³£Î»ÓÚÄ©¶Ë¡£ÈçÍ¼5ª²18ËùÊ¾£¬¾­¹ýÑµÁ·µÄ¾í»ýÉñ¾­ÍøÂç¿ÉÒÔ³É¹¦Ê¶±ð×ÖÄ¸X¡£



Í¼5ª²18½«Í¼Æ¬Õ¹¿ª²¢Æ´½Ó



5.3.4¾í»ýÉñ¾­ÍøÂçµÄÌØµã

¾í»ýÉñ¾­ÍøÂçÑÝ±ä×Ô¶à²ã¸ÐÖª»ú£¬¾ßÓÐ¾Ö²¿Á¬½Ó¡¢È¨Öµ¹²ÏíºÍ½µ²ÉÑùµÈÌØÐÔ£¬ÔÚÍ¼Ïñ´¦Àí·½Ãæ±íÏÖ³öÉ«¡£Ïà±ÈÆäËûÉñ¾­ÍøÂç£¬¾í»ýÉñ¾­ÍøÂçµÄÌØÊâÖ®´¦ÔÚÓÚÈ¨Öµ¹²ÏíºÍ¾Ö²¿Á¬½Ó¡£¾Ö²¿Á¬½ÓÊ¹µÃÍøÂçÄÜ¹»»ñÈ¡Í¼ÏñµÄ¾Ö²¿ÌØÕ÷£¬¶øÈ¨Öµ¹²ÏíÔò½µµÍÁËÍøÂçµÄÑµÁ·¸´ÔÓ¶È¡£´ËÍâ£¬³Ø»¯²Ù×÷ÊµÏÖÁËÊý¾ÝµÄ½µÎ¬£¬Ê¹µÃµÍ²ã´ÎµÄ¾Ö²¿ÌØÕ÷ÄÜ¹»×éºÏ³ÉÎª¸ü¸ß²ã´ÎµÄÌØÕ÷£¬´Ó¶ø»ñµÃÕû¸öÍ¼ÏñµÄÌØÕ÷±íÊ¾¡£

ÔÚ´«Í³µÄÉñ¾­ÍøÂç½á¹¹ÖÐ£¬Ã¿¸öÉñ¾­Ôª¶¼ÓëÉÏÒ»²ãµÄËùÓÐÉñ¾­ÔªÈ«Á¬½Ó¡£È»¶ø£¬ÔÚ¾í»ýÉñ¾­ÍøÂçÖÐ£¬ÉÏÒ»²ãµÄÉñ¾­Ôª½öÁ¬½Óµ½ÏÂÒ»²ãµÄ²¿·ÖÉñ¾­Ôª£¬ÈçÍ¼5ª²19ËùÊ¾¡£



Í¼5ª²19È«Á¬½ÓÓë¾Ö²¿Á¬½Ó



ÔÚ¾í»ýÉñ¾­ÍøÂçÖÐ£¬Í¼ÏñÏñËØÖ®¼ä´æÔÚ¾Ö²¿Ïà¹ØÐÔ£¬Ã¿¸öÏñËØµã¶¼ÓÐ×Å¾ßÌåµÄÊµ¼ÊÒâÒå¡£ÎªÁË¼õÉÙÄ£ÐÍ²ÎÊý²¢ÌáÈ¡¾Ö²¿ÌØÕ÷£¬²ÉÓÃÏ¡ÊèµÄ¾Ö²¿Á¬½Ó·½Ê½¡£

¾í»ýºËÏñÒ»¸ö»¬¶¯´°¿Ú£¬ÔÚÕû¸öÊäÈëÍ¼ÏñÖÐÒÔÌØ¶¨²½³¤»¬¶¯£¬Í¨¹ý¾í»ýÔËËãÉú³ÉÊäÈëÍ¼ÏñµÄÌØÕ÷Í¼¡£Õâ¸öÌØÕ÷Í¼°üº¬ÁË¾í»ý²ãËùÌáÈ¡µÄ¾Ö²¿ÌØÕ÷£¬¶ø¾í»ýºËÔò¹²Ïí²ÎÊý¡£ÔÚÕû¸öÍøÂçµÄÑµÁ·¹ý³ÌÖÐ£¬¾í»ýºËÖÐµÄÈ¨Öµ»áËæ×ÅÑµÁ·µÄ½øÐÐ¶ø¸üÐÂ¡£Òò´Ë£¬ÕûÕÅÍ¼Ïñ¶¼Ê¹ÓÃÍ¬Ò»¸ö¾í»ýºËÄÚµÄ²ÎÊý£¬ÊµÏÖÁËÈ¨Öµ¹²Ïí¡£

5.4Ñ­»·Éñ¾­ÍøÂç
5.4.1ÐòÁÐÊý¾Ý

ÈË¹¤Éñ¾­ÍøÂçºÍ¾í»ýÉñ¾­ÍøÂç¶¼ÊôÓÚÇ°À¡Éñ¾­ÍøÂç¡£Ç°À¡Éñ¾­ÍøÂçÊÇÒ»ÖÖ¾²Ì¬ÍøÂç£¬Êý¾Ý´«µÝÊÇµ¥ÏòµÄ¡£ÕâÒâÎ¶×ÅÍøÂçµÄÊä³öÖ»È¡¾öÓÚµ±Ç°µÄÊäÈë£¬²»¾ß±¸¼ÇÒäÄÜÁ¦¡£ÔÚÊµ¼ÊÈÎÎñÖÐ£¬Ðí¶àÊý¾Ý¶¼¾ßÓÐÉÏÏÂÎÄ¹ØÁªÐÔ£¬ÕâÐ©Êý¾Ý±»³ÆÎªÐòÁÐÊý¾Ý£¬ÈçÎÄ±¾


Í¼5ª²20ÐòÁÐÊý¾Ý

¡¢ÓïÒôºÍÊÓÆµµÈ¡£ÕâÐ©Êý¾Ý³¤¶È²»¹Ì¶¨£¬¶øÇ°À¡Éñ¾­ÍøÂçµÄÊäÈëºÍÊä³öÊÇ¹Ì¶¨³¤¶ÈµÄ£¬Òò´ËÄÑÒÔ´¦ÀíÐòÁÐÊý¾Ý¡£ÔÚÐòÁÐÊý¾ÝÖÐ£¬¸÷ÔªËØÖ®¼ä´æÔÚÒ»¶¨µÄ¹ØÁª£¬Òò´Ë£¬ÔÚ´¦ÀíÐòÁÐÊý¾ÝÊ±£¬ÐèÒª¿¼ÂÇÖ®Ç°Ê±¼ä²½µÄÊý¾Ý£¬¶ø²»½ö½öÊÇµ±Ç°Ê±¼ä²½µÄÊý¾Ý¡£

ÏÖ¸ø¶¨Ò»×éÐòÁÐÊý¾ÝData0,1,2£¬ÈçÍ¼5ª²20ËùÊ¾¡£¸ù¾ÝData0¿ÉÒÔÔ¤²âResult0£¬µ±Ô¤²âÆäËûÊý¾ÝÊ±£¬ÈÔÈ»Ö»Ê¹ÓÃµ¥¸öÊý¾Ý£¬²¢ÇÒÃ¿´ÎÊ¹ÓÃµÄÉñ¾­ÍøÂç¶¼ÊÇÏàÍ¬µÄ¡£ËäÈ»ÕâÐ©Êý¾Ý¾ßÓÐË³Ðò¹ØÏµ£¬µ«´«Í³µÄÉñ¾­ÍøÂç½á¹¹ÎÞ·¨Ñ§Ï°µ½ÕâÐ©Êý¾ÝÖ®¼äµÄÏà¹ØÐÔ¡£

ÄÇÃ´£¬ÈçºÎÊ¹Éñ¾­ÍøÂçÄÜ¹»·ÖÎöÊý¾ÝÖ®¼äµÄÏà¹ØÐÔÄØ? ¿ÉÒÔÏëÏóÒ»ÏÂÈËÀàÊÇÈçºÎ·ÖÎö²»Í¬ÊÂÎïÖ®¼äµÄ¹ØÁªµÄ¡£×î»ù±¾µÄ·½Ê½¾ÍÊÇ¼Ç×¡Ö®Ç°·¢ÉúµÄÊÂ¼þ¡£Èç¹ûÈÃÉñ¾­ÍøÂçÒ²¾ß±¸ÕâÖÖ¼ÇÒä¹¦ÄÜ£¬ËüÔÚ·ÖÎöÊý¾ÝData0ºó£¬¾Í¿ÉÒÔ½«½á¹û´æ´¢ÔÚ¼ÇÒäÖÐ¡£ÔÚ·ÖÎöData1Ê±,Éñ¾­ÍøÂç»á²úÉúÐÂµÄ¼ÇÒä,ÕâÐ©ÐÂµÄ¼ÇÒäÓë¾ÉµÄ¼ÇÒäÓÐ¹Ø£¿Òò´Ë£¬¿ÉÒÔµ÷ÓÃ¾ÉµÄ¼ÇÒäÀ´Ò»Æð·ÖÎöÊý¾Ý¡£È»¶ø£¬Òª·ÖÎö¸ü¶àÓÐÐòÊý¾Ý£¬¾ÍÐèÒªÓÃµ½Ñ­»·Éñ¾­ÍøÂç(Recurrent Neural Networks£¬RNN)£¬ËüÄÜ¹»¸ßÐ§µØ´¦ÀíÐòÁÐÊý¾Ý£¬²¢¼ÇÂ¼¸÷¸öÊ±ÐòµÄÊä³ö¡£ÓÉÓÚÏÈÇ°Ê±¼ä²½µÄÊä³ö»áÓ°ÏìºóÐøµÄÊä³ö£¬Òò´ËÑ­»·Éñ¾­ÍøÂç¿ÉÒÔÍÚ¾òÐòÁÐÊý¾ÝÖÐµÄÊ±ÐòÐÅÏ¢ºÍÓïÒåÐÅÏ¢¡£

5.4.2Ñ­»·Éñ¾­ÍøÂç

Ñ­»·Éñ¾­ÍøÂç³£ÓÃÓÚÓïÒôÊ¶±ð¡¢»úÆ÷·­Òë¡¢ÊÓÆµ½âÎöµÈÁìÓò£¬ËüÄ£ÄâÁËÈËÄÔ¼ÇÒä¹¦ÄÜ¡£¸ÃÍøÂçÀûÓÃÖÜÆÚÐÔµÄÒþº¬²ã½ÚµãÁ¬½ÓÀ´²¶×½ÐòÁÐÊý¾ÝÖÐµÄ¶¯Ì¬ÐÅÏ¢¡£ÔÚÑ­»·Éñ¾­ÍøÂçÖÐ£¬Ò»¸öÐòÁÐµÄµ±Ç°Êä³öÓëÖ®Ç°µÄÊä³öÏà¹ØÁª¡£¾ßÌå¶øÑÔ£¬ÍøÂç»á¶ÔÖ®Ç°µÄÊý¾Ý¼ÓÒÔ¼ÇÒä²¢½«ÆäÓ¦ÓÃÓÚµ±Ç°Êä³öµÄ¼ÆËãÖÐ¡£ÕâÊÇÍ¨¹ýÒþº¬²ãÖ®¼äµÄÏà»¥Á¬½ÓÊµÏÖµÄ£¬Òò´ËÒþº¬²ãµÄÊäÈë²»½ö°üÀ¨ÊäÈë²ãµÄÊý¾Ý£¬»¹°üÀ¨ÉÏÒ»Ê±¿ÌÒþº¬²ãµÄÊä³ö¡£½«Ñ­»·Éñ¾­ÍøÂçÕ¹¿ª³ÉÒ»¸öÈ«Á¬½ÓµÄÉñ¾­ÍøÂç£¬ÈçÍ¼5ª²21ËùÊ¾¡£¿ÉÒÔ¿´µ½Òþº¬²ãÖÐµÄÉñ¾­Ôª²»½öÓëÉÏÏÂ²ãµÄÉñ¾­Ôª»¥ÏàÁ¬½Ó£¬»¹ÓëÍ¬²ãµÄÆäËû½Úµã»¥ÏàÁ¬½Ó¡£

ÀíÂÛÉÏ£¬Ñ­»·Éñ¾­ÍøÂç¿ÉÒÔ´¦ÀíÈÎÒâ³¤¶ÈµÄÐòÁÐÊý¾Ý¡£È»¶ø£¬ÔÚÊµ¼ÊÓ¦ÓÃÖÐ£¬ÎªÁË½µµÍ¸´ÔÓ¶È£¬Í¨³£»á¼ÙÉèµ±Ç°µÄ×´Ì¬Ö»ÓëÇ°ÃæµÄ¼¸¸ö×´Ì¬ÓÐ¹Ø¡£Ñ­»·Éñ¾­ÍøÂçÓÉ¶à¸öÑ­»·Ìå¶Ñµþ¶ø³É£¬ÎªÁË·½±ã¶Ñµþ,Ñ­»·ÌåÓÐÁ½ÀàÊä³ö£º Òþº¬²ãÊä³öºÍ×îÖÕÊä³ö¡£Ñ­»·Ìå¼°Æä°´Ê±¼äÕ¹¿ªºóµÄÐ§¹ûÈçÍ¼5ª²22ËùÊ¾¡£



Í¼5ª²21½«Ñ­»·Éñ¾­ÍøÂçÕ¹¿ª³ÉÈ«Éñ¾­ÍøÂç




Í¼5ª²22Ñ­»·Ìå¼°Æä°´Ê±¼äÕ¹¿ªºóµÄÐ§¹û





ÔÚÍ¬Ò»¸öÒþº¬µ¥ÔªÖÐ£¬ÔÚt-1Ê±¿Ì£¬½ÓÊÕÁËxt-1µÄÊäÈë£» ÔÚtÊ±¿Ì£¬½ÓÊÕÁËxtµÄÊäÈë¡£ÔÚt+1Ê±¿Ì£¬½ÓÊÕÁËxt+1µÄÊäÈë¡£Ò²¾ÍÊÇËµ£¬Í¬Ò»¸öÒþº¬µ¥ÔªÖÐÔÚ²»Í¬Ê±¿Ì»á½ÓÊÕµ½²»Í¬µÄÊäÈë¡£

stµÄÊäÈë°üÀ¨xtºÍst-1£¬xtÊÇµ±Ç°Ê±¿ÌµÄÊäÈë£¬st-1ÊÇÉÏÒ»Ê±¿ÌµÄÐÅÏ¢¡£ÆäÖÐ£¬stÊÇÐòÁÐÔÚÊ±¼ät´¦µÄ¼ÇÒäµ¥Ôª£¬»º´æÁËÖ®Ç°µÄÐÅÏ¢¡£fÍ¨³£ÊÇ·ÇÏßÐÔµÄ¼¤»îº¯Êý£¬ÈçTanhº¯Êý»òReLUº¯Êý£¬stµÄ¸üÐÂ¹«Ê½ÈçÏÂËùÊ¾£º 


st=f(Uxt+Wst-1)(5ª²17)


otÊÇÐòÁÐÔÚÊ±¼ät´¦µÄÊä³ö£¬softmaxÊÇ¼¤»îº¯Êý£¬µ±È»Ò²¿ÉÒÔÊ¹ÓÃÆäËûµÄ¼¤»îº¯Êý£¬Æä¸üÐÂ¹«Ê½ÈçÏÂ£º 


ot=softmax(Vst)(5ª²18)


ÔÚ´«Í³Éñ¾­ÍøÂçÖÐ£¬Ã¿¸öÍøÂç²ãµÄ²ÎÊý¶¼ÊÇ¶ÀÁ¢µÄ¡£È»¶ø£¬ÔÚÑ­»·Éñ¾­ÍøÂçÖÐ£¬Ã¿Ò»²½µÄÊäÈë¶¼¹²ÏíÏàÍ¬µÄU¡¢VºÍW²ÎÊý¼¯¡£»»¾ä»°Ëµ£¬Ñ­»·Éñ¾­ÍøÂçÖÐµÄÃ¿Ò»²½ËùÖ´ÐÐµÄÈÎÎñ¶¼ÊÇÏàÍ¬µÄ£¬Ö»ÊÇÊäÈëÊý¾Ý²»Í¬£¬´Ó¶ø¼«´óµØ¼õÉÙÁËÐèÒªÑ§Ï°µÄ²ÎÊýÊýÁ¿¡£µ±Õ¹¿ªÑ­»·Éñ¾­ÍøÂçÊ±£¬Ëü±ä³ÉÒ»¸ö¶à²ãµÄÍøÂç¡£ÔÚÒ»¸ö¶à²ã´«Í³Éñ¾­ÍøÂçÖÐ£¬Á¬½Óxtµ½stÖ®¼äµÄU¾ØÕóÓëÁ¬½Óxt+1µ½st+1Ö®¼äµÄU¾ØÕóÊÇ²»Í¬µÄ£» È»¶ø£¬¶ÔÓÚÑ­»·Éñ¾­ÍøÂç£¬ÕâÐ©U¾ØÕóÊÇÏàÍ¬µÄ¡£Í¬ÑùµØ£¬Á¬½Óst-1ÓëstÖ®¼äµÄW¡¢Á¬½ÓstÓëotÖ®¼äµÄVÒ²ÊÇÏàÍ¬µÄ¡£¾¡¹ÜÍ¼5ª²22ÖÐÃ¿¸öÊ±¼ä²½¶¼ÓÐÊä³ö£¬µ«²¢·ÇÃ¿¸öÊ±¼ä²½µÄÊä³ö¶¼ÊÇ±ØÐèµÄ¡£ÀýÈç£¬ÔÚÐèÒªÔ¤²âÒ»ÌõÓï¾ä±í´ïµÄÇé¸ÐÊ±£¬½öÐèÒª×îºóÒ»¸öµ¥´ÊµÄÊä³ö£¬¶ø²»ÐèÒªÃ¿¸öµ¥´ÊµÄÊä³ö¡£Ñ­»·Éñ¾­ÍøÂçµÄ¹Ø¼üÔÚÓÚÒþº¬²ã£¬¸Ã²ã¿ÉÒÔ²¶»ñÐòÁÐÐÅÏ¢¡£

5.4.3Ñ­»·Éñ¾­ÍøÂçµÄ±äÌå

ÔÚÑµÁ·ÖÐ£¬Ô­Ê¼µÄÑ­»·Éñ¾­ÍøÂçËæ×ÅÑµÁ·Ê±¼äµÄÔö¼ÓºÍÍøÂç²ãÊýµÄÔö¶à£¬ÈÝÒ×³öÏÖÌÝ¶È±¬Õ¨»òÌÝ¶ÈÏûÊ§µÄÎÊÌâ£¬µ¼ÖÂÎÞ·¨´¦Àí³¤ÐòÁÐÊý¾ÝºÍ²¶»ñ³¤¾àÀëÒÀÀµ¹ØÏµµÄÎÊÌâ¡£Îª½â¾öÕâÒ»ÎÊÌâ£¬Ìá³öÁË¸Ä½ø·½°¸£¬¼´³¤¶ÌÆÚ¼ÇÒäÉñ¾­ÍøÂç(Long Shortª²term Memory,LSTM)¡£±¾½Ú½«ÏêÏ¸½éÉÜLSTMµÄÍøÂç¼Ü¹¹¡£

LSTMÊÇÄ¿Ç°×îÖªÃû¡¢×î³É¹¦µÄÑ­»·Éñ¾­ÍøÂç¸Ä½øÖ®Ò»¡£Ëü¾ß±¸¶ÔÖØÒªµÄÐÅÏ¢½øÐÐ³¤ÆÚ¼ÇÒäµÄÄÜÁ¦£¬Ò»¶¨³Ì¶ÈÉÏ»º½âÁËÌÝ¶ÈÏûÊ§µÄÎÊÌâ¡£Óë´«Í³µÄÑ­»·Éñ¾­ÍøÂçÏà±È£¬LSTMÔÚst-1¡¢xtµÄ»ù´¡ÉÏ¼ÓÁËÒ»¸ö³¤Ê±¼ÇÒä×´Ì¬ct-1(cell state)À´¼ÆËãst£¬Í¬Ê±¶ÔÍøÂçÄ£ÐÍÄÚ²¿½øÐÐÁË¾«ÐÄÉè¼Æ£¬Ôö¼ÓÁËÒÅÍüÃÅft¡¢ÊäÈëÃÅit¡¢Êä³öÃÅotÈý¸öÃÅ¿Øµ¥ÔªÒÔ¼°Ò»¸öÄÚ²¿¼ÇÒäÉñ¾­Ôªc¡«t¡£ÒÅÍüÃÅftµÄ×÷ÓÃÊÇ¿ØÖÆÇ°Ò»²½¼ÇÒäµ¥ÔªÖÐÐÅÏ¢±»ÒÅÍüµÄ³Ì¶È£¬ÊäÈëÃÅitÔò¿ØÖÆµ±Ç°¼ÇÒäÖÐµÄÐÅÏ¢¸üÐÂµ½¼ÇÒäµ¥ÔªµÄ³Ì¶È£¬¶øÊä³öÃÅotÔò¾ö¶¨ÁËµ±Ç°µÄÒþº¬×´Ì¬µÄÊä³ö¡£ÔÚÑµÁ·ºÃµÄÍøÂçÖÐ£¬µ±ÊäÈëÐòÁÐ²»°üº¬ÖØÒªÐÅÏ¢Ê±£¬LSTMÒÅÍüÃÅµÄÖµ½Ó½üÓÚ1£¬ÊäÈëÃÅµÄÖµ½Ó½üÓÚ0£¬ÕâÓÐÖúÓÚ±£Áô¹ýÈ¥µÄÐÅÏ¢£¬ÊµÏÖÁË³¤Ê±¼ÇÒäµÄ¹¦ÄÜ¡£È»¶ø£¬µ±ÊäÈëÐòÁÐÖÐ³öÏÖÁËÖØÒªÐÅÏ¢£¬ÇÒ¸ÃÐÅÏ¢ÒâÎ¶×ÅÖ®Ç°µÄ¼ÇÒä²»ÔÙÖØÒªÊ±£¬ÊäÈëÃÅµÄÖµ»á½Ó½üÓÚ1£¬¶øÒÅÍüÃÅµÄÖµ»á½Ó½üÓÚ0£¬´Ó¶øÊµÏÖÁË¾É¼ÇÒäµÄÒÅÍü£¬Í¬Ê±ÐÂµÄÖØÒªÐÅÏ¢±»ÄÉÈë¼ÇÒä¡£Í¨¹ýÕâÑùµÄÉèÖÃ£¬Õû¸öÍøÂç¸üÈÝÒ×Ñ§Ï°µ½ÐòÁÐÖ®¼äµÄ³¤ÆÚÒÀÀµ¹ØÏµ¡£

Í¼5ª²23Õ¹Ê¾ÁËLSTMµÄÍøÂç¼Ü¹¹¡£



Í¼5ª²23LSTMµÄÍøÂç¼Ü¹¹



¾­µäµÄLSTMÖÐ£¬µÚt²½µÄ¸üÐÂ¼ÆËã¹«Ê½ÈçÏÂËùÊ¾£º 


xinput=concat(st-1,xt)(5ª²19)

ÒÅÍüÃÅÉñ¾­Ôª£º


ft=¦Ò(xinput¡¤Wf+bf)(5ª²20)

ÊäÈëÃÅÉñ¾­Ôª£º


it=¦Ò(xinput¡¤Wi+bi)(5ª²21)

¼ÇÒäÃÅÉñ¾­Ôª£º

c¡«t=Tanh(xinput¡¤Wc+bc)(5ª²22) 

ÒÅÍüºóµÄ³¤Ê±¼ÇÒä£º


c¡«¡ät-1=ft¡¤ct-1(5ª²23)

ÊäÈëºóµÄ¼ÇÒä£º


c¡«¡ät=it¡Ñc¡«t(5ª²24)

Êä³öÃÅÉñ¾­Ôª£º  


ot=¦Ò(xinputWo+bo)(5ª²25)


tÊ±¿ÌµÄ³¤Ê±¼ÇÒä£º 


ct= c¡«¡ät-1+c¡«¡ät(5ª²26)

tÊ±¿ÌµÄ¶ÌÊ±¼ÇÒä£º 


st=ot¡ÑTanh(ct)(5ª²27)

ÆäÖÐ£¬xinputÖ¸µÄÊÇ¶ÔÉÏÒ»Ê±¿Ìt-1µÄ¼ÇÒä×´Ì¬st-1ÒÔ¼°µ±Ç°Ê±¿ÌtµÄÏòÁ¿ÊäÈëxt½øÐÐÌØÕ÷Î¬¶ÈµÄÆ´½ÓËùµÃµ½µÄ½á¹û¡£¦ÒÖ¸µÄÊÇSigmoidº¯Êý¡£Wf¡¢bf¡¢Wi¡¢bi¡¢Wo¡¢boÊÇ¸÷¸öÃÅÉñ¾­ÔªµÄ¿ÉÑ§Ï°²ÎÊý¡£ÒÅÍüÃÅ¡¢ÊäÈëÃÅÒÔ¼°Êä³öÃÅ¾ù²ÉÓÃSigmoid×÷Îª¼¤»îº¯Êý£¬Òò´ËÊä³öÏòÁ¿ft¡¢it¡¢otµÄÃ¿¸öÔªËØ¾ùÎª0~1£¬ÓÃÓÚµ÷½Ú¸÷Î¬¶ÈÐÅÏ¢Á÷Í¨¹ýÃÅµÄÊýÁ¿£» ¶ø¼ÇÒäÃÅÓëÒÅÍüÃÅ¡¢ÊäÈëÃÅºÍÊä³öÃÅÉñ¾­ÔªµÄÊä³öÏòÁ¿¾ßÓÐÏàÍ¬µÄÎ¬¶È¡£²»Í¬µÄÊÇ£¬¼ÇÒäÃÅÊ¹ÓÃµÄ¼¤»îº¯ÊýÊÇTanh£¬Òò´ËÆäÊä³öÏòÁ¿c¡«tµÄÃ¿¸öÔªËØ¾ùÎª-1~1¡£

5.4.4Ë«ÏòLSTMÖ®ÌØÕ÷ÌáÈ¡ ELMo

ELMoÓÚ2018Äê3ÔÂÌá³ö£¬Ô´×ÔÂÛÎÄDeep contextualized word representations¡£×÷ÕßÈÏÎªºÃµÄ´Ê±íÕ÷Ä£ÐÍÓ¦¸ÃÄÜ¹»Í¬Ê±¼æ¹ËÁ½¸öÎÊÌâ£º Ò»ÊÇ´¦Àí´ÊÓïÓÃ·¨ÔÚÓïÒåºÍÓï·¨ÉÏµÄ¸´ÔÓÓÃ·¨£» ¶þÊÇ¸ù¾Ý²»Í¬Óï¾³Áé»îµ÷Õû´ÊÓïµÄ±íÕ÷¡£´«Í³µÄWord2Vec»òÕßGloveÖ»ÄÜ½â¾öµÚÒ»¸öÎÊÌâ£¬ËüÃÇÉú³ÉµÄ´ÊÏòÁ¿ÊÇ¾²Ì¬µÄ£¬Ò²¾ÍÊÇËµÃ¿¸ö´ÊµÄÏòÁ¿»¯±íÊ¾ÊÇ¹Ì¶¨µÄ¡£È»¶ø£¬ºÜ¶àµ¥´ÊÔÚ²»Í¬µÄÓï¾³ÏÂÓÐ²»Í¬µÄº¬Òå¡£ÀýÈç,¡°ÎÒÈ¥Ï´ÊÖ¼ä·½±ãÒ»ÏÂ¡±ºÍ¡°Äã½ñÍí¼¸µã·½±ã¡±ÕâÁ½¾ä»°ÖÐµÄ¡°·½±ã¡±±í´ïµÄÒâË¼ÏÔÈ»²»Í¬¡£Òò´Ë£¬ÔÚÕâÖÖÇé¿öÏÂ£¬ÐèÒªÒ»ÖÖ¶¯Ì¬µÄ´ÊÏòÁ¿ÄÜ¹»¸ù¾ÝÓï¾³À´±íÊ¾µ¥´Ê£¬ELMoËù×öµÄ¾ÍÊÇÕâ¼þÊÂ¡£¸ÃÄ£ÐÍ»á¸ù¾ÝÉÏÏÂÎÄÀ´ÍÆ¶ÏÃ¿¸ö´Ê¶ÔÓ¦µÄ´ÊÏòÁ¿£¬²¢ÄÜ¹»¸ù¾Ý²»Í¬Óï¾³À´Àí½â¶àÒå´ÊµÄº¬Òå¡£ÖµµÃÒ»ÌáµÄÊÇ£¬ELMoÒ²ÊÇÔ¤ÑµÁ·ÓïÑÔÄ£ÐÍµÄÏÈºÓ¡£

ELMoµÄÍøÂç½á¹¹²ÉÓÃÁËË«²ãË«ÏòLSTM£¬¸ÃÓïÑÔÄ£ÐÍµÄÑµÁ·ÈÎÎñÄ¿±êÊÇ¸ù¾Ýµ¥´ÊwµÄÉÏÏÂÎÄÀ´ÕýÈ·Ô¤²âµ¥´Êw,ÆäÖÐwÖ®Ç°µÄµ¥´ÊÐòÁÐ³ÆÎªÉÏÎÄ£¬Ö®ºóµÄµ¥´ÊÐòÁÐ³ÆÎªÏÂÎÄ¡£¶ÔÓÚÇ°ÏòµÄLSTMÖÐµÄµÚt¸öÊ±¿Ì¶øÑÔ£¬ÓÉÓÚÆäÄ£ÄâµÄÊÇÓïÑÔÄ£ÐÍ£¬ËùÒÔµÚt¸öÊ±¿ÌµÄÊä³öÎª


P(wn|w1,w2,¡­,wn-1)(5ª²28)


¶ÔÓÚÕû¸öÐòÁÐµÄÊä³öÓÐ


P(h1,h2,¡­,hn)=¡Çnk=1P(hk|h1,h2,¡­,hk-1)(5ª²29)

Í¬Àí£¬¶ÔÓÚºóÏòµÄLSTM¶øÑÔ£¬Æä¼ÆËã½á¹ûÎª


P(h1,h2,¡­,hn)=¡Çnk=1P(hk|hk+1,hk+2,¡­,hn)(5ª²30)


×ÛÉÏËùÊö£¬¶ÔÓÚµÚÒ»²ãµÄBIª²LSTM£¬¿ÉÒÔ×ÛºÏÇ°ÏòºÍºóÏòµÄÁ½¸öLSTMµÃµ½Êä³öµÄËÆÈ»º¯ÊýÎª


¡Æni=1log(P(hi))=log(P(hi|h1,h2,¡­,hi-1);¦Èx,¦Èleft,¦Ès)+
log(P(hi|hi+1,hi+2,¡­,hn);¦Èx,¦Èright,¦Ès)(5ª²31)

ÆäÖÐ,Èý¸ö¦È·Ö±ð±íÊ¾ÊäÈëµÄ²ÎÊý¡¢²»Í¬·½ÏòµÄLSTMµÄ²ÎÊýºÍSoftmaxµÄ²ÎÊý¡£Í¼5ª²24Õ¹Ê¾µÄÊÇELMoµÄÄ£ÐÍ¼Ü¹¹¡£



Í¼5ª²24ELMoÔ¤ÑµÁ·ÓïÑÔÄ£ÐÍ



Í¼5ª²24×ó²àµÄÇ°ÏòË«²ãLSTM´ú±íÕýÏò±àÂëÆ÷£¬Ëü½ÓÊÕ´Ó×óµ½ÓÒË³ÐòÅÅÁÐµÄÉÏÏÂÎÄÎÄ±¾(³ýÁËÒªÔ¤²âµÄµ¥´Êw)contextª²before£» ÓÒ²àµÄÄæÏòË«²ãLSTM´ú±í·´·½Ïò±àÂëÆ÷£¬½ÓÊÕ´ÓÓÒµ½×óÄæÐòÅÅÁÐµÄÏÂÎÄÎÄ±¾contextª²after¡£Ã¿¸ö±àÂëÆ÷¶¼ÓÉÁ½²ãLSTM¶Ñµþ¶ø³É¡£¸ÃÍøÂç½á¹¹ÔÚ×ÔÈ»ÓïÑÔ´¦ÀíÁìÓò±»¹ã·ºÓ¦ÓÃ¡£Í¨¹ýÊ¹ÓÃ´óÁ¿µÄÓïÁÏ¿âÑµÁ·¸ÃÍøÂç½á¹¹½øÐÐÓïÑÔÄ£ÐÍÈÎÎñ£¬¿ÉÒÔÊÂÏÈÔ¤ÑµÁ·³öÄ£ÐÍ¡£Èç¹û³É¹¦ÑµÁ·ÁË¸ÃÄ£ÐÍ£¬ÔÚÊäÈëÐÂµÄ¾ä×ÓXÊ±£¬Ã¿¸öµ¥´Ê¶¼¿ÉÒÔµÃµ½Èý¸ö¶ÔÓ¦µÄÇ¶ÈëÏòÁ¿£» ×îµ×²ãÊÇµ¥´Ê³õÊ¼»¯µÄÇ¶ÈëÏòÁ¿£» µÚÒ»²ãÊÇË«ÏòLSTMÖÐ¶ÔÓ¦µ¥´ÊÎ»ÖÃµÄÇ¶ÈëÏòÁ¿£¬ÕâÒ»²ã¸ü¶àµØ±àÂëÁËµ¥´ÊµÄ¾ä·¨ÐÅÏ¢£» µÚ¶þ²ãÊÇLSTMÖÐ¶ÔÓ¦µ¥´ÊÎ»ÖÃµÄÇ¶ÈëÏòÁ¿£¬ÕâÒ»²ã¸ü¶àµØ±àÂëÁËµ¥´ÊµÄÓïÒåÐÅÏ¢¡£Òò´Ë£¬


Í¼5ª²25ÓÐÏòÍ¼


ÕýÏò±àÂëÆ÷ºÍ·´Ïò±àÂëÆ÷¶¼»á»ñµÃÏàÓ¦µ¥´ÊµÄÇ¶ÈëÏòÁ¿¡£½ÓÏÂÀ´£¬ÎªÕâÈý¸öÇ¶ÈëÏòÁ¿ÖÐµÄÃ¿Ò»¸ö·ÖÅäÒ»¸öÈ¨ÖØa(¿ÉÒÔÍ¨¹ýÑ§Ï°»ñµÃ)£¬²¢¸ù¾Ý¸÷×ÔµÄÈ¨ÖØ½øÐÐ¼ÓÈ¨ÇóºÍÒÔ½«ËüÃÇÕûºÏ³ÉÒ»¸öÏòÁ¿¡£È»ºó£¬½«ÕûºÏºóµÄÏòÁ¿×÷ÎªÊäÈëX¾ä×ÓÖÐ¶ÔÓ¦µ¥´ÊµÄÌØÕ÷£¬ÓÃÓÚÏÂÓÎÈÎÎñ¡£»»¾ä»°Ëµ£¬ELMoµÄÔ¤ÑµÁ·¹ý³Ì²»½öÑ§Ï°ÁËµ¥´ÊµÄÇ¶ÈëÏòÁ¿£¬»¹Ñ§Ï°ÁËÒ»¸öË«²ãË«ÏòLSTMÍøÂç½á¹¹£¬ÕâÁ½Õß¶¼·Ç³£ÓÐÓÃ¡£Í¼µÄÐÎÊ½´æÔÚÈçÍ¼5ª²25ËùÊ¾¡£


5.5Í¼Éñ¾­ÍøÂç


Ëæ×Å»úÆ÷Ñ§Ï°¡¢Éî¶ÈÑ§Ï°µÄ¿ìËÙ·¢Õ¹£¬ÓïÒô¡¢Í¼Ïñ¡¢×ÔÈ»ÓïÑÔ´¦ÀíµÈÁìÓòÈ¡µÃÁË¾Þ´óµÄÍ»ÆÆ¡£È»¶ø£¬ÕâÐ©ÁìÓòÖÐµÄÊý¾ÝÍ¨³£¾ßÓÐ·Ç³£¼òµ¥µÄ½á¹¹£¬ÀýÈçÐòÁÐ»òÍø¸ñÊý¾Ý£¬¶øÉî¶ÈÑ§Ï°ÔÚ´¦ÀíÕâÖÖÀàÐÍµÄÊý¾Ý·½Ãæ±íÏÖ³öÉ«¡£È»¶ø£¬ÔÚÊµ¼Ê¹¤×÷ÖÐ£¬²¢²»ÊÇËùÓÐÊÂÎï¶¼ÄÜÒÔÐòÁÐ»òÕßÍø¸ñÐÎÊ½À´±íÊ¾£¬ÀýÈç£¬Éç½»ÍøÂç¡¢ÖªÊ¶Í¼Æ×ºÍÉúÎïÍøÂçµÈÍùÍùÒÔÍ¼µÄÐÎÊ½´æÔÚ£¬ÆäÖÐÔªËØÖ®¼äµÄ¹ØÏµ·Ç³£¸´ÔÓ¡£Òò´Ë£¬Ðí¶àÑ§Ï°ÈÎÎñÐèÒªÓÐÐ§µØ´¦ÀíÕâÖÖ·á¸»µÄÍ¼Êý¾Ý¡£

Í¼½á¹¹Êý¾ÝµÄ¸´ÔÓÐÔ¶ÔÏÖÓÐ»úÆ÷Ñ§Ï°Ëã·¨Ìá³öÁËÖØ´óÌôÕ½¡£Í¼½á¹¹Êý¾Ý¾ßÓÐ²»¹æÔòÐÔ£¬Ã¿ÕÅÍ¼´óÐ¡²»Í¬¡¢½ÚµãÎÞÐò£¬²¢ÇÒÍ¼ÖÐµÄÃ¿¸ö½Úµã¶¼¿ÉÒÔÓÐ²»Í¬ÊýÁ¿µÄÁÚ½Úµã£¬ÕâÊ¹µÃÒ»Ð©ÔÚÍ¼ÏñÖÐÈÝÒ×¼ÆËãµÄÖØÒªÔËËã(Èç¾í»ý²Ù×÷)²»ÄÜÖ±½ÓÓ¦ÓÃÓÚÍ¼½á¹¹Êý¾Ý¡£´ËÍâ£¬ÏÖÓÐ»úÆ÷Ñ§Ï°Ëã·¨µÄºËÐÄ¼ÙÉèÊÇÊµÀýÖ®¼ä±Ë´Ë¶ÀÁ¢¶øÍ¼½á¹¹Êý¾ÝÖÐµÄÃ¿¸öÊµÀý¶¼ÓëÖÜÎ§µÄÆäËûÊµÀýÏà¹Ø£¬°üº¬¸´ÔÓµÄÁ¬½ÓÐÅÏ¢£¬ÓÃÓÚ²¶»ñÊý¾ÝÖ®¼äµÄÒÀÀµ¹ØÏµ£¬°üÀ¨ÒýÓÃ¡¢ÅóÓÑ¹ØÏµºÍÏà»¥×÷ÓÃµÈ¡£Òò´Ë£¬ÈçºÎÀûÓÃÉî¶ÈÑ§Ï°·½·¨¶ÔÍ¼½á¹¹µÄÊý¾Ý½øÐÐÓÐÐ§µÄ·ÖÎöºÍÍÆÀíÒÑ¾­ÒýÆðÁË¹ã·ºµÄÑÐ¾¿Óë¹Ø×¢¡£Í¼Éñ¾­ÍøÂç£¨GNN£©ÊÇ´¦ÀíÍ¼½á¹¹Êý¾ÝÖÐÏàÁÚ½Úµã¼äÐÅÏ¢´«²¥ºÍ¾ÛºÏµÄÖØÒª¼¼Êõ£¬ËüÓÐÐ§µØ½«Éî¶ÈÑ§Ï°µÄÀíÄîÓ¦ÓÃÓÚ·ÇÅ·¼¸ÀïµÃ¿Õ¼äµÄÊý¾ÝÉÏ¡£±¾½Ú½«·ÖÀà½éÉÜ²»Í¬ÀàÐÍµÄÍ¼½á¹¹£¬²¢·ÖÎö¶Ô±È²»Í¬µÄÍ¼Éñ¾­ÍøÂç¼¼Êõ¡£

5.5.1Í¼½á¹¹¶¨Òå

Í¼Éñ¾­ÍøÂçËù´¦ÀíµÄÊý¾ÝÎªÔÚÅ·ÊÏ¿Õ¼äÄÚÌØÕ÷±íÊ¾Îª²»¹æÔòÍøÂçµÄÍ¼½á¹¹Êý¾Ý¡£»ù±¾µÄÍ¼½á¹¹¶¨ÒåÎª(G,V,E)£¬ÆäÖÐV´ú±í½Úµã¼¯ºÏ£¬E±íÊ¾±ß¼¯ºÏ¡£ÔÚ¿Õ¼äÉÏ£¬Í¼½á¹¹µÄ±ä»¯¿ÉÒÔ´Ó½ÚµãºÍ±ßÀ´½øÐÐÇø·Ö£¬Èç±ßÒì¹¹µÄÓÐÏòÍ¼¡¢È¨ÖØÍ¼ºÍ±ßÐÅÏ¢Í¼£¬ÒÔ¼°½ÚµãÒì¹¹Í¼¡£

(1) ÓÐÏòÍ¼ÊÇÖ¸ÔÚÍ¼½á¹¹ÖÐ£¬Á¬½Ó½ÚµãÖ®¼äµÄ±ß°üº¬Ö¸ÏòÐÔ¹ØÏµ£¬ÈçÍ¼5ª²25ËùÊ¾¡£ÓÐÏòÍ¼½ÚµãÖ®¼äµÄ¹ØÁª°üº¬·½ÏòµÄ´«µÝÐÔ¹ØÏµ¡£¶ÔÓÚÍ¼Éñ¾­ÍøÂç¶øÑÔ£¬ÕâÖÖ´«µÝ¹ØÏµÀàËÆÓÚÉî¶ÈÑ§Ï°Éñ¾­ÍøÂçÖÐÉñ¾­ÔªÖ®¼äµÄÐÅºÅ´«µÝ½á¹¹¡£ÓÐÏòÍ¼µÄÊäÈëÊÇ¸÷¸ö½ÚµãËù¶ÔÓ¦µÄ²ÎÊý¡£

(2) È¨ÖØÍ¼ÊÇÖ¸ÔÚÍ¼½á¹¹ÖÐµÄ±ß°üº¬È¨ÖØÐÅÏ¢£¬ÕâÐ©È¨ÖØ¿ÉÒÔÓÐÐ§µØÃèÊö½ÚµãÖ®¼äÏà»¥×÷ÓÃµÄ¿É¿¿³Ì¶È£¬¶¨Á¿µØ±íÏÖ¹ØÏµµÄÁ¬½ÓÇ¿¶È£¬ÈçÍ¼5ª²26ËùÊ¾¡£

(3) ±ßÐÅÏ¢Í¼ÊÇÖ¸ÔÚÍ¼½á¹¹ÖÐ´æÔÚ²»Í¬½á¹¹µÄ±ß£¬½ÚµãÖ®¼äµÄ¹ØÁª¹ØÏµ¿ÉÒÔ°üº¬È¨ÖØ¡¢·½ÏòÒÔ¼°Òì¹¹µÄ¹ØÏµ£¬ÈçÍ¼5ª²27ËùÊ¾¡£ÀýÈç£¬ÔÚÒ»¸ö¸´ÔÓµÄÉç½»ÍøÂçÍ¼ÖÐ£¬½ÚµãÖ®¼äµÄ¹ØÏµ¼È¿ÉÒÔÊÇµ¥ÏòµÄ¡°¹Ø×¢¡±¹ØÏµ£¬ÓÖ¿ÉÒÔÊÇË«ÏòµÄ¡°ÅóÓÑ¡±¹ØÏµ¡£¶ÔÓÚ°üº¬¸´ÔÓ±ßÐÅÏ¢µÄÍ¼½á¹¹£¬¼òµ¥µÄÈ¨ÖØÏÞÖÆÎÞ·¨Ö±½Ó±íÊ¾¸´ÔÓµÄ¹ØÏµ¡£

(4) ½ÚµãÒì¹¹Í¼ÊÇÖ¸ÔÚÍ¼ÖÐµÄ½ÚµãÊôÓÚ¶à¸ö²»Í¬µÄÀàÐÍµÄÍ¼½á¹¹£¬ÈçÍ¼5ª²28ËùÊ¾¡£ÕâÖÖÍ¼½á¹¹ÍùÍù¿ÉÒÔ¸ù¾ÝÒì¹¹½ÚµãµÄÀàÐÍ¶ÔÆä½øÐÐÏòÁ¿±íÊ¾¡£ÎªÁËÊµÏÖ½ÚµãµÄÏòÁ¿±íÊ¾£¬¿ÉÒÔÊ¹ÓÃoneª²hotµÈ±àÂë·½Ê½¡£



Í¼5ª²26È¨ÖØÍ¼




Í¼5ª²27±ßÐÅÏ¢Í¼




Í¼5ª²28½ÚµãÒì¹¹Í¼




5.5.2Í¨ÓÃµÄÍ¼Éñ¾­ÍøÂç¿ò¼Ü

Í¼Éñ¾­ÍøÂçÔÚÉî¶ÈÑ§Ï°ÖÐµÄÓ¦ÓÃ¶ÔÓÚ´¦Àí·ÇÅ·¼¸ÀïµÃÊý¾Ý¾ßÓÐ·Ç³£ÖØÒªµÄÒâÒå¡£ÌØ±ðÊÇ£¬Ëü¿ÉÒÔÓÃÓÚ´«Í³±´Ò¶Ë¹Òò¹ûÍøÂçµÄ½âÊÍµÄ¡¢ÒÔ¶¨ÒåÉî¶ÈÉñ¾­ÍøÂç¹ØÏµ¿ÉÍÆÀíºÍÒò¹û¿É½âÊÍµÄÎÊÌâ¡£ÏÂÃæ×Ü½áºÍ¹éÄÉÁËÏÖÓÐµÄÍ¼Éñ¾­ÍøÂçËã·¨£¬²¢Ìá³öÁËÒ»¸öÍ¨ÓÃµÄÍ¼Éñ¾­ÍøÂç½á¹¹¡£Õâ¸öÍ¼Éñ¾­ÍøÂçµÄÍÆÀí¹ý³Ì°üÀ¨ÒÔÏÂ¼¸¸ö²½Öè¡£

(1) Í¼½ÚµãÔ¤±íÊ¾£º Í¨¹ýÍ¼Ç¶Èë(graph embedding)µÄ·½·¨¶ÔÍ¼ÖÐÃ¿¸ö½Úµã½øÐÐÇ¶Èë±íÊ¾¡£

(2) Í¼½Úµã²ÉÑù£º ¶ÔÍ¼ÖÐÃ¿¸ö½Úµã»ò½Úµã¶ÔµÄÕý¸ºÑù±¾½øÐÐ²ÉÑù¡£

(3) ×ÓÍ¼ÌáÈ¡£º ÌáÈ¡Í¼ÖÐÃ¿¸ö½ÚµãµÄÁÚ½Úµã¹¹½¨n½××ÓÍ¼£¬ÆäÖÐn±íÊ¾×ÓÍ¼°üº¬Ä¿±ê½ÚµãµÄn½×£¨Ìø£©ÁÚ½Úµã£¬´Ó¶øÐÎ³ÉÍ¨ÓÃµÄ×ÓÍ¼½á¹¹¡£

(4) ×ÓÍ¼ÌØÕ÷ÈÚºÏ£º ¶ÔÃ¿¸öÊäÈëÉñ¾­ÍøÂçµÄ×ÓÍ¼½øÐÐ¾Ö²¿»òÈ«¾ÖµÄÌØÕ÷ÌáÈ¡¡£

(5) Éú³ÉÍ¼Éñ¾­ÍøÂçºÍÑµÁ·£º ¶¨ÒåÍøÂçµÄ²ãÊýºÍÊäÈëÊä³öµÄ²ÎÊý£¬²¢¶ÔÍ¼Êý¾Ý½øÐÐÍøÂçÑµÁ·¡£

½ÓÏÂÀ´½«ÒÔ¼¸¸ö¾­µäµÄÍ¼Éñ¾­ÍøÂçÄ£ÐÍÎªÏßË÷£¬½éÉÜÍ¼Éñ¾­ÍøÂçµÄ·¢Õ¹Àú³Ì¡£

5.5.3Í¼¾í»ýÍøÂç

Í¼¾í»ýÍøÂç£¨GCN£©ÊÇÍ¼Éñ¾­ÍøÂçµÄ¡°¿ªÉ½Ö®×÷¡±£¬ËüÊ×´Î³É¹¦µØ½«¾í»ý²Ù×÷ÒýÈëÍ¼½á¹¹Êý¾Ý´¦ÀíÖÐ£¬²¢¸ø³öÁË¾ßÌåµÄÍÆµ¼¡£ÆäÖÐÉæ¼°¸´ÔÓµÄÆ×Í¼ÀíÂÛ£¬ÍÆµ¼¹ý³Ì½ÏÎª¸´ÔÓ£¬ÕâÀï²»ÔÙ½éÉÜ¡£¾¡¹ÜÍÆµ¼¹ý³Ì±È½Ï¸´ÔÓ£¬µ«×îÖÕµÄ½á¹û·Ç³£¼òµ¥Ã÷ÁË¡£GCN½«Ô­Ê¼Í¼½á¹¹µÄÊý¾ÝG=(V,E)Ó³Éäµ½Ò»¸öÐÂµÄÌØÕ÷¿Õ¼ä£º 


fG¡úf*(5ª²32)

GCNµÄ·Ö²ã´«²¥¹æÔòÈçÏÂ£º 


Hl+1=¦Ò(D¥œ-12A¥œD¥œ-12Hlwl)(5ª²33)

ÆäÖÐ£¬A¥œ=A+I£¬AÊÇÔ­Ê¼µÄÁÚ½Ó¾ØÕó£¬IÊÇµ¥Î»¾ØÕó£¬¼´¶Ô½ÇÏßÎª1£¬ÆäÓàÈ«Îª0£¬D¥œÊÇA¥œµÄ¶È¾ØÕó£¬HÊÇÃ¿Ò»²ãËùÓÐ½ÚµãµÄÌØÕ÷ÏòÁ¿¾ØÕó£¬¶ÔÓÚÊäÈë²ã¶øÑÔ£¬H0¾ÍµÈÓÚÌØÕ÷¾ØÕóX £¬¦ÒÊÇ·ÇÏßÐÔ¼¤»îº¯Êý£¬wl±íÊ¾µÄÊÇµ±Ç°¾í»ý²ã±ä»»µÄ¿ÉÑµÁ·²ÎÊý¾ØÕó¡£GCNÉÆÓÚÑ§Ï°±àÂëÍ¼µÄ½á¹¹ÐÅÏ¢£¬Òò´ËÄÜ¹»Ñ§Ï°µ½¸üÓÐÐ§µÄ½Úµã±íÊ¾£¬´Ó¶øÔÚÏÂÓÎÈÎÎñÖÐÏà½ÏÓÚ´«Í³·½·¨±íÏÖ³öÏÔÖøµÄÌáÉý¡£È»¶ø£¬GCNÒ²´æÔÚÒ»Ð©Ã÷ÏÔµÄÈ±µã¡£Ê×ÏÈ£¬GCNÐèÒª½«Õû¸öÍ¼·Åµ½ÄÚ´æºÍÏÔ´æ£¬Õâ»áµ¼ÖÂ´óÁ¿µÄÄÚ´æºÍÏÔ´æÏûºÄ£¬Òò´ËÄÑÒÔ´¦Àí´óÐÍÍ¼£» Æä´Î£¬GCNÔÚÑµÁ·Ê±£¬ÐèÒªÖªµÀÕû¸öÍ¼µÄ½á¹¹ÐÅÏ¢(°üÀ¨´ýÔ¤²âµÄ½Úµã),ÕâÔÚÄ³Ð©ÏÖÊµÈÎÎñÖÐ²¢²»¿ÉÐÐ£¬ÀýÈçÊ¹ÓÃ½ñÌìÑµÁ·µÄÍ¼Ä£ÐÍÀ´Ô¤²âÃ÷ÌìµÄÊý¾Ý£¬ÒòÎªÃ÷ÌìµÄ½ÚµãÐÅÏ¢ÊÇÎÞ·¨»ñÈ¡µÄ¡£

5.5.4GraphSAGE


ÎªÁË½â¾öGCN´æÔÚµÄÁ½¸öÈ±µã£¬ÑÐ¾¿ÈËÔ±Ìá³öÁËGraphSAGE£¨Graph Sample and Aggregate£©¡£ÔÚ½éÉÜGraphSAGEÖ®Ç°£¬ÐèÒªÏÈÁË½â¹éÄÉÊ½Ñ§Ï°(inductive learning)ºÍÖ±ÍÆÊ½Ñ§Ï°(transductive learning)¡£ÓÉÓÚÍ¼Êý¾ÝºÍÆäËûÀàÐÍÊý¾ÝÓÐËù²»Í¬£¬Í¼Êý¾ÝÖÐµÄÃ¿¸ö½Úµã¶¼¿ÉÒÔÍ¨¹ý±ßµÄ¹ØÏµÀûÓÃÆäËû½ÚµãµÄÐÅÏ¢¡£Õâ´øÀ´ÁËÒ»¸öÎÊÌâ£º µ±Ê¹ÓÃGCN½øÐÐÑµÁ·Ê±£¬ËüÊäÈëÕû¸öÍ¼£¬²¢ÔÚÊÕ¼¯ÁÚ½ÚµãÐÅÏ¢Ê±Ê¹ÓÃ²âÊÔºÍÑéÖ¤¼¯µÄÑù±¾£¬Õâ±»³ÆÎªÖ±ÍÆÊ½Ñ§Ï°¡£È»¶ø£¬´ó¶àÊý»úÆ÷Ñ§Ï°ÎÊÌâ¶¼ÊÇ¹éÄÉÊ½Ñ§Ï°£¬ÒòÎªÍ¨³£»á½«Ñù±¾¼¯·ÖÎªÑµÁ·/ÑéÖ¤/²âÊÔ£¬²¢ÇÒ½öÊ¹ÓÃÑµÁ·Ñù±¾½øÐÐÑµÁ·¡£ÕâÖÖ·½·¨µÄÓÅÊÆÔÚÓÚÄÜ¹»´¦ÀíÐÂ¼ÓÈëµÄ½Úµã£¬²¢ÀûÓÃÒÑÖª½ÚµãµÄÐÅÏ¢Éú³ÉÇ¶ÈëÏòÁ¿À´±íÊ¾Î´Öª½Úµã£¬¶øGraphSAGEÕýÊÇ²ÉÓÃÕâÖÖ·½·¨ÊµÏÖµÄ¡£GraphSAGEÊÇÒ»ÖÖ¹éÄÉÊ½Ñ§Ï°¿ò¼Ü£¬Æä¾ßÌåÊµÏÖ°üÀ¨²ÉÑù(sample)ºÍ¾ÛºÏ(aggregate)Á½¸ö²½Öè¡£ÆäÖÐ£¬²ÉÑùÖ¸µÄÊÇ´ÓÁÚ½ÚµãÖÐÈ¡µÃÑù±¾£¬¶ø¾ÛºÏÊÇÖ¸»ñÈ¡ÁÚ½ÚµãµÄÇ¶ÈëÏòÁ¿Ö®ºóÈçºÎ½«ÕâÐ©Ç¶ÈëÏòÁ¿»ã¾ÛÒÔ¸üÐÂ½Úµã×ÔÉíµÄÇ¶ÈëÏòÁ¿ÐÅÏ¢¡£Í¼5ª²29Õ¹Ê¾ÁËGraphSAGEÑ§Ï°µÄ¹ý³Ì¡£



Í¼5ª²29GraphSAGEÑ§Ï°µÄ¹ý³Ì



µÚÒ»²½£¬¶ÔÁÚ½Úµã½øÐÐ²ÉÑù£» µÚ¶þ²½£¬Ê¹ÓÃ¾ÛºÏº¯Êý¾ÛºÏÕâÐ©ÁÚ½ÚµãÐÅÏ¢ÒÔ¸üÐÂ½ÚµãµÄ±íÊ¾ÏòÁ¿£¨Ç¶Èë£©£» µÚÈý²½£¬¸ù¾Ý¸üÐÂºóµÄ½Úµã±íÊ¾Ô¤²â½ÚµãµÄ±êÇ©¡£

GraphSAGEÍ¨¹ý²ÉÑù»úÖÆ³É¹¦½â¾öÁËGCNÐèÒªÕû¸öÍ¼ÐÅÏ¢µÄÎÊÌâ£¬²¢¿Ë·þÁËGCNÑµÁ·Ê±ÄÚ´æºÍÏÔ´æ·½ÃæµÄÏÞÖÆ¡£¼´Ê¹¶ÔÓÚÎ´ÖªµÄÐÂ½Úµã£¬GraphSAGEÒ²ÄÜ¹»Ìá¹©ÓÐÐ§µÄ±íÊ¾¡£´ËÍâ£¬¸ÃÄ£ÐÍµÄ²ÎÊýÊýÁ¿ÓëÍ¼ÖÐ½Úµã¸öÊýÎÞ¹Ø£¬´Ó¶øÊ¹µÃGraphSAGEÄÜ¹»´¦Àí¸ü´óµÄÍ¼¡£È»¶ø£¬GraphSAGEÒ²´æÔÚÒ»Ð©È±µã¡£ÓÉÓÚÃ¿¸ö½Úµã¿ÉÄÜ¾ßÓÐ´óÁ¿ÁÚ½Úµã£¬GraphSAGEµÄ²ÉÑù·½·¨Î´¿¼ÂÇ²»Í¬ÁÚ½ÚµãµÄÖØÒªÐÔ²îÒì£¬Òò´ËÔÚ¾ÛºÏ¼ÆËã¹ý³ÌÖÐ£¬ÁÚ½ÚµãµÄÖØÒªÐÔÔÚ²»Í¬½Úµã¼ä¿ÉÄÜ´æÔÚ²îÒì¡£

5.5.5Í¼×¢ÒâÁ¦ÍøÂç

ÎªÁË½â¾öGraphSAGEÔÚ¾ÛºÏÁÚ½ÚµãÊ±Î´¿¼ÂÇ²»Í¬ÁÚ½ÚµãÖØÒªÐÔµÄÎÊÌâ£¬Í¼×¢ÒâÁ¦ÍøÂç(Graph Attention Networks£¬GAT)½è¼øÁËTransformerÖÐµÄ×¢ÒâÁ¦»úÖÆ¡£Èç½ñ£¬×¢ÒâÁ¦»úÖÆÒÑ¾­±»¹ã·ºÓ¦ÓÃÓÚ»ùÓÚÐòÁÐµÄÈÎÎñÖÐ£¬²¢¾ßÓÐ·Å´óÊý¾ÝÖÐ×îÖØÒª²¿·ÖÓ°ÏìµÄÓÅµã¡£ÔÚ¼ÆËãÍ¼ÖÐµÄÃ¿¸ö½ÚµãµÄ±íÊ¾Ê±£¬GAT»á¸ù¾ÝÁÚ½ÚµãÌØÕ÷µÄ²»Í¬À´ÎªÆä·ÖÅä²»Í¬µÄÈ¨Öµ¡£GATµÄÍ¼¾í»ýÔËËã¶¨ÒåÈçÏÂ£º 


hti=¦Ò¡Æj¡ÊNi¦Á(ht-1i,ht-1j)Wt-1ht-1j(5ª²34)

ÆäÖÐ£¬¦ÁÊÇÒ»¸ö×¢ÒâÁ¦º¯Êý£¬Ëü×ÔÊÊÓ¦µØ¿ØÖÆÏàÁÚ½Úµãj¶ÔÓÚ½ÚµãiµÄ¹±Ï×¡£ÎªÁËÊ¹Ä£ÐÍ¸üºÃµØÊÊÓ¦²»Í¬µÄ×Ó¿Õ¼ä£¬²¢Ìá¸ßÆäÄâºÏÄÜÁ¦£¬¸Ã·½·¨ÒýÈëÁË¶àÍ·×¢ÒâÁ¦»úÖÆ¡£ÕâÒâÎ¶×ÅÍ¬Ê±Ê¹ÓÃ¶à¸ö×Ô×¢ÒâÁ¦¼ÆËã£¬È»ºó½«¼ÆËãµÄ½á¹ûºÏ²¢(Á¬½Ó»òÕßÇóºÍ)£º 


hti=¡¬Kk=1¦Ò¡Æj¡ÊNi¦Ák(ht-1i,ht-1j)Wt-1kht-1j(5ª²35)

´ËÍâ£¬ÓÉÓÚGAT½á¹¹µÄÌØÐÔ£¬ËüÎÞÐëÊ¹ÓÃÔ¤ÏÈ¹¹½¨ºÃµÄÍ¼£¬Òò´ËGAT¼ÈÊÊÓÃÓÚÖ±ÍÆÊ½Ñ§Ï°£¬ÓÖÊÊÓÃÓÚ¹éÄÉÊ½Ñ§Ï°¡£ÑµÁ·GCNÊ±ÎÞÐëÁË½âÕû¸öÍ¼½á¹¹£¬Ö»ÐèÖªµÀÃ¿¸ö½ÚµãµÄÁÚ½Úµã¼´¿É¡£


²Î¿¼ÎÄÏ×


£Û1£ÝBEN¦PTEZ J M,CASTRO J L,REQUENA I.Are artificial neural networks black boxes?£ÛJ£Ý.IEEE Transactions on Neural Networks,1997,8(5): 1156ª²1164.

£Û2£ÝSIMON H.Neural networks: a comprehensive foundation£ÛM£Ý.Upper Saddle River: Prentice Hall,1998.

£Û3£ÝSHARMA V,RAI S,D A.A comprehensive study of artificial neural networks£ÛJ£Ý.International Journal of Advanced Research in Computer Science and Software Engineering,2012,2(10): 278ª²284.

£Û4£ÝMCCULLOCH W S,PITTS W.A logical calculus of the ideas immanent in nervous activity£ÛJ£Ý.The Bulletin of Mathematical Biophysics,1943,5: 115ª²133.

£Û5£ÝEMILE A,KORST J.Simulated annealing and Boltzmann machines: a stochastic approach to combinatorial optimization and neural computing£ÛM£Ý.New York: John Wiley and Sons,Inc.,1989.

£Û6£ÝGERALD M,ELROD D W,TRENARY R G.Computational neural networks as modelª²free mapping devices£ÛJ£Ý.Journal of Chemical Information and Computer Sciences,1992,32(6): 732ª²741.

£Û7£ÝSVOZIL D,KVASNICKA V,POSPICHAL J.Introduction to multiª²layer feedª²forward neural networks£ÛJ£Ý.Chemometrics and Intelligent Laboratory Systems,1997,39(1): 43ª²62.

£Û8£ÝLECUN Y,BENGIO Y,HINTON G.Deep learning£ÛJ£Ý.Nature,2015,521(7553): 436ª²444.

£Û9£ÝWERBOS P.New tools for prediction and analysis in the behavioral science£ÛD£Ý.Cambridge: Harvard University,1974.

£Û10£ÝMIKOLOV T,SUTSKEVER I£¬CHEN K,et al.Efficient estimation of word representations in vector space£ÛC£Ý.Proceedings of International Conference on Learning Representations,2013.

£Û11£ÝDEVLIN K J,CHANG M W,TOUTANOVA L K.Bert: preª²training of deep bidirectional transformers for language understanding£ÛC£Ý.Proceedings of Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies,2019,1: 4171ª²4186.

£Û12£ÝO¡¯SHEA K,NASH R.An introduction to convolutional neural networks£ÛJ£Ý.arXiv,2015.

£Û13£ÝHUBEL D H,WIESEL T N.Receptive fields and functional architecture of monkey striate cortex£ÛJ£Ý.The Journal of physiology,1968,195(1): 215ª²243.

£Û14£ÝLECUN Y,BOSER B,DENKER J S,et al.Backpropagation applied to handwritten zip code recognition£ÛJ£Ý.Neural computation,1989,1(4): 541ª²551.

£Û15£ÝLECUN Y,BOTTOU L,BENGIO Y,et al.Gradientª²based learning applied to document recognition£ÛC£Ý.Proceedings of the IEEE,1998,86(11): 2278ª²2324.

£Û16£ÝZEILER M D,ROB F.Visualizing and understanding convolutional networks£ÛC£Ý.Proceedings of European Conference on Computer Vision,2014,13: 818ª²833.

£Û17£ÝHOCHREITER S.SCHMIDHUBER J.Long shortª²term memory£ÛJ£Ý.Neural Computation,1997,9(8): 1735ª²1780.

£Û18£ÝCHUNG J,GULCEHRE C,CHO K,et al.Empirical evaluation of gated recurrent neural networks on sequence modeling£ÛC£Ý.In Conference and Workshop on Neural Information Processing Systems Workshop on Deep Learning,2014.

£Û19£ÝMATTHEW E P,MARK N,MOHIT I,et al.Deep contextualized word representations£ÛC£Ý.Proceedings of the Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies,2018,1: 2227ª²2237.

£Û20£ÝPENNINGTON J,SOCHER R,MANNING C D.Glove: global vectors for word representation£ÛC£Ý.Proceedings of the Conference on Empirical Methods in Natural Language Processing,2014: 1532ª²1543.

£Û21£ÝZHOU J,CUI G,HU S,et al.Graph neural networks: A review of methods and applications£ÛJ£Ý.AI open,2020,1: 57ª²81.

£Û22£ÝWU Z,PAN S,CHEN F,et al.A comprehensive survey on graph neural networks£ÛJ£Ý.IEEE Transactions on Neural Networks and Learning Systems,2020,32(1): 4ª²24.

£Û23£ÝZHANG Z,CUI P,ZHU W.Deep learning on graphs: a survey£ÛJ£Ý.IEEE Transactions on Knowledge and Data Engineering,2020,34(1): 249ª²270.

£Û24£ÝKIPF T N,WELLING M.Semiª²supervised classification with graph convolutional networks£ÛC£Ý.Proceedings of the International Conference on Learning Representations,2016.

£Û25£ÝHAMILTON W,YING Z,LESKOVEC J.Inductive representation learning on large graphs£ÛC£Ý.Advances in Neural Information Processing Systems,2017,1ª²11.

£Û26£ÝVELICKOVIC P,CUCURULL G,CASANOVA A,et al.Graph attention networks£ÛC£Ý.Proceedings of the International Conference on Learning Representations,2018,1ª²12.

£Û27£ÝVASWANI A,SHAZEER N,PARMAR N,et al.Attention is all you need£ÛC£Ý.Advances in Neural Information Processing Systems,2017,1ª²11.