µÚ5ÕÂ·ÖÀàÓë¾í»ýÉñ¾­ÍøÂç




·ÖÀà¾ÍÊÇ½«Ä³¸öÊÂÎïÅÐ¶¨ÎªÊôÓÚÔ¤ÏÈÉè¶¨µÄÓÐÏÞ¸ö¼¯ºÏÖÐµÄÄ³Ò»¸öµÄ¹ý³Ì¡£ÔÚÈÕ³£Éú»îÖÐ¾­³£·ÖÀà£¬±ÈÈç´ÓÔ¶´¦¹Û²ìÅÐ¶ÏÄ³ÈËµÄÐÔ±ð¡£·ÖÀàÊÇ»úÆ÷Ñ§Ï°ÖÐÓ¦ÓÃ×îÎª¹ã·ºµÄÈÎÎñ¡£·ÖÀàÎÊÌâ°üÀ¨¶þ·ÖÀàÎÊÌâºÍ¶à·ÖÀàÎÊÌâ¡£·ÖÀàÈÎÎñÖÐÑù±¾µÄÀà±ðÊÇÔ¤ÏÈÉè¶¨µÄ¡£·ÖÀàÊÇ¼à¶½Ñ§Ï°¡£
±¾ÕÂ·Ö±ðÌÖÂÛ¾ö²ßº¯Êý·ÖÀàÄ£ÐÍ¡¢¸ÅÂÊ·ÖÀàÄ£ÐÍºÍÉñ¾­ÍøÂç·ÖÀàÄ£ÐÍÖÐµÄ³£ÓÃÄ£ÐÍ¡£¾ö²ßº¯Êý·ÖÀàÄ£ÐÍÖÐ£¬ÌÖÂÛ¾ö²ßÊ÷ÓëËæ»úÉ­ÁÖÄ£ÐÍ¡£¸ÅÂÊ·ÖÀàÄ£ÐÍÖÐ£¬ÌÖÂÛÆÓËØ±´Ò¶Ë¹·ÖÀàÄ£ÐÍ¡£Éñ¾­ÍøÂç·ÖÀàÄ£ÐÍÖÐ£¬ÌÖÂÛÈ«Á¬½Ó²ãÉñ¾­ÍøÂçÓë¾í»ýÉñ¾­ÍøÂç¼°ÆäÔÚ·ÖÀàÖÐµÄÓ¦ÓÃ¡£
±¾ÕÂ»ùÓÚMindSporeºÍTensorFlow 2Éî¶ÈÑ§Ï°¿ò¼Ü£¬¶ÔÎó²î·´Ïò´«²¥Ñ§Ï°Ëã·¨¡¢¼¤»îº¯Êý¡¢ËðÊ§º¯ÊýºÍÓÅ»¯·½·¨µÈ¶à²ãÉñ¾­ÍøÂçµÄ»ù´¡ÖªÊ¶ÒÔ¼°¾í»ý²ã¡¢³Ø»¯²ã¡¢Åú±ê×¼»¯²ãµÈ¾í»ýÉñ¾­ÍøÂç»ù±¾×é³Éµ¥Ôª½øÐÐÌÖÂÛ¡£
5.1·ÖÀàËã·¨»ù´¡
±¾½ÚÌÖÂÛÒ»°ãÐÔµÄ·ÖÀàÈÎÎñÒÔ¼°·ÖÀàËã·¨µÄÆÀ¼ÛÖ¸±êµÈ»ù´¡ÖªÊ¶¡£
5.1.1·ÖÀàÈÎÎñ
·ÖÀàÈÎÎñµÄÄ¿±êÊÇ¸øÎ´±ê¼ÇµÄ²âÊÔÑù±¾½øÐÐ±ê¼Ç¡£Óë¾ÛÀà²»Í¬µÄÊÇ£¬·ÖÀàÈÎÎñµÄÑµÁ·Ñù±¾ÒÑ¾­»®·ÖÎªÈô¸É¸ö×Ó¼¯ÁË£¬Ã¿¸ö×Ó¼¯³ÆÎª¡°Àà¡±£¬ÓÃÀà±ð±êÇ©À´Çø·Ö¡£Óë»Ø¹é²»Í¬µÄÊÇ£¬·ÖÀàÈÎÎñµÄ±êÇ©ÊýÁ¿ÊÇÓÐÏÞµÄ¡£
ÉèÑù±¾¼¯S={s1,s2,¡­,sm}°üº¬m¸öÑù±¾£¬Ñù±¾si=(xi,yi)°üÀ¨Ò»¸öÊµÀýxiºÍÒ»¸ö±êÇ©yi£¬ÊµÀýÓÉnÎ¬ÌØÕ÷ÏòÁ¿±íÊ¾£¬¼´xi=(x(1)i,x(2)i,¡­,x(n)i)¡£·ÖÀàÈÎÎñ¿É·ÖÎªÑ§Ï°¹ý³ÌºÍÅÐ±ð(Ô¤²â)¹ý³Ì£¬ÈçÍ¼5ª²1ËùÊ¾¡£



Í¼5ª²1·ÖÀàÈÎÎñµÄÄ£ÐÍ

ÔÚÑ§Ï°¹ý³Ì£¬·ÖÀàÈÎÎñ½«Ñù±¾¼¯ÖÐµÄÖªÊ¶ÌáÁ¶³öÀ´£¬ÐÎ³ÉÄ£ÐÍ¡£Íê³É·ÖÀàÈÎÎñµÄÄ£ÐÍÓÐ¾ö²ßº¯ÊýÄ£ÐÍ¡¢¸ÅÂÊÄ£ÐÍºÍÉñ¾­ÍøÂçÄ£ÐÍµÈ¡£
¾ö²ßº¯Êý·ÖÀàÄ£ÐÍ½¨Á¢ÁË´ÓÊµÀýÌØÕ÷ÏòÁ¿µ½Àà±ð±êÇ©µÄÓ³ÉäY=f(X)£¬ÆäÖÐ£¬XÊÇ¶¨ÒåÓò£¬ËüÊÇËùÓÐÊµÀýÌØÕ÷ÏòÁ¿µÄ¼¯ºÏ£»  YÊÇÖµÓò£¬ËüÊÇËùÓÐÀà±ð±êÇ©µÄ¼¯ºÏ¡£
¸ÅÂÊ·ÖÀàÄ£ÐÍ½¨Á¢ÁËÌõ¼þ¸ÅÂÊ·Ö²¼º¯ÊýP^(Y|X)£¬Ëü·´Ó³ÁË´ÓÊµÀýÌØÕ÷ÏòÁ¿µ½Àà±ð±êÇ©µÄ¸ÅÂÊÓ³Éä¡£
Éñ¾­ÍøÂç·ÖÀàÄ£ÐÍ½¨Á¢ÁËÄÜÕýÈ··´Ó³ÊµÀýÌØÕ÷ÏòÁ¿ÓëÀà±ð±êÇ©¹ØÏµµÄÉñ¾­ÍøÂçN(S,W)¡£
¼Ç²âÊÔÑù±¾Îªx=(x(1),x(2),¡­,x(n))¡£ÔÚÅÐ±ð¹ý³ÌÖÐ£¬¾ö²ßº¯Êý·ÖÀàÄ£ÐÍÒÀ¾Ý¾ö²ßº¯ÊýY=f(X)¸øÓè²âÊÔÑù±¾xÒ»¸öÀà±êÇ©y^£» ¸ÅÂÊ·ÖÀàÄ£ÐÍÒÀ¾ÝÌõ¼þ¸ÅÂÊP^(Y|X)¼ÆËãÔÚ¸ø¶¨xÊ±È¡Ã¿Ò»¸öÀà±êÇ©y^µÄÌõ¼þ¸ÅÂÊÖµ£¬È¡×î´óÖµ¶ÔÓ¦µÄy^×÷ÎªÊä³ö£» Éñ¾­ÍøÂç·ÖÀàÄ£ÐÍ½«xÀ¡ÈëÒÑ¾­ÑµÁ·ºÃµÄÍøÂçN(S,W)£¬´ÓÊä³öµÃµ½Àà±êÇ©y^¡£
Èç¹ûÖµÓòÖ»ÓÐÁ½¸öÖµ£¬Ôò¸ÃÄ£ÐÍÊÇ¶þ·ÖÀàµÄ£»  Èç¹û¶àÓÚÁ½¸öÖµ£¬Ôò¸ÃÄ£ÐÍÊÇ¶à·ÖÀàµÄ¡£
5.1.2·ÖÀàÄ£ÐÍµÄÆÀ¼ÛÖ¸±ê
±¾½ÚÖ÷ÒªÌÖÂÛ¶þ·ÖÀàÄ£ÐÍµÄÆÀ¼ÛÖ¸±ê£¬ËüÃÇÖÐµÄ´ó²¿·Ö¿ÉÒÔÈÝÒ×µØÀ©Õ¹µ½¶à·ÖÀàÈÎÎñ¡£
1. ×¼È·ÂÊ
×¼È·ÂÊ(Accuracy)ÊÇÖ¸ÔÚ·ÖÀàÖÐ£¬ÓÃÄ£ÐÍ¶Ô²âÊÔ¼¯½øÐÐ·ÖÀà£¬·ÖÀàÕýÈ·µÄÑù±¾ÊýÕ¼×ÜÊýµÄ±ÈÀý£º 
accuracy=ncorrectntotal(5ª²1)
sklearnyÀ©Õ¹¿âÖÐÌá¹©ÁËÒ»¸ö×¨ÃÅ¶ÔÄ£ÐÍ½øÐÐÆÀ¹ÀµÄ°ümetrics£¬¸Ã°ü¿ÉÒÔÂú×ãÒ»°ãµÄÄ£ÐÍÆÀ¹ÀÐèÇó¡£°üÖÐÌá¹©ÁË×¼È·ÂÊ¼ÆËãº¯Êý£¬º¯ÊýÔ­ÐÍÎª£º sklearn.metrics.accuracy_score(y_true,y_pred,normalize=True,sample_weight=None)¡£ÆäÖÐ£¬normalizeÄ¬ÈÏÖµÎªTrue£¬·µ»ØÕýÈ··ÖÀàµÄ±ÈÀý£» Èç¹ûÉèÎªFalse£¬Ôò·µ»ØÕýÈ··ÖÀàµÄÑù±¾Êý¡£
2. »ìÏý¾ØÕó
»ìÏý¾ØÕó(Confusion Matrix)ÊÇ¶Ô·ÖÀàµÄ½á¹û½øÐÐÏêÏ¸ÃèÊöµÄ¾ØÕó£¬¶ÔÓÚ¶þ·ÖÀàÔòÊÇÒ»¸ö2¡Á2µÄ¾ØÕó£¬¶ÔÓÚn·ÖÀàÔòÊÇn¡ÁnµÄ¾ØÕó¡£¶þ·ÖÀàµÄ»ìÏý¾ØÕó£¬Èç±í5ª²1ËùÊ¾£¬µÚÒ»ÐÐÊÇÕæÊµÀà±ðÎª¡°Õý(Positive)¡±µÄÑù±¾Êý£¬µÚ¶þÐÐÔòÊÇÕæÊµÀà±ðÎª¡°¸º(Negative)¡±µÄÑù±¾Êý£¬µÚÒ»ÁÐÊÇÔ¤²âÖµÎª¡°Õý¡±µÄÑù±¾Êý£¬µÚ¶þÁÐÔòÊÇÔ¤²âÖµÎª¡°¸º¡±µÄÑù±¾Êý¡£


±í5ª²1¶þ·ÖÀàµÄ»ìÏý¾ØÕó



Ô¤²âÎª¡°Õý¡±µÄÑù±¾ÊýÔ¤²âÎª¡°¸º¡±µÄÑù±¾Êý

±êÇ©Îª¡°Õý¡±µÄÑù±¾ÊýTrue Positive(TP)False Negative(FN)

±êÇ©Îª¡°¸º¡±µÄÑù±¾ÊýFalse Positive(FP)True Negative(TN)

±í5ª²1ÖÐTP±íÊ¾ÕæÕý£¬¼´±»Ëã·¨·ÖÀàÕýÈ·µÄÕýÑù±¾£» FN±íÊ¾¼ÙÕý£¬¼´±»Ëã·¨·ÖÀà´íÎóµÄÕýÑù±¾£» FP±íÊ¾¼Ù¸º£¬¼´±»Ëã·¨·ÖÀà´íÎóµÄ¸ºÑù±¾£» TN±íÊ¾Õæ¸º£¬¼´±»Ëã·¨·ÖÀàÕýÈ·µÄ¸ºÑù±¾¡£
sklearn.metricsÖÐ¼ÆËã»ìÏý¾ØÕóµÄº¯ÊýÎªconfusion_matrix¡£
¿ÉÒÔÓÉ»ìÏý¾ØÕó¼ÆËã³ö×¼È·ÂÊaccuracy£º 
accuracy=TP+TNTP+FP+FN+TN(5ª²2)
3. Æ½¾ù×¼È·ÂÊ
×¼È·ÂÊÖ¸±êËäÈ»¼òµ¥¡¢Ò×¶®£¬µ«ËüÃ»ÓÐ¶Ô²»Í¬Àà±ð½øÐÐÇø·Ö¡£²»Í¬Àà±ðÏÂ·ÖÀà´íÎóµÄ´ú¼Û¿ÉÄÜ²»Í¬£¬ÀýÈçÔÚÖØ´ó²¡»¼Õï¶ÏÖÐ£¬Â©Õï(False Negative)¿ÉÄÜÒª±ÈÎóÕï(False Positive)¸øÖÎÁÆ´øÀ´¸üÎªÑÏÖØµÄºó¹û£¬´ËÊ±×¼È·ÂÊ¾Í²»×ãÒÔ·´Ó³Ô¤²âµÄÐ§¹û¡£Èç¹ûÑù±¾Àà±ð·Ö²¼²»Æ½ºâ(¼´ÓÐµÄÀà±ðÏÂµÄÑù±¾¹ý¶à£¬ÓÐµÄÀà±ðÏÂµÄÑù±¾¸öÊý¹ýÉÙ)£¬×¼È·ÂÊÒ²ÄÑÒÔ·´Ó³ÕæÊµÔ¤²âÐ§¹û¡£ÈçÔÚÀà±ðÑù±¾ÊýÁ¿²î±ð¼«¶Ë²»Æ½ºâÊ±£¬Ö»ÐèÒª½«È«²¿ÊµÀýÔ¤²âÎª¶àµÄÄÇÀà£¬¾Í¿ÉÒÔÈ¡µÃºÜ¸ßµÄ×¼È·ÂÊ¡£
Æ½¾ù×¼È·ÂÊ(Average Perª²class Accuracy)µÄÈ«³ÆÎª£º °´ÀàÆ½¾ù×¼È·ÂÊ£¬¼´¼ÆËãÃ¿¸öÀà±ðµÄ×¼È·ÂÊ£¬È»ºóÔÙ¼ÆËãËüÃÇµÄÆ½¾ùÖµ¡£
Æ½¾ù×¼È·ÂÊÒ²¿ÉÒÔÍ¨¹ý»ìÏý¾ØÕóÀ´¼ÆËã£º 
average_accuracy=TPTP+FN+TNFP+TN2(5ª²3)
ÔÚÑù±¾Àà±ð·Ö²¼²»Æ½ºâµÄÆÀ¼ÛÎÊÌâÉÏ£¬ÓÐÒ»¸ö³ÆÎªAUC(Area Under the Curve)µÄÆÀ¼ÛÖ¸±êµÃµ½ÁË¹ã·ºÓ¦ÓÃ£¬ÓÐÐèÒªµÄ¶ÁÕß¿É²Î¿¼Ô­°æÊé¡£
4. ¾«È·ÂÊª²ÕÙ»ØÂÊ
¾«È·ÂÊª²ÕÙ»ØÂÊ(Precisionª²Recall)°üº¬Á½¸öÆÀ¼ÛÖ¸±ê£¬Ò»°ãÍ¬Ê±Ê¹ÓÃ¡£¾«È·ÂÊÊÇÖ¸·ÖÀàÆ÷·ÖÀàÕýÈ·µÄÕý£¨¸º£©Ñù±¾µÄ¸öÊýÕ¼¸Ã·ÖÀàÆ÷ËùÓÐ·ÖÀàÎªÕý(¸º)Ñù±¾¸öÊýµÄ±ÈÀý¡£ÕÙ»ØÂÊÊÇÖ¸·ÖÀàÆ÷·ÖÀàÕýÈ·µÄÕý(¸º£©Ñù±¾¸öÊýÕ¼ËùÓÐµÄÕý(¸º)Ñù±¾¸öÊýµÄ±ÈÀý¡£
¾«È·ÂÊÊÇ´ÓÔ¤²âµÄ½Ç¶ÈÀ´¿´µÄ£¬¼´Ô¤²âÎªÕý(¸º)µÄÑù±¾ÖÐ£¬Ô¤²â³É¹¦µÄ±ÈÀý¡£ÕÙ»ØÂÊÊÇ´ÓÑù±¾µÄ½Ç¶ÈÀ´¿´µÄ£¬¼´Êµ¼Ê±êÇ©ÎªÕý(¸º)µÄÑù±¾ÖÐ£¬±»³É¹¦Ô¤²âµÄ±ÈÀý¡£×¼È·ÂÊÒ²ÊÇ´ÓÑù±¾µÄ½Ç¶ÈÀ´¿´µÄ£¬¼´ËùÓÐÑù±¾ÖÐ£¬ÕýÈ·Ô¤²âµÄ±ÈÀý¡£ÓëÕÙ»ØÂÊ²»Í¬£¬×¼È·ÂÊÊÇ²»·ÖÀà±ðµÄ¡£
ÔÚ»ìÏý¾ØÕóÖÐ£¬Ô¤²âÎªÕýµÄÑù±¾µÄ¾«È·ÂÊÎª£º 
precisionPositive=TPTP+FP(5ª²4)	
Ô¤²âÎª¸ºµÄÑù±¾µÄ¾«È·ÂÊÎª£º 
precisionNegative=TNTN+FN(5ª²5)
ÕæÊµÕýÑù±¾µÄÕÙ»ØÂÊÎª£º 
recallPositive=TPTP+FN=TPR(5ª²6)
ÕæÊµ¸ºÑù±¾µÄÕÙ»ØÂÊÎª£º 
recallNegative=TNTN+FP=TNR(5ª²7)
5. F1ª²score
¾«È·ÂÊÓëÕÙ»ØÂÊÊµ¼ÊÉÏÊÇÒ»¶ÔÃ¬¶ÜµÄÖµ£¬ÓÐÊ±ºòµ¥¶À²ÉÓÃÒ»¸öÖµÄÑÒÔÈ«ÃæºâÁ¿Ëã·¨£¬F1ª²scoreÊÔÍ¼½«Á½Õß½áºÏÆðÀ´×÷ÎªÒ»¸öÖ¸±êÀ´ºâÁ¿Ëã·¨¡£F1ª²scoreÎª¾«È·ÂÊÓëÕÙ»ØÂÊµÄµ÷ºÍÆ½¾ùÖµ£¬¼´£º 
F1=2¡Áprecision¡Árecallprecision+recall(5ª²8)
»¹¿ÉÒÔ¸ø¾«È·ÂÊºÍÕÙ»ØÂÊ¼ÓÈ¨ÖØÏµÊýÀ´Çø±ðÁ½ÕßµÄÖØÒªÐÔ£¬½«F1ª²scoreÀ©Õ¹ÎªF¦Âª²score£º 
F¦Â=(1+¦Â2)precision¡Árecall(¦Â2¡Áprecision)+recall(5ª²9)
ÆäÖÐ£¬¦Â±íÊ¾ÕÙ»ØÂÊ±È¾«È·ÂÊµÄÖØÒª³Ì¶È£¬³ýÁË1Ö®Íâ£¬³£È¡2»ò0.5£¬·Ö±ð±íÊ¾ÕÙ»ØÂÊµÄÖØÒª³Ì¶ÈÊÇ¾«È·ÂÊµÄ2±¶»òÒ»°ë¡£
sklearn.metrics°üÖÐÌá¹©ÁË¼ÆËãF1ª²scoreºÍF¦Âª²scoreµÄº¯Êý£¬¿ÉÔÚÐèÒªÊ±µ÷ÓÃ¡£


ÊÓÆµ½²½â


5.2¾ö²ßÊ÷ÓëËæ»úÉ­ÁÖ
¾ö²ßÊ÷(Decision Tree)ÊÇ³£ÓÃµÄ·ÖÀà·½·¨£¬ÒÔËüÎª»ù´¡µÄËæ»úÉ­ÁÖ(Random Forests£¬RF)ÔÚ´ó¶àÊýÓ¦ÓÃÇé¾°ÖÐ¶¼±íÏÖ½ÏºÃ¡£
5.2.1¾ö²ßÊ÷»ù±¾Ë¼Ïë
¾ö²ßÊ÷µÄ»ù±¾Ë¼ÏëºÜÈÝÒ×Àí½â£¬ÔÚÉú»îÖÐÈËÃÇ¾­³£Ó¦ÓÃ¾ö²ßÊ÷µÄË¼ÏëÀ´×ö¾ö¶¨£¬Ä³ÏàÇ×¾ö²ß¹ý³ÌÈçÍ¼5ª²2ËùÊ¾¡£


Í¼5ª²2Ä³ÏàÇ×¾ö²ß¹ý³Ì


·ÖÀàµÄ½¨Ä£¹ý³ÌÓëÉÏÃæ×ö¾ö¶¨µÄ¹ý³ÌÏà·´£¬ÓÉÓÚÊÂÏÈ²»ÖªµÀÈËÃÇµÄ¾ö²ßË¼Â·£¬ÐèÒªÍ¨¹ýÈËÃÇÒÑ¾­×ö³öµÄ´óÁ¿¾ö¶¨À´¡°´§Ä¦¡±³öÆä¾ö²ßË¼Â·£¬Ò²¾ÍÊÇÍ¨¹ý´óÁ¿Êý¾ÝÀ´¹éÄÉµÀÀí£¬ÈçÍ¨¹ýÈç±í5ª²2ËùÊ¾µÄÏàÇ×Êý¾ÝÀ´·ÖÎöÄ³ÈËµÄÏàÇ×¾ö²ßÌõ¼þ¡£


±í5ª²2Ä³ÈËÏàÇ×Êý¾Ý



±àºÅÄêÁä/ËêÉí¸ß/cmÑ§ÀúÔÂÐ½/ÔªÊÇ·ñÏàÇ×

135176±¾¿Æ20000·ñ

228178Ë¶Ê¿10000ÊÇ

326172±¾¿Æ25000·ñ

429173²©Ê¿20000ÊÇ

528174±¾¿Æ15000ÊÇ

µ±Ó°Ïì¾ö²ßµÄÒòËØ½ÏÉÙÊ±£¬ÈËÃÇ¿ÉÒÔÖ±¹ÛµØ´Ó±í5ª²2ËùÊ¾µÄÊý¾Ý(¼´ÑµÁ·Ñù±¾)ÖÐÍÆ²â³öÈçÍ¼5ª²2ËùÊ¾µÄÏàÇ×¾ö²ßË¼Â·£¬´Ó¶øÁË½â´ËÈËµÄÏë·¨£¬¸üÓÐÄ¿±êµØ¸øËûÍÆ¼öÏàÇ×¶ÔÏó¡£
µ±Ñù±¾ºÍÌØÕ÷ÊýÁ¿½Ï¶àÊ±£¬ÇÒÑµÁ·Ñù±¾¿ÉÄÜ³öÏÖ³åÍ»£¬ÈË¾ÍÄÑÒÔÊ¤ÈÎ½¨Á¢Ä£ÐÍµÄÈÎÎñ¡£´ËÊ±£¬Ò»°ãÒª°´Ò»¶¨Ëã·¨ÓÉ¼ÆËã»úÀ´×Ô¶¯Íê³É¹éÄÉ£¬´Ó¶ø½¨Á¢Æð¿ÉÓÃÀ´Ô¤²âµÄÄ£ÐÍ£¬²¢ÓÃ¸ÃÄ£ÐÍÀ´Ô¤²â²âÊÔÑù±¾£¬´Ó¶øÉ¸Ñ¡ÏàÇ×¶ÔÏó¡£



Í¼5ª²3¾ö²ßÊ÷Ê¾Àý1

¾ö²ßÊ÷Ä£ÐÍÊÇÒ»ÖÖ¶Ô²âÊÔÑù±¾½øÐÐ·ÖÀàµÄÊ÷ÐÎ½á¹¹£¬¸Ã½á¹¹ÓÉ½Úµã(Node)ºÍÓÐÏò±ß(Directed Edge)×é³É£¬½Úµã·ÖÎªÄÚ²¿½Úµã(Internal Node)ºÍÒ¶½Úµã(Leaf Node)Á½Àà¡£ÄÚ²¿½Úµã±íÊ¾¶Ô²âÊÔÑù±¾µÄÒ»¸öÌØÕ÷½øÐÐ²âÊÔ£¬ÄÚ²¿½ÚµãÏÂÃæµÄ·ÖÖ§±íÊ¾¸ÃÌØÕ÷²âÊÔµÄÊä³ö¡£Èç¹ûÖ»¶ÔÌØÕ÷µÄÒ»¸ö¾ßÌåÖµ½øÐÐ²âÊÔ£¬ÄÇÃ´½«Ö»ÓÐÕý(´óÓÚ»òµÈÓÚ)»ò¸º(Ð¡ÓÚ)2¸öÊä³ö£¬¿ÉÒÔÉú³É¶þ²æÊ÷¡£±¾ÊéÖÐ£¬¶þ²æÊ÷µÄ×ó×ÓÊ÷Ä¬ÈÏ±íÊ¾²âÊÔÎª¸ºµÄÊä³ö£¬ÓÒ×ÓÊ÷Ä¬ÈÏ±íÊ¾²âÊÔÎªÕýµÄÊä³ö¡£Èç¹û¶ÔÌØÕ÷µÄ¶à¸ö¾ßÌåÖµ½øÐÐ²âÊÔ£¬ÄÇÃ´½«²úÉú¶à¸öÊä³ö£¬¿ÉÒÔÉú³É¶à²æÊ÷¡£Ò¶½Úµã±íÊ¾Ñù±¾µÄÒ»¸ö·ÖÀà£¬Èç¹ûÑù±¾Ö»ÓÐÁ½¸ö·ÖÀàÀà±ð£¬ÄÇÃ´¸ÃÄ£ÐÍÊÇ¶þ·ÖÀàÄ£ÐÍ£¬·ñÔòÊÇ¶à·ÖÀàÄ£ÐÍ¡£
ÓÃÔ²µã±íÊ¾ÄÚ²¿½Úµã£¬ÓÃ·½¿é±íÊ¾Ò¶½Úµã£¬¿É½«Í¼5ª²2ËùÊ¾µÄ¾ö²ß¹ý³Ì±íÊ¾Îª¾ö²ßÊ÷Ä£ÐÍ£¬ÈçÍ¼5ª²3ËùÊ¾¡£ÔÚ¸Ã¾ö²ßÊ÷Ä£ÐÍÖÐ£¬Ã¿¸öÄÚ²¿½ÚµãµÄÊä³öÖ»ÓÐÁ½¸ö·ÖÖ§£¬Òò´ËËüÊÇ¶þ²æÊ÷Ä£ÐÍ£¬Í¬Ê±£¬Ò¶½ÚµãÖ»ÓÐÕý¡¢¸ºÁ½Àà£¬·Ö±ð±íÊ¾ÏàÇ×ºÍ²»ÏàÇ×Á½ÖÖÇé¿ö£¬Òò´ËËüÊÇ¶þ·ÖÀàÄ£ÐÍ¡£Í¼ÖÐ·Ö±ðÓÃ¿ÕÐÄºÍÊµÐÄµÄ·½¿é±íÊ¾ÏàÇ×ºÍ²»ÏàÇ×Á½Àà½á¹û¡£
Í¼5ª²3ÖÐ£¬×î¸ßµÄÄÚ²¿½Úµã(¸ù½Úµã)±íÊ¾¶ÔÄêÁäÌØÕ÷ÊÇ·ñ´óÓÚ30Ëê½øÐÐ²âÊÔ£¬×ó×ÓÊ÷±íÊ¾ÄêÁäÐ¡ÓÚ30ËêµÄÊä³ö£¬ÓÒ×ÓÊ÷±íÊ¾ÄêÁä´óÓÚ»òµÈÓÚ30ËêµÄÊä³ö¡£ÖµµÃ×¢ÒâµÄÊÇ£¬Ò»¸öÌØÕ÷¿ÉÒÔÔÚÊ÷µÄ¶à¸ö²»Í¬·ÖÖ§³öÏÖ£¬Èç¹ûÔÚÉí¸ß³¬¹ý175cmºó£¬»¹Òª¿¼²ìÔÂÐ½ÊÇ·ñ³¬¹ý8000ÔªÌõ¼þÊ±£¬Ôò¾ö²ß¹ý³Ì¿ÉÒÔ±íÊ¾ÎªÈçÍ¼5ª²4ËùÊ¾µÄÄ£ÐÍ¡£
¶ÔÓÚ±í5ª²2ËùÊ¾µÄÏàÇ×Êý¾Ý£¬»¹¿ÉÒÔ¹éÄÉ³ÉÍ¼5ª²5ËùÊ¾µÄ¶þ²æ¾ö²ßÊ÷¡£



Í¼5ª²4¾ö²ßÊ÷Ê¾Àý2




Í¼5ª²5¾ö²ßÊ÷Ê¾Àý3



¾Í±í5ª²2ÖÐµÄÑµÁ·Êý¾Ý¶øÑÔ£¬Í¼5ª²3ºÍÍ¼5ª²5ËùÊ¾µÄ¶þ²æ¾ö²ßÊ÷ÄÜÆðµ½ÍêÈ«ÏàÍ¬µÄÇø·ÖÐ§¹û¡£µ«ÊÇ£¬Í¼5ª²5ËùÊ¾µÄ¶þ²æ¾ö²ßÊ÷Ö»ÓÃÁËÁ½¸öÌØÕ÷¼°ÏàÓ¦µÄ¾ö²ßÖµ¾Í´ïµ½ÁËÏàÍ¬µÄÐ§¹û£¬ÔÚ½øÐÐÔ¤²âµÄÊ±ºò£¬ÏÔÈ»Òª¼òµ¥¡¢¸ßÐ§µÃ¶à¡£¸ÃÀý×ÓËµÃ÷£¬ÔÚÉú³É¾ö²ßÊ÷Ê±£¬Ñ¡ÔñºÏÊÊµÄÌØÕ÷¼°Æä¾ö²ßÖµÊÇ·Ç³£ÖØÒªµÄ¡£
Ê¹ÓÃ¾ö²ßÊ÷½øÐÐ¾ö²ßµÄ¹ý³ÌÊÇ´Ó¸ù½Úµã¿ªÊ¼£¬ÒÀ´Î²âÊÔÑù±¾ÏàÓ¦µÄÌØÕ÷£¬²¢°´ÕÕÆäÖµÑ¡ÔñÊä³ö·ÖÖ§£¬Ö±µ½µ½´ïÒ¶×Ó½Úµã£¬È»ºó½«Ò¶×Ó½Úµã´æ·ÅµÄÀà±ð×÷Îª¾ö²ß½á¹û¡£Èç¶ÔÄêÁäÎª27Ëê¡¢Éí¸ßÎª176cm¡¢Ñ§ÀúÎª±¾¿Æ¡¢ÔÂÐ½Îª25000ÔªµÄ¶ÔÏó£¬ÒÀ¾ÝÍ¼5ª²3ËùÊ¾µÄÄ£ÐÍ£¬ÏÈ²âÊÔ¸ù½ÚµãÄêÁäÌØÕ÷£¬Ð¡ÓÚ30Ëê£¬ÑØ×ó×ÓÊ÷¼ÌÐø²âÊÔ£¬Éí¸ß´óÓÚ175cm£¬×ßÓÒ×ÓÊ÷£¬µ½´ïÒ¶½Úµã£¬µÃ³öÏàÇ×µÄ¾ö²ß½áÂÛ¡£
5.2.2¾ö²ßÊ÷½¨Á¢ÓëÓ¦ÓÃ
¾ö²ßÊ÷Ëã·¨Ò»°ã²ÉÓÃµÝ¹é·½Ê½½¨Ê÷¡£
½¨Á¢¶þ²æ¾ö²ßÊ÷µÄÁ÷³ÌÈçÍ¼5ª²6ËùÊ¾¡£


Í¼5ª²6½¨Á¢¶þ²æ¾ö²ßÊ÷Á÷³Ì


Á÷³ÌÖÐ£¬ÕÒ·ÖÁÑµãÊÇËã·¨µÄ¹Ø¼ü£¬Ñ¡ÔñÄÄÒ»¸öÌØÕ÷¼°Æä¾ö²ßÖµÀ´»®·ÖÑµÁ·¼¯¶ÔÉú³ÉµÄÊ÷½á¹¹Ó°ÏìºÜ´ó¡£¶Ô¾ö²ßÊ÷µÄÑÐ¾¿»ù±¾ÉÏ¼¯ÖÐÓÚ¸ÃÎÊÌâ£¬¸ÃÎÊÌâÏ°¹ßÉÏ³ÆÎªÑù±¾¼¯·ÖÁÑ£¬ÒÀÆä½â¾ö·½·¨¿É½«¾ö²ßÊ÷Ëã·¨·ÖÎªID3¡¢C4.5¡¢CARTµÈËã·¨¡£ÕâÐ©Ëã·¨¶ÔÑù±¾¼¯½øÐÐ·ÖÁÑµÄ·½·¨¶¼ÊÇÒÀ¾ÝÄ³¸öÖ¸±ê¶ÔËùÓÐÇ±ÔÚ·ÖÁÑµã½øÐÐÊÔ·ÖÁÑ£¬ÕÒ³ö×î·ûºÏÖ¸±êÒªÇóµÄÄÇ¸öµã×÷ÎªÊµ¼Ê·ÖÁÑµã¡£ÒÀ¾ÝµÄÖ¸±ê·ÖÎªÐÅÏ¢ÔöÒæ(Information Gain)¡¢ÔöÒæÂÊ(Gain Ratio)ºÍ»ùÄáÖ¸Êý(Gini Index)µÈ£¬ËüÃÇ¶¼ÒÔÐÅÏ¢ÂÛÎªÀíÂÛ»ù´¡£¬ËüÃÇµÄÄ¿±ê¶¼ÊÇ½¨Á¢ÈçÍ¼5ª²5ËùÊ¾µÄ²ã´Î¾¡¿ÉÄÜÉÙµÄ¾ö²ßÊ÷¡£¾ö²ßÊ÷µÄ²ã´ÎÉÙ£¬ËµÃ÷¶ÔÐÂÑù±¾µÄ²âÊÔ´ÎÊý¾ÍÉÙ£¬Ëù×öµÄ²âÊÔÔ½ÓÐÐ§¡£ÓÐ¹ØÐÅÏ¢ÔöÒæ¡¢ÔöÒæÂÊºÍ»ùÄáÖ¸ÊýµÈ²âÊÔÖ¸±ê£¬¸ÐÐËÈ¤µÄ¶ÁÕß¿É²Î¿¼Ô­°æÊé¡£
Óë½¨Á¢¶þ²æÊ÷Ê±ÒÔÄ³ÌØÕ÷µÄÄ³¸öÖµ×÷Îª·ÖÁÑµã²»Í¬£¬½¨Á¢¶à²æ¾ö²ßÊ÷µÄ·ÖÁÑµãÊÇÄ³Ò»¸öÌØÕ÷¡£ÔÚÊÔ·ÖÁÑÊ±£¬Ëü¶ÔÑù±¾¼¯°´Ä³ÌØÕ÷µÄÃ¿¸öÈ¡Öµ¶¼·ÖÁÑÒ»¸ö×Ó¼¯£¬È»ºó¼ÆËãÖ¸±êÖµ¡£×îºóÑ¡Ôñ×î·ûºÏÖ¸±êÒªÇóµÄÌØÕ÷×÷Îª·ÖÁÑµã¡£
sklearnµÄ¾ö²ßÊ÷ÀàÔÚtreeÄ£¿éÖÐ£¬DecisionTreeClassifierÀàºÍ·½·¨Ô­ÐÍ¼û´úÂë5ª²1¡£


´úÂë5ª²1sklearnÖÐµÄ¾ö²ßÊ÷Ëã·¨



1. class sklearn.tree.DecisionTreeClassifier(criterion='gini', splitter='best', max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0ª±0, max_features=None, random_state=None, max_leaf_nodes=None, min_impurity_decrease=0.0, min_impurity_split=None, class_weight=None, presort=False)

2. 

3. apply(self, X£Û, check_input£Ý)

4. decision_path(self, X£Û, check_input£Ý)

5. fit(self, X, y£Û, sample_weight, ¡­£Ý)

6. get_depth(self)

7. get_n_leaves(self)

8. get_params(self£Û, deep£Ý)

9. predict(self, X£Û, check_input£Ý)

10. predict_log_proba(self, X)

11. predict_proba(self, X£Û, check_input£Ý)

12. score(self, X, y£Û, sample_weight£Ý)

13. set_params(self, £Ü*£Ü*params)

ÆäÖÐ£¬criterion²ÎÊýÖ¸¶¨ÊÇ²ÉÓÃ»ùÄáÖ¸Êý»òÐÅÏ¢ÔöÒæ×÷ÎªÑù±¾¼¯·ÖÁÑµÄÖ¸±ê£¬fit·½·¨ÓÃÀ´½¨Ê÷¡£predict_brobaÓÃÀ´²úÉú¸ÅÂÊÖµµÄÔ¤²âÊä³ö£¬ËüÊÇ¼ÆËãÒ¶½ÚµãÖÐ²»Í¬ÖÖÀàÑù±¾µÄ±ÈÀýÖµ×÷ÎªÊä³ö¡£predict_log_proba·½·¨ÓÃÀ´²úÉú¶ÔÊý¸ÅÂÊÖµµÄÔ¤²âÊä³ö¡£
ÓÃËüÀ´Ê¾Àý±í5ª²2ËùÊ¾µÄÏàÇ×¾ö²ßÄ£ÐÍ¼û´úÂë5ª²2¡£


´úÂë5ª²2¾ö²ßÊ÷Ê¾Àý(¾ö²ßÊ÷Ê¾Àý.ipynb)



1. from sklearn import tree

2. # ÑµÁ·Ñù±¾¼¯

3. blind_date_X = £Û £Û35, 176, 0, 20000£Ý,

4.£Û28, 178, 1, 10000£Ý,

5.£Û26, 172, 0, 25000£Ý,

6.£Û29, 173, 2, 20000£Ý,

7.£Û28, 174, 0, 15000£Ý £Ý

8. blind_date_y = £Û 0, 1, 0, 1, 1 £Ý

9. # ²âÊÔÑù±¾¼¯

10. test_sample = £Û  £Û24, 178, 2, 17000£Ý,

11.£Û27, 176, 0, 25000£Ý,

12.£Û27, 176, 0, 10000£Ý  £Ý

13. clf = tree.DecisionTreeClassifier()# ÊµÀý»¯

14. clf = clf.fit(blind_date_X, blind_date_y)# ½¨Ê÷

15. clf.predict(test_sample)# Ô¤²â

16.  array(£Û1, 0, 1£Ý)

17. tree.plot_tree(clf)# »­³öÊ÷½á¹¹

18.  £ÛText(200.88000000000002, 181.2, 'X£Û2£Ý = 0.5£Üngini = 0.48£Ünsamples = 5£Ünvalue = £Û2, 3£Ý'),

19.  Text(133.92000000000002, 108.72, 'X£Û3£Ý = 17500.0£Üngini = 0.444£Ünsamples = 3£Ünvalue = £Û2, 1£Ý'),

20.  Text(66.96000000000001, 36.23999999999998, 'gini = 0.0£Ünsamples = 1£Ünvalue = £Û0, 1£Ý'),

21.  Text(200.88000000000002, 36.23999999999998, 'gini = 0.0£Ünsamples = 2£Ünvalue = £Û2, 0£Ý'),

22.  Text(267.84000000000003, 108.72, 'gini = 0.0£Ünsamples = 2£Ünvalue = £Û0, 2£Ý')£Ý



23. 

24. print(clf.feature_importances_)# ¸ø³öÌØÕ÷µÄÖØÒª¶È

25.  £Û0.0.0.44444444 0.55555556£Ý

µÚ17ÐÐ»­³öÊ÷½á¹¹£¬¿É¼ûÓëÍ¼5ª²5ËùÊ¾¾ö²ßÊ÷½á¹¹Ò»Ñù¡£
µÚ24ÐÐ´òÓ¡³öfeature_importances_ÊôÐÔÖµ£¬Ëü¸ø³öÁËÌØÕ÷µÄÖØÒª¶È¡£´ÓµÚ25ÐÐÊä³ö¿ÉÖªÄêÁäºÍÉí¸ßÌØÕ÷²¢²»ÖØÒª£¬Òò´Ë£¬ÔÚÊ÷½á¹¹ÖÐ£¬²¢Ã»ÓÐÓÃµ½ÕâÁ½¸öÌØÕ÷¡£ÕâËµÃ÷¾ö²ßÊ÷Ëã·¨ÄÜ¹»Á¢×ãÏÖÓÐµÄÑµÁ·¼¯·¢ÏÖ×îÆð×÷ÓÃµÄÌØÕ÷¡£Õâ¸ö¹¦ÄÜÒ²¿ÉÒÔÓÃÀ´½µÎ¬£¬½«ÕâÁ½¸öÖØÒª¶ÈÎª0µÄÌØÕ÷È¥µô£¬²¢²»»áÓ°ÏìÄ£ÐÍµÄ½¨Á¢ºÍÔ¤²â¡£
¾ö²ßÊ÷Ëã·¨ÈÝÒ×³öÏÖ¹ýÄâºÏÏÖÏó¡£ÈçÍ¼5ª²7ËùÊ¾µÄ¶þÎ¬Æ½ÃæÉÏµÄÑù±¾¼¯ÖÐ£¬Ô²µãºÍÊ®×Öµã·Ö±ð±íÊ¾²»Í¬µÄÁ½ÀàÑù±¾¡£ÔÚ×óÏÂ½Ç³öÏÖÁËÒ»¸öÓëÖÜÎ§Ô²µã²»Í¬µÄÊ®×Öµã(Í¼ÖÐÔ²È¦ËùÊ¾)£¬Ò»°ãÈÏÎª¸ÃµãÎªÔëÉùµã¡£Èç¹û²»¼Ó´¦Àí£¬Éú³ÉµÄ¾ö²ßÊ÷½«»á½«¸Ãµãµ¥¶ÀÑÓÉì³öÒ»¸ö·ÖÖ¦À´£¬´Ó¶ø²úÉú¹ýÄâºÏÏÖÏó¡£¶Ô´ËÀà¹ýÄâºÏµÄÒ»°ã´¦Àí·½·¨ÊÇ¼ôÖ¦(Pruning)£¬ËüÊÇ½«ÑÓÉì³öÀ´µÄ·ÖÖ¦¼ôµô£¬±ÜÃâÊÜµ½ÔëÉùµÄÓ°Ïì¡£ÓÐ¹Ø¹ýÄâºÏºÍ¼ôÖ¦½øÒ»²½µÄÌÖÂÛ£¬¿É²Î¿¼Ô­°æÊé¡£


Í¼5ª²7»ìÈëÔëÉùµÄÊ¾ÀýÑù±¾£¨¼û²Ê²å£©


¾ö²ßÊ÷Ä£ÐÍ»¹¿ÉÒÔÓÃÓÚ»Ø¹éÎÊÌâ¡£Ê÷Ä£ÐÍ½â¾ö»Ø¹éÎÊÌâµÄ»ù±¾Ë¼ÏëÊÇ½«Ñù±¾¿Õ¼äÇÐ·ÖÎª¶à¸ö×Ó¿Õ¼ä£¬ÔÚÃ¿¸ö×Ó¿Õ¼äÖÐµ¥¶À½¨Á¢»Ø¹éÄ£ÐÍ£¬Òò´Ë£¬»ùÓÚÊ÷µÄ»Ø¹éÄ£ÐÍÊôÓÚ¾Ö²¿»Ø¹éÄ£ÐÍ¡£Óë¾Ö²¿¼ÓÈ¨ÏßÐÔ»Ø¹éÄ£ÐÍºÍK½üÁÚ·¨²»Í¬µÄÊÇ£¬»ùÓÚÊ÷µÄ»Ø¹éÄ£ÐÍ»áÏÈÉú³É¹Ì¶¨µÄÄ£ÐÍ£¬²»ÐèÒªÔÚÃ¿´ÎÔ¤²âÊ±¶¼¼ÆËãÃ¿¸öÑµÁ·Ñù±¾µÄÈ¨Öµ£¬Òò´ËÐ§ÂÊÏà¶Ô½Ï¸ß¡£
sklearnÖÐµÄÊ÷»Ø¹éËã·¨ÔÚtreeÄ£¿éÖÐµÄDecisionTreeRegressorÀàÖÐÊµÏÖ¡£
5.2.3Ëæ»úÉ­ÁÖ
Ëæ»úÉ­ÁÖËã·¨µÄ»ù±¾Ë¼ÏëÊÇ´ÓÑù±¾¼¯ÖÐÓÐ·Å»ØµØÖØ¸´Ëæ»ú³éÑùÉú³ÉÐÂµÄÑù±¾¼¯ºÏ£¬È»ºóÎÞ·Å»ØµØËæ»úÑ¡ÔñÈô¸ÉÌØÕ÷Éú³ÉÒ»¿Ã¾ö²ßÊ÷£¬Èô¸É¿Ã¾ö²ßÊ÷×é³ÉËæ»úÉ­ÁÖ£¬ÔÚÔ¤²â·ÖÀàÊ±£¬½«²âÊÔÑù±¾½»ÓÉÃ¿¸ö¾ö²ßÊ÷ÅÐ¶Ï£¬²¢¸ù¾ÝÃ¿¿ÃÊ÷µÄ½á¹ûÍ¶Æ±¾ö¶¨×îÖÕ·ÖÀà¡£
Ëæ»úÉ­ÁÖËã·¨¾ßÓÐ×¼È·ÂÊ¸ß¡¢ÄÜ¹»´¦Àí¸ßÎ¬Êý¾ÝºÍ´óÊý¾Ý¼¯¡¢ÄÜ¹»ÆÀ¹À¸÷ÌØÕ÷µÄÖØÒªÐÔµÈÓÅÊÆ£¬ÔÚ¹¤³ÌÊµ¼ùºÍ¸÷Àà»úÆ÷Ñ§Ï°¾ºÈüÖÐ±»¹ã·ºµØÓ¦ÓÃ¡£
sklearnÖÐµÄËæ»úÉ­ÁÖ·ÖÀàËã·¨ÀàÔÚensembleÄ£¿éÖÐ£¬ÀàºÍ·½·¨Ô­ÐÍ¼û´úÂë5ª²3¡£


´úÂë5ª²3sklearnÖÐµÄËæ»úÉ­ÁÖËã·¨



1. class sklearn.ensemble.RandomForestClassifier(n_estimators='warn', criterion='gini', max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features='auto', max_leaf_nodes=None, min_impurity_decrease=0.0, min_impurity_split=None, bootstrap=True, oob_score=False, n_jobs=None, random_state=None, verbose=0, warm_start=False, class_weight=None)

2. 

3. apply(self, X)

4. decision_path(self, X)

5. fit(self, X, y£Û, sample_weight£Ý)

6. get_params(self£Û, deep£Ý)

7. predict(self, X)

8. predict_log_proba(self, X)




9. predict_proba(self, X)

10. score(self, X, y£Û, sample_weight£Ý)

11. set_params(self, £Ü*£Ü*params)

ÆäÖÐ£¬n_estimatorsÊÇÉ­ÁÖÖÐÊ÷µÄ¿ÃÊý£¬max_featuresÊÇÓÃÀ´·ÖÁÑÊ±µÄ×î´óÌØÕ÷Êý¡£
Ëæ»úÉ­ÁÖÍ¬Ñù¿ÉÓÃÓÚ»Ø¹éÈÎÎñ£¬ÏàÓ¦µÄÀàÎªsklearn.ensemble.RandomForestRegressor¡£
ÏñËæ»úÉ­ÁÖÕâÑùÓÉ¶à¸ö·ÖÀàÆ÷À´¼¯Ìå¾ö²ßµÄ·½·¨³ÆÎª¼¯³ÉÑ§Ï°·½·¨¡£¼¯³ÉÑ§Ï°(Ensemble Learning)ÊÇÒ»ÖÖÓÐÐ§µÄ»úÆ÷Ñ§Ï°·½·¨£¬Ò²ÊÇ¸÷Àà¾ºÈüÖÐµÄ³£ÓÃ¹¤¾ß£¬ÔÚ¹¤Òµ½çµÃµ½ÁË¹ã·ºµÄÓ¦ÓÃ¡£Ä¿Ç°£¬¼¯³ÉÑ§Ï°ÓÐÈýÖÖÖ÷Òª·½·¨£¬·Ö±ðÎª×°´ü·½·¨¡¢ÌáÉý·½·¨ºÍÍ¶Æ±·½·¨£¬ÓÐ¹ØËüÃÇµÄÏêÏ¸ÌÖÂÛ£¬¿É²Î¿¼Ô­°æÊé¡£
5.3ÆÓËØ±´Ò¶Ë¹·ÖÀà
ÆÓËØ±´Ò¶Ë¹(Na¢†ve Bayes)·ÖÀàÊÇ»ùÓÚ±´Ò¶Ë¹¶¨ÀíÓëÌØÕ÷Ìõ¼þ¶ÀÁ¢¼Ù¶¨µÄ·ÖÀà·½·¨¡£
±´Ò¶Ë¹¹«Ê½¿ÉÓÉÌõ¼þ¸ÅÂÊµÄ¶¨ÒåÖ±½ÓµÃµ½¡£ÉèÊÔÑéEµÄÑù±¾¿Õ¼äÎªS£¬AÎªEµÄÊÂ¼þ£¬B1£¬B2£¬¡­£¬BnÎªSµÄÒ»¸ö»®·Ö£¬ÇÒP(A)>0£¬P(Bi)>0(i=1,2,¡­,n)£¬Ôò±´Ò¶Ë¹¹«Ê½Îª£º 
P(Bi|A)=P(BiA)P(A)=P(A|Bi)P(Bi)¡Ænj=1P(A|Bj)P(Bj),i=1,2,¡­,n(5ª²10)
ÆäÖÐ£¬P(Bi)³ÆÎªÏÈÑé¸ÅÂÊ£¬¼´·ÖÀàBi·¢ÉúµÄ¸ÅÂÊ£¬ËüºÍÌõ¼þ¸ÅÂÊP(A|Bi)¿É´ÓÑù±¾¼¯ÖÐ¹À¼ÆµÃµ½¡£Í¨¹ý±´Ò¶Ë¹¹«Ê½¾Í¿ÉÒÔÕÒµ½Ê¹ºóÑé¸ÅÂÊP(Bi|A)×î´óµÄBi¡£¼´AÊÂ¼þ·¢ÉúÊ±£¬×îÓÐ¿ÉÄÜµÄ·ÖÀàBi¡£
ÔÚ»úÆ÷Ñ§Ï°ÁìÓò£¬A¿ÉÒÔ¿´³ÉÒ»¸öÑù±¾£¬¶øB1£¬B2£¬¡­£¬Bn¿ÉÒÔ¿´³ÉÑù±¾µÄËùÓÐ¿ÉÄÜµÄ·ÖÀà£¬»òÕßÊÇÑù±¾µÄËùÓÐ¿ÉÄÜµÄ±êÇ©¡£±´Ò¶Ë¹·ÖÀà£¬¾ÍÊÇÍ¨¹ý±´Ò¶Ë¹¹«Ê½¼ÆËã¸ÅÂÊ£¬½«Ñù±¾A·Öµ½¿ÉÄÜÐÔ×î´óµÄÀàÖÐ£¬»òÕßËµÊÇ¸øÑù±¾A·ÖÒ»¸ö¿ÉÄÜÐÔ×î´óµÄ±êÇ©¡£
ÉèÑù±¾¼¯ÎªS={s1,s2,¡­,sm}£¬Ã¿¸öÑù±¾si=(xi,yi)°üÀ¨Ò»¸öÊµÀýxiºÍÒ»¸ö±êÇ©yi¡£±êÇ©yiÓÐkÖÖÈ¡Öµ{y(1)i,y(2)i,¡­,y(k)i}¡£
ÆÓËØ±´Ò¶Ë¹·¨Ê×ÏÈ»ùÓÚÌØÕ÷Ìõ¼þ¶ÀÁ¢¼Ù¶¨,´ÓÑù±¾¼¯ÖÐÑ§Ï°µ½ÏÈÑé¸ÅÂÊºÍÌõ¼þ¸ÅÂÊ£¬È»ºó»ùÓÚËüÃÇ£¬¶Ô¸ø¶¨µÄ²âÊÔÑù±¾x£¬ÀûÓÃ±´Ò¶Ë¹¹«Ê½Çó³öÊ¹ºóÑé¸ÅÂÊ×î´óµÄÔ¤²âÖµy¡£y¿É¿´×÷xËùÊô·ÖÀàµÄ±àºÅ¡£
ÌØÕ÷Ìõ¼þ¶ÀÁ¢¼Ù¶¨£¬ÊÇÖ¸¼Ù¶¨Ñù±¾µÄ¸÷¸öÌØÕ÷ÊÇÏà»¥¶ÀÁ¢µÄ£¬»¥²»¹ØÁª¡£Õâ¸ö¼Ù¶¨ÏÔÈ»ÊÇ²»·ûºÏÊµ¼ÊµÄ£¬µ«Ëü¿ÉÒÔÔÚ´óÊý¾ÝÁ¿¡¢´óÌØÕ÷Á¿µÄÇé¿öÏÂ¼«´ó¼ò»¯¼ÆËã£¬Ê¹µÃ±´Ò¶Ë¹Ëã·¨Êµ¼Ê¿ÉÐÐ¡£´ÓÊµ¼ÊÓ¦ÓÃÇé¿öÀ´¿´£¬ÆÓËØ±´Ò¶Ë¹·ÖÀàÒ²È¡µÃÁË²»´íµÄÐ§¹û¡£
ÓÐ¹ØÆÓËØ±´Ò¶Ë¹·¨Ô­ÀíµÄÉîÈëÌÖÂÛ¿É²Î¿¼Ô­°æÊé¡£
ÔÚÓ¦ÓÃÆÓËØ±´Ò¶Ë¹·¨½øÐÐ·ÖÀàÊ±£¬¸ù¾ÝÌõ¼þ¸ÅÂÊP(A|Bi)µÄ²»Í¬¼Ù¶¨·Ö²¼£¬¿ÉÒÔ·ÖÎª²»Í¬µÄ·ÖÀàÆ÷¡£
1. ¶àÏîÊ½ÆÓËØ±´Ò¶Ë¹·ÖÀàÆ÷
¶àÏîÊ½ÆÓËØ±´Ò¶Ë¹(Multinomial Na¢†ve Bayes)·ÖÀàÆ÷¼ÙÉèÌõ¼þ¸ÅÂÊP(A|Bi)·þ´Ó¶àÏîÊ½·Ö²¼¡£¶à´ÎÅ×Ó²±ÒÊÔÑéÖÐ£¬³öÏÖÖ¸¶¨´ÎÊýÕýÃæ(»ò·´Ãæ)µÄ¸ÅÂÊÊÇ¶þÏî·Ö²¼¡£½«¶þÏî·Ö²¼ÖÐµÄÁ½ÖÖ×´Ì¬ÍÆ¹ãµ½¶àÖÖ×´Ì¬£¬¾ÍµÃµ½ÁË¶àÏîÊ½·Ö²¼¡£
¶àÏîÊ½·Ö²¼ÊÊÓÃÓÚÀëÉ¢È¡ÖµµÄ·ÖÀà³¡ºÏ¡£
ÔÚsklearn.naive_bayesÖÐµÄMultinomialNBÊµÏÖÁË¶àÏîÊ½·ÖÀàÆ÷£¬ÆäÔ­ÐÍ¼û´úÂë5ª²4¡£


´úÂë5ª²4sklearnÖÐµÄ¶àÏîÊ½ÆÓËØ±´Ò¶Ë¹·ÖÀàÆ÷



1. class sklearn.naive_bayes.MultinomialNB(*, alpha=1.0, fit_prior=True, class_prior=None)

2. fit(X, y, sample_weight=None)

3. predict(X)

4. predict_proba(X)

ÆäÖÐ£¬alpha³ÆÎªÆ½»¬Öµ£¬ËüÓÃÀ´±ÜÃâÔÚ¹À¼ÆÌõ¼þ¸ÅÂÊÊ±³öÏÖÖµÎª0µÄÇé¿ö£¬ËüµÄÈ¡Öµ´óÓÚ0¡£µ±alphaµÈÓÚ1Ê±£¬³ÆÎªLaplace£¨À­ÆÕÀ­Ë¹£©Æ½»¬¡£
µ±¼Ù¶¨ÌØÕ÷È¡Öµ·ûºÏ0ª²1·Ö²¼Ê±£¬¶àÏîÊ½·ÖÀàÆ÷ÍË»¯Îª²®Å¬ÀûÆÓËØ±´Ò¶Ë¹(Bernoulli Na¢†ve Bayes)·ÖÀàÆ÷¡£¼´²®Å¬ÀûÆÓËØ·ÖÀàÆ÷ÖÐ£¬ÌØÕ÷Ö»ÄÜÈ¡Á½¸öÖµ(Ìõ¼þ¸ÅÂÊP(A|Bi)·þ´Ó¶þÏî·Ö²¼)£¬ËüÔÚÄ³Ð©³¡ºÏÏÂ±È¶àÏîÊ½·ÖÀàÆ÷Ð§¹ûÒªºÃÒ»Ð©¡£Ê¹ÓÃ²®Å¬Àû·ÖÀàÆ÷Ö®Ç°£¬ÐèÒªÏÈ½«·Ç¶þÖµµÄÌØÕ÷×ª»¯Îª¶þÖµµÄÌØÕ÷¡£
sklearn.naive_bayesÖÐµÄBernoulliNBÊµÏÖÁË²®Å¬ÀûÆÓËØ±´Ò¶Ë¹·ÖÀàÆ÷¡£
2. ¸ßË¹ÆÓËØ±´Ò¶Ë¹·ÖÀàÆ÷
µ±ÌØÕ÷ÖµÊÇÁ¬Ðø±äÁ¿µÄÊ±ºò£¬¿É²ÉÓÃ¸ßË¹ÆÓËØ±´Ò¶Ë¹(Gaussian Na¢†ve Bayes)·ÖÀàÆ÷¡£¸ßË¹ÆÓËØ±´Ò¶Ë¹·ÖÀàÆ÷¼ÙÉèÌõ¼þ¸ÅÂÊP(A|Bi)·þ´Ó²ÎÊýÎ´ÖªµÄ¸ßË¹·Ö²¼¡£
ÔÚsklearn.naive_bayesÖÐµÄGaussianNBÊµÏÖÁË¸ßË¹·ÖÀàÆ÷¡£
ÓÃÆÓËØ±´Ò¶Ë¹·ÖÀàÆ÷À´¶Ô±í5ª²2ËùÊ¾µÄÏàÇ×Êý¾Ý½øÐÐ½¨Ä£²¢Ô¤²â²âÊÔÑù±¾µÄÊ¾Àý¼û´úÂë5ª²5¡£


´úÂë5ª²5ÆÓËØ±´Ò¶Ë¹·ÖÀàÆ÷Ê¾Àý(±´Ò¶Ë¹·ÖÀàÆ÷Ê¾Àý.ipynb)



1. # ÑµÁ·Ñù±¾¼¯

2. blind_date_X = £Û £Û35, 176, 0, 20000£Ý,

3.£Û28, 178, 1, 10000£Ý,

4.£Û26, 172, 0, 25000£Ý,

5.£Û29, 173, 2, 20000£Ý,

6.£Û28, 174, 0, 15000£Ý £Ý

7. blind_date_y = £Û 0, 1, 0, 1, 1 £Ý

8. # ²âÊÔÑù±¾¼¯

9. test_sample = £Û  £Û24, 178, 2, 17000£Ý,

10.£Û27, 176, 0, 25000£Ý,

11.£Û27, 176, 0, 10000£Ý  £Ý




12. 

13. # ¶àÏîÊ½ÆÓËØ±´Ò¶Ë¹·ÖÀàÆ÷

14. from sklearn.naive_bayes import MultinomialNB

15. clf = MultinomialNB()

16. clf.fit(blind_date_X, blind_date_y)

17. print(clf.predict(test_sample))

18.  £Û1 0 1£Ý

19. 

20. # ¸ßË¹ÆÓËØ±´Ò¶Ë¹·ÖÀàÆ÷

21. from sklearn.naive_bayes import GaussianNB

22. clf = GaussianNB()

23. clf.fit(blind_date_X, blind_date_y)

24. print(clf.predict(test_sample))

25.  £Û1 0 1£Ý

26. print(clf.class_prior_)# ±êÇ©µÄÏÈÑé¸ÅÂÊ

27.  £Û0.4 0.6£Ý

28. print(clf.class_count_)# Ã¿¸ö±êÇ©µÄÑù±¾ÊýÁ¿

29.  £Û2. 3.£Ý

30. print(clf.theta_)# ¸ßË¹Ä£ÐÍµÄÆÚÍûÖµ

31.  £Û£Û3.05000000e+01 1.74000000e+02 0.00000000e+00 2.25000000e+04£Ý

32. £Û2.83333333e+01 1.75000000e+02 1.00000000e+00 1.50000000e+04£Ý£Ý

33. print(clf.sigma_)# ¸ßË¹Ä£ÐÍµÄ·½²î

34.  £Û£Û2.02760000e+01 4.02600000e+00 2.60000000e-02 6.25000003e+06£Ý

35. £Û2.48222222e-01 4.69266667e+00 6.92666667e-01 1.66666667e+07£Ý£Ý

´ÓÊ¾ÀýµÄÊä³öÀ´ÑéÖ¤¸ßË¹ÆÓËØ±´Ò¶Ë¹·ÖÀàÆ÷¡£
µÚ26ÐÐÊä³öµÄÊÇÃ¿Àà±êÇ©µÄÏÈÑé¸ÅÂÊ¡£
µÚ30ÐÐºÍµÚ33ÐÐÊä³öµÄÊÇ¸ßË¹·Ö²¼µÄ¾ùÖµºÍ·½²î¡£ÒòÎªÑµÁ·Ñù±¾ÓÐ4¸öÌØÕ÷ºÍ2¸ö±êÇ©£¬Ã¿¸öÌØÕ÷ÓëÃ¿¸ö±êÇ©Éú³ÉÒ»¸ö¸ßË¹·Ö²¼£¬Òò´Ë¹²ÓÐ8¸ö¸ßË¹·Ö²¼¡£ÑéËãµÚÒ»¸ö¸ßË¹·Ö²¼µÄ¾ùÖµ(µÚ31ÐÐµÄµÚÒ»¸öÖµ3.05000000e+01)£¬ËüÊÇ±êÇ©ÖµÎª0Ê±µÄÄêÁäÌØÕ÷Á½¸öÈ¡Öµ35ºÍ26µÄ¾ùÖµ¡£
¶ø¶ÔÓÚ¶àÏîÊ½ÆÓËØ±´Ò¶Ë¹·ÖÀàÆ÷£¬Ëü¶ÔÃ¿Ò»¸öÌØÕ÷Éú³ÉÒ»¸öÏßÐÔ·ÖÀàÆ÷(ÏßÐÔ·ÖÀàÆ÷¿É¿´×÷½«Ê½(4ª²2)ËùÊ¾µÄÏßÐÔ»Ø¹éÓÃÓÚ·ÖÀà£¬ËüÓÃ¡°Ö±Ïß¡±½«¿Õ¼ä»®·ÖÁ½¸ö²¿·Ö£¬²»Í¬²¿·ÖµÄÑù±¾µã·Ö±ðÊôÓÚ²»Í¬µÄÁ½¸öÀà)£¬¶ÁÕß¿ÉÒÔÐÞ¸Ä´úÂë²é¿´¶àÏîÊ½ÆÓËØ±´Ò¶Ë¹·ÖÀàÆ÷µÄcoef_ÊôÐÔ£¬Ëü´ú±í4¸öÏßÐÔº¯ÊýµÄÐ±ÂÊ¡£
ÆÓËØ±´Ò¶Ë¹·¨ÊµÏÖ¼òµ¥£¬Ñ§Ï°ÓëÔ¤²âµÄÐ§ÂÊ¶¼ºÜ¸ß£¬ÉõÖÁÔÚÄ³Ð©ÌØÕ÷Ïà¹ØÐÔ½Ï¸ßµÄÇé¿öÏÂ¶¼ÓÐ²»´íµÄ±íÏÖ£¬ÊÇÒ»ÖÖ³£ÓÃµÄ·½·¨¡£
5.4Éñ¾­ÍøÂçÓë·ÖÀàÈÎÎñ
±¾½ÚÌÖÂÛ¶à²ãÉñ¾­ÍøÂçµÄÒ»Ð©»ù´¡ÎÊÌâ£¬²¢Ê¾ÀýÈ«Á¬½Ó²ãÉñ¾­ÍøÂçÔÚ·ÖÀàÈÎÎñÖÐµÄÓ¦ÓÃ¡£



ÊÓÆµ½²½â


5.4.1Îó²î·´Ïò´«²¥Ñ§Ï°Ëã·¨
ÓÃÉñ¾­ÍøÂçÀ´Íê³É»úÆ÷Ñ§Ï°ÈÎÎñ£¬ÏÈÒªÉè¼ÆºÃÍøÂç½á¹¹S£¬È»ºóÓÃÑµÁ·Ñù±¾È¥Ñ§Ï°ÍøÂçÖÐµÄÁ¬½ÓÏµÊýºÍãÐÖµÏµÊý£¨¼´ÍøÂç²ÎÊýW£©£¬×îºó¶Ô²âÊÔÑù±¾½øÐÐÔ¤²â¡£
ÔÚµÚ4ÕÂÌÖÂÛÁË¶à²ãÉñ¾­ÍøÂçÔÚ»Ø¹éÎÊÌâÖÐµÄ³õ²½Ó¦ÓÃ£¬ÔÚ±¾½ÚÌÖÂÛ¶à²ãÉñ¾­ÍøÂçµÄ²ÎÊýÑ§Ï°ÎÊÌâ¡£
ÔÚÑÐ¾¿ÔçÆÚ£¬Ã»ÓÐÊÊºÏ¶à²ãÉñ¾­ÍøÂçµÄÓÐÐ§µÄ²ÎÊýÑ§Ï°·½·¨ÊÇ³¤ÆÚÀ§ÈÅ¸ÃÁìÓòÑÐ¾¿ÕßµÄ¹Ø¼üÎÊÌâ£¬ÒÔÖÁÓÚÈÃÈËÃÇ¶ÔÈË¹¤Éñ¾­ÍøÂçµÄÇ°Í¾²úÉúÁË»³ÒÉ£¬µ¼ÖÂ¸ÃÁìÓòµÄÑÐ¾¿½øÈëÁËµÍ¹ÈÆÚ¡£Ö±µ½1986Äê£¬ÒÔRumelhartºÍMcCellandÎªÊ×µÄÐ¡×é·¢±íÁËÎó²î·´Ïò´«²¥(Error Back Propagation£¬BP)Ëã·¨£Û10£Ý£¬¸ÃÎÊÌâ²ÅµÃÒÔ½â¾ö£¬¶à²ãÉñ¾­ÍøÂç´Ó´ËµÃµ½¿ìËÙ·¢Õ¹¡£
²ÉÓÃBPËã·¨À´Ñ§Ï°µÄ¡¢ÎÞ·´À¡µÄ¡¢Í¬²ã½ÚµãÎÞÁ¬½ÓµÄ¡¢¶à²ã½á¹¹µÄÇ°À¡Éñ¾­ÍøÂç³ÆÎªBPÉñ¾­ÍøÂç¡£BPÑ§Ï°Ëã·¨ÊôÓÚ¼à¶½Ñ§Ï°Ëã·¨¡£BPÉñ¾­ÍøÂç¿ÉÓÃÓÚ½â¾ö·ÖÀàÎÊÌâºÍ»Ø¹éÎÊÌâ£¬ÊÇÓ¦ÓÃ×î¶àµÄÉñ¾­ÍøÂç¡£
±¾½ÚÏÈÓÃÒ»¸ö¼òµ¥µÄÊ¾ÀýÀ´ÌÖÂÛBPËã·¨£¬È»ºóÔÙÍÆ¹ãµ½Ò»°ãÇé¿ö¡£
1. Îó²î·´Ïò´«²¥Ñ§Ï°Ê¾Àý
Âß¼­´úÊýÖÐµÄÒì»òÔËËãÊÇ·ÇÏßÐÔµÄ£¬Ëü²»ÄÜÓÉµ¥¸öÉñ¾­ÔªÀ´Ä£Äâ¡£ÏÂÃæÓÃÄ£ÄâÒì»òÔËËãµÄÉñ¾­ÍøÂçÎªÀýÀ´ËµÃ÷BPÑ§Ï°¹ý³Ì¡£
ÉèÄ£ÄâÒì»òÔËËãµÄÑµÁ·Ñù±¾¼¯Èç±í5ª²3ËùÊ¾¡£±íÖÐ£¬x(1)ºÍx(2)ÊÇÒì»òÔËËãµÄÁ½¸öÊäÈë¡£l(1)±íÊ¾Òì»òÔËËãµÄÕæÖµÊä³ö£¬¼´µ±Òì»òÔËËãÎªÕæÊ±ÖµÎª1£¬·ñÔòÎª0¡£l(2)ÊÇÒì»òÔËËãµÄ¼ÙÖµÊä³ö£¬¼´µ±Òì»òÔËËãÎªÕæÊ±ÖµÎª0£¬·ñÔòÎª1¡£


±í5ª²3Ä£ÄâÒì»òÔËËãµÄÑµÁ·Ñù±¾¼¯



x(1)x(2)l(1)l(2)

10001

20110

31010

41101

ÓÃÈçÍ¼5ª²8ËùÊ¾ÍøÂç½á¹¹µÄÈý²ãÈ«Á¬½ÓÉñ¾­ÍøÂçÀ´Ä£ÄâÒì»òÔËËã¡£½ÓÏÂÀ´ÓÃ±í5ª²3ËùÊ¾µÄÑµÁ·Ñù±¾À´Ñ§Ï°¸ÃÉñ¾­ÍøÂçµÄ²ÎÊý¡£


Í¼5ª²8Ä£ÄâÒì»òÔËËãµÄÈý²ã¸ÐÖª»ú



Í¼5ª²8ËùÊ¾µÄÉñ¾­ÍøÂçÖÐ£¬×î×ó±ßÎªÊäÈë²ã£¬ÓÐÁ½¸ö½Úµã£¬´ÓÉÏÖÁÏÂ±àºÅÎª½Úµã1ºÍ½Úµã2¡£ÊäÈë²ãµÄÊäÈëÏòÁ¿Îªx=(x(1),x(2))£¬ÓÃ´øÀ¨ºÅµÄÉÏ±ê±íÊ¾ÊäÈë½ÚµãÐòºÅ¡£
ÎªÁËÍ³Ò»±êÊ¶£¬½«Êä³ö²ãÒ²¿´×÷Òþ²ã£¬¼´Èý²ãÉñ¾­ÍøÂçÀïÓÐÁ½¸öÒþ²ã¡£µÚ1Òþ²ã¹²ÓÐ2¸ö½Úµã£¬Ò²´ÓÉÏÖÁÏÂ±àºÅ£¬·Ö±ðÓÃy(1)1ºÍy(2)1±íÊ¾ËüÃÇµÄÊä³ö£¬¼´ÓÃÏÂ±êÀ´±íÊ¾Òþ²ãÐòºÅ£¬ÓÃ´øÀ¨ºÅµÄÉÏ±êÀ´±íÊ¾²ãÄÚ½ÚµãÐòºÅ¡£µÚ2Òþ²ã£¬¼´Êä³ö²ã£¬Ò²ÓÐ2¸ö½Úµã£¬ËüµÄÊä³ö·Ö±ðÓÃz(1)=y(1)2ºÍz(2)=y(2)2±íÊ¾¡£
´ÓÊäÈë²ãµÚ1½Úµãµ½µÚ1Òþ²ãµÄµÚ1½ÚµãµÄÁ¬½ÓÏµÊý¼ÇÎªw(1,1)1£¬ÓÃÏÂ±ê±íÊ¾µ½µÚ1Òþ²ã½ÚµãµÄÁ¬½ÓÏµÊý£¬ÉÏ±êÀ¨ºÅÄÚ±íÊ¾ÊÇ´ÓÇ°Ò»²ãµÄ1ºÅ½Úµãµ½±¾²ãµÄ1ºÅ½Úµã¡£
ÓÃ¦È(1)1±íÊ¾µÚ1Òþ²ãµÄµÚ1½ÚµãµÄãÐÖµÏµÊý¡£ÀàËÆ¿ÉµÃÆäËûÏµÊýµÄ±íÊ¾·½·¨ÈçÍ¼5ª²8ËùÊ¾¡£
Îª·½±ãÆð¼û£¬»¹¿ÉÒÔÓÃ¾ØÕóºÍÏòÁ¿À´±íÊ¾¸÷²ÎÊý¡£Èç´ÓÊäÈë²ãµ½µÚ1Òþ²ãµÄÁ¬½ÓÏµÊý¿ÉÒÔÓÃÒ»¸ö2¡Á2µÄ¾ØÕóW1À´±íÊ¾£º W1=w(1,1)1w(1,2)1
w(2,1)1w(2,2)1£¬ÆäÖÐ£¬ÐÐ±íÊ¾Ç°Ò»²ãµÄ½Úµã£¬ÁÐ±íÊ¾±¾²ãµÄ½Úµã£¬ÈçµÚ1ÐÐµÚ2ÁÐµÄÔªËØw(1,2)1±íÊ¾ÊÇ´ÓÊäÈë²ãµÄµÚ1¸ö½Úµãµ½µÚ1Òþ²ãµÄµÚ2¸ö½ÚµãµÄÁ¬½ÓÏµÊý¡£
Í¬Ñù£¬µÚ1Òþ²ãµÄãÐÖµ¿É±íÊ¾ÎªÏòÁ¿£º ¦È1=£Û¦È(1)1¦È(2)1£Ý¡£´ÓµÚ1Òþ²ãµ½µÚ2Òþ²ã(Êä³ö²ã)µÄÁ¬½ÓÏµÊý¿É±íÊ¾ÎªÏòÁ¿£º W2=w(1,1)2w(1,2)2
w(2,1)2w(2,2)2£¬µÚ2Òþ²ãµÄãÐÖµ¿É±íÊ¾ÎªÏòÁ¿£º ¦È2=£Û¦È(1)2¦È(2)2£Ý¡£
ÎªÁË·½±ãÇóµ¼£¬Òþ²ãºÍÊä³ö²ãµÄ¼¤Àøº¯Êý²ÉÓÃÈçÍ¼2ª²7ÖÐÐéÏßËùÊ¾µÄSigmoidº¯Êý£¬ËüµÄ¶¨ÒåÈçÊ½(2ª²4)ËùÊ¾¡£Sigmoidº¯ÊýµÄµ¼ÊýÎª£º 
g¡ä(z)=-1(1+e-z)2e-z(-1)=11+e-z¡¤e-z1+e-z

=g(z)(1-g(z))(5ª²11)
BPÑ§Ï°Ëã·¨¿É·ÖÎªÇ°Ïò´«²¥Ô¤²âÓë·´Ïò´«²¥Ñ§Ï°Á½¸ö¹ý³Ì¡£ÒªÑ§Ï°µÄ¸÷²ÎÊýÖµÒ»°ãÏÈ×÷Ëæ»ú³õÊ¼»¯¡£È¡ÑµÁ·Ñù±¾ÊäÈëÍøÂç£¬Öð²ãÇ°Ïò¼ÆËãÊä³ö£¬ÔÚÊä³ö²ãµÃµ½Ô¤²âÖµ£¬´ËÎªÇ°Ïò´«²¥Ô¤²â¹ý³Ì¡£¸ù¾ÝÔ¤²âÖµÓëÊµ¼ÊÖµµÄÎó²îÔÙ´ÓÊä³ö²ã¿ªÊ¼Öð²ã·´Ïòµ÷½Ú¸÷²ãµÄ²ÎÊý£¬´ËÎª·´Ïò´«²¥Ñ§Ï°¹ý³Ì¡£¾­¹ý¶àÑù±¾µÄ¶à´ÎÇ°Ïò´«²¥Ô¤²âºÍ·´Ïò´«²¥Ñ§Ï°£¬×îÖÕÑ§Ï°µÃµ½ÍøÂç¸÷²ÎÊýµÄÖµ¡£
1) Ç°Ïò´«²¥Ô¤²â¹ý³Ì
Ç°Ïò´«²¥Ô¤²âµÄ¹ý³ÌÊÇÒ»¸öÖð²ã¼ÆËãµÄ¹ý³Ì¡£ÉèÍøÂç¸÷²ÎÊý³õÖµÎª£º W1=0.10.2
0.20.3£¬¦È1=£Û0.30.3£Ý£¬W2=0.40.5
0.40.5£¬¦È2=£Û0.60.6£Ý¡£
È¡µÚÒ»¸öÑµÁ·Ñù±¾(0,0)£¬ÓÉÊ½(2ª²2)ºÍÊ½(2ª²3)¿ÉµÃµÚ1Òþ²ãµÄÊä³ö£º 
y(1)1=g(w(1,1)1x(1)+w(2,1)1x(2)+¦È(1)1)

=11+e-(w(1,1)1x(1)+w(2,1)1x(2)+¦È(1)1)=11+e-0.3=0.574

y(2)1=g(w(1,2)1x(1)+w(2,2)1x(2)+¦È(2)1)

=11+e-(w(1,2)1x(1)+w(2,2)1x(2)+¦È(2)1)=0.574(5ª²12)
Í¬Ñù¼ÆËãµÚ2Òþ²ã£¬Ò²¾ÍÊÇÊä³ö²ãµÄÊä³ö£º 
z(1)=y(1)2=g(w(1,1)2y(1)1+w(2,1)2y(2)1+¦È(1)2)

=11+e-(w(1,1)2y(1)1+w(2,1)2y(2)1+¦È(1)2)

=11+e-(0.4¡Á0.574+0.4¡Á0.574+0.6)=0.743

z(2)=y(2)2=g(w(1,2)2y(1)1+w(2,2)2y(2)1+¦È(2)2)

=11+e-(w(1,2)2y(1)1+w(2,2)2y(2)1+¦È(2)2)=0.764(5ª²13)
2) ·´Ïò´«²¥Ñ§Ï°¹ý³Ì
ÓÃl(1)ºÍl(2)±íÊ¾±êÇ©Öµ£¬²ÉÓÃ¸÷±êÇ©ÖµµÄ¾ù·½Îó²îMSE×÷Îª×ÜÎó²î£¬²¢½«×ÜÎó²îÒÀ´ÎÕ¹¿ªÖÁÊäÈë²ã£º 
E=12¡Æ2i=1(z(i)-l(i))2=12¡Æ2i=1(g(w(1,i)2y(1)1+w(2,i)2y(2)1+¦È(i)2)-l(i))2

=12¡Æ2i=1(g(w(1,i)2g(w(1,1)1x(1)+w(2,1)1x(2)+¦È(1)1)+

w(2,i)2g(w(1,2)1x(1)+w(2,2)1x(2)+¦È(2)1)+¦È(i)2)-l(i))2(5ª²14)
¿É¼û£¬×ÜÎó²îEÊÇ¸÷²ã²ÎÊý±äÁ¿µÄº¯Êý£¬Òò´ËÑ§Ï°µÄÄ¿µÄ¾ÍÊÇÍ¨¹ýµ÷Õû¸÷²ÎÊý±äÁ¿µÄÖµ£¬Ê¹E×îÐ¡¡£¿É²ÉÓÃÌÝ¶ÈÏÂ½µ·¨À´µü´ú¸üÐÂËùÓÐ²ÎÊýµÄÖµ£º ÏÈÇó³ö×ÜÎó²î¶Ô¸÷²ÎÊý±äÁ¿µÄÆ«µ¼Êý£¬¼´ÌÝ¶È£¬ÔÙÑØÌÝ¶È¸º·½ÏòÇ°½øÒ»¶¨²½³¤¡£
µÚÒ»¸öÑµÁ·Ñù±¾µÄ±êÇ©ÖµÎª(0,1)£¬¼ÆËã×ÜÎó²îÎª£º 
E=12¡Æ2i=1(z(i)-l(i))2=0.304(5ª²15)
Êä³ö²ã½ÚµãµÄ²ÎÊý¸üÐÂ£¬ÒÔ½Úµã1µÄw(1,1)2ºÍ¦È(1)2ÎªÀýÏêÏ¸ÌÖÂÛ¡£ÏÈÇóÆ«µ¼ªµEªµw(1,1)2£¬¸ù¾ÝÁ´Ê½Çóµ¼·¨ÔòºÍÊ½(5ª²13)¡¢Ê½(5ª²15)¿ÉÖª£º 
ªµEªµw(1,1)2=ªµEªµy(1)2¡¤ªµy(1)2ªµw(1,1)2=ªµ12¡Æ2i=1(y(i)2-l(i))2ªµy(1)2¡¤ªµy(1)2ªµw(1,1)2

=(y(1)2-l(1))¡¤ªµy(1)2ªµw(1,1)2(5ª²16)
ÆäÖÐ£¬y(1)2-l(1)ÊÇÊä³ö²ã½Úµã1µÄÎó²î£¬¼ÇÎªE12£¬¼´E12=y(1)2-l(1)=0.743¡£Òò´ËªµEªµw(1,1)2¿ÉÊÓÎª¸Ã½ÚµãµÄÎó²î³ËÒÔ¸Ã½ÚµãÊä³ö¶Ô´ý¸üÐÂ²ÎÊý±äÁ¿µÄÆ«µ¼£º 
ªµEªµw(1,1)2=E12¡¤ªµy(1)2ªµw(1,1)2(5ª²17)
ÆäÖÐ£¬Îó²îE12ÓÃÀ´ÇóÆ«µ¼²¢¸üÐÂ²ÎÊý£¬³ÆÖ®ÎªÐ£¶ÔÎó²î¡£
ÉèÌÝ¶ÈÏÂ½µ·¨ÖÐµÄ²½³¤¦ÁÎª0.5£¬ÓÉÊ½(4ª²11)¿ÉÖªw(1,1)2¸üÐÂÎª£º 
w(1,1)2¡ûw(1,1)2-¦ÁE12¡¤ªµy(1)2ªµw(1,1)2(5ª²18)
ÆäÖÐ£¬Æ«µ¼Êýªµy(1)2ªµw(1,1)2µÄ¼ÆËãÎª£º 
ªµy£¨1£©2ªµw£¨1,1£©2=ªµg£¨w£¨1,1£©2y£¨1£©1+ w£¨2,1£©2y£¨2£©1+ ¦È£¨1£©2£©ªµw£¨1,1£©2

=ªµg£¨w£¨1,1£©2y£¨1£©1+ w£¨2,1£©2y£¨2£©1+ ¦È£¨1£©2£©ªµ£¨w£¨1,1£©2y£¨1£©1+ w£¨2,1£©2y£¨2£©1+ ¦È£¨1£©2£©¡¤ªµ£¨w£¨1,1£©2y£¨1£©1+ w£¨2,1£©2y£¨2£©1+ ¦È£¨1£©2£©ªµw£¨1,1£©2

=g£¨w£¨1,1£©2y£¨1£©1+ w£¨2,1£©2y£¨2£©1+ ¦È£¨1£©2£©¡¤£¨1£­g£¨w£¨1,1£©2y£¨1£©1+ w£¨2,1£©2y£¨2£©1+ ¦È£¨1£©2£©£©¡¤y£¨1£©1

=y£¨1£©2¡¤£¨1£­y£¨1£©2£©¡¤y£¨1£©1(5ª²19)
Ê½£¨5ª²19£©ÖÐ£¬ÓÃµ½ÁËSigmoidº¯ÊýµÄµ¼Êý£¬¼ûÊ½(5ª²11)¡£
Òò´Ë£º 
w(1,1)2¡ûw(1,1)2-¦ÁE12¡¤ªµy(1)2ªµw(1,1)2

=w(1,1)2-¦ÁE12¡¤y(1)2¡¤(1-y(1)2)¡¤y(1)1

=0.4-0.5¡Á0.743¡Á0.743¡Á(1-0.743)¡Á0.574

=0.359(5ª²20)
ªµEªµw(1,1)2µÄÇóµ¼Â·¾¶ÈçÍ¼5ª²9ÖÐ´ÖÊµÏßËùÊ¾¡£


Í¼5ª²9BPËã·¨ÖÐÇóµ¼Â·¾¶Ê¾Àý


Í¬Ñù£¬¿ÉµÃw(1,2)2¡¢w(2,1)2ºÍw(2,2)2µÄ¸üÐÂÖµ·Ö±ðÎª£º 0.512¡¢0.359ºÍ0.512¡£
¶ÔÓÚ¦È(1)2µÄ¸üÐÂ£¬ÏÈÇó×ÜÎó²î¶ÔËüµÄÆ«µ¼Êý£º 
ªµEªµ¦È(1)2=ªµEªµy(1)2¡¤ªµy(1)2ªµ¦È(1)2=E12¡¤ªµy(1)2ªµ¦È(1)2

=E12¡¤y(1)2¡¤(1-y(1)2)¡¤ªµ(w(1,1)2y(1)1+w(2,1)2y(2)1+¦È(1)2)ªµ¦È(1)2

=E12¡¤y(1)2¡¤(1-y(1)2)(5ª²21)

Òò´ËªµEªµ¦È(1)2¿ÉÊÓÎª¸Ã½ÚµãµÄÐ£¶ÔÎó²î³ËÒÔ¸Ã½ÚµãÊä³ö¶Ô´ý¸üÐÂãÐÖµ±äÁ¿µÄÆ«µ¼¡£¦È(1)2µÄ¸üÐÂÎª£º 
¦È(1)2¡û¦È(1)2-¦ÁªµEªµ¦È(1)2=0.529(5ª²22)
Í¬Ñù¿ÉµÃ¦È(2)2µÄ¸üÐÂÎª£º 0.621¡£
µÚ1Òþ²ãµÄ²ÎÊý¸üÐÂ£¬ÒÔ½Úµã2µÄw(1,2)1ºÍ¦È(2)1ÎªÀýÏêÏ¸ÌÖÂÛ¡£¶Ôw(1,2)1µÄÇóµ¼ÓÐÁ½ÌõÂ·¾¶£¬ÈçÍ¼5ª²9ÖÐ´ÖÐéÏßËùÊ¾¡£
ªµEªµw(1,2)1=ªµEªµy(1)2¡¤ªµy(1)2ªµw(1,2)1+ªµEªµy(2)2¡¤ªµy(2)2ªµw(1,2)1

=ªµEªµy(1)2¡¤ªµy(1)2ªµy(2)1¡¤ªµy(2)1ªµw(1,2)1+ªµEªµy(2)2¡¤ªµy(2)2ªµy(2)1¡¤ªµy(2)1ªµw(1,2)1

=ªµEªµy(1)2¡¤ªµy(1)2ªµy(2)1+ªµEªµy(2)2¡¤ªµy(2)2ªµy(2)1¡¤ªµy(2)1ªµw(1,2)1

=E12¡¤ªµy(1)2ªµy(2)1+E22¡¤ªµy(2)2ªµy(2)1¡¤ªµy(2)1ªµw(1,2)1(5ª²23)
ÆäÖÐ£¬E22=(y(2)2-l(2))ÊÇÊä³ö²ã½Úµã2µÄÐ£¶ÔÎó²î¡£¿É½«E12¡¤ªµy(1)2ªµy(2)1+E22¡¤ªµy(2)2ªµy(2)1ÊÓÎªÐ£¶ÔÎó²îE12ºÍE22ÑØÇóµ¼Â·¾¶·´Ïò´«²¥µ½µÚ1Òþ²ã½Úµã2µÄÐ£¶ÔÎó²î£¬ÈçÍ¼5ª²10ËùÊ¾£¬½«¸ÃÐ£¶ÔÎó²î¼ÇÎªE21£º 
E21=E12¡¤ªµy(1)2ªµy(2)1+E22¡¤ªµy(2)2ªµy(2)1(5ª²24)


Í¼5ª²10BPËã·¨ÖÐÐ£¶ÔÎó²î·´Ïò´«²¥Ê¾Àý



Ê½(5ª²23)¿ÉÐ´Îª£º 
ªµEªµw(1,2)1=E21¡¤ªµy(2)1ªµw(1,2)1(5ª²25)
Òò´Ë£¬ªµEªµw(1,2)1¿ÉÊÓÎª¸Ã½ÚµãµÄÐ£¶ÔÎó²î³ËÒÔ¸Ã½ÚµãÊä³öÖµ¶Ô´ý¸üÐÂ²ÎÊý±äÁ¿µÄÆ«µ¼Êý¡£Ê½£¨5ª²25£©ÓëÊ½(5ª²17)¾ßÓÐÏàÍ¬µÄÐÎÊ½¡£¾Ý´Ë£¬·´Ïò´«²¥Ñ§Ï°¹ý³ÌÖÐµÄÇóÌÝ¶È¿ÉÒÔ¿´³ÉÊÇÏÈ¼ÆËã³öÃ¿¸ö½ÚµãµÄ·´Ïò´«²¥Ð£¶ÔÎó²î£¬ÔÙ³ËÒÔÒ»¸ö±¾µØÆ«µ¼Êý¡£
Ê½(5ª²25)µÄÁ½ÏîÒò×Ó¼ÆËãÈçÏÂ£º 
E21=E12¡¤ªµy(1)2ªµy(2)1+E22¡¤ªµy(2)2ªµy(2)1=E12¡¤y(1)2(1-y(1)2)w(2,1)2+E22¡¤y(2)2(1-y(2)2)w(2,2)2

ªµy(2)1ªµw(1,2)1=y(2)1(1-y(2)1)ªµ(w(1,2)1x(1)+w(2,2)1x(2)+¦È(2)1)ªµw(1,2)1=y(2)1(1-y(2)1)x(1)=0(5ª²26)
Òò´Ë£¬ªµEªµw(1,2)1=0¡£
w(1,2)1µÄ¸üÐÂÎª£º 
w(1,2)1¡ûw(1,2)1-¦ÁªµEªµw(1,2)1=w(1,2)1=0.2(5ª²27)
Í¬Ñù¿É¼ÆËãµÚ1Òþ²ãµÄÆäËûÈý¸öÁ¬½ÓÏµÊýÒ²±£³Ö²»±ä¡£
¿ÉÖª¦È(2)1¸üÐÂÎª£º 
¦È(2)1¡û¦È(2)1-¦ÁªµEªµ¦È(2)1=¦È(2)1-¦ÁE21¡¤y(2)1(1-y(2)1)=0.296(5ª²28)
Í¬Ñù¿ÉµÃ¦È(1)1¸üÐÂÎª£º 0.296¡£
ÒÔÉÏ¸ø³öÁËÊäÈëµÚÒ»¸öÑµÁ·Ñù±¾ºó£¬ÍøÂçµÄÇ°ÏòÔ¤²âºÍ·´ÏòÑ§Ï°¹ý³Ì¡£¿É½«Ñù±¾ÒÀ´ÎÊäÈëÍøÂç½øÐÐÑµÁ·¡£Ò»°ãÒª½«Ñù±¾¶à´ÎÊäÈëÍøÂç½øÐÐ¶àÂÖÑµÁ·¡£
Ê¾ÀýµÄÊµÏÖ¼û´úÂë5ª²6¡£¹²ÔËÐÐÁË2000ÂÖ(µÚ44ÐÐ)£¬Ã¿Ò»ÂÖ¶ÔÃ¿Ò»¸öÑù±¾½øÐÐÒ»´ÎÇ°Ïò´«²¥Ô¤²âºÍÒ»´ÎºóÏò´«²¥Ñ§Ï°£¬²¢¼ÆËãËùÓÐËÄ¸öÑù±¾µÄÆ½¾ù×ÜÎó²î(µÚ64ÐÐºÍµÚ86ÐÐ)¡£


´úÂë5ª²6Ä£ÄâÒì»òÔËËãÈý²ã¸ÐÖª»úµÄÎó²î·´Ïò´«²¥Ñ§Ï°(Îó²î·´Ïò´«²¥Ëã·¨Ê¾Àý.ipynb)



1. import numpy as np

2. 

3. # Ñù±¾Ê¾Àý

4. XX = np.array(£Û£Û0.0,0.0£Ý,

5. £Û0.0,1.0£Ý,

6. £Û1.0,0.0£Ý,

7. £Û1.0,1.0£Ý£Ý)

8. # Ñù±¾±êÇ©

9. L = np.array(£Û£Û0.0,1.0£Ý,




10. £Û1.0,0.0£Ý,

11. £Û1.0,0.0£Ý,

12. £Û0.0,1.0£Ý£Ý)

13. 

14. a = 0.5# ²½³¤

15. W1 = np.array(£Û£Û0.1, 0.2£Ý,# µÚ1Òþ²ãµÄÁ¬½ÓÏµÊý

16.£Û0.2, 0.3£Ý£Ý)

17. theta1 = np.array(£Û0.3, 0.3£Ý)# µÚ1Òþ²ãµÄãÐÖµ

18. W2 = np.array(£Û£Û0.4, 0.5£Ý, # µÚ2Òþ²ãµÄÁ¬½ÓÏµÊý

19.£Û0.4, 0.5£Ý£Ý)

20. theta2 = np.array(£Û0.6, 0.6£Ý)# µÚ2Òþ²ãµÄãÐÖµ

21. Y1 = np.array(£Û0,0, 0.0£Ý)# µÚ1Òþ²ãµÄÊä³ö

22. Y2 = np.array(£Û0,0, 0.0£Ý)# µÚ2Òþ²ãµÄÊä³ö

23. E2 = np.array(£Û0,0, 0.0£Ý)# µÚ2Òþ²ãµÄÎó²î

24. E1 = np.array(£Û0,0, 0.0£Ý)# µÚ1Òþ²ãµÄÎó²î

25. 

26. def sigmoid(x):

27. return 1/(1+np.exp(-x))

28. 

29. # ¼ÆËãµÚ1Òþ²ã½Úµã1µÄÊä³ö

30. def y_1_1(W1, theta1, X):

31. return sigmoid(W1£Û0,0£Ý*X£Û0£Ý + W1£Û1,0£Ý*X£Û1£Ý + theta1£Û0£Ý)

32. 

33. # ¼ÆËãµÚ1Òþ²ã½Úµã2µÄÊä³ö

34. def y_1_2(W1, theta1, X):

35. return sigmoid(W1£Û0,1£Ý*X£Û0£Ý + W1£Û1,1£Ý*X£Û1£Ý + theta1£Û1£Ý)

36. 

37. # ¼ÆËãµÚ2Òþ²ã½Úµã1µÄÊä³ö

38. def y_2_1(W2, theta2, Y1):

39. return sigmoid(W2£Û0,0£Ý*Y1£Û0£Ý + W2£Û1,0£Ý*Y1£Û1£Ý + theta2£Û0£Ý)

40. 

41. # ¼ÆËãµÚ2Òþ²ã½Úµã2µÄÊä³ö

42. def y_2_2(W2, theta2, Y1):

43. return sigmoid(W2£Û0,1£Ý*Y1£Û0£Ý + W2£Û1,1£Ý*Y1£Û1£Ý + theta2£Û1£Ý)

44. 

45. for j in range(2000):# ÑµÁ·ÂÖÊý

46. print("£Ün£ÜnÂÖ£º ", j)

47. E = 0.0

48. for i in range(4):

49.print("Ñù±¾£º ", i)

50.print("ÊµÀý£º ", XX£Ûi£Ý)

51.print("±êÇ©", L£Ûi£Ý)

52.# Ç°Ïò´«²¥Ô¤²â

53.# ¼ÆËãµÚ1Òþ²ãµÄÊä³ö

54.Y1£Û0£Ý = y_1_1(W1, theta1, XX£Ûi£Ý)

55.Y1£Û1£Ý = y_1_2(W1, theta1, XX£Ûi£Ý)

56.#print("µÚ1Òþ²ãµÄÊä³ö:", Y1)

57.



58.# ¼ÆËãµÚ2Òþ²ãµÄÊä³ö

59.Y2£Û0£Ý = y_2_1(W2, theta2, Y1)

60.Y2£Û1£Ý = y_2_2(W2, theta2, Y1)

61.print("µÚ2Òþ²ãµÄÊä³ö:", Y2)

62.

63.# ºóÏò´«²¥Îó²î

64.# ¼ÆËãµÚ2Òþ²ãµÄÐ£¶ÔÎó²î

65.E2£Û0£Ý = Y2£Û0£Ý - L£Ûi£Ý£Û0£Ý

66.E2£Û1£Ý = Y2£Û1£Ý - L£Ûi£Ý£Û1£Ý

67.E += 0.5*(E2£Û0£Ý*E2£Û0£Ý+E2£Û1£Ý*E2£Û1£Ý)

68.#print("×ÜÎó²î", E)

69.#print("µÚ2Òþ²ãµÄÐ£¶ÔÎó²î", E2)

70.

71.# ¼ÆËãµÚ1Òþ²ãµÄÐ£¶ÔÎó²î

72.E1£Û0£Ý = E2£Û0£Ý*Y2£Û0£Ý*(1 - Y2£Û0£Ý)*W2£Û0,0£Ý + E2£Û1£Ý*Y2£Û1£Ý*(1 - Y2£Û1£Ý)*W2£Û0,1£Ý

73.E1£Û1£Ý = E2£Û0£Ý*Y2£Û0£Ý*(1 - Y2£Û0£Ý)*W2£Û1,0£Ý + E2£Û1£Ý*Y2£Û1£Ý*(1 - Y2£Û1£Ý)*W2£Û1,1£Ý

74.#print("µÚ1Òþ²ãµÄÐ£¶ÔÎó²î", E1)

75.

76.# ¸üÐÂÏµÊý

77.# ¸üÐÂµÚ2Òþ²ãµÄÏµÊý

78.W2£Û0,0£Ý = W2£Û0,0£Ý - a*E2£Û0£Ý*Y2£Û0£Ý*(1 - Y2£Û0£Ý)*Y1£Û0£Ý

79.W2£Û1,0£Ý = W2£Û1,0£Ý - a*E2£Û0£Ý*Y2£Û0£Ý*(1 - Y2£Û0£Ý)*Y1£Û1£Ý

80.theta2£Û0£Ý = theta2£Û0£Ý - a*E2£Û0£Ý*Y2£Û0£Ý*(1 - Y2£Û0£Ý)

81.W2£Û0,1£Ý = W2£Û0,1£Ý - a*E2£Û1£Ý*Y2£Û1£Ý*(1 - Y2£Û1£Ý)*Y1£Û0£Ý

82.W2£Û1,1£Ý = W2£Û1,1£Ý - a*E2£Û1£Ý*Y2£Û1£Ý*(1 - Y2£Û1£Ý)*Y1£Û1£Ý

83.theta2£Û1£Ý = theta2£Û1£Ý - a*E2£Û1£Ý*Y2£Û1£Ý*(1 - Y2£Û1£Ý)

84.#print("µÚ2Òþ²ãµÄÁ¬½ÓÏµÊý", W2)

85.#print("µÚ2Òþ²ãµÄãÐÖµÏµÊý", theta2)

86.

87.# ¸üÐÂµÚ1Òþ²ãµÄÏµÊý

88.W1£Û0,0£Ý = W1£Û0,0£Ý - a*E1£Û0£Ý*Y1£Û0£Ý*(1 - Y1£Û0£Ý)*XX£Ûi£Ý£Û0£Ý

89.W1£Û1,0£Ý = W1£Û1,0£Ý - a*E1£Û0£Ý*Y1£Û0£Ý*(1 - Y1£Û0£Ý)*XX£Ûi£Ý£Û1£Ý

90.theta1£Û0£Ý = theta1£Û0£Ý - a*E1£Û0£Ý*Y1£Û0£Ý*(1 - Y1£Û0£Ý)

91.W1£Û0,1£Ý = W1£Û0,1£Ý - a*E1£Û1£Ý*Y1£Û1£Ý*(1 - Y1£Û1£Ý)*XX£Ûi£Ý£Û0£Ý

92.W1£Û1,1£Ý = W1£Û1,1£Ý - a*E1£Û1£Ý*Y1£Û1£Ý*(1 - Y1£Û1£Ý)*XX£Ûi£Ý£Û1£Ý

93.theta1£Û1£Ý = theta1£Û1£Ý - a*E1£Û1£Ý*Y1£Û1£Ý*(1 - Y1£Û1£Ý)

94.#print("µÚ1Òþ²ãµÄÁ¬½ÓÏµÊý", W1)

95.#print("µÚ1Òþ²ãµÄãÐÖµÏµÊý", theta1)

96. print("Æ½¾ù×ÜÎó²î" + str(E/4.0))

97.  ¡­

98. ÂÖ£º  1999

99. Ñù±¾£º  0

100. ÊµÀý£º  £Û0. 0.£Ý

101. ±êÇ© £Û0. 1.£Ý

102. µÚ2Òþ²ãµÄÊä³ö: £Û0.07158904 0.92822515 0.£Ý

103. Ñù±¾£º  1

104. ÊµÀý£º  £Û0. 1.£Ý

105. ±êÇ© £Û1. 0.£Ý




106. µÚ2Òþ²ãµÄÊä³ö: £Û0.9138734  0.08633152 0.£Ý

107. Ñù±¾£º  2

108. ÊµÀý£º  £Û1. 0.£Ý

109. ±êÇ© £Û1. 0.£Ý

110. µÚ2Òþ²ãµÄÊä³ö: £Û0.91375259 0.08644981 0.£Ý

111. Ñù±¾£º  3

112. ÊµÀý£º  £Û1. 1.£Ý

113. ±êÇ© £Û0. 1.£Ý

114. µÚ2Òþ²ãµÄÊä³ö: £Û0.11774177 0.88200493 0.£Ý

115. Æ½¾ù×ÜÎó²î0.008480711186161102

µÚ29ÐÐµ½µÚ43ÐÐµÄ´úÂë·Ö±ðÊÇÇ°Ïò´«²¥Ô¤²âÖÐÊ½(5ª²12)ºÍÊ½(5ª²13)µÄÊµÏÖ¡£ºóÃæ·´Ïò´«²¥Ñ§Ï°¹ý³ÌµÄ´úÂëÒ²·Ö±ðÊÇ°´²ã¼ÆËãÐ£¶ÔÎó²î²¢¸üÐÂ²ÎÊýµÄ¼ÆËãÊ½µÄÊµÏÖ¡£
¾­¹ý2000ÂÖÑµÁ·£¬Ã¿ÂÖÆ½¾ù×ÜÎó²îÓÉ0.32½µÎª0.008£¬ÄÜ¹»×¼È·µØÄ£ÄâÒì»òÔËËã£¬×îºóÒ»ÂÖµÄËÄ¸öÊä³öÓëÏàÓ¦±êÇ©Öµ¶Ô±ÈÎª£º 


£Û0.07158904£¬0.92822515£Ý¡ú£Û0.£¬1.£Ý£¬

£Û0.9138734£¬0.08633152£Ý¡ú£Û1.£¬0.£Ý£¬

£Û0.91375259£¬0.08644981£Ý¡ú£Û1.£¬0.£Ý£¬

£Û 0.11774177£¬0.88200493£Ý¡ú£Û0.£¬1.£Ý¡£

¿É¼û£¬Ô¤²âÊä³öºÜ½Ó½üÊµ¼Ê±êÇ©Öµ¡£¹ØÓÚÕâÐ©Êä³öÓë±êÇ©ÖµµÄ±È½Ï£¬½«ÔÚ5.4.2½ÚÓÐ¹ØËðÊ§º¯ÊýµÄÄÚÈÝÖÐ½øÒ»²½ÌÖÂÛ¡£
ÏÂÃæÓÃÉî¶ÈÑ§Ï°¿ò¼ÜÀ´Ä£ÄâÒì»òÔËËã£¬ÒòÎª½ØÖÁ±¾ÊéÍê¸åÊ±MindSpore»¹²»Ö§³ÖÔÚCPUÆ½Ì¨ÉÏÔËÐÐSGDËã×Ó£¬¸ÃÊ¾ÀýÖ»ÓÃTensorFlow 2¿ò¼ÜÀ´ÊµÏÖ£¬¼û´úÂë5ª²7¡£


´úÂë5ª²7Éî¶ÈÑ§Ï°¿ò¼ÜÄ£ÄâÒì»òÔËËã(TensorFlow 2Ä£ÄâÒì»òÔËËãÊ¾Àý.ipynb)



1. import tensorflow as tf

2. import numpy as np

3. 

4. # Ñù±¾ÊµÀý

5. XX = np.array(£Û£Û0.0,0.0£Ý,

6. £Û0.0,1.0£Ý,

7. £Û1.0,0.0£Ý,

8. £Û1.0,1.0£Ý£Ý)

9. # Ñù±¾±êÇ©

10. L = np.array(£Û£Û0.0,1.0£Ý,

11. £Û1.0,0.0£Ý,

12. £Û1.0,0.0£Ý,

13. £Û0.0,1.0£Ý£Ý)

14. 

15. tf_model = tf.keras.Sequential(£Û

16. tf.keras.layers.Dense(4, activation='sigmoid', input_shape=(2,), kernel_initializer='random_uniform', bias_initializer='zeros'),

17. tf.keras.layers.Dense(2, activation='sigmoid', kernel_initializer='random_uniform', bias_initializer='zeros')




18. £Ý)

19. 

20. tf_model.compile(optimiaer=tf.keras.optimizers.SGD(), loss=tf.keras.losses.mean_squared_error, metrics=£Û'accuracy'£Ý)

21. 

22. tf_model.summary()

23. tf_model.fit(XX, L, batch_size=4, epochs=2000, verbose=1)

24. tf_model.evaluate(XX, L)

25.  ¡­

26. ¡­

27. Epoch 2000/2000

28. 4/4 £Û==============================£Ý - 0s 1ms/sample - loss: 0.1588 - accuracy: 1.0000

29. 4/1 £Û==============================£Ý - 0s 61ms/sample - loss: 0.1587 - accuracy: 1.0000

30. £Û0.1586894541978836, 1.0£Ý

31. 

32. tf_model.predict(XX)

33.  array(£Û£Û0.3823219 , 0.6143209 £Ý,

34.£Û0.60479236, 0.39570323£Ý,

35.£Û0.6001088 , 0.40094683£Ý,

36.£Û0.41395947, 0.58794016£Ý£Ý, dtype=float32)

µ±²ÉÓÃÈçÍ¼5ª²10ËùÊ¾µÄ(2£¬2£¬2)È«Á¬½Ó²ãÉñ¾­ÍøÂçÊ±£¬ÑµÁ·2000ÂÖÊ±£¬Îó²îÔ¼Îª0ª±19£¬ËÄ¸ö±êÇ©¶ÔÓ¦µÄÊä³öÎª£º 


£Û0.43767142£¬0.56202793£Ý¡ú£Û0.£¬1.£Ý£¬

£Û0.5493321£¬0.45261452£Ý¡ú£Û1.£¬0.£Ý£¬

£Û0.575727£¬0.42299467£Ý¡ú£Û1.£¬0.£Ý£¬

£Û0.43716326£¬0.5625658 £Ý¡ú£Û 0.£¬1.£Ý¡£

Èç¹ûÔö¼ÓÒþ²ãµÄÊýÁ¿£¬½«ÓÐÐ§Ìá¸ßÄ£ÄâÐ§¹û£¬±ÈÈçÔÚµÚ16ÐÐ£¬½«Òþ²ã½ÚµãÊýÁ¿Ôö¼Óµ½4¸ö£¬ÔòÈçµÚ30ÐÐÊä³ö£¬Îó²î½µµ½Ô¼0.16£¬¶ÔÓ¦±êÇ©Êä³öÈçµÚ33ÐÐµ½µÚ36ÐÐËùÊ¾¡£¶ÁÕß¿ÉÒÔ³¢ÊÔ¼ÌÐøÔö¼ÓÒþ²ãÊýÁ¿¡¢²ãÊý£¬»òÕßÔö¼ÓÑµÁ·ÂÖÊý£¬±È½ÏÄ£ÄâÐ§¹ûµÄ²îÒì¡£
2. Îó²î·´Ïò´«²¥Ñ§Ï°Ëã·¨
½«5.4.1½ÚÖÐµÄÊ¾ÀýÍÆµ¼¹ý³ÌÍÆ¹ãµ½Ò»°ãÇé¿ö¡£
ÉèBPÉñ¾­ÍøÂç¹²ÓÐM+1²ã£¬°üÀ¨ÊäÈë²ãºÍM¸öÒþ²ã(µÚM¸öÒþ²ãÎªÊä³ö²ã)¡£ÍøÂçÊäÈë·ÖÁ¿¸öÊýÎªU£¬Êä³ö·ÖÁ¿¸öÊýÎªV¡£Æä½Úµã±àºÅ·½·¨ÓëÍ¼5ª²8ËùÊ¾µÄÊ¾ÀýÏàÍ¬¡£
ÉèÉñ¾­Ôª²ÉÓÃµÄ¼¤Àøº¯ÊýÎªf(x)¡£
ÉèÑµÁ·Ñù±¾Îª(x£¬l)£¬ÊµÀýÏòÁ¿x=(x(1),x(2),¡­,x(U))£¬±êÇ©ÏòÁ¿l=(l(1),l(2),¡­,l(V))¡£
1) Ç°Ïò´«²¥Ô¤²â
ÉèµÚ1Òþ²ã¹²ÓÐn1¸ö½Úµã£¬ËüÃÇµÄÊä³ö¼ÇÎªy1=£Ûy(1)1,y(2)1,¡­,y(n1)1£Ý£¬ËüÃÇµÄãÐÖµÏµÊý¼ÇÎª¦È1=£Û¦È(1)1,¦È(2)1,¡­,¦È(n1)1£Ý£¬´ÓÊäÈë²ãµ½¸ÃÒþ²ãµÄÁ¬½ÓÏµÊý¼ÇÎªW1=w(1,1)1¡­w(1,n1)1
¦óª÷¦ó
w(U,1)1¡­w(U,n1)1¡£¿ÉµÃ£º 
y1=f(xW1+¦È1)(5ª²29)
ÉèµÚ2Òþ²ã¹²ÓÐn2¸ö½Úµã£¬ËüÃÇµÄÊä³ö¼ÇÎªy2=£Ûy(1)2,y(2)2,¡­,y(n2)2£Ý£¬ËüÃÇµÄãÐÖµÏµÊý¼ÇÎª¦È2=£Û¦È(1)2,¦È(2)2,¡­,¦È(n2)2£Ý£¬´ÓµÚ1Òþ²ãµ½¸ÃÒþ²ãµÄÁ¬½ÓÏµÊý¼ÇÎªW2=w(1,1)1¡­w(1,n2)1
¦óª÷¦ó
w(n1,1)1¡­w(n1,n2)1¡£¿ÉµÃ£º 
y2=f(y1W2+¦È2)(5ª²30)
ÒÀ´Î¿ÉÇ°Ïò¼ÆËã¸÷²ãÊä³ö£¬Ö±µ½Êä³ö²ã¡£Êä³öÎªz=(z(1),z(2),¡­,z(V))¡£
ÐèÒª×¢ÒâµÄÊÇ£¬ËùÓÐÁ¬½ÓÏµÊýºÍãÐÖµÏµÊýÔÚËã·¨ÔËÐÐÇ°¶¼ÐèÒªÖ¸¶¨Ò»¸ö³õÊ¼Öµ£¬¿É²ÉÓÃ¸³ÓèËæ»úÊýµÄ·½Ê½¡£
2) ·´Ïò´«²¥Ñ§Ï°
ÉèËðÊ§º¯Êý²ÉÓÃ¾ù·½Îó²î¡£Êä³ö²ãµÄÐ£¶ÔÎó²î¼ÇÎªEM£º 
EM=(E1M,E2M,¡­,EVM)=z-l(5ª²31)
µÚM-1²ãµÄÐ£¶ÔÎó²î¼ÇÎªEM-1£º 
EM-1=EM¡Áªµy(1)Mªµy(1)M-1¡­ªµy(1)Mªµy(nM-1)M-1
¦óª÷¦ó
ªµy(V)Mªµy(1)M-1¡­ªµy(V)Mªµy(nM-1)M-1(5ª²32)
ÆäÖÐ£¬ÓÒ²àµÄ¾ØÕóÊÇµÚM²ãÊä³ö¶ÔµÚM-1²ãÊä³öµÄÆ«µ¼ÊýÅÅÁÐµÄ¾ØÕó£¨¼´µÚM²ãÊä³ö¶ÔµÚM-1²ãÊä³öµÄÑÅ¿É±È¾ØÕó£©£»  nM-1ÊÇµÚM-1²ãµÄ½ÚµãÊý¡£
ÒÀ´Î¿É·´Ïò¼ÆËã¸÷²ãµÄÐ£¶ÔÎó²î£¬Ö±µ½µÚ1Òþ²ã¡£
½ÓÏÂÀ´£¬¸ù¾ÝÐ£¶ÔÎó²î¸üÐÂÁ¬½ÓÏµÊýºÍãÐÖµÏµÊý¡£¶ÔµÚiÒþ²ãµÄµÚj½ÚµãµÄµÚk¸öÁ¬½ÓÏµÊýw(k,j)i£º 
w(k,j)i¡ûw(k,j)i-¦Á¡¤Eji¡¤ªµy(j)iªµw(k,j)i(5ª²33)
ÆäÖÐ£¬ªµy(j)iªµw(k,j)iµÄ¼ÆËãÎª£º 
ªµy(j)iªµw(k,j)i=ªµy(j)iªµ(yi-1¡ÁWi|j+¦È(j)i)¡¤ªµ(yi-1¡ÁWi|j+¦È(j)i)ªµw(k,j)i

= f¡ä(x)|x=yi-1¡ÁWi|j+¦È(j)i¡¤y(k)i-1(5ª²34)

ÆäÖÐ£¬yi-1¡ÁWi|j+¦È(j)iÎª¸Ã½ÚµãÊäÈëµÄÏßÐÔ×éºÏ²¿·Ö£»  Wi|j±íÊ¾WiµÄµÚjÁÐ¡£Ê½£¨5ª²34£©ÖÐ£¬Èç¹û³öÏÖy(k)0£¬ÔòËü±íÊ¾x(k)£¬¼´Ô­Ê¼ÊäÈë¡£
¶Ô¸Ã½ÚµãµÄãÐÖµÏµÊý¦È(j)i£º 
¦È(j)i¡û¦È(j)i-¦Á¡¤Eji¡¤ªµy(j)iªµ¦È(j)i=¦È(j)i-¦Á¡¤Eji¡¤f¡ä(x)|x=yi-1¡ÁWi|j+¦È(j)i(5ª²35)
ÒÔÉÏ¸ø³öÁËµ¥¸öÑµÁ·Ñù±¾µÄBPËã·¨¼ÆËã¹ý³Ì¡£µ±²ÉÓÃÅúÌÝ¶ÈÏÂ½µ·¨Ê±£¬¶ÔÒ»ÅúÑµÁ·Ñù±¾¼ÆËã³öµ¼Êýºó£¬È¡Æ½¾ùÊý×÷ÎªÏÂ½µµÄÌÝ¶È¡£
Ò»°ãµÄÉî¶ÈÑ§Ï°¿ò¼Ü¶¼ÄÚÖÃÊµÏÖÁËBPËã·¨£¬³ýÁË½øÐÐÌØ±ðµÄÑÐ¾¿Íâ£¬Ò»°ã²»ÐèÒªÓÃ»§ÊµÏÖ»òÐÞ¸ÄBPËã·¨¡£
5.4.2Éñ¾­ÍøÂç³£ÓÃ¼¤»îº¯Êý¡¢ËðÊ§º¯ÊýºÍÓÅ»¯·½·¨
Ç°ÎÄµÄÊ¾Àý£¬Ö÷Òª²ÉÓÃµÄ¼¤»îº¯Êý¡¢ËðÊ§º¯ÊýºÍÓÅ»¯·½·¨·Ö±ðÎª£º Sigmoid¡¢MSEºÍSGD¡£±¾½ÚÓÃÊ¾ÀýÀ´ÌÖÂÛÆäËû³£ÓÃµÄ¼¤»îº¯Êý¡¢ËðÊ§º¯ÊýºÍÓÅ»¯·½·¨£¬±È½Ï¸÷º¯ÊýºÍ·½·¨µÄÐ§¹û¡£
ÏÈ¸ø³öÒ»¸ö¾­µäµÄ·ÖÀàÈÎÎñÊ¾Àý£º ÊÖÐ´ÌåÊý×ÖÊ¶±ð¡£¸ÃÊ¾Àý²ÉÓÃÈ«Á¬½Ó²ãÉñ¾­ÍøÂç£¬ÒòÎª½ØÖÁ±¾ÊéÍê¸åÊ±MindSpore¿ò¼Ü¶ÔËã×ÓÔÚCPUÆ½Ì¨ÉÏÔËÐÐµÄÖ§³Ö»¹²»¹»¶à£¬ÈÔÈ»²ÉÓÃÔÚTensorFlow 2Éî¶ÈÑ§Ï°¿ò¼ÜÏÂÊµÏÖ¡£
MNISTÊý¾Ý¼¯http://yann.lecun.com/exdb/mnist/ÊÇÒ»¸öÊÖÐ´ÌåµÄÊý×ÖÍ¼Æ¬¼¯£¬Ëü°üº¬ÓÐÑµÁ·¼¯ºÍ²âÊÔ¼¯£¬ÓÉ250¸öÈËÊÖÐ´µÄÊý×Ö¹¹³É¡£ÑµÁ·¼¯°üº¬60000¸öÑù±¾£¬²âÊÔ¼¯°üº¬10000¸öÑù±¾¡£Ã¿¸öÑù±¾°üÀ¨Ò»·ùÍ¼Æ¬ºÍÒ»¸ö±êÇ©¡£Ã¿·ùÍ¼Æ¬ÓÉ28¡Á28¸öÏñËØµã¹¹³É,Ã¿¸öÏñËØµãÓÃ1¸ö»Ò¶ÈÖµ±íÊ¾¡£±êÇ©ÊÇÓëÍ¼Æ¬¶ÔÓ¦µÄ0~9µÄÊý×Ö¡£ÑµÁ·¼¯µÄÇ°10·ùÍ¼Æ¬ÈçÍ¼5ª²11ËùÊ¾¡£


Í¼5ª²11MNISTÍ¼Æ¬Ê¾Àý


MNISTÊý¾Ý¼¯Ïà¶Ô¼òµ¥£¬ÊÊºÏ×÷ÎªÑ§Ï°Éñ¾­ÍøÂçµÄÈëÃÅÊ¾Àý¡£ÊÖÐ´ÌåÊý×ÖÊ¶±ðµÄÈÎÎñÊÇ¹¹½¨Éñ¾­ÍøÂç£¬²¢ÓÃÑµÁ·¼¯ÈÃÉñ¾­ÍøÂç½øÐÐÓÐ¼à¶½µØÑ§Ï°£¬ÓÃÑéÖ¤¼¯À´ÑéÖ¤ËüµÄ·ÖÀàÐ§¹û¡£
¹¹½¨¶à²ãÈ«Á¬½ÓÉñ¾­ÍøÂçÀ´½øÐÐ·ÖÀàÈÎÎñ£¬Ê¾Àý´úÂë¼û´úÂë5ª²8¡£


´úÂë5ª²8ÊÖÐ´ÌåÊý×ÖÊ¶±ð¶à²ãÈ«Á¬½ÓÉñ¾­ÍøÂçÊ¾Àý(MNIST¶à²ãÈ«Á¬½ÓÉñ¾­ÍøÂçÓ¦ÓÃÊ¾Àý.ipynb)



1. import numpy as np

2. import tensorflow.keras as ka




3. import datetime

4.  

5. np.random.seed(0)

6.  

7. (X_train, y_train), (X_val, y_val) = ka.datasets.mnist.load_data("E:£Üdatasets£ÜMNIST_Data£Ümnist.npz")# ¼ÓÔØÊý¾Ý¼¯£¬²¢·Ö³ÉÑµÁ·¼¯ºÍÑéÖ¤¼¯

8.  

9. num_pixels = X_train.shape£Û1£Ý * X_train.shape£Û2£Ý# Ã¿·ùÍ¼Æ¬µÄÏñËØÊýÎª784

10. 

11. # ½«¶þÎ¬µÄÊý×éÀ­³ÉÒ»Î¬µÄÏòÁ¿

12. X_train = X_train.reshape(X_train.shape£Û0£Ý, num_pixels).astype('float32')

13. X_val = X_val.reshape(X_val.shape£Û0£Ý, num_pixels).astype('float32')

14. 

15. # ¹éÒ»»¯

16. X_train = X_train / 255

17. X_val = X_val / 255

18.  

19. y_train = ka.utils.to_categorical(y_train)# ×ª»¯Îª¶ÀÈÈ±àÂë

20. y_val = ka.utils.to_categorical(y_val)

21. num_classes = y_val.shape£Û1£Ý# 10

22. 

23. # ¶à²ãÈ«Á¬½ÓÉñ¾­ÍøÂçÄ£ÐÍ

24. model = ka.Sequential(£Û

25. ka.layers.Dense(num_pixels, input_shape=(num_pixels,), kernel_initializer='normal', activation='sigmoid'),

26. ka.layers.Dense(784, kernel_initializer='normal', activation='sigmoid'),

27. ka.layers.Dense(num_classes, kernel_initializer='normal', activation='sigmoid')

28. £Ý)

29. model.summary()

30. 

31. model.compile(loss='categorical_crossentropy', optimizer='sgd', metrics=£Û'accuracy'£Ý)

32. #model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=£Û'accuracy'£Ý)

33. 

34. startdate = datetime.datetime.now()# »ñÈ¡µ±Ç°Ê±¼ä

35. model.fit(X_train, y_train, validation_data=(X_val, y_val), epochs=20, batch_size=200, verbose=2)

36. enddate = datetime.datetime.now()

37. 

38. print("ÑµÁ·ÓÃÊ±£º " + str(enddate - startdate))

39.  

40. Model: "sequential"

41. _________________________________________________________________

42. Layer (type)Output ShapeParam#   

43. =================================================================

44. dense (Dense)(None, 784) 615440

45. _________________________________________________________________




46. dense_1 (Dense)(None, 784) 615440

47. _________________________________________________________________

48. dense_2 (Dense)(None, 10)7850 

49. =================================================================

50. Total params: 1,238,730

51. Trainable params: 1,238,730

52. Non-trainable params: 0

53. _________________________________________________________________

54. Train on 60000 samples, validate on 10000 samples

55. Epoch 1/20

56. 60000/60000 - 23s - loss: 0.1025 - accuracy: 0.1292 - val_loss: 0.0903 - val_accuracy: 0.1221

57. Epoch 2/20

58. 60000/60000 - 14s - loss: 0.0901 - accuracy: 0.1226 - val_loss: 0.0899 - val_accuracy: 0.1230

59. Epoch 3/20

60. ¡­¡­

µÚ7ÐÐ¼ÓÔØÊý¾Ý¼¯¡£Í¨¹ýkeras.datasets.mnist.load_data()¿ÉÄÜÎÞ·¨³É¹¦´Ó¹ÙÍøÏÂÔØ£¬¿ÉÒÔÓÃÏÂÔØ¹¤¾ßÌáÇ°ÏÂÔØ»òÕß´ÓÆäËûÔ´ÏÂÔØ¡£±¾ÀýÖÐÒÑ¾­ÌáÇ°ÏÂÔØmnist.npzÎÄ¼þ£¬²¢´æ·ÅÔÚE:£Üdatasets£ÜMNIST_Data£ÜÄ¿Â¼ÏÂ¡£
µÚ12ÐÐ½«¶þÎ¬µÄÍ¼ÏñÊý¾ÝÀ­³ÉÒ»Î¬£¬Ê¹Êý¾ÝÊÊºÏ¶à²ãÉñ¾­ÍøÂçµÄÊäÈëÒªÇó¡£µÚ16~17ÐÐ½«Ñù±¾ÌØÕ÷½øÐÐ¹éÒ»»¯£¬»Ò¶ÈµÄÈ¡Öµ·¶Î§ÊÇ0~255£¬Òò´Ë³ýÒÔ255¾ÍÊµÏÖÁË¹éÒ»»¯¡£
µÚ19ÐÐ²ÉÓÃÁË¶ÀÈÈ(Oneª²Hot)±àÂë¡£¶ÀÈÈ±àÂë³£ÓÃÀ´´¦ÀíÃ»ÓÐ´ÎÐòµÄ·ÖÀàÌØÕ÷¡£
·ÖÀàÌØÕ÷ÊÇÔÚÒ»¸ö¼¯ºÏÀïÃ»ÓÐ´ÎÐòµÄÓÐÏÞ¸öÖµ£¬ÈçÈËµÄÐÔ±ð¡¢°à¼¶±àºÅµÈ¡£¶Ô·ÖÀàÌØÕ÷³£¼ûµÄ±àÂë·½Ê½ÊÇÕûÊý£¬ÈçÄÐÅ®ÐÔ±ð·Ö±ð±íÊ¾Îª1¡¢0£¬Ò»°à¡¢¶þ°à¡¢Èý°àµÈ·Ö±ð±íÊ¾Îª1¡¢2¡¢3µÈ¡£µ«ÊÇ£¬ÕûÊý±àÂëÌìÈ»´æÔÚ´ÎÐò£¬¶øÔ­À´µÄ·ÖÀàÌØÕ÷ÊÇÃ»ÓÐ´ÎÐòµÄ¡£Èç¹ûËã·¨²»¿¼ÂÇËüÃÇµÄ²î±ð£¬Ôò»á´øÀ´ÒâÏë²»µ½µÄºó¹û¡£±ÈÈç£¬°à¼¶·Ö±ðÓÃ1¡¢2¡¢3¡¢4µÈÀ´±àÂëÊ±£¬Èç¹û»úÆ÷Ñ§Ï°Ëã·¨ºöÂÔÁË´ÎÐòÎÊÌâ£¬¾Í»áÈÏÎªÒ»°àºÍ¶þ°àÖ®¼äµÄ¾àÀëÊÇ1£¬¶øÒ»°àºÍÈý°àÖ®¼äµÄ¾àÀëÊÇ2¡£
ÎªÁË·ÀÖ¹´ËÀà´íÎóµÄ³öÏÖ£¬³£²ÉÓÃ¶ÀÈÈ±àÂë¡£¼ÙÈç·ÖÀàÌØÕ÷ÓÐn¸öÀà±ð£¬¶ÀÈÈ±àÂëÔòÊ¹ÓÃnÎ»À´¶ÔËüÃÇ½øÐÐ±àÂë¡£ÀýÈç£¬¼ÙÉèÓÐËÄ¸ö°à£¬ÔòÒ»°àµ½ËÄ°à·Ö±ð±àÂëÎª0001£¬0010£¬0100£¬1000£¬Ã¿¸ö±àÂëÖ»ÓÐÒ»Î»ÓÐÐ§¡£Èç´Ë£¬ÈÎÒâÁ½¸ö°àÖ®¼äµÄLp¾àÀë¶¼ÏàµÈ£¬ÈçL1¾àÀë¶¼Îª2£¬L2¾àÀë¶¼Îª2£¬L3¾àÀë¶¼Îª32£¬¡­£¬L¡Þ¾àÀë¶¼Îª1¡£
ÔÚÓÃÓÚ·ÖÀàµÄÉñ¾­ÍøÂçÖÐ³£¶ÔÊä³öµÄÀà±êÇ©²ÉÓÃ¶ÀÈÈ±àÂë¡£Èç±¾Ê¾ÀýÖÐ£¬Êä³öµÄ±êÇ©Àà±ðÊýÎª10£¬Èç¹û²»²ÉÓÃ¶ÀÈÈ±àÂë£¬ÄÇÃ´Éñ¾­ÍøÂçµÄÊä³ö²ãÎª1¸ö½Úµã£¬Êä³öÖµÔò¿ÉÄÜ³öÏÖ0µ½9ÒÔÍâµÄÊý¡£Èç¹û²ÉÓÃ¶ÀÈÈ±àÂë£¬ÔòÊä³ö²ãµÄ½ÚµãÎª10¸ö£¬Ã¿´ÎÖ»ÓÐÒ»¸ö½ÚµãÊä³ö1£¬ÆäËûÈ«Îª0¡£Êµ¼ÊÉÏ£¬Èç±í5ª²3ËùÊ¾µÄÄ£ÄâÒì»òÔËËãµÄÑµÁ·Ñù±¾µÄ±êÇ©¾Í²ÉÓÃÁË¶ÀÈÈ±àÂë¡£
µÚ24ÐÐµ½28ÐÐ¹¹½¨ÁËÒ»¸öËÄ²ãÉñ¾­ÍøÂç£¬ËüÓÐÈý¸öÒþ²ã(È«Á¬½Ó²ã)£¬¼¤»îº¯Êý¶¼²ÉÓÃSigmoidº¯Êý¡£ËðÊ§º¯Êý²ÉÓÃ¾ù·½Îó²îMSE£¬ÓÅ»¯Ëã·¨²ÉÓÃÌÝ¶ÈÏÂ½µ·¨£¬ÆÀ²âÖ¸±ê²ÉÓÃ×¼È·ÂÊ¡£
ÑµÁ·20ÂÖ£¬¶Ô²âÊÔÑù±¾½öÄÜ´ïµ½0.1921µÄÊ¶±ðÂÊ¡£
ÎªÁËÊ¹¶ÁÕß¸ü¼ÓÉîÈëµØÀí½âÈ«Á¬½Ó²ãÉñ¾­ÍøÂç£¬½áºÏ¸ÃÊ¾ÀýÀ´½â¶ÁÁ½¸öÓÐ¹ØÄ£ÐÍµÄÎÊÌâ¡£
µÚ29ÐÐÓÃsummary()·½·¨Êä³öÁËÄ£ÐÍµÄ²ÎÊýÇé¿ö£¬ÈçµÚ39ÐÐÖÁ51ÐÐËùÊ¾¡£¿ÉÒÔ¿´µ½Èý¸öÈ«Á¬½Ó²ãµÄ²ÎÊý¸öÊý·Ö±ðÊÇ615440¡¢615440ºÍ7850¡£ÒòÎªÍ¼Æ¬ÊÇÓÉ28¡Á28¸öÏñËØµã¹¹³É£¬Òò´ËÊäÈë²ãµÄ½Úµã¸öÊýÎª784(µÚ9´úÂë)£¬µÚÒ»Òþ²ãÎª784¸ö½Úµã£¬Òò´Ë×÷ÎªÈ«Á¬½Ó²ã£¬ÆäÁ¬½ÓÏµÊý¸öÊýÎª784¡Á784=614656£¬ÔÙ¼ÓÉÏ784¸ö½ÚµãµÄãÐÖµÏµÊý£¬ËùÒÔµÚÒ»Òþ²ã¹²ÓÐ615440¸öÒªÑ§Ï°µÄ²ÎÊý¡£
µÚ7ÐÐÔÚ¼ÓÔØÊý¾ÝÊ±£¬·Ö³ÉÁËÑµÁ·¼¯ºÍÑéÖ¤¼¯¡£ÔÚµÚ35ÐÐÄ£ÐÍÑµÁ·Ê±£¬ÔÚÃ¿ÂÖÑµÁ·½áÊøÊ±ÓÃÑéÖ¤¼¯À´ÑéÖ¤Ä£ÐÍÐ§¹û¡£½«verbose²ÎÊýÉèÖÃÎª2£¬¿ÉÒÔÏÔÊ¾ÏêÏ¸µÄÑµÁ·¹ý³Ì£¬ÈçµÚ56ÐÐËùÊ¾£¬·Ö±ðÁÐ³öÃ¿ÂÖÑµÁ·½áÊøºóµÄÑµÁ·Ñù±¾ËðÊ§Öµ¡¢ÑµÁ·Ñù±¾×¼È·ÂÊ¡¢ÑéÖ¤Ñù±¾ËðÊ§ÖµºÍÑéÖ¤Ñù±¾×¼È·ÂÊ¡£ËüÃÇÔÚÑµÁ·µü´ú¹ý³ÌÖÐµÄ±ä»¯£¬¿ÉÒÔ½ÒÊ¾³öÄ³Ð©ÑµÁ·Çé¿ö£¬ÈçÑµÁ·Ñù±¾ËðÊ§ÖµÏÂ½µ¶øÑéÖ¤Ñù±¾ËðÊ§ÖµÉÏÉý£¬Ôò¿ÉÄÜÒÑ¾­¿ªÊ¼¹ýÄâºÏ£¬ÈçÁ½Õß³ÖÐø²»±ä»òÎ¢Ð¡±ä»¯£¬ÔòËµÃ÷ÑµÁ·Óöµ½Æ¿¾±£¬¿ÉÄÜÐèÒª²ÉÈ¡¼õÉÙÌÝ¶ÈÏÂ½µ·¨ÖÐµÄÑ§Ï°ÂÊ(²½³¤)µÈ´ëÊ©¡£
ÏÂÃæÓÃ¸ÃÊ¾ÀýÀ´ÌÖÂÛÉñ¾­ÍøÂçÖÐ³£ÓÃµÄ¼¤»îº¯Êý¡¢ËðÊ§º¯ÊýºÍÓÅ»¯·½·¨¡£
1. ¼¤»îº¯Êý
³£ÓÃµÄ¼¤»îº¯Êý»¹ÓÐReLUº¯Êý¡¢Softplusº¯Êý¡¢tanhº¯ÊýºÍSoftmaxº¯ÊýµÈ¡£
ReLUº¯ÊýµÄ¶¨ÒåÎª£º 
f(x)=max(0,x)(5ª²36)
Softplusº¯ÊýµÄ¶¨ÒåÎª£º 
f(x)=ln(1+ex)(5ª²37)
ReLUº¯ÊýºÍSoftplusº¯ÊýÇóµ¼¼òµ¥¡¢ÊÕÁ²¿ì£¬ÔÚÉñ¾­ÍøÂçÖÐµÃµ½ÁË¹ã·ºÓ¦ÓÃ¡£ËüÃÇµÄÍ¼ÏñÈçÍ¼5ª²12ÖÐÊµÏßºÍÐéÏßËùÊ¾£¬Softplusº¯Êý¿ÉÒÔ¿´×÷ÊÇ¡°Èí»¯¡±ÁËµÄReLUº¯Êý¡£


Í¼5ª²12ReLUº¯ÊýÓëSoftplusº¯Êý

tanhº¯ÊýµÄÍ¼ÏñÀàËÆÓÚSigmoidº¯Êý£¬×÷ÓÃÒ²ÀàËÆÓÚSigmoidº¯Êý¡£ËüµÄ¶¨ÒåÎª£º 
tanh(x)=sinh (x)cosh(x)=ex-e-xex+e-x(5ª²38)
Êµ¼ÊÉÏ£º 
tanh(x)=2Sigmoid(2x)-1(5ª²39)
¼ÙÉèÓÐÒ»×éÊµÊýy1,y2,¡­,yK(¿É¿´×÷¶à·ÖÀàµÄ½á¹û)£¬Softmaxº¯Êý½«ËüÃÇ×ª»¯ÎªÒ»×é¶ÔÓ¦µÄ¸ÅÂÊÖµ£º  
pk=eyk¡ÆKi=1eyi,k=1,2,¡­,K(5ª²40)
Ò×Öª¡Æpk=1¡£
Softmaxº¯ÊýÍ¨¹ýÖ¸ÊýÔËËã·Å´óy1,y2,¡­,yKÖ®¼äµÄ²î±ð£¬Ê¹Ð¡µÄÖµÇ÷½ü0£¬¶øÊ¹×î´óÖµÇ÷½ü1£¬Òò´ËËüµÄ×÷ÓÃÀàËÆÓÚÈ¡×î´óÖµmaxº¯Êý£¬µ«ÓÖ²»ÄÇÃ´ÉúÓ²£¬ËùÒÔ½ÐSoftmax¡£¼ÙÈçÓÐÒ»×éÊý1¡¢2¡¢5¡¢3£¬ÈÝÒ×¼ÆËã³öËüÃÇµÄSoftmaxº¯ÊýÖµ·Ö±ðÔ¼Îª0.01¡¢0ª±04¡¢0.83¡¢0.11£¬½«ËüÃÇµÄÔ­ÊýÖµºÍSoftmaxº¯ÊýÖµ¡¢maxº¯ÊýÖµµÈ±ÈÀý»­³ö£¬ÈçÍ¼5ª²13ËùÊ¾¡£


Í¼5ª²13Softmaxº¯Êý×÷ÓÃÊ¾Àý


Softmaxº¯ÊýÔÚÉñ¾­ÍøÂçÖÐÖ÷ÒªÓÃÀ´×÷Êä³öÖµµÄ¹éÒ»»¯£¬³£ÓÃÓÚ·ÖÀàÈÎÎñµÄÉñ¾­ÍøÂçµÄÊä³ö²ãµÄ¼¤»îº¯ÊýÖÐ¡£
ÐÞ¸Ä´úÂë5ª²8µÚ24ÐÐµ½µÚ27ÐÐ´úÂë£¬Ê¹Ä£ÐÍ·Ö±ð²ÉÓÃ²»Í¬¼¤»îº¯Êý×éºÏ½øÐÐ±È½Ï£¬ÆäËû²ÎÊý²»±ä£¬ÈÔÎªMSEËðÊ§º¯Êý¡¢SGDÓÅ»¯·½·¨£¬²¢ÑµÁ·20ÂÖ£¬ÔËÐÐ½á¹ûÈç±í5ª²4ËùÊ¾¡£


±í5ª²4MNIST·ÖÀàÖÐ²»Í¬¼¤»îº¯Êý×éºÏÊ±µÄÐ§¹û±È½Ï



ÐòºÅÒþ²ã1Òþ²ã2Êä³ö²ã²âÊÔÑù±¾×¼È·ÂÊ

1SoftmaxSoftmaxSoftmax0.1135

2ReLUReLUReLU0.9202

3SoftplusSoftplusSoftplus0.8136

4tanhtanhtanh0.9030

5SigmoidSigmoidSoftmax0.2195

6ReLUReLUSoftmax0.8617

¿É¼û£¬²ÉÓÃ²»Í¬µÄ¼¤»îº¯Êý£¬ÆäÐ§¹ûÓÐºÜ´óµÄ²îÒì¡£
²ÉÓÃÊ²Ã´ÑùµÄ¼¤»îº¯Êý£¬Òª¸ù¾ÝÀíÂÛÑÐ¾¿¡¢¹¤³Ì¾­ÑéºÍÊÔÑé×ÛºÏ·ÖÎö¡£ÈçÔÚ4.5.3½ÚµÄ¹ýÄâºÏÊ¾ÀýÖÐ£¬Èç¹û²ÉÓÃSoftplus¼¤»îº¯Êý£¬ÑµÁ·ÂÖÊýÈÔÎª5000£¬ÍøÂç½á¹¹ÈÔÈ»ÊÇËÄ²ã(1£¬5£¬5£¬1)½á¹¹£¬·Ö±ð¶ÔÑù±¾ÌØÕ÷½øÐÐ¹éÒ»»¯´¦ÀíºÍ²»¹éÒ»»¯´¦ÀíÊ±ÄâºÏ¶àÏîÊ½µÄ½á¹ûÈçÍ¼5ª²14ËùÊ¾¡£


Í¼5ª²14²ÉÓÃSoftplus¼¤»îº¯ÊýÄâºÏ¶àÏîÊ½µÄ½á¹û


ÕâÊÇÒòÎªSoftplusº¯Êý½«¸ºÊýÇ÷½ü0(¼ûÍ¼5ª²12)£¬Òò´ËÔÚ²»¹éÒ»»¯´¦ÀíÊ±£¬ÍøÂç¶ÔÄ¿±êº¯ÊýµÄ¸ºÊý²¿·Ö´¦ÀíÄÜÁ¦ºÜµÍ¡£
2. ËðÊ§º¯Êý
Ç°ÎÄ²ÉÓÃµÄÆ½·½ºÍÐÎÊ½µÄËðÊ§º¯ÊýMSEÊÇ»ùÓÚÅ·ÊÏ¾àÀëµÄËðÊ§º¯Êý¡£Éñ¾­ÍøÂçÖÐ³£ÓÃµÄËðÊ§º¯Êý»¹ÓÐKLÉ¢¶ÈËðÊ§º¯Êý(Kullbackª²Leibler Divergence)¡¢½»²æìØ(Crossentropy)ËðÊ§º¯ÊýµÈ¡£
½»²æìØ¿ÉÒÔÓÃÀ´ºâÁ¿Á½¸ö·Ö²¼Ö®¼äµÄ²î¾à£¬ÏÂÃæÒÔÊ¾ÀýÈëÊÖÌÖÂÛ¡£
´úÂë5ª²6Ä£ÄâÁËÒì»òÔËËãÈý²ã¸ÐÖª»úµÄÎó²î·´Ïò´«²¥Ñ§Ï°¹ý³Ì£¬×îºó¸ø³öÁËÔ¤²âÊä³öÓë±êÇ©ÖµµÄ¶Ô±È£¬ÖØÐÂÁÐ³öÈçÏÂ£º 


(a) £Û 0.07158904  0.92822515 £Ý ¡ú £Û 0.  1.£Ý

(b) £Û 0.9138734   0.08633152 £Ý ¡ú £Û 1.  0.£Ý

(c) £Û 0.91375259  0.08644981 £Ý ¡ú £Û 1.  0.£Ý

(d) £Û 0.11774177  0.88200493 £Ý ¡ú £Û 0.  1.£Ý

¶ÔÓÚ£¨a£©ºÍ£¨d£©Á½ÏîÊä³ö£¬±êÇ©Öµ¶¼ÊÇ£Û 0.1.£Ý£¬Ö±¹ÛÀ´¿´£¨a£©µÄÔ¤²âÓ¦¸Ã¸ü×¼Ò»Ð©¡£ÈçºÎÐÎÊ½»¯µØ¶ÈÁ¿ËüÃÇÓë±êÇ©ÖµµÄ²î¾àÄØ£¿
ÓÃpi±íÊ¾µÚi¸öÊä³öµÄ±êÇ©Öµ£¬¼´ÕæÊµÖµ£» ÓÃqi±íÊ¾µÚi¸öÊä³öÖµ£¬¼´Ô¤²âÖµ¡£½«piÓëqiÖ®¼äµÄ¶ÔÊý²îÔÚpiÉÏµÄÆÚÍûÖµ³ÆÎªÏà¶ÔìØ£º 
DKL(¡¬p¡¬q)=Epi(lnpi-lnqi)=¡Æni=1pi(lnpi-lnqi)=¡Æni=1pilnpiqi(5ª²41)
¼ÆËã(a)ºÍ(d)Á½ÏîÊä³öµÄÏà¶ÔìØ£º 
Da=0¡Áln00.07158904+1¡Áln10.92822515=0.07447962

Dd=0¡Áln00.11774177+1¡Áln10.88200493=0.12555622(5ª²42)
ÆäÖÐ£¬0¡Áln0¼ÆÎª0¡£
ÓëÖ±½Ó¹Û²ìµÄ½áÂÛÏàÍ¬¡£¿É¼û£¬Ïà¶ÔìØÔ½´óµÄÊä³öÓë±êÇ©Öµ²î¾àÔ½´ó¡£Èç¹ûpiÓëqiÏàÍ¬£¬ÄÇÃ´DKL(p¡¬q)=0¡£
ÖµµÃ×¢ÒâµÄÊÇ£¬Ïà¶ÔìØ²»¾ßÓÐ¶Ô³ÆÐÔ¡£Ïà¶ÔìØÓÖ³ÆÎªKLÉ¢¶È¡£
½«Ïà¶ÔìØµÄ¶¨ÒåÊ½(5ª²41)½øÒ»²½Õ¹¿ª£º 
DKL(p¡¬q)=¡Æni=1pi(lnpi-lnqi)=¡Æni=1pilnpi+-¡Æni=1pilnqi(5ª²43)
Ç°Ò»ÏîµÄÖµÖ»ÓëÕæÊµÖµpiÓÐ¹Ø£¬Òò´ËÒ»°ãÓÃºóÒ»Ïî×÷ÎªÁ½¸ö·Ö²¼Ö®¼ä²îÒìµÄ¶ÈÁ¿£¬³ÆÎª½»²æìØ£º 
H(p,q)=-¡Æni=1pilnqi(5ª²44)
Èç¹ûÖ»ÓÐÕý¸ºÁ½¸ö·ÖÀà(±êÇ©¼ÇÎª+1ºÍ-1)£¬¼Ç±êÇ©ÎªÕýÀàµÄ¸ÅÂÊÎªy£¬¼ÇÔ¤²âÎªÕýÀàµÄ¸ÅÂÊÎªp£¬ÄÇÃ´Ê½£¨5ª²44£©Îª£º 
H(y,p)=-£Ûylnp+(1-y)ln(1-p)£Ý(5ª²45)
½»²æìØËðÊ§º¯ÊýÔÚÌÝ¶ÈÏÂ½µ·¨ÖÐ¿ÉÒÔ¸ÄÉÆMSEÑ§Ï°ËÙÂÊ½µµÍµÄÎÊÌâ£¬µÃµ½ÁË¹ã·ºµÄÓ¦ÓÃ¡£
²ÉÓÃSGDÓÅ»¯·½·¨£¬Èý²ã·Ö±ð²ÉÓÃReLU¡¢ReLUºÍSoftmax¼¤»îº¯Êý£¬ÑµÁ·20ÂÖ£¬²ÉÓÃ²»Í¬µÄËðÊ§º¯Êý½øÐÐ±È½Ï£¬´úÂë5ª²8ËùÊ¾µÄÊ¾ÀýµÄÔËÐÐ½á¹ûÈç±í5ª²5ËùÊ¾¡£


±í5ª²5MNIST·ÖÀàÖÐ²ÉÓÃ²»Í¬ËðÊ§º¯ÊýÊ±µÄÐ§¹û±È½Ï



ÐòºÅËð Ê§ º¯ Êý²âÊÔÑù±¾×¼È·ÂÊ

1KLD0.9523

2categorical_crossentropy0.9540

3MSE0.8617

3. ¶à²ãÉñ¾­ÍøÂç³£ÓÃÓÅ»¯Ëã·¨
ÏÂÃæÌÖÂÛ³£ÓÃÓÚ¶à²ãÉñ¾­ÍøÂçÖÐµÄÓÅ»¯Ëã·¨£¬ËüÃÇ¶¼ÊÇÌÝ¶ÈÏÂ½µ·¨µÄ¸Ä½ø·½·¨£¬Ö÷Òª´ÓÔö¼Ó¶¯Á¿ºÍµ÷ÕûÓÅ»¯²½³¤Á½·½Ãæ×ÅÊÖ¡£
1) ²½³¤ÓÅ»¯Ëã·¨
ÔÚ4.2.1½Ú¼òÒªÌÖÂÛÁË²½³¤¶ÔÌÝ¶ÈÏÂ½µµÄÓ°Ïì¼°µ÷Õû´óÐ¡µÄ²ßÂÔ¡£ÎªÁË¿Ë·þ¹Ì¶¨²½³¤µÄ±×¶Ë£¬MindSporeÉî¶ÈÑ§Ï°¿ò¼ÜºÍTensorFlow 2Éî¶ÈÑ§Ï°¿ò¼Ü¶¼Ìá¹©ÁË¶¯Ì¬µ÷Õû²½³¤µÄ·½·¨¡£


´úÂë5ª²9MindSporeºÍTensorFlow 2ÖÐµÄSGDÔ­ÐÍ



1. # MindSpore¿ò¼ÜÏÂ

2. class mindspore.nn.SGD(params, learning_rate=0.1, momentum=0.0, dampening=0.0, weight_decay=0.0, nesterov=False, loss_scale=1.0)

3. 

4. # TensorFlow¿ò¼ÜÏÂ

5. tf.keras.optimizers.SGD(

6. learning_rate=0.01, momentum=0.0, nesterov=False, name='SGD', **kwargs

7. )

MindSporeºÍTensorFlow 2ÖÐµÄSGDÔ­ÐÍ¼û´úÂë5ª²9¡£Á½ÕßÔ­ÐÍÖÐµÄlearning_rate³¬²ÎÊý£¨¼´ÌÝ¶ÈÏÂ½µ·¨ÖÐµÄ²½³¤£¬Ò²³ÆÎªÑ§Ï°ÂÊ£©Ä¬ÈÏ³õÊ¼Öµ¶¼ÊÇ¹Ì¶¨µÄ0.1£¬¿ÉÒÔÉèÖÃÎª¶¯Ì¬µÄ²½³¤¡£ÉèÖÃ¶¯Ì¬²½³¤¿ÉÒÔÊ¹ÓÃ¿ò¼ÜÔ¤¶¨ÒåµÄ·½·¨£¬Ò²¿ÉÒÔÊ¹ÓÃÓÃ»§×ÔÐÐ¶¨ÒåµÄ·½·¨¡£
MindSporeÌá¹©ÁËº¯ÊýºÍÀàÁ½ÖÖÔ¤¶¨ÒåµÄ¶¯Ì¬µ÷Õû²½³¤·½·¨£¬Á½ÖÖ·½·¨µÄ¾ßÌå¹¦ÄÜÏà½ü£¬ËüÃÇ·Ö±ð°´ÓàÏÒº¯Êý¡¢Ö¸Êýº¯Êý¡¢ÓëÊ±¼ä³É·´±È¡¢¶àÏîÊ½º¯ÊýµÈ·½Ê½Ë¥¼õ²½³¤¡£ÓÃ¹ÙÍøÉÏµÄÖ¸Êýº¯ÊýË¥¼õÀý×Óhttps://www.mindspore.cn/doc/api_python/zhª²CN/r1.1/mindspore/nn/mindspore.nn.exponential_decay_lr.html#mindspore.nn.exponential_decay_lrÀ´ËµÃ÷£¬¼û´úÂë5ª²10¡£


´úÂë5ª²10mindspore.nn.exponential_decay_lrÓ¦ÓÃÊ¾Àý



1. learning_rate = 0.1

2. decay_rate = 0.9

3. total_step = 6

4. step_per_epoch = 2

5. decay_epoch = 1

6. output = exponential_decay_lr(learning_rate, decay_rate, total_step, step_per_epoch, decay_epoch)

7. print(output)

8.  £Û0.1, 0.1, 0.09000000000000001, 0.09000000000000001, 0.08100000000000002, 
0.08100000000000002£Ý

Éèµ±Ç°ÎªµÚi²½£¬Æä²½³¤µÄ¼ÆËã·½·¨Îª£º 
decayed_learning_rate£Ûi£Ý=learning_rate¡Á decay_ratecurrent_epochdecay_epoch(5ª²46)
ÆäÖÐ£¬current_epoch=flooristep_per_epoch£¬floorÎªÏòÏÂÈ¡ÕûÔËËã¡£
ÔÚÊ¾ÀýÖÐ£¬µ±i=0Ê±£¬currentepoch=floor02=0£¬¼´µ±Ç°ÎªµÚ0ÂÖ£¬¿ÉÖªdecayed_learning_rate£Û0£Ý=0.1¡£¶ÁÕß¿É×ÔÐÐÑéËãÆäËûÊä³öÖµ¡£
ÔÚTensorFlow 2¿ò¼ÜÖÐÒ²Ìá¹©ÁËÀàËÆµÄ¶¯Ì¬µ÷Õû²½³¤·½·¨£¬ËüÃÇ¶¼ÔÚtensorflow.keras.optimezers.schedulesÄ£¿éÄÚ¡£¶ÁÕß¿ÉÔÚÐèÒªÊ±²éÔÄ×ÊÁÏ£¬²»ÔÙ×¸Êö¡£
ÕâÐ©¶¯Ì¬µ÷Õû²½³¤µÄ·½·¨£¬Êµ¼ÊÉÏ²¢Ã»ÓÐ½áºÏÓÅ»¯µÄ¾ßÌå½øÕ¹À´Éè¶¨²½³¤£¬ÈÔÈ»¿ÉÒÔ¿´³ÉÊÇÒ»×éÔ¤ÏÈÉè¶¨µÄ²½³¤£¬Ö»²»¹ýËüÃÇµÄ´óÐ¡°´Ò»¶¨µÄ·½Ê½Öð²½Ë¥¼õÁË¡£
Òò´Ë£¬ÈËÃÇÓÖÑÐ¾¿³ö½áºÏÓÅ»¯¾ßÌå½øÕ¹µÄ×ÔÊÊÓ¦²½³¤µ÷Õû·½·¨¡£
Adagrad(Adaptive Gradient)Ëã·¨¼ÇÂ¼ÏÂËùÓÐÀúÊ·ÌÝ¶ÈµÄÆ½·½ºÍ£¬²¢ÓÃËüµÄÆ½·½¸ùÀ´³ýÒÔ²½³¤£¬ÕâÑù¾ÍÊ¹µÃµ±Ç°µÄÊµ¼Ê²½³¤Ô½À´Ô½Ð¡¡£
MindSporeÖÐÊµÏÖ¸ÃËã·¨µÄÀàÎªmindspore.nn.Adagrad¡£TensorFlow 2ÖÐÊµÏÖ¸ÃËã·¨µÄÀàÊÇtf.keras.optimizers.Adagrad¡£



Í¼5ª²15¼ÓÈë¶¯Á¿µÄÌÝ¶ÈÏÂ½µ
¹ý³ÌÊ¾ÒâÍ¼

2) ¶¯Á¿ÓÅ»¯Ëã·¨
ÔÚ¾­µäÁ¦Ñ§ÖÐ£¬¶¯Á¿(Momentum)±íÊ¾ÎïÌåµÄÖÊÁ¿ºÍÆäÖÊÐÄËÙ¶ÈµÄ³Ë»ý£¬ÌåÏÖÎªÎïÌåÔÚÆäÔË¶¯·½ÏòÉÏ±£³ÖÔË¶¯µÄÇ÷ÊÆ¡£ÔÚÌÝ¶ÈÏÂ½µ·¨ÖÐ£¬Èç¹ûÊ¹ÌÝ¶ÈÏÂ½µµÄ¹ý³Ì¾ßÓÐÒ»¶¨µÄ¡°¶¯Á¿¡±£¬¾ßÓÐ±£³ÖÔ­·½ÏòÔË¶¯µÄÒ»¶¨µÄ ¡°¹ßÐÔ¡±£¬ÔòÓÐ¿ÉÄÜÔÚÏÂ½µµÄ¹ý³ÌÖÐ¡°³å¹ý¡±Ð¡µÄ¡°ÍÝµØ¡±£¬±ÜÃâÏÝÈë¼«Ð¡Öµµã£¬ÈçÍ¼5ª²15ËùÊ¾¡£ÆäÖÐ£¬ÔÚµÚ3¸öµã´¦£¬ÆäÌÝ¶È¸º·½ÏòÈçÐéÏßÊµ¼ýÍ·ËùÊ¾£¬¶øÔÚ¶¯Á¿µÄÓ°ÏìÏÂ£¬ÈÔÈ»±£³ÖÏò×óµÄ¡°¹ßÐÔ¡±£¬´Ó¶ø¡°³å³ö¡±ÁË¾Ö²¿¼«Ð¡µã¡£
¼ÓÈë¶¯Á¿ÓÅ»¯£¬ÌÝ¶ÈÏÂ½µ·¨»¹¿ÉÒÔ¿Ë·þÇ°½øÂ·ÏßÕñµ´µÄÎÊÌâ£¬´Ó¶ø¼Ó¿ìÊÕÁ²ËÙ¶È¡£
ÔÚSGDËã·¨ÖÐ£¬Í¨¹ýÅäÖÃMomentum ²ÎÊý(¼û´úÂë5ª²9ÖÐÏàÓ¦µÄ²ÎÊý)£¬¾Í¿ÉÒÔÊ¹ÌÝ¶ÈÏÂ½µ·¨ÀûÓÃÕâÖÖ¡°¹ßÐÔ¡±¡£Momentum ²ÎÊýÉèÖÃµÄÊÇ¡°¹ßÐÔ¡±µÄ´óÐ¡¡£
¼ÓÈë¶¯Á¿µÄÌÝ¶ÈÏÂ½µµÄµü´ú¹ØÏµÊ½»¹ÓÐÒ»ÖÖ¸Ä½ø·½·¨£¬³ÆÎªNAG(Nesterov Accelerated Gradient)¡£¸Ã·½·¨ÖÐ£¬¼ÆËãÌÝ¶ÈµÄµã·¢ÉúÁË±ä»¯£¬Ëü¿ÉÒÔÀí½âÎªÏÈ°´¡°¹ßÐÔ¡±Ç°½øÒ»Ð¡²½£¬ÔÙ¼ÆËãÌÝ¶È¡£ÕâÖÖ·½·¨ÔÚÃ¿Ò»²½¶¼ÍùÇ°¶à×ßÁËÒ»Ð¡²½£¬ÓÐÊ±¿ÉÒÔ¼Ó¿ìÊÕÁ²ËÙ¶È¡£ÉèÖÃSGDµÄnesterov(¼û´úÂë5ª²9ÖÐÏàÓ¦µÄ²ÎÊý)ÎªTrue£¬¼´¿ÉÊ¹ÓÃ¸ÃËã·¨¡£
ÔÚMindSporeÖÐ×¨ÃÅÊµÏÖÁË¸ÃËã·¨£º mindspore.nn.Momentum£¬Êµ¼ÊÉÏ£¬ÔÚµÚ4ÕÂµÄÄ£ÄâÏßÐÔ»Ø¹éÊ¾ÀýÖÐÒÑ¾­Ó¦ÓÃ¹ý(´úÂë4ª²14µÄµÚ32ÐÐ)¸ÃËã×Ó¡£
3) ½áºÏ¶¯Á¿ºÍ²½³¤ÓÅ»¯µÄËã·¨
½áºÏ¶¯Á¿ºÍ²½³¤½øÐÐÓÅ»¯µÄËã·¨ÓÐRMSProp(Root Mean Square Prop)Ëã·¨ºÍAdam(Adaptive Moment Estimation)Ëã·¨µÈ¡£
RMSPropËã·¨Í¨¹ý¶ÔAdagradËã·¨Öð²½Ôö¼Ó¿ØÖÆÀúÊ·ÐÅÏ¢Óëµ±Ç°ÌÝ¶ÈµÄ±ÈÀýÏµÊý¡¢Ôö¼Ó¶¯Á¿Òò×ÓºÍÖÐÐÄ»¯²Ù×÷ÐÎ³ÉÁËÈý¸ö°æ±¾¡£ÔÚMindSporeÖÐ£¬ÊµÏÖ¸ÃËã·¨µÄÀàÊÇmindspore.nn.RMSProp£¬ÔÚTensorFlow 2ÖÐÊµÏÖ¸ÃËã·¨µÄÊÇtensorflow.keras.optimizers.RMSprop¡£
AdamËã·¨ÊÇÒ»ÖÖ½áºÏÁËAdaGradËã·¨ºÍRMSPropËã·¨ÓÅµãµÄËã·¨¡£AdamËã·¨×ÛºÏÐ§¹û½ÏºÃ£¬Ó¦ÓÃ¹ã·º¡£
ÔÚMindSporeÖÐ£¬ÊµÏÖAdam Ëã·¨µÄÊÇmindspore.nn.Adam¡£ÔÚTensorFlow 2ÖÐÊµÏÖ¸ÃËã·¨µÄÊÇtf.keras.optimizers.Adam¡£
ÏÂÃæÈÔÈ»Ê¾ÀýËüÃÇµÄÐ§¹û£¬Èç¹ûÐèÒªÉîÈëÑÐ¾¿Ô­Àí£¬¿É²Î¿¼Ô­°æÊé¡£
´úÂë5ª²8ËùÊ¾µÄÊ¾Àý£¬Èç¹û²ÉÓÃAdamËã·¨£¬»¹ÊÇÑµÁ·20ÂÖ£¬ÄÜ¹»´ïµ½0.9812µÄÊ¶±ðÂÊ¡£¶ÁÕß¿É×ÔÐÐÊÔÑéÒ»ÏÂ¡£
Éñ¾­ÍøÂçÈýÒþ²ã·Ö±ð²ÉÓÃReLU¡¢ReLUºÍSoftmax¼¤»îº¯Êý×éºÏ£¬²ÉÓÃ½»²æìØËðÊ§º¯Êý£¬ÑµÁ·20ÂÖ£¬²ÉÓÃ²»Í¬µÄÓÅ»¯·½·¨£¬´úÂë5ª²8ËùÊ¾µÄÊ¾ÀýµÄÔËÐÐ½á¹ûÈç±í5ª²6ËùÊ¾¡£


±í5ª²6MNIST·ÖÀàÖÐ²ÉÓÃ²»Í¬ÓÅ»¯·½·¨Ê±µÄÐ§¹û±È½Ï



ÐòºÅÓÅ»¯·½·¨²âÊÔÑù±¾×¼È·ÂÊ

1SGD0.9540

2AdaGrad0.9735

3rmsprop0.9824

4Adam0.9823

²»Í¬µÄÓÅ»¯Ëã·¨ÓÐ²»Í¬µÄÌØµã£¬¶ÁÕß¿ÉÍ¨¹ý¸ü¶àµÄÁ·Ï°À´ÃþË÷ËüÃÇµÄÓ¦ÓÃ·½·¨ºÍÌØµã¡£
5.4.3¾Ö²¿ÊÕÁ²ÓëÌÝ¶ÈÏûÉ¢
±¾½Ú¼òÒªÌÖÂÛ¶à²ãÉñ¾­ÍøÂçµÄÁ½¸öÎÊÌâ¡£
1. ¾Ö²¿ÊÕÁ²
BPÉñ¾­ÍøÂç²»Ò»¶¨ÊÕÁ²£¬Ò²¾ÍÊÇËµ£¬ÍøÂçµÄÑµÁ·²»Ò»¶¨³É¹¦¡£Îó²îµÄÆ½·½ÊÇ·ÇÍ¹º¯Êý£¬BPÉñ¾­ÍøÂçÊÇ·ñÊÕÁ²»òÕßÄÜ·ñÊÕÁ²µ½È«¾Ö×îÓÅ£¬Óë³õÊ¼ÖµÓÐ¹Ø¡£¶ÁÕß¿ÉÒÔ½«´úÂë5ª²6ÖÐµÄ²ÎÊýÈ«²¿ÖÃ³õÖµÎª0.1ÔÙÔËÐÐ£¬¿´ÄÜ·ñÊÕÁ²¡£
È«¾ÖÓÅ»¯ÓëÍ¹º¯ÊýµÄÎÊÌâ£¬ÒÔ¼°»úÆ÷Ñ§Ï°Ëã·¨¾¡Á¿±ÜÃâ¾Ö²¿×îÓÅµÄ·½·¨£¬Ç°ÎÄÒÑ¾­½øÐÐÁË¼òÒªÌÖÂÛ£¬ÓÐÐèÒªµÄ¶ÁÕßÒ²¿É²Î¿¼Ô­°æÊé¡£
2. ÌÝ¶ÈÏûÉ¢ºÍÌÝ¶È±¬Õ¨
ÔÚÐ£¶ÔÎó²î·´Ïò´«²¥µÄ¹ý³ÌÖÐ£¬¼ûÊ½(5ª²32)£¬Èç¹ûÆ«µ¼Êý½ÏÐ¡(ÈçÍ¼2ª²7ÖÐ´óÓÚcµÄÇøÓò£¬³ÆÎª´¦ÓÚ·ÇÏßÐÔ¼¤»îº¯ÊýµÄ±¥ºÍÇø)£¬ÔÚ¶à´ÎÁ¬³ËÖ®ºó£¬Ð£¶ÔÎó²î»áÇ÷½ü0£¬µ¼ÖÂÌÝ¶ÈÒ²Ç÷½ü0£¬Ç°Ãæ²ãµÄ²ÎÊýÎÞ·¨µÃµ½ÓÐÐ§¸üÐÂ£¬ÕâÖÖÇé¿ö³ÆÎªÌÝ¶ÈÏûÉ¢¡£ÌÝ¶ÈÏûÉ¢»áÊ¹µÃÔö¼ÓÔÙ¶àµÄ²ãÒ²ÎÞ·¨Ìá¸ßÐ§¹û£¬ÉõÖÁ·´¶ø»á½µµÍÐ§¹û¡£
Ïà·´£¬Èç¹ûÆ«µ¼Êý½Ï´ó£¬ÔòÌÝ¶È»áÔÚ·´Ïò´«²¥µÄ¹ý³ÌÖÐ³ÊÖ¸Êý¼¶Ôö³¤£¬µ¼ÖÂÒç³ö£¬ÎÞ·¨¼ÆËã£¬ÍøÂç²»ÎÈ¶¨£¬ÕâÖÖÇé¿ö³ÆÎªÌÝ¶È±¬Õ¨¡£
ÌÝ¶ÈÏûÉ¢ºÍÌÝ¶È±¬Õ¨Ö»ÔÚ²ã´Î½Ï¶àµÄÍøÂçÖÐ³öÏÖ£¬³£ÓÃµÄ½â¾ö·½·¨°üÀ¨¾¡Á¿Ê¹ÓÃºÏÊÊµÄ¼¤»îº¯Êý(ÈçReLUº¯Êý£¬ËüÔÚÕýÊý²¿·Öµ¼ÊýÎª1)£» Ô¤ÑµÁ·£» ºÏÊÊµÄÍøÂçÄ£ÐÍ(ÓÐÐ©ÍøÂçÄ£ÐÍ¾ßÓÐÔ¤·ÀÌÝ¶ÈÏûÉ¢ºÍÌÝ¶È±¬Õ¨ÄÜÁ¦)£» ÌÝ¶È½Ø¶Ï£¬µÈµÈ¡£
5.5¾í»ýÉñ¾­ÍøÂç
¾í»ýÉñ¾­ÍøÂç(Convolutional Neural Network£¬CNN)ÔÚÌá³öÖ®³õ±»³É¹¦Ó¦ÓÃÓÚÊÖÐ´×Ö·ûÍ¼ÏñÊ¶±ð£Û11£Ý£¬2012ÄêµÄAlexNetÍøÂç£Û12£ÝÔÚÍ¼Ïñ·ÖÀàÈÎÎñÖÐÈ¡µÃ³É¹¦£¬´Ëºó£¬¾í»ýÉñ¾­ÍøÂç·¢Õ¹Ñ¸ËÙ£¬ÏÖÔÚÒÑ¾­±»¹ã·ºÓ¦ÓÃÓÚÍ¼ÐÎ¡¢Í¼Ïñ¡¢ÓïÒôÊ¶±ðµÈÁìÓò¡£
Í¼Æ¬µÄÏñËØÊýÍùÍù·Ç³£´ó£¬Èç¹ûÓÃ¶à²ãÈ«Á¬½ÓÍøÂçÀ´´¦Àí£¬Ôò²ÎÊýÊýÁ¿½«´óµ½ÄÑÒÔÓÐÐ§ÑµÁ·µÄµØ²½¡£ÊÜÃ¨ÄÔÑÐ¾¿µÄÆô·¢£¬¾í»ýÉñ¾­ÍøÂçÔÚ¶à²ãÈ«Á¬½ÓÍøÂçµÄ»ù´¡ÉÏ½øÐÐÁË¸Ä½ø£¬ËüÔÚ²»¼õÉÙ²ãÊýµÄÇ°ÌáÏÂÓÐÐ§µØÌáÉýÁËÑµÁ·ËÙ¶È¡£¾í»ýÉñ¾­ÍøÂçÔÚ¶à¸öÑÐ¾¿ÁìÓò¶¼È¡µÃÁË³É¹¦£¬ÌØ±ðÊÇÔÚÓëÍ¼ÐÎÓÐ¹ØµÄ·ÖÀàÈÎÎñÖÐ¡£


ÊÓÆµ½²½â


5.5.1¾í»ýÉñ¾­ÍøÂçÊ¾Àý
±¾½ÚÓÃÊ¾ÀýÀ´Õ¹Ê¾¾í»ýÉñ¾­ÍøÂçÔÚÍ¼ÏñÊ¶±ð·½ÃæµÄÓÅÊÆ£¬²¢½«ÔÚËæºóµÄ¼¸½ÚÖÐÖðÒ»ÆÊÎöÆäÖÐµÄ¹Ø¼üµã¡£
´úÂë5ª²8ËùÊ¾µÄÊÇÓÃ¶à²ãÈ«Á¬½ÓÉñ¾­ÍøÂçÀ´Íê³ÉÊÖÐ´ÌåÊý×ÖÊ¶±ðÊ¾Àý¡£Í¨¹ý²ÉÓÃ½»²æìØËðÊ§º¯ÊýºÍAdamÓÅ»¯Ëã·¨£¬ÒÔ¼°ÐÞ¸ÄÍøÂç½á¹¹¡¢Ôö¼ÓÑµÁ·ÂÖÊýµÈ´ëÊ©£¬·¢ÏÖ×î¸ßÄÜ´ïµ½0.983×óÓÒµÄÊ¶±ðÂÊ¡£
ÏÈÊ¾ÀýÔÚTensorFlow 2¿ò¼ÜÏÂµÄÊµÏÖ£¬ÔÙ¶Ô±ÈÊ¾ÀýMindSpore¿ò¼ÜÏÂµÄÊµÏÖ¡£
ÔÚTensorFlow 2¿ò¼ÜÏÂ£¬ÓÃ½Ï¼òµ¥µÄ¾í»ýÉñ¾­ÍøÂçÖ»ÐèÒª2ÂÖÑµÁ·¾Í¿ÉÒÔÇáËÉ´ïµ½0.986µÄÊ¶±ðÂÊ£¬¼û´úÂë5ª²11¡£


´úÂë5ª²11TensorFlow 2¿ò¼ÜÏÂMNISTÊ¾Àý(MINST¾í»ýÉñ¾­ÍøÂçÊ¾Àý.ipynb)



1. import numpy as np

2. import tensorflow.keras as ka




3. import datetime

4. 

5. np.random.seed(0)

6.  

7. (X_train, y_train), (X_val, y_val) = ka.datasets.mnist.load_data("E:£Üdatasets£ÜMNIST_Data£Ümnist.npz") 

8.  

9. # ½«Êý×é×ª»»³É¾í»ý²ãÐèÒªµÄ¸ñÊ½

10. X_train = X_train.reshape(X_train.shape£Û0£Ý,28, 28, 1).astype('float32')

11. X_val = X_val.reshape(X_val.shape£Û0£Ý, 28, 28, 1).astype('float32')

12. 

13. X_train = X_train / 255

14. X_val = X_val / 255

15.  

16. y_train = ka.utils.to_categorical(y_train)# ×ª»¯Îª¶ÀÈÈ±àÂë

17. y_val = ka.utils.to_categorical(y_val)

18. num_classes = y_val.shape£Û1£Ý# 10

19. 

20. # CNNÄ£ÐÍ

21. model = ka.Sequential(£Û

22. ka.layers.Conv2D(filters=32, kernel_size=(5, 5), input_shape=(28, 28, 1), activation='relu'),

23. ka.layers.MaxPooling2D(pool_size=(2, 2)),

24. ka.layers.Dropout(0.2),

25. ka.layers.BatchNormalization(),

26. ka.layers.Flatten(),

27. ka.layers.Dense(128, activation='relu'),

28. ka.layers.Dense(num_classes, activation='softmax')

29. £Ý)

30. model.summary()

31. 

32. model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=£Û'accuracy'£Ý)

33. 

34. startdate = datetime.datetime.now()# »ñÈ¡µ±Ç°Ê±¼ä

35. model.fit(X_train, y_train, validation_data=(X_val, y_val), epochs=2, batch_size=200, verbose=2)

36. enddate = datetime.datetime.now()

37. print("ÑµÁ·ÓÃÊ±£º " + str(enddate - startdate))   

µÚ21ÐÐµ½29ÐÐÊÇ¹¹½¨¾í»ýÉñ¾­ÍøÂçµÄ´úÂë£¬µÚ22ÐÐÌí¼ÓµÄÊÇ¾í»ý²ã£¬µÚ23ÐÐÌí¼ÓµÄÊÇ³Ø»¯²ã¡£
¾í»ý²ãºÍ³Ø»¯²ãÊÇ¾í»ýÉñ¾­ÍøÂçµÄºËÐÄ×é³É£¬ËüÃÇºÍÈ«Á¬½Ó²ãÒ»Æð¿ÉÒÔ×éºÏ³ÉºÜ¶à²ã´ÎµÄÍøÂç¡£¾í»ýÉñ¾­ÍøÂç»¹¿ÉÒÔ°´ÐèÌí¼ÓÓÃÀ´ÒÖÖÆ¹ýÄâºÏµÄDropout²ã(µÚ24ÐÐ)¡¢À­Æ½¶àÎ¬Êý¾ÝµÄFlatten²ã(µÚ25ÐÐ)¡¢¼Ó¿ìÊÕÁ²ºÍÒÖÖÆÌÝ¶ÈÏûÉ¢µÄÅú±ê×¼»¯BatchNormalization²ã(µÚ26ÐÐ)µÈ¡£
ÔÚMindSpore¿ò¼ÜÖÐ£¬¶ÔÕÕÊµÏÖ¸ÃÊ¾ÀýµÄ´úÂë¼û´úÂë5ª²12¡£


´úÂë5ª²12MindSpore¿ò¼ÜÏÂMNISTÊ¾Àý(MINST¾í»ýÉñ¾­ÍøÂçÊ¾Àý.ipynb)



1. import os

2. import mindspore.dataset as ds

3. import mindspore.nn as nn

4. from mindspore import Model

5. from mindspore.common.initializer import Normal

6. from mindspore.train.callback import LossMonitor

7. import mindspore.dataset.vision.c_transforms as CV

8. import mindspore.dataset.transforms.c_transforms as C

9. from mindspore.nn.metrics import Accuracy

10. from mindspore import dtype as mstype

11. from mindspore.nn import SoftmaxCrossEntropyWithLogits

12. 

13. def create_dataset(data_path, batch_size=32, repeat_size=1, num_parallel_workers=1):

14. # ´ÓmnistÎÄ¼þ²úÉúÊý¾Ý¼¯

15. 

16. mnist_ds = ds.MnistDataset(data_path)

17. 

18. rescale = 1.0 / 255.0# ¹éÒ»»¯±ÈÀý

19. shift = 0.0

20. rescale_nml = 1 / 0.3081

21. shift_nml = -1 * 0.1307 / 0.3081

22. 

23. # map Ëã×Ó

24. rescale_nml_op = CV.Rescale(rescale_nml, shift_nml) 

25. rescale_op = CV.Rescale(rescale, shift) 

26. hwc2chw_op = CV.HWC2CHW()# (height, width, channel) - (channel, height, width)

27. type_cast_op = C.TypeCast(mstype.int32) 

28. 

29. mnist_ds = mnist_ds.map(operations=type_cast_op, input_columns="label", num_parallel_workers=num_parallel_workers)

30. mnist_ds = mnist_ds.map(operations=rescale_op, input_columns="image", num_parallel_workers=num_parallel_workers)

31. mnist_ds = mnist_ds.map(operations=rescale_nml_op, input_columns="image", num_parallel_workers=num_parallel_workers)

32. mnist_ds = mnist_ds.map(operations=hwc2chw_op, input_columns="image", num_parallel_workers=num_parallel_workers)

33. 

34. buffer_size = 10000

35. mnist_ds = mnist_ds.shuffle(buffer_size=buffer_size)

36. mnist_ds = mnist_ds.batch(batch_size, drop_remainder=True)

37. mnist_ds = mnist_ds.repeat(repeat_size)

38. 

39. return mnist_ds

40. 

41. 

42. class CNNNet(nn.Cell):

43. def __init__(self, num_class=10, num_channel=1):




44.super(CNNNet, self).__init__()

45.self.conv = nn.Conv2d(num_channel, 32, 5, pad_mode='valid', has_bias=True)

46.self.fc1 = nn.Dense(32 * 12 * 12, 128, weight_init=Normal(0.02))

47.self.fc2 = nn.Dense(128, num_class, weight_init=Normal(0.02))

48.self.relu = nn.ReLU()

49.self.max_pool2d = nn.MaxPool2d(kernel_size=2, stride=2)

50.self.flatten = nn.Flatten()

51.self.dropout = nn.Dropout(keep_prob=0.8)

52.self.bn = nn.BatchNorm2d(num_features=32)

53.self.softmax = nn.softmax()

54. def construct(self, x):

55.x = self.relu(self.conv(x))

56.x = self.max_pool2d(x)

57.x = self.dropout(x)

58.x = self.bn(x)

59.x = self.flatten(x)

60.x = self.relu(self.fc1(x))

61.x = self.softmax(self.fc2(x))

62.return x

63. 

64. lr = 0.01

65. momentum = 0.9

66. dataset_size = 1

67. mnist_path = "E:£Üdatasets£ÜMNIST_Data"

68. net_loss = SoftmaxCrossEntropyWithLogits(sparse=True, reduction='mean')

69. train_epoch = 2

70. net = CNNNet()

71. net_opt = nn.Momentum(net.trainable_params(), lr, momentum)

72. ms_model= Model(net, net_loss, net_opt, metrics={"Accuracy": Accuracy()})

73. ds_train = create_dataset(os.path.join(mnist_path, "train"), 200, dataset_size)

74. startdate = datetime.datetime.now()# »ñÈ¡µ±Ç°Ê±¼ä

75. ms_model.train(train_epoch, ds_train, callbacks=£ÛLossMonitor()£Ý, dataset_sink_mode=False)

76. enddate = datetime.datetime.now()

77. print("ÑµÁ·ÓÃÊ±£º " + str(enddate - startdate))

78.  epoch: 1 step: 1, loss is 2.325413

79. epoch: 1 step: 2, loss is 2.2675755

80. ¡­

81. epoch: 2 step: 299, loss is 0.099331215

82. epoch: 2 step: 300, loss is 0.023031829

83. ÑµÁ·ÓÃÊ±£º 0:03:47.365005

84. 

85. ds_eval = create_dataset(os.path.join(mnist_path, "test"))

86. acc = ms_model.eval(ds_eval, dataset_sink_mode=False)

87. print(format(acc))

88.  {'Accuracy': 0.9801682692307693}

µÚ13ÐÐµ½µÚ39ÐÐÊý¾Ý´¦Àíº¯Êý£¬ËüÍê³É¶ÔÑµÁ·¼¯ºÍÑéÖ¤¼¯À¡ÈëÄ£ÐÍÇ°µÄ×¼±¸¹¤×÷¡£
µÚ42ÐÐµ½µÚ62ÐÐ½¨Á¢CNNÄ£ÐÍ£¬¸ÃÄ£ÐÍ½á¹¹Óë´úÂë5ª²11ËùÊ¾µÄTensorFlow 2¿ò¼ÜÏÂµÄ½á¹¹Ïà½ü£¬¶¼°üÀ¨¾í»ý²ã¡¢³Ø»¯²ã¡¢Dropout²ã¡¢Flatten²ãºÍBatchNormalization²ãµÈ¡£
ÓÉÓÚ½ØÖÁ±¾ÊéÍê¸åÊ±MindSpore»¹²»Ö§³ÖÔÚCPUÆ½Ì¨ÉÏÔËÐÐ³ýMomentumÖ®ÍâµÄÓÅ»¯Ëã·¨£¬Òò´ËÎÞ·¨²ÉÓÃÆäËûÓÅ»¯Ëã·¨¡£¸ÃÊ¾Àý±¾´ÎÔËÐÐ×îÖÕÔÚÑéÖ¤¼¯ÉÏµÄ×¼È·ÂÊÎª0.98¡£


ÊÓÆµ½²½â


5.5.2¾í»ý²ã
´úÂë5ª²11ÖÐµÚ22ÐÐºÍ´úÂë5ª²12ÖÐµÚ45ÐÐµÄ¶þÎ¬¾í»ý²ãConv2dµÄÊäÈëÊÇinput_shape=(28,28,1)£¬ÕâÓëÇ°ÎÄÌÖÂÛµÄËùÓÐ»úÆ÷Ñ§Ï°Ä£ÐÍµÄÊäÈë¶¼²»Í¬¡£Ç°ÎÄÄ£ÐÍµÄÊäÈëÊÇÒ»Î¬ÏòÁ¿£¬¸ÃÒ»Î¬ÏòÁ¿ÒªÃ´ÊÇ¾­ÌØÕ÷¹¤³ÌÌáÈ¡³öÀ´µÄÌØÕ÷£¬ÒªÃ´ÊÇ±»À­³ÉÒ»Î¬µÄÍ¼ÏñÊý¾Ý(¼û´úÂë5ª²8ËùÊ¾µÄ¶à²ãÈ«Á¬½ÓÉñ¾­ÍøÂçÊÖÐ´ÌåÊý×ÖÊ¶±ðÊ¾Àý)¡£¶øÕâÀï¾í»ý²ãµÄÊäÈëÊÇÍ¼Æ¬Êý¾Ý×é³ÉµÄ¶àÎ¬Êý¾Ý¡£
ÔÚ3.6½Ú½éÉÜ¹ýÓÐ¹ØÍ¼ÏñµÄÖªÊ¶¡£ÔÚMNISTÍ¼Æ¬ÖÐ£¬Ö»ÓÐÒ»ÖÖÑÕÉ«£¬Í¨³£³Æ»ÒÉ«ÁÁ¶È¡£MNISTÍ¼Æ¬µÄÎ¬¶ÈÊÇ(28,28,1)£¬Ç°ÃæÁ½Î¬´æ´¢28¡Á28¸öÏñËØµãµÄ×ø±êÎ»ÖÃ£¬ºóÃæ1Î¬±íÊ¾ÏñËØµãµÄ»ÒÉ«ÁÁ¶ÈÖµ£¬Òò´ËËüÊÇ28¡Á28µÄµ¥Í¨µÀÊý¾Ý¡£
ÔÚÊýÑ§ÁìÓò£¬¾í»ýÊÇÒ»ÖÖ»ý·Ö±ä»»¡£¾í»ýÔÚºÜ¶àÁìÓò¶¼µÃµ½ÁË¹ã·ºµÄÓ¦ÓÃ£¬ÈçÔÚÍ³¼ÆÑ§ÖÐËü¿ÉÓÃÀ´×öÍ³¼ÆÊý¾ÝµÄ¼ÓÈ¨»¬¶¯Æ½¾ù£¬ÔÚµç×ÓÐÅºÅ´¦ÀíÖÐÍ¨¹ý½«ÏßÐÔÏµÍ³µÄÊäÈëÓëÏµÍ³º¯Êý½øÐÐ¾í»ýµÃµ½ÏµÍ³Êä³ö¡­¡­¡£ÔÚÉî¶ÈÑ§Ï°ÖÐ£¬ËüÓÃÀ´×öÊý¾ÝµÄ¾í»ýÔËËã£¬ÔÚÍ¼Ïñ´¦ÀíÁìÓòÈ¡µÃÁË·Ç³£ºÃµÄÐ§¹û¡£
ÔÚµ¥Í¨µÀÊý¾ÝÉÏµÄ¾í»ýÔËËãÊ¾ÀýÈçÍ¼5ª²16ËùÊ¾¡£µ¥Í¨µÀÊý¾ÝÉÏµÄ¾í»ýÔËËã°üÀ¨´ý´¦ÀíÕÅÁ¿I¡¢¾í»ýºËKºÍÊä³öÕÅÁ¿SÈý¸ö×é³É²¿·Ö£¬ËüÃÇµÄ´óÐ¡·Ö±ðÎª4¡Á4¡¢3¡Á3ºÍ2¡Á2¡£


Í¼5ª²16¾í»ýÔËËãÊ¾Àý£¨¼û²Ê²å£©


¹²½øÐÐÁË4´ÎÔËËã¡£µÚ1´ÎÔËËãÏÈÓÃ¾í»ýºËµÄ×óÉÏ½ÇÈ¥¶Ô×¼´ý´¦ÀíÕÅÁ¿µÄ×óÉÏ½Ç£¬Î»ÖÃÎªI(0,0)£¬ÈçÍ¼ÖÐÉîÉ«²¿·Ö¡£È»ºó£¬½«¾í»ýºËÓë¶Ô×¼²¿·ÖµÄÏàÓ¦Î»ÖÃµÄÖµÏà³ËÔÙÇóºÍ(¿É¿´×÷¾ØÕóµÄµã»ýÔËËã)£º 1¡Á1+1¡Á1+2¡Á2+1¡Á1+0¡Á0+0¡Á1+0¡Á1+1¡Á1+1¡Á1=9¡£ËùÒÔ£¬µÚ1´ÎÔËËãµÄÊä³öÎª9£¬¼ÇÎªS(0,0)=9¡£
µÚ2´ÎÔËËã£¬½«¾í»ýºËÏòÓÒÒÆ¶¯Ò»²½£¬¾í»ýºËµÄ×óÉÏ½Ç¶Ô×¼´ý´¦ÀíÕÅÁ¿µÄÎ»ÖÃÎªI(0,1)£¬ÔÙ½øÐÐÏàÓ¦Î»ÖÃÖµµÄÏà³ËÇóºÍ£¬µÃµ½Êä³öÎªS(0,1)=9¡£
µÚ3´ÎÔËËã£¬ÒòÎª¾í»ýºËÒÑ¾­µ½´ï×îÓÒ±ß£¬Òò´ËÏÂÒÆÒ»ÐÐ£¬´Ó×î×ó±ßI(1,0)¿ªÊ¼¶Ô×¼£¬È»ºóÔÙ½øÐÐÏàÓ¦Î»ÖÃÖµµÄÏà³ËÇóºÍ£¬µÃµ½Êä³öÎªS(1,0)=7¡£
µÚ4´ÎÔËËã£¬½«¾í»ýºËÏòÓÒÒÆ¶¯Ò»²½£¬µ½´ïI(1,1)£¬ÔÙÓë¶Ô×¼²¿·ÖµÄÏàÓ¦Î»ÖÃµÄÖµÏà³ËÇóºÍ£¬µÃµ½Êä³öÎªS(1,1)=7¡£
¾í»ýºËÒÑ¾­µ½´ï´ý´¦ÀíÕÅÁ¿µÄ×îÓÒ²àºÍ×îÏÂ²à£¬¾í»ýÔËËã½áÊø¡£Ã¿´ÎÊä³öµÄ½á¹ûÒ²°´ÒÆ¶¯Î»ÖÃÅÅÁÐ£¬µÃµ½Êä³öÕÅÁ¿S=99
77¡£
¼Ç´ý´¦ÀíµÄÕÅÁ¿ÎªI£¬¾í»ýºËÎªK£¬Ã¿Ò»´Î¾í»ýÔËËã¿É±íÊöÎª£º 
S(i,j)=(I*K)(i,j)=¡ÆMm=1¡ÆNn=1I(i+m-1,j+n-1)K(m,n)(5ª²47)
ÆäÖÐ£¬I*K±íÊ¾¾í»ýÔËËã£¬MºÍN·Ö±ð±íÊ¾¾í»ýºËµÄ³¤¶ÈºÍ¿í¶È¡£i,jÊÇ´ý´¦ÀíÕÅÁ¿IµÄ×ø±êÎ»ÖÃ£¬Ò²ÊÇ¾í»ýºË×óÉÏ½Ç¶ÔÆëµÄÎ»ÖÃ¡£
°´Ê½(5ª²47)´ÓÉÏµ½ÏÂ£¬´Ó×óµ½ÓÒÒÀ´Î¾í»ýÔËËã£¬¿ÉµÃÊä³öÕÅÁ¿S¡£¼Ç´ý´¦ÀíÕÅÁ¿IµÄ³¤¶ÈºÍ¿í¶ÈÎªPºÍQ£¬ÔòÊä³öÕÅÁ¿SµÄ³¤¶ÈP¡äºÍQ¡ä¿í¶È·Ö±ðÎª£º 
P¡ä=P-M+1

Q¡ä=Q-N+1(5ª²48)
ÔÚMindSpore¿ò¼ÜÖÐ£¬ÔÚÉèÖÃÓÐ¹Ø²ãµÄÊäÈë²ÎÊýÊ±£¬ÐèÒª¼ÆËã¸ÃÖµ(½«ÔÚºóÎÄÏêÏ¸ÌÖÂÛ)¡£
´úÂë5ª²11ËùÊ¾µÄÊ¾Àý£¬ÊäÈëÎª28¡Á28£¬¾í»ýºËÎª5¡Á5£¬Òò´ËÊä³öÎª24¡Á24¡£
ÔÚÊµ¼ÊÓ¦ÓÃÖÐ£¬ÓëÉñ¾­ÔªÄ£ÐÍÒ»Ñù£¬¾í»ýÔËËãÍùÍù»¹Òª¼Ó1¸öãÐÖµ¦È£¬¼´£º 
S(i,j)=(I*K)(i,j)=¡ÆMm=1¡ÆNn=1I(i+m,j+n)K(m,n)+¦È(5ª²49)
ÆäÖÐ£¬¾í»ýºËKºÍãÐÖµ¦ÈÊÇÒªÑ§Ï°µÄ²ÎÊý¡£
Èç¹ûÊý¾ÝÊÇ¶àÍ¨µÀµÄ£¬Ôò¾í»ýºËÒ²·ÖÎª¶à²ã£¬Ã¿Ò»²ã¶ÔÓ¦Ò»¸öÍ¨µÀ£¬¸÷²ã²ÎÊý²»Í¬¡£Ã¿²ã¾í»ýºËµÄ²Ù×÷Óëµ¥Í¨µÀÉÏµÄ¾í»ý²Ù×÷ÏàÍ¬£¬×îÖÕÊä³öÊÇÃ¿²ãÊä³öµÄºÍÔÙ¼ÓÉÏãÐÖµ£¬ÈçÍ¼5ª²17ËùÊ¾¡£Òò´Ë£¬ÎÞÂÛÊäÈëµÄÕÅÁ¿ÓÐ¶àÉÙ¸öÍ¨µÀ£¬¾­¹ýÒ»¸ö¾í»ýºËºóµÄÊä³ö¶¼ÊÇµ¥²ãµÄ¡£


Í¼5ª²17¶àÍ¨µÀ¾í»ýÔËËãÊ¾Àý


´Ó¾í»ýÔËËãµÄ¹ý³Ì¿É¼û£¬¾í»ý²ãµÄÊä³öÖ»Óë²¿·ÖÊäÈëÓÐ¹Ø¡£ËäÈ»ÒªÉ¨ÃèÕû¸öÊäÈë²ã£¬µ«¾í»ýºËµÄ²ÎÊýÊÇÒ»ÑùµÄ£¬Õâ³ÆÎª²ÎÊý¹²Ïí(Parameter Sharing)¡£²ÎÊý¹²ÏíÏÔÖø¼õÉÙÁËÐèÒªÑ§Ï°µÄ²ÎÊýµÄÊýÁ¿¡£
ÔÚ¾í»ýÔËËãÖÐ£¬Ò»°ã»áÉèÖÃ¶à¸ö¾í»ýºË¡£´úÂë5ª²11ËùÊ¾µÄÊ¾ÀýÖÐÉèÖÃÁË32¸ö¾í»ýºË(TensorFlow 2ÖÐ³ÆÎª¹ýÂËÆ÷filters)£¬Ã¿¸ö¾í»ýºËÊä³öÒ»²ã£¬Òò´Ë¸Ã¾í»ý²ãµÄÊä³öÊÇ32²ãµÄ£¬Ò²¾ÍÊÇËµ½«28¡Á28¡Á1µÄÊý¾Ý±ä³ÉÁË24¡Á24¡Á32µÄ¡£ÔÚ»­Éñ¾­ÍøÂç½á¹¹Í¼Ê±£¬Ò»°ãÓÃÍ¼5ª²18ÖÐµÄ³¤·½ÌåÀ´±íÊ¾ÉÏÊö¾í»ýÔËËã£¬ÓÃË®Æ½·½Ïò³¤¶È±íÊ¾¾í»ýºËµÄÊýÁ¿¡£


Í¼5ª²18¾í»ý²ãÍ¼Ê¾


ÔÙÀ´ËãÒ»ÏÂ´úÂë5ª²11Ê¾ÀýÖÐ¸Ã¾í»ý²ãµÄÑµÁ·²ÎÊýÁ¿¡£ÒòÎªÊäÈëÊÇµ¥Í¨µÀµÄ£¬Òò´ËÃ¿¸ö¾í»ýºËÖ»ÓÐÒ»²ã£¬ËüµÄ²ÎÊýÎª5¡Á5+1=26¸ö£¬¹²32¸ö¾í»ýºË£¬Òò´ËÑµÁ·²ÎÊýÎª26¡Á32=832¸ö¡£
Èç¹û´ý´¦ÀíµÄÕÅÁ¿¹æÄ£ºÜ´ó£¬¿ÉÒÔ½«¾í»ýºËÓÉÒÀ´ÎÒÆ¶¯¸ÄÎªÌøÔ¾ÒÆ¶¯£¬¼´Ò»´ÎÒÆ¶¯Á½¸ö»ò¶à¸öÊý¾Ýµ¥Ôª£¬Õâ³ÆÎª¼Ó´ó²½³¤(Strides)¡£¼Ó´ó²½³¤¿ÉÒÔ¼õÉÙ¼ÆËãÁ¿¡¢¼Ó¿ìÑµÁ·ËÙ¶È¡£
ÎªÁËÌáÈ¡µ½±ßÔµµÄÌØÕ÷£¬¿ÉÒÔÔÚ´ý´¦ÀíÕÅÁ¿µÄ±ßÔµÌî³ä0ÔÙ½øÐÐ¾í»ýÔËËã£¬³ÆÎªÁãÌî³ä(Zeroª²Padding)£¬ÈçÍ¼5ª²19ËùÊ¾¡£Ìî³äÒ²¿ÉÒÔ¸ù¾Ý¾Í½üµÄÖµ½øÐÐÌî³ä¡£


Í¼5ª²19±ßÔµÌî³äÊ¾Àý

±ßÔµÌî³äµÄÁíÒ»¸öÓÃÍ¾ÊÇÔÚÕÅÁ¿Óë¾í»ýºË²»Æ¥ÅäÊ±£¬Í¨¹ýÌî³äÊ¹Ö®Æ¥Åä£¬´Ó¶ø¾í»ýºËÄÜÉ¨Ãèµ½ËùÓÐÊý¾Ý¡£
Èç²ÉÓÃÍ¼5ª²19ËùÊ¾µÄÌî³ä£¬ÔÚ²½³¤Îª1Ê±£¬Êä³öÕÅÁ¿µÄ³¤¶ÈºÍ¿í¶È¶¼Òª¼Ó2¡£
À´¹Û²ìÒ»ÏÂ´úÂë5ª²11ÖÐµÚ22ÐÐµÄ¶þÎ¬¾í»ý²ãµÄÏêÏ¸Çé¿ö¡£¸Ã¾í»ý²ãµÄÊäÈëÎª(28,28,1)µÄÕÅÁ¿£¬ÎªÒ»·ùMNISTÍ¼Æ¬¡£ËüÉèÖÃÁË32¸ö¾í»ýºË£¬Ã¿¸ö¾í»ýºË´óÐ¡Îª(5£¬5)£¬²»½øÐÐ±ßÔµÌî³ä(Ä¬ÈÏÉèÖÃ)£¬²ÉÓÃReLU¼¤»îº¯Êý¡£
´úÂë5ª²12µÄµÚ45ÐÐºÍµÚ55ÐÐÔÚMindSporeÏÂÍê³ÉÁËÍ¬ÑùµÄ¹¤×÷¡£MindSporeºÍTensorFlow 2ÏÂµÄConv2dËã×ÓµÄ¶¨ÒåÔ­ÐÍ¼û´úÂë5ª²13£¬¶ÁÕß¿ÉÒÔ¶Ô±ÈÒ»ÏÂËüÃÇµÄ²ÎÊý¡£


´úÂë5ª²13MindSporeºÍTensorFlow 2ÖÐConv2dËã×ÓµÄÔ­ÐÍ



1. # MindSpore

2. class mindspore.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, pad_mode='same', padding=0, dilation=1, group=1, has_bias=False, weight_init='normal', bias_init='zeros', data_format='NCHW')

3. 

4. # TensorFlow 2

5. tf.keras.layers.Conv2D(

6. filters, kernel_size, strides=(1, 1), padding='valid',

7. data_format=None, dilation_rate=(1, 1), groups=1, activation=None,

8. use_bias=True, kernel_initializer='glorot_uniform',

9. bias_initializer='zeros', kernel_regularizer=None,

10. bias_regularizer=None, activity_regularizer=None, kernel_constraint=None,

11. bias_constraint=None, **kwargs

12. )

ÐèÒª×¢ÒâµÄÊÇ£¬ËüÃÇÄ¬ÈÏµÄÊäÈëÊý¾ÝµÄ¸ñÊ½²»Ò»Ñù¡£TensorFlow 2µÄConv2dµÄÊäÈëÍ¼Ïñ¸ñÊ½Îª(height£¬width£¬channel)£¬¶øMindSporeµÄConv2dÄ¬ÈÏµÄÊäÈëÍ¼Ïñ¸ñÊ½Îª(channel£¬height£¬width)¡£ËüÃÇµÄÍ¨µÀÊýµÄÎ»ÖÃ²»Ò»Ñù£¬¿ÉÒÔÍ¨¹ýÉèÖÃdata_format²ÎÊýÀ´¸Ä±äÄ¬ÈÏ¸ñÊ½¡£´úÂë5ª²12µÄµÚ26ÐÐ½«Ô­Ê¼¸ñÊ½×ª»»³ÉMindSpore¿ò¼ÜÄ¬ÈÏµÄÒªÇó¸ñÊ½¡£
´úÂë5ª²14¶ÔMindSporeºÍTensorFlow 2¿ò¼ÜÖÐConv2dËã×ÓÒÔ±¾Ð¡½ÚµÄÀý×Ó½øÐÐÁËÑéÖ¤£¬Í¨¹ý·Ö±ðÉèÖÃ¾í»ýºËµÄÊýÁ¿(¼´Í¨µÀÊý)ºÍ±ßÔµÌî³ä·½Ê½£¬À´¹Û²ìÊä³öÕÅÁ¿µÄshape¡£ÈçµÚ11ÐÐµÄÊä³ö£¬ÊÇÔÚMindSpore¿ò¼ÜÏÂ£¬¶ÔÍ¼5ª²16ËùÊ¾µÄ¾í»ýÔËËãÔÚ²»½øÐÐ±ßÔµÌî³äÊ±µÄÑéÖ¤Êä³ö¡£MindSpore¿ò¼ÜÖÐConv2dËã×ÓµÄÊäÈëºÍÊä³öµÄËÄÎ¬ÕÅÁ¿µÄº¬Òå·Ö±ðÎª(Åú´óÐ¡£¬Í¨µÀÊý£¬¸ß£¬¿í)¡£ÆäËûÇé¿ö¶ÁÕß¿É×ÔÐÐ¶Ô±ÈÑéÖ¤£¬²»ÔÙ×¸Êö¡£


´úÂë5ª²14Conv2dËã×ÓÑéÖ¤(Conv2dËã×ÓÑéÖ¤.ipynb)



1. # MindSpore

2. import mindspore

3. import numpy as np

4. import mindspore.nn as nn

5. from mindspore import Tensor




6. input = Tensor(np.ones(£Û1, 1, 4, 4£Ý), mindspore.float32)

7. 

8. net = nn.Conv2d(1, 1, 3, has_bias=True, pad_mode='valid')# 1¾í»ýºË£¬valid±ßÔµÌî³ä

9. output = net(input).shape

10. print("1¾í»ýºË£¬valid±ßÔµÌî³ä", output)

11.  1¾í»ýºË£¬valid±ßÔµÌî³ä (1, 1, 2, 2)

12. net = nn.Conv2d(1, 5, 3, has_bias=True, pad_mode='valid')# 5¾í»ýºË£¬valid±ßÔµÌî³ä

13. output = net(input).shape

14. print("5¾í»ýºË£¬valid±ßÔµÌî³ä", output)

15.  5¾í»ýºË£¬valid±ßÔµÌî³ä (1, 5, 2, 2)

16. net = nn.Conv2d(1, 1, 3, has_bias=True, pad_mode='same')# 1¾í»ýºË£¬same±ßÔµÌî³ä

17. output = net(input).shape

18. print("1¾í»ýºË£¬same±ßÔµÌî³ä", output)

19.  1¾í»ýºË£¬same±ßÔµÌî³ä (1, 1, 4, 4)

20. net = nn.Conv2d(1, 1, 3, has_bias=True, pad_mode='pad')# 1¾í»ýºË£¬pad±ßÔµÌî³ä

21. output = net(input).shape

22. print("1¾í»ýºË£¬pad±ßÔµÌî³ä", output)

23.  1¾í»ýºË£¬pad±ßÔµÌî³ä (1, 1, 2, 2)

24. 

25. # TensorFlow 2 

26. import tensorflow as tf

27. input_shape = (1, 4, 4, 1)

28. x = tf.random.normal(input_shape)

29. 

30. network = tf.keras.layers.Conv2D(1, 3, activation='relu', padding="valid", input_shape=input_shape£Û1:£Ý)

31. y = network(x)

32. print("1¾í»ýºË£¬valid±ßÔµÌî³ä", y.shape)

33.  1¾í»ýºË£¬valid±ßÔµÌî³ä (1, 2, 2, 1)

34. network = tf.keras.layers.Conv2D(1, 3, activation='relu', padding="same", input_shape=input_shape£Û1:£Ý)

35. y = network(x)

36. print("1¾í»ýºË£¬same±ßÔµÌî³ä", y.shape)

37.  1¾í»ýºË£¬same±ßÔµÌî³ä (1, 4, 4, 1)

38. network = tf.keras.layers.Conv2D(5, 3, activation='relu', padding="valid", input_shape=input_shape£Û1:£Ý)

39. y = network(x)

40. print("5¾í»ýºË£¬valid±ßÔµÌî³ä", y.shape)

41.  5¾í»ýºË£¬valid±ßÔµÌî³ä (1, 2, 2, 5)


5.5.3³Ø»¯²ãºÍFlatten²ã
³Ø»¯(Pooling)²ãÒ»°ã¸úÔÚ¾í»ý²ãÖ®ºó£¬ÓÃÓÚÑ¹ËõÊý¾ÝºÍ²ÎÊýµÄÊýÁ¿¡£
³Ø»¯²Ù×÷Ò²³ÆÎªÏÂ²ÉÑù(Subª²Sampling)£¬¾ßÌå¹ý³ÌÓë¾í»ý²ã»ù±¾ÏàÍ¬£¬Ö»²»¹ý³Ø»¯²ãµÄ¾í»ýºËÖ»È¡¶ÔÓ¦Î»ÖÃµÄ×î´óÖµ»òÆ½¾ùÖµ£¬·Ö±ð³ÆÎª×î´ó³Ø»¯»òÆ½¾ù³Ø»¯¡£×î´ó³Ø»¯²Ù×÷ÈçÍ¼5ª²20ËùÊ¾£¬½«¶ÔÓ¦Î»ÖÃÖÐµÄ×î´óÖµÊä³ö£¬½á¹ûÎª2¡£Èç¹ûÊÇÆ½¾ù³Ø»¯£¬Ôò½«¶ÔÓ¦Î»ÖÃÖÐµÄËùÓÐÖµÇóÆ½¾ùÖµ£¬µÃµ½Êä³ö1¡£³Ø»¯²ãÃ»ÓÐÐèÒªÑµÁ·µÄ²ÎÊý¡£


Í¼5ª²20×î´ó³Ø»¯²Ù×÷Ê¾Àý


³Ø»¯²ãµÄÒÆ¶¯·½Ê½Óë¾í»ý²ã²»Í¬£¬Ëü²»ÖØµþµØÒÆ¶¯£¬Í¼5ª²20ËùÊ¾µÄ³Ø»¯²Ù×÷£¬Êä³öµÄÕÅÁ¿µÄ¹æÄ£Îª2¡Á2¡£´úÂë5ª²11µÚ23ÐÐºÍ´úÂë5ª²12µÚ56ÐÐ³Ø»¯²ãÊä³öµÄÕÅÁ¿Îª12¡Á12¡Á32¡£
´úÂë5ª²11µÚ24ÐÐºÍºÍ´úÂë5ª²12µÚ57ÐÐÌí¼ÓµÄÊÇDropout²ã¡£
´úÂë5ª²11µÚ25ÐÐºÍºÍ´úÂë5ª²12µÚ58ÐÐÌí¼ÓµÄÊÇËùÎ½µÄÅú±ê×¼»¯²ã£¬½«ÔÚ5.5.4½ÚÌÖÂÛ¡£
´úÂë5ª²11µÚ26ÐÐºÍºÍ´úÂë5ª²12µÚ59ÐÐÌí¼ÓµÄÊÇFlatten²ã¡£Flatten²ãºÜ¼òµ¥£¬Ö»ÊÇ½«ÊäÈëµÄ¶àÎ¬Êý¾ÝÀ­³ÉÒ»Î¬µÄ£¬¿ÉÒÔÀí½âÎª½«Êý¾Ý¡°Ñ¹Æ½¡±¡£
´úÂë5ª²11µÚ27¡¢28ÐÐºÍºÍ´úÂë5ª²12µÚ60¡¢61ÐÐÌí¼ÓµÄÊÇÈ«Á¬½Ó²ã¡£´úÂë5ª²12ÖÐµÄÈ«Á¬½Ó²ãÔÚµÚ46¡¢47ÐÐ¶¨Òå¡£
MindSporeÖÐµÄÈ«Á¬½Ó²ãËã×ÓDenseÐèÒªÏÔÊ½ÉèÖÃÊäÈë²ÎÊý¸öÊý£¬À´¿´µÚ46ÐÐ¶¨ÒåµÄDenseËã×ÓµÄÊäÈë²ÎÊý¸öÊýÊÇÈçºÎ¼ÆËãµÄ¡£ÔÚ¾í»ý²ãÖÐ£¬Ã¿¸ö¾í»ýºË½«ÊäÈëµÄ1¡Á28¡Á28(°´MindSporeÄ¬ÈÏµÄÊý¾Ý¸ñÊ½ÒªÇó£¬½«Í¨µÀÊýÐ´ÔÚÇ°Ãæ)¸ñÊ½µÄÊý¾Ý×ª»»³ÉÁË1¡Á24¡Á24(Ê½(5ª²48))¸ñÊ½µÄÊý¾Ý£¬ÒòÎªÓÐ32¸ö¾í»ýºË£¬Òò´Ë¸Ã¾í»ý²ãµÄ×îÖÕÊä³öÊý¾Ý¸ñÊ½Îª32¡Á24¡Á24¡£ÔÙ¾­¹ýÒ»¸öºËÎª2¡Á2µÄ³Ø»¯²ã£¬Êä³öÊý¾Ý¸ñÊ½Îª32¡Á12¡Á12¡£Òò´Ë£¬Ëü¾ÍÊÇµÚ46ÐÐ¶¨ÒåDenseËã×ÓÊ±µÄÊäÈë²ÎÊý¡£
ÔÚ»­Éñ¾­ÍøÂç½á¹¹Í¼Ê±£¬¿ÉÒÔÓÃÀàËÆÍ¼5ª²18ÖÐµÄ²»Í¬ÑÕÉ«µÄ³¤·½ÌåÀ´±íÊ¾³Ø»¯²ãºÍÈ«Á¬½Ó²ã¡£³ý¾í»ý²ã¡¢³Ø»¯²ãºÍÈ«Á¬½Ó²ã(ÊäÈëÖ®Ç°Òþº¬Flatten²ã)Ö®ÍâµÄ²ã£¬²»¸Ä±äÍøÂç½á¹¹£¬Òò´Ë£¬Ò»°ãÖ»ÓÃÕâÈý²ãÀ´±íÊ¾Éñ¾­ÍøÂçµÄ½á¹¹¡£»­³ö´úÂë5ª²11ºÍ´úÂë5ª²12ËùÊ¾Ê¾ÀýµÄÉñ¾­ÍøÂç½á¹¹ÈçÍ¼5ª²21ËùÊ¾¡£


Í¼5ª²21´úÂë5ª²11ºÍ´úÂë5ª²12Ê¾ÀýµÄÉñ¾­ÍøÂç½á¹¹


5.5.4Åú±ê×¼»¯²ã
Åú±ê×¼»¯(Batch Normalization)¿ÉÒÔÒÖÖÆÌÝ¶ÈÏûÉ¢£¬¼ÓËÙÉñ¾­ÍøÂçÑµÁ·¡£Åú±ê×¼»¯µÄÌá³öÕßÈÏÎªÉî¶ÈÉñ¾­ÍøÂçµÄÑµÁ·Ö®ËùÒÔ¸´ÔÓ£¬ÊÇÒòÎªÔÚÑµÁ·Ê±Ã¿²ãµÄÊäÈë¶¼Ëæ×ÅÇ°Ò»²ãµÄ²ÎÊýµÄ±ä»¯¶ø±ä»¯¡£Òò´Ë£¬ÔÚÑµÁ·Ê±£¬ÐèÒª×ÐÏ¸µ÷Õû²½³¤ºÍ³õÊ¼»¯²ÎÊýÀ´È¡µÃºÃµÄÐ§¹û¡£
Õë¶ÔÉÏÊöÎÊÌâ£¬ÔÚÑµÁ·½×¶Î£¬Åú±ê×¼»¯¶ÔÃ¿Ò»²ãµÄÅúÁ¿ÊäÈëÊý¾Ýx½øÐÐ±ê×¼»¯²Ù×÷(¼û7.1½Ú)£¬Ê¹Ö®¾¡Á¿±ÜÃâÂäÈë·ÇÏßÐÔ¼¤»îº¯ÊýµÄ±¥ºÍÇø¡£¾ßÌåÀ´½²¾ÍÊÇÊ¹Ö®¾ùÖµÎª0£¬·½²îÎª1¡£¼ÇÃ¿Ò»ÅúÊäÈëÊý¾ÝÎªB={x1,x2,¡­,xm}£¬¶ÔÆäÖÐÈÎÒ»xi½øÐÐÈçÏÂ²Ù×÷£º 
¦ÌB=1m¡Æmi=1xi

¦Ò2B=1m¡Æmi=1(xi-¦ÌB)2

x^i=xi-¦ÌB¦Ò2B+¦Å
yi=¦Ãix^i+¦Âi(5ª²50)
ÆäÖÐ£¬¦ÅÎª·ÀÖ¹·ÖÄ¸Îª0µÄºÜÐ¡µÄ³£Êý¡£Ç°Èý²½·Ö±ðÎª¼ÆËã¾ùÖµ¡¢¼ÆËã·½²î¡¢±ê×¼»¯£¬×îºóÒ»²½ÊÇ¶Ô¹éÒ»»¯ºóµÄ½á¹û½øÐÐËõ·ÅºÍÆ½ÒÆ£¬ÆäÖÐµÄ ¦ÃiºÍ ¦ÂiÊÇÒªÑ§Ï°µÄ²ÎÊý£¬ËüÃÇ¶¼ÊÇmÎ¬µÄÏòÁ¿¡£¦ÌBºÍ¦Ò2BÊÇ´ÓÊäÈëÊý¾ÝÖÐ¼ÆËãµÃµ½£¬ÊÇ²»ÐèÒªÑ§Ï°µÄ²ÎÊý¡£
´úÂë5ª²11ºÍ´úÂë5ª²12ËùÊ¾µÄÊ¾ÀýÖÐ£¬ÔÚDropout²ãºÍFlatten²ãÖ®¼ä¼ÓÈëÁËÅú±ê×¼»¯²ã¡£¶Ô±ÈÊÇ·ñ¼ÓÈë¸Ã²ãµÄÔËÐÐ½á¹û£¬¿ÉÒÔ·¢ÏÖÔÚ¼ÓÈë¸Ã²ãºó£¬ÍøÂç½«¸ü¿ìÊÕÁ²¡£¶ÁÕß¿ÉÒÔ×ÔÐÐÑéÖ¤¡£
5.5.5µäÐÍ¾í»ýÉñ¾­ÍøÂç
ÔÚÉî¶ÈÑ§Ï°µÄ·¢Õ¹¹ý³ÌÖÐ£¬³öÏÖÁËºÜ¶à¾­µäµÄ¾í»ýÉñ¾­ÍøÂç£¬ËüÃÇ¶ÔÉî¶ÈÑ§Ï°µÄÑ§ÊõÑÐ¾¿ºÍ¹¤ÒµÉú²ú¶¼Æðµ½ÁË´Ù½øµÄ×÷ÓÃ£¬ÈçVGG¡¢ResNet¡¢InceptionºÍDenseNetµÈ£¬ºÜ¶àÊµ¼ÊÊ¹ÓÃµÄ¾í»ýÉñ¾­¶¼ÊÇÔÚËüÃÇµÄ»ù´¡ÉÏ½øÐÐ¸Ä½øµÄ¡£³õÑ§ÕßÓ¦´ÓÊÔÑé¿ªÊ¼£¬ÔÄ¶ÁÂÛÎÄºÍÊµÏÖ´úÂë(MindSpore¿ò¼ÜÖÐµÄmodel_zoohttps://gitee.com/mindspore/mindspore/tree/r1.1/model_zoo/officialºÍTensorFlow 2¿ò¼ÜÖÐµÄkeras.applications°üÖÐ°üº¬ÁËºÜ¶àÓÐÓ°ÏìÁ¦µÄÉñ¾­ÍøÂçÄ£ÐÍµÄÔ´´úÂë)À´È«ÃæÁË½âËüÃÇ¡£
ÏÂÃæ¼òÒªÌÖÂÛVGG¾í»ýÉñ¾­ÍøÂç£¬²¢¼òÒªÊ¾ÀýÆäÓ¦ÓÃ¡£
VGGª²16ÊÇÅ£½ò´óÑ§µÄVisual Geometry GroupÔÚ2015Äê·¢²¼µÄ¹²16²ãµÄ¾í»ýÉñ¾­ÍøÂç£¬ÓÐÔ¼1.38ÒÚ¸öÍøÂç²ÎÊý¡£¸ÃÍøÂç³£±»³õÑ§ÕßÓÃÀ´Ñ§Ï°ºÍÌåÑé¾í»ýÉñ¾­ÍøÂç¡£
VGGª²16Ä£ÐÍÊÇÕë¶ÔImageNetÌôÕ½ÈüÉè¼ÆµÄ£¬¸ÃÌôÕ½ÈüµÄÊý¾Ý¼¯ÎªILSVRCª²2012Í¼Ïñ·ÖÀàÊý¾Ý¼¯¡£ILSVRCª²2012Í¼Ïñ·ÖÀàÊý¾Ý¼¯µÄÑµÁ·¼¯ÓÐ×Ü¹²ÓÐ1281167ÕÅÍ¼Æ¬£¬·ÖÎª1000¸öÀà±ð£¬ËüµÄÑéÖ¤¼¯ÓÐ50000ÕÅÍ¼Æ¬Ñù±¾£¬Ã¿¸öÀà±ð50¸öÑù±¾¡£
ILSVRCª²2012Í¼Ïñ·ÖÀàÊý¾Ý¼¯ÊÇ2009Äê¿ªÊ¼´´½¨µÄImageNetÍ¼ÏñÊý¾Ý¼¯µÄÒ»²¿·Ö¡£»ùÓÚ¸ÃÍ¼ÏñÊý¾Ý¼¯¾Ù°ìÁË¾ßÓÐºÜ´óÓ°ÏìÁ¦µÄImageNetÌôÕ½Èü£¬ºÜ¶àÐÂÄ£ÐÍ¾ÍÊÇÔÚ¸ÃÌôÕ½ÈüÉÏ·¢²¼µÄ¡£


Í¼5ª²22VGGª²16Ä£ÐÍµÄÍøÂç½á¹¹


VGGª²16Ä£ÐÍµÄÍøÂç½á¹¹ÈçÍ¼5ª²22ËùÊ¾£¬´Ó×ó²àÊäÈë´óÐ¡Îª224¡Á224¡Á3µÄ²ÊÉ«Í¼Æ¬£¬ÔÚÓÒ²àÊä³ö¸ÃÍ¼Æ¬µÄ·ÖÀà¡£
ÊäÈë²ãÖ®ºó£¬ÏÈÊÇ2¸ö´óÐ¡Îª3¡Á3¡¢¾í»ýºËÊýÎª64¡¢²½³¤Îª1¡¢ÁãÌî³äµÄ¾í»ý²ã£¬´ËÊ±µÄÊý¾ÝÎ¬¶È´óÐ¡Îª224¡Á224¡Á64£¬ÔÚË®Æ½·½Ïò±»À­³¤ÁË¡£
È»ºóÊÇ1¸ö´óÐ¡Îª2¡Á2µÄ×î´ó³Ø»¯²ã£¬½«Êý¾ÝµÄÎ¬¶È½µÎª112¡Á112¡Á64£¬ÔÙ¾­¹ý2¸ö´óÐ¡Îª3¡Á3¡¢¾í»ýºËÊýÎª128¡¢²½³¤Îª1¡¢ÁãÌî³äµÄ¾í»ý²ã£¬ÔÙÒ»´ÎÔÚË®Æ½·½ÏòÉÏ±»À­³¤£¬±äÎª112¡Á112¡Á128¡£
È»ºóÊÇ1¸ö´óÐ¡Îª2¡Á2µÄ×î´ó³Ø»¯²ã£¬ºÍ3¸ö´óÐ¡Îª3¡Á3¡¢¾í»ýºËÊýÎª256¡¢²½³¤Îª1¡¢ÁãÌî³äµÄ¾í»ý²ã£¬Êý¾ÝÎ¬¶È±äÎª56¡Á56¡Á256¡£
È»ºóÊÇ1¸ö´óÐ¡Îª2¡Á2µÄ×î´ó³Ø»¯²ã£¬ºÍ3¸ö´óÐ¡Îª3¡Á3¡¢¾í»ýºËÊýÎª512¡¢²½³¤Îª1¡¢ÁãÌî³äµÄ¾í»ý²ã£¬Êý¾ÝÎ¬¶È±äÎª28¡Á28¡Á512¡£
È»ºóÊÇ1¸ö´óÐ¡Îª2¡Á2µÄ×î´ó³Ø»¯²ã£¬ºÍ3¸ö´óÐ¡Îª3¡Á3¡¢¾í»ýºËÊýÎª512¡¢²½³¤Îª1¡¢ÁãÌî³äµÄ¾í»ý²ã£¬Êý¾ÝÎ¬¶È±äÎª14¡Á14¡Á512¡£
È»ºóÊÇ1¸ö´óÐ¡Îª2¡Á2µÄ×î´ó³Ø»¯²ã£¬Êý¾ÝÎ¬¶È±äÎª7¡Á7¡Á512¡£
È»ºóÊÇ1¸öFlatten²ã½«Êý¾ÝÀ­Æ½¡£
×îºóÊÇ3¸öÈ«Á¬½Ó²ã£¬½ÚµãÊý·Ö±ðÎª4096¡¢4096ºÍ1000¡£
³ý×îºóÒ»²ãÈ«Á¬½Ó²ã²ÉÓÃSoftmax¼¤»îº¯ÊýÍâ£¬ËùÓÐ¾í»ý²ãºÍÈ«Á¬½Ó²ã¶¼²ÉÓÃReLU¼¤»îº¯Êý¡£
´ÓÉÏÃæÍøÂç½á¹¹¿É¼û£¬¾­¹ý¾í»ý²ã£¬Í¨µÀÊýÁ¿²»¶ÏÔö¼Ó£¬¶ø¾­¹ý³Ø»¯²ã£¬Êý¾ÝµÄ¸ß¶ÈºÍ¿í¶È²»¶Ï¼õÉÙ¡£
Visual Geometry GroupºóÓÖ·¢²¼ÁË19²ãµÄVGGª²19Ä£ÐÍ¡£
MindSporeºÍTensorFlow 2ÊµÏÖÁËVGGª²16Ä£ÐÍºÍVGGª²19Ä£ÐÍhttps://gitee.com/mindspore/mindspore/blob/master/model_zoo/official/cv/vgg16/README.mdhttps://github.com/tensorflow/tensorflow/blob/master/tensorflow/python/keras/applications/vgg16.py£¬½¨Òé¶ÁÕß×ÐÏ¸ÔÄ¶Á²¢·ÖÎö¡£TensorFlow 2»¹Ìá¹©ÁËÓÃILSVRCª²2012ª²CLSÍ¼Ïñ·ÖÀàÊý¾Ý¼¯Ô¤ÏÈÑµÁ·ºÃµÄVGGª²16ºÍVGGª²19Ä£ÐÍ£¬ÏÂÃæ¸ø³öÒ»¸öÓÃÔ¤ÏÈÑµÁ·ºÃµÄÄ£ÐÍÀ´Ê¶±ðÒ»·ùÍ¼Æ¬(Í¼5ª²23)µÄÀý×Ó¡£


Í¼5ª²23ÊÔÑéÓÃÐ¡¹·Í¼Æ¬



Àý×Ó´úÂë¼û´úÂë5ª²15¡£


´úÂë5ª²15VGGª²19Ô¤ÑµÁ·Ä£ÐÍÓ¦ÓÃ(vgg19_app.ipynb)



1. import tensorflow.keras.applications.vgg19 as vgg19

2. import tensorflow.keras.preprocessing.image as imagepre

3. 

4. # ¼ÓÔØÔ¤ÑµÁ·Ä£ÐÍ

5. model = vgg19.VGG19(weights='E:£Ü£ÜMLDatas£Ü£Üvgg19_weights_tf_dim_ordering_tf_kernels.h5', include_top=True)# ¼ÓÔØÔ¤ÏÈÏÂÔØµÄÄ£ÐÍ

6. # ¼ÓÔØÍ¼Æ¬²¢×ª»»ÎªºÏÊÊµÄÊý¾ÝÐÎÊ½

7. image = imagepre.load_img('116.jpg', target_size=(224, 224))

8. imagedata = imagepre.img_to_array(image)

9. imagedata = imagedata.reshape((1,) + imagedata.shape)

10. 

11. imagedata = vgg19.preprocess_input(imagedata)

12. prediction = model.predict(imagedata)# ·ÖÀàÔ¤²â

13. results = vgg19.decode_predictions(prediction, top=3)

14. print(results)

15. #£Û£Û('n02113624', 'toy_poodle', 0.6034094), ('n02113712', 'miniature_poodle', 0ª±34426507), ('n02113799', 'standard_poodle', 0.0124355545)£Ý£Ý

¿É¼û£¬Í¼Æ¬Îªtoy poodle(Íæ¾ß¹ó±öÈ®)µÄ¸ÅÂÊ×î´ó£¬Ô¼Îª0.6¡£
5.6Ï°Ìâ
1.  ÏÂ±íÎªÄ³¶þ·ÖÀàÆ÷Ô¤²â½á¹ûµÄ»ìÏý¾ØÕó£¬ÊÔ¼ÆËã×¼È·ÂÊ¡¢Æ½¾ù×¼È·ÂÊ¡¢¾«È·ÂÊ¡¢ÕÙ»ØÂÊºÍF1ª²score¡£






Ô¤²âÎª¡°0¡±µÄÑù±¾ÊýÔ¤²âÎª¡°1¡±µÄÑù±¾Êý

±êÇ©Îª¡°0¡±µÄÑù±¾Êý10261101

±êÇ©Îª¡°1¡±µÄÑù±¾Êý1007911026

2. ÓëMNISTÊÖÐ´ÌåÊý×Ö¼¯Ò»Ñù£¬CIFARª²10°üº¬ÁË60000ÕÅÍ¼Æ¬£¬¹²10Àà¡£ÑµÁ·¼¯50000ÕÅ£¬²âÊÔ¼¯10000ÕÅ¡£µ«ÓëMNIST²»Í¬µÄÊÇ£¬CIFARª²10Êý¾Ý¼¯ÖÐµÄÍ¼Æ¬ÊÇ²ÊÉ«µÄ£¬Ã¿ÕÅÍ¼Æ¬µÄ´óÐ¡ÊÇ32¡Á32¡Á3£¬3´ú±íR/G/BÈý¸öÍ¨µÀ£¬Ã¿¸öÏñËØµãµÄÑÕÉ«ÓÉR/G/BÈý¸öÖµ¾ö¶¨£¬R/G/BµÄÈ¡Öµ·¶Î§Îª0~255¡£·ÂÕÕMNISTÊÖÐ´ÌåÊý×ÖÊ¶±ð£¬ÓÃMindSpore¿ò¼Ü»òTensorFlow 2.0¿ò¼ÜÊµÏÖ¾í»ýÉñ¾­ÍøÂç¶ÔCIFARª²10½øÐÐ·ÖÀàÊÔÑé¡£
3. ÊÔ¼ÆËã´úÂë5ª²11ºÍ´úÂë5ª²12ËùÊ¾ÀýµÄ¾í»ýÉñ¾­ÍøÂçÖÐ¸÷²ãÐèÒªÑ§Ï°µÄ²ÎÊýÊýÁ¿¡£
4. ÔÚ5.4.1½ÚµÄÎó²î·´Ïò´«²¥Ñ§Ï°Ê¾ÀýÖÐ£¬¼ÆËãµÚ2¸öÑµÁ·Ñù±¾(0,1)µÄÇ°Ïò´«²¥¹ý³Ì¡£ÍøÂç²ÎÊýµÄ³õÖµÓëÊ¾Àý³õÖµÏàÍ¬£º W1=0.10.2
0.20.3,¦È1=£Û0.30.3£Ý,W2=0.40.5
0.40.5,¦È2=£Û0.60.6£Ý¡£
5. ½ÓµÚ4Ìâ£¬ÔÙ¼ÆËã·´Ïò´«²¥Ñ§Ï°¹ý³ÌÖÐw(1,2)1µÄ¸üÐÂ¡£
6. ÔÚµ¥Í¨µÀÊý¾ÝÉÏ½øÐÐ¾í»ýÔËËã£¬´ý´¦ÀíÕÅÁ¿IºÍ¾í»ýºËK·Ö±ðÈçÏÂ£¬Çë¼ÆËãÔÚ¾í»ýºËÒÆ¶¯²½³¤Îª1µÄÊä³öÕÅÁ¿S¡£ãÐÖµ¦È=0¡£
´ý´¦ÀíÕÅÁ¿£º 



1911208
322091
584231115
710910
00182

¾í»ýºË£º 



12
01

7. ½ÓµÚ6Ìâ£¬Èç¹ûÔÚ±ßÔµ²ÉÓÃ0Ìî³ä£¬Çë¼ÆËãÊä³öÕÅÁ¿S¡£