µÚ3ÕÂ»úÆ÷Ñ§Ï°³õ²½

±¾ÕÂÖ÷Òª½éÉÜÓÐ¹Ø»úÆ÷Ñ§Ï°µÄÏà¹ØÖªÊ¶£¬°üÀ¨»úÆ÷Ñ§Ï°µÄ»ù±¾Á÷³Ì¡¢Âß¼­»Ø¹é·ÖÀà¡¢ÏßÐÔ»Ø¹éÔ¤²â¼°¾ÛÀàµÈ¡£ÔÚ±¾ÕÂÖÐ£¬½«ÒªÑ§Ï°£º
¤r »úÆ÷Ñ§Ï°¸ÅÊö¡£
¤r »úÆ÷Ñ§Ï°µÄ·ÖÀà¡£
¤r Êý¾ÝÔ¤´¦ÀíÓëÌØÕ÷¹¤³Ì¡£
¤r sklearn¿â¼ò½é¡£
¤r Âß¼­»Ø¹é·ÖÀà¡£
¤r ÏßÐÔ»Ø¹éÔ¤²â¡£
¤r ¾ÛÀà¡£


08 »úÆ÷Ñ§
Ï°µ¼Òý


 3£®1»úÆ÷Ñ§Ï°¸ÅÊö
2016Äê3ÔÂ£¬AlphaGoÓëÎ§ÆåÊÀ½ç¹Ú¾üÀîÊÀÊ¯½øÐÐÁËÎ§ÆåÈË»ú´óÕ½£¬ÒÔ4¡Ã1µÄ×Ü±È·Ö»ñÊ¤£» 2017Äê5ÔÂ£¬AlphaGoÓëÊÀ½çÅÅÃûµÚÒ»µÄ¿Â½à¶ÔÕ½£¬ÒÔ3¡Ã0µÄ×Ü±È·Ö»ñÊ¤¡£Î§Æå½çÈÏÎª£¬AlphaGoµÄÆåÁ¦ÒÑ¾­³¬¹ýÁËÈËÀàÎ§ÆåµÄ¶¥¼âË®Æ½¡£Ëæ×ÅAlphaGoµÄ´ó»ð£¬»úÆ÷Ñ§Ï°(Machine Learing£¬ML)»ñµÃÔ½À´Ô½¶àµÄ¹Ø×¢¡£
ÄÇÊ²Ã´ÊÇ»úÆ÷Ñ§Ï°ÄØ£¿ÃÀ¹ú¿¨ÄÚ»ù¡¤Ã·Â¡´óÑ§(Carnegie Mellon University)»úÆ÷Ñ§Ï°ÑÐ¾¿ÁìÓòµÄÖøÃû½ÌÊÚTom Mitchell¶Ô»úÆ÷Ñ§Ï°µÄ¶¨ÒåÎª£º¡°A program can be said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured bt P, improves with experience E£®¡±·­Òë¹ýÀ´¾ÍÊÇ£º¡°Èç¹ûÒ»¸ö³ÌÐòÔÚÊ¹ÓÃ¼ÈÓÐµÄ¾­Ñé(E)Ö´ÐÐÄ³ÀàÈÎÎñ(T)µÄ¹ý³ÌÖÐ±»ÈÏ¶¨ÎªÊÇ¾ß±¸Ñ§Ï°ÄÜÁ¦µÄ£¬ÄÇÃ´ËüÒ»¶¨ÐèÒªÕ¹ÏÖ³öÀûÓÃÏÖÓÐµÄ¾­Ñé(E)²»¶Ï¸ÄÉÆÆäÍê³É¼È¶¨ÈÎÎñ(T)µÄÐÔÄÜ(P)µÄÌØÖÊ¡±¡£
»úÆ÷Ñ§Ï°ÊÇÒ»ÃÅ¶àÁìÓò½»²æÑ§¿Æ£¬Éæ¼°¸ÅÂÊÂÛ¡¢Í³¼ÆÑ§¡¢±Æ½üÂÛ¡¢Í¹·ÖÎö¡¢Ëã·¨¸´ÔÓ¶ÈÀíÂÛµÈ¶àÃÅÑ§¿Æ¡£Ëü×¨ÃÅÑÐ¾¿¼ÆËã»úÔõÑùÄ£Äâ»òÊµÏÖÈËÀàµÄÑ§Ï°ÐÐÎª£¬ÒÔ»ñÈ¡ÐÂµÄÖªÊ¶»ò¼¼ÄÜ£¬ÖØÐÂ×éÖ¯ÒÑÓÐµÄÖªÊ¶½á¹¹Ê¹Ö®²»¶Ï¸ÄÉÆ×ÔÉíµÄÐÔÄÜ¡£ËüÊÇÈË¹¤ÖÇÄÜµÄºËÐÄ£¬ÊÇÊ¹¼ÆËã»ú¾ßÓÐÖÇÄÜµÄ¸ù±¾Í¾¾¶£¬ÆäÓ¦ÓÃ±é¼°ÈË¹¤ÖÇÄÜµÄ¸÷¸öÁìÓò£¬ËüÖ÷ÒªÊ¹ÓÃ¹éÄÉ¡¢×ÛºÏ¶ø²»ÊÇÑÝÒï¡£
³ýÈ¥Ò»Ð©ÎÞ¹Ø½ôÒªµÄÇé¿ö£¬ÈËÃÇºÜÄÑÖ±½Ó´ÓÔ­Ê¼Êý¾Ý±¾Éí»ñµÃËùÐèÐÅÏ¢£¬ÀýÈç£¬¶ÔÓÚÀ¬»øÓÊ¼þµÄ¼ì²â£¬¼ì²âÒ»¸öµ¥´ÊÊÇ·ñ´æÔÚ²¢Ã»ÓÐÌ«´óµÄÒâÒå£¬È»¶øµ±Ä³¼¸¸öÌØ¶¨µ¥´ÊÍ¬Ê±³öÏÖÊ±£¬ÔÙ¸¨ÒÔ¿¼²ìÓÊ¼þ³¤¶ÈÒÔ¼°ÆäËûÒòËØ£¬ÈËÃÇ¾Í¿ÉÒÔ¸ü×¼È·µØÅÐ¶¨¸ÃÓÊ¼þÊÇ·ñÎªÀ¬»øÓÊ¼þ¡£¼òµ¥µØËµ£¬»úÆ÷Ñ§Ï°¾ÍÊÇ°ÑÎÞÐòµÄÊý¾Ý×ª»»ÎªÓÐÓÃµÄÐÅÏ¢¡£
»úÆ÷Ñ§Ï°ºá¿ç¼ÆËã»ú¿ÆÑ§¡¢¹¤³Ì¼¼ÊõºÍÍ³¼ÆÑ§µÈ¶à¸öÑ§¿Æ£¬ÐèÒª¶àÑ§¿ÆµÄ×¨ÒµÖªÊ¶¡£Ëü¿ÉÒÔ×÷ÎªÊµ¼Ê¹¤¾ßÓ¦ÓÃÓÚ´ÓÕþÖÎµ½µØÖÊÑ§µÄ¶à¸öÁìÓò£¬½â¾öÆäÖÐµÄºÜ¶àÎÊÌâ¡£ÉõÖÁ¿ÉÒÔÕâÃ´Ëµ£¬»úÆ÷Ñ§Ï°¶ÔÓÚÈÎºÎÐèÒª½âÊÍ²¢²Ù×÷Êý¾ÝµÄÁìÓò¶¼ÓÐËùñÔÒæ¡£







»úÆ÷Ñ§Ï°µÄ¹¤×÷Á÷³ÌÈçÍ¼3ª²1ËùÊ¾¡£


Í¼3ª²1»úÆ÷Ñ§Ï°µÄ¹¤×÷Á÷³Ì


1£® ³éÏóÊµ¼ÊÎÊÌâ
 ÉîÈëÀí½âÊµ¼ÊÎÊÌâµÄÒµÎñ³¡¾°ÊÇ»úÆ÷Ñ§Ï°µÄ¿ªÊ¼¡£Àí½âÊµ¼ÊÎÊÌâ£¬Ö÷Òª°üÀ¨Ã÷È·¿ÉÒÔ»ñµÃµÄÊý¾Ý£¬Ã÷È·»úÆ÷Ñ§Ï°µÄÄ¿±êÊÇ·ÖÀà¡¢»Ø¹é»¹ÊÇ¾ÛÀà¡£ÀýÈç»Ø´ðÒ»±­ÒºÌåÊÇºì¾Æ»¹ÊÇÆ¡¾Æ£¬Ê×ÏÈÒªÇå³þÕâ¸öÎÊÌâÊÇÒ»¸ö·ÖÀàÎÊÌâ£¬È»ºó¾ÍÐèÒª´ÓÕâÒ»±­ÒºÌåÖÐËÑ¼¯Ò»Ð©Êý¾Ý£¬ÏñÅÝÄ­ÊýÁ¿¡¢ÒºÌåÑÕÉ«ºÍ¾Æ±­µÄÐÎ×´µÈÌØÕ÷¿ÉÄÜÊÇÖØµã£¬¶øÒºÌåµÄ¶àÉÙ¡¢¾Æ±­µÄÈÝÁ¿µÈÌØÕ÷¿ÉÄÜ²»ÐèÒª¹Ø×¢¡£
2£® »ñÈ¡Êý¾Ý
 ÔÚ»ñÈ¡Êý¾ÝÊ±£¬µÃµ½µÄÊý¾ÝÒªÓÐ´ú±íÐÔ£¬·ñÔò»á¶Ô½á¹ûÓÐºÜ´óµÄÓ°Ïì£¬»á³öÏÖ¹ýÄâºÏ»òÇ·ÄâºÏµÄÏÖÏó¡£»ñÈ¡µÄ·½Ê½¿ÉÒÔÊÇÅÀ³æ£¬¿ÉÒÔÊÇÊý¾Ý¿âÀ­È¡£¬Ò²¿ÉÒÔÊÇAPIµÈ¡£
3£® Êý¾ÝÔ¤´¦Àí
Êµ¼ÊµÄ³¡¾°ÖÐ£¬µÃµ½µÄÊý¾Ý³£³£²¢²»Âú×ã»úÆ÷Ñ§Ï°Ëã·¨µÄÒªÇó¡£ÒòÎªÈËÎª¡¢Èí¼þºÍÒµÎñµ¼ÖÂµÄÒì³£Êý¾Ý»¹ÊÇ±È½Ï¶àµÄ£¬ÀýÈçÐÔ±ðÊý¾ÝµÄÈ±Ê§¡¢ÄêÁäÊý¾ÝµÄÒì³£(¸ºÊý»òÕß³¬´óµÄÊý)£¬¶ø´ó¶àÊýÄ£ÐÍ¶ÔÊý¾Ý¶¼ÓÐ»ù±¾ÒªÇó£¬ÕâÐ©Òì³£Êý¾Ý¶ÔÄ£ÐÍÊÇÓÐÓ°ÏìµÄ¡£Òò´Ë£¬Í¨³£¶¼ÐèÒª¶ÔÊý¾Ý½øÐÐ»ù±¾´¦Àí£¬°üÀ¨Êý¾ÝÇåÏ´¡¢Êý¾Ý¹éÒ»»¯¡¢À©³äµÈ¡£
4£® ÌØÕ÷¹¤³Ì
ÌØÕ÷¹¤³Ì°üÀ¨´ÓÔ­Ê¼Êý¾ÝÖÐ½øÐÐÌØÕ÷¹¹½¨¡¢ÌØÕ÷ÌáÈ¡ºÍÌØÕ÷Ñ¡Ôñ¡£ÌØÕ÷¹¤³ÌÐèÒª·´¸´Àí½âÊµ¼ÊÒµÎñ³¡¾°¡£ÌØÕ÷¹¤³Ì¶ÔºÜ¶à½á¹ûÓÐ¾ö¶¨ÐÔµÄÓ°Ïì¡£ÌØÕ÷Ñ¡ÔñºÃÁË£¬·Ç³£¼òµ¥µÄËã·¨Ò²ÄÜµÃ³öÁ¼ºÃ¡¢ÎÈ¶¨µÄ½á¹û¡£ÌØÕ÷¹¤³ÌÐèÒªÔËÓÃÌØÕ÷ÓÐÐ§ÐÔ·ÖÎöµÄÏà¹Ø¼¼Êõ£¬ÈçÏà¹ØÏµÊý¡¢¿¨·½¼ìÑé¡¢Æ½¾ù»¥ÐÅÏ¢¡¢Ìõ¼þìØ¡¢ºóÑé¸ÅÂÊ¡¢Âß¼­»Ø¹éÈ¨ÖØµÈ¡£ÀýÈçÒªÔ¤²âÊÇ·ñÏÂÓê£¬ÔÚÔ¤²âÖ®Ç°£¬¿Ï¶¨ÐèÒªÒ»Ð©ÌØÕ÷£¬ÈçÊÇ·ñ³öÏÖÁË³¯Ï¼»òÍíÏ¼¡¢ÎÂ¶È¡¢¿ÕÆøÊª¶ÈµÈ¡£¶ÔÓÚ·ÖÀàÎÊÌâ£¬»¹ÐèÒª¶ÔÊý¾Ý½øÐÐ±êÇ©£¬ÈçÌìÆøÊÇ·ñÏÂÓêµÈ¡£ÔÚÕâ¸ö¹ý³ÌÖ®ºó£¬¾ÍµÃµ½ÁËÕýÊ½µÄÊý¾Ý¼¯¡£Ò»°ã½«Êý¾Ý¼¯·Ö³ÉÈý×é£º µÚÒ»×éÎªÓÃÓÚÑ§Ï°µÄÊý¾Ý¼¯£¬³ÆÎªÑµÁ·¼¯£» µÚ¶þ×éÓÃÀ´Ô¤·À¹ýÄâºÏµÄ·¢Éú£¬¸¨ÖúÑµÁ·¹ý³ÌµÄÊý¾Ý¼¯£¬³ÆÎªÑéÖ¤¼¯£» µÚÈý×éÓÃÓÚ²âÊÔºÍÆÀ¹ÀÑµÁ·ºÃµÄÄ£ÐÍµÄÊý¾Ý¼¯£¬³ÆÎª²âÊÔ¼¯¡£ÎªÁË±£Ö¤Ñ§Ï°ÓÐÐ§£¬ÐèÒªÈý¸öÊý¾Ý¼¯²»Ïà½»¡£ÔÚÊµ¼ÊµÄÔËÓÃÖÐ£¬Ò²¿ÉÒÔÑ¡ÔñÑµÁ·¼¯ºÍ²âÊÔ¼¯Á½¸öÊý¾Ý¼¯½øÐÐÑ§Ï°ºÍ²âÊÔ¡£
5£® ÑµÁ·Ä£ÐÍ¼°µ÷ÓÅ
¸ù¾ÝÊý¾ÝµÄÊµ¼ÊÇé¿öºÍ¾ßÌåÒª½â¾öµÄÎÊÌâÀ´Ñ¡ÔñÄ£ÐÍ£¬Òª´ÓÑù±¾Êý¡¢ÌØÕ÷Î¬¶È¡¢Êý¾ÝÌØÕ÷µÈ×ÛºÏ¿¼ÂÇ£¬Í¬Ê±£¬±ØÐëÇå³þ½â¾öµÄÎÊÌâÊÇ·ÖÀà»¹ÊÇ»Ø¹é¡£¶ÔÓÚÄ£ÐÍµ÷ÓÅ£¬¿ÉÒÔ²ÉÓÃ½»²îÑéÖ¤¡¢¹Û²ìËðÊ§ÇúÏß¡¢²âÊÔ½á¹ûÇúÏßµÈ·ÖÎöÔ­Òò¡£¿ÉÒÔ³¢ÊÔ¶àÄ£ÐÍÈÚºÏ£¬À´Ìá¸ßÑ§Ï°Ð§¹û¡£
6£® Ä£ÐÍÆÀ¹À
¸ù¾Ý·ÖÀà¡¢»Ø¹éµÈ²»Í¬ÎÊÌâ£¬Ñ¡Ôñ²»Í¬µÄÆÀ¼ÛÖ¸±ê¡£´Ó¸÷¸ö·½ÃæÆÀ¹ÀÄ£ÐÍ×¼È·ÂÊ¡¢Îó²î¡¢Ê±¼ä¸´ÔÓ¶È¡¢¿Õ¼ä¸´ÔÓ¶È¡¢ÎÈ¶¨ÐÔ¡¢Ç¨ÒÆÐÔµÈ£¬ÒÔÆÚ´ïµ½×î¼ÑÐ§¹û¡£
¹ý³Ì5ºÍ6¿ÉÒÔÊÇÒ»¸öµü´úµÄ¹ý³Ì¡£
µ±×îÖÕÄ£ÐÍ´ïµ½×î¼ÑÐ§¹ûºó£¬¾Í¿ÉÒÔÀûÓÃÕâ¸öÄ£ÐÍ½â¾öÊµ¼ÊÎÊÌâÁË¡£
 3£®2»úÆ÷Ñ§Ï°µÄ·ÖÀà
1£® »úÆ÷Ñ§Ï°µÄ·ÖÀà¸ÅÊö 
»úÆ÷Ñ§Ï°´óÖÂ·ÖÎª¼à¶½Ñ§Ï°¡¢°ë¼à¶½Ñ§Ï°ºÍÎÞ¼à¶½Ñ§Ï°£¬Éæ¼°Ò»Ð©Ïà¹ØµÄ¼¼Êõ£¬ÈçÍ¼3ª²2ËùÊ¾¡£»¹ÓÐÒ»Ð©ÆäËû·ÖÀà£¬ÔÚ´Ë²»×öÌÖÂÛ¡£


Í¼3ª²2»úÆ÷Ñ§Ï°µÄ·ÖÀà


¼à¶½Ñ§Ï°ÊÇ»ùÓÚ±êÇ©ÑµÁ·Êý¾ÝµÄ»úÆ÷Ñ§Ï°Ä£ÐÍµÄ¹ý³Ì¡£¼ÙÈç»ùÓÚÄêÁä¡¢½ÌÓý¡¢µØµãµÈ¸÷ÖÖÒòËØÈ¥½¨Á¢Ò»¸ö×Ô¶¯Ô¤²âÈËÊÕÈëµÄÏµÍ³¡£Òª×öµ½ÕâÒ»µã£¬ÐèÒª´´½¨Ò»¸öÓµÓÐËùÓÐ±ØÒªÏ¸½Ú²¢±ê¼ÇËüµÄÈËÔ±µÄÊý¾Ý¿â¡£ÕâÑù×ö£¬ÊÇ¸æËßËã·¨£¬Ê²Ã´²ÎÊý¶ÔÓ¦ÓÚÊ²Ã´ÊÕÈë¡£»ùÓÚÕâ¸öÓ³Éä£¬Ëã·¨½«»áÑ§Ï°ÈçºÎÊ¹ÓÃÌá¹©¸øËüµÄ²ÎÊýÀ´¼ÆËãÒ»¸öÈËµÄÊÕÈë¡£
°ë¼à¶½Ñ§Ï°ÊÇÄ£Ê½Ê¶±ðºÍ»úÆ÷Ñ§Ï°ÁìÓòÑÐ¾¿µÄÖØµãÎÊÌâ£¬ÊÇ¼à¶½Ñ§Ï°ÓëÎÞ¼à¶½Ñ§Ï°Ïà½áºÏµÄÒ»ÖÖÑ§Ï°·½·¨¡£°ë¼à¶½Ñ§Ï°Ê¹ÓÃ´óÁ¿µÄÎ´±ê¼ÇÊý¾Ý£¬ÒÔ¼°Í¬Ê±Ê¹ÓÃ±ê¼ÇÊý¾Ý£¬À´½øÐÐÄ£Ê½Ê¶±ð¹¤×÷¡£µ±Ê¹ÓÃ°ë¼à¶½Ñ§Ï°Ê±£¬½«»áÒªÇó¾¡Á¿ÉÙµÄÈËÔ±À´´ÓÊÂ¹¤×÷£¬Í¬Ê±£¬ÓÖÄÜ¹»´øÀ´±È½Ï¸ßµÄ×¼È·ÐÔ£¬Òò´Ë£¬°ë¼à¶½Ñ§Ï°Ä¿Ç°Ô½À´Ô½ÊÜµ½ÈËÃÇµÄÖØÊÓ¡£°ë¼à¶½Ñ§Ï°²»ÊÇ±¾ÕÂµÄÖØµã¡£
·Ç¼à¶½Ñ§Ï°Ö¸µÄÊÇ½¨Á¢»úÆ÷Ñ§Ï°Ä£ÐÍµÄ¹ý³Ì²»ÒÀÀµÓÚ±êÇ©ÑµÁ·Êý¾Ý¡£´ÓÄ³ÖÖÒâÒåÉÏËµ£¬ËüÓë¸Õ¸ÕÌÖÂÛµÄÏà·´¡£ÓÉÓÚÃ»ÓÐ¿ÉÓÃµÄ±êÇ©£¬Ö»ÄÜ´ÓµÃµ½µÄÊý¾ÝÖÐÌáÈ¡ÐèÒªµÄ¶«Î÷¡£¼ÙÉèÏë½¨Á¢Ò»¸öÏµÍ³È¥°ÑÒ»×éÊý¾Ýµã¼¯·Ö¸î³É¶à¸ö×é¡£¼¬ÊÖµÄÊÇ²»ÖªµÀ·ÖÀëµÄ±ê×¼ÊÇÊ²Ã´¡£Òò´Ë£¬Ò»¸öÎÞ¼à¶½Ñ§Ï°Ëã·¨ÐèÒª½«¸ø¶¨µÄÊý¾Ý¼¯ÒÔ¾¡¿ÉÄÜºÃµÄ·½Ê½½øÐÐ·Ö×é¡£
ÔÚÎÞ¼à¶½Ñ§Ï°ÖÐ£¬»ù±¾ÉÏ²»ÖªµÀ½á¹û»áÊÇÊ²Ã´Ñù×Ó¡£µ«¿ÉÒÔÍ¨¹ý¾ÛÀàµÄ·½Ê½´ÓÊý¾ÝÖÐÌáÈ¡Ò»¸öÌØÊâµÄ½á¹¹¡£¾ÛÀàÊÇÎÞ¼à¶½Ñ§Ï°ÖÐµÄÒ»ÖÖËã·¨£¬ÎÒÃÇÔÚÖ®ºó»áÌÖÂÛ¡£ÔÚÎÞ¼à¶½Ñ§Ï°ÖÐ¸ø¶¨µÄÊý¾ÝºÍ¼à¶½Ñ§Ï°ÖÐ¸ø¶¨µÄÊý¾ÝÊÇ²»Ò»ÑùµÄ¡£ÔÚÎÞ¼à¶½Ñ§Ï°ÖÐ¸ø¶¨µÄÊý¾ÝÃ»ÓÐÈÎºÎ±êÇ©»òÕßËµÖ»ÓÐÍ¬Ò»ÖÖ±êÇ©£¬ÈçÍ¼3ª²3ËùÊ¾¡£


Í¼3ª²3¼à¶½Ñ§Ï°ºÍ·Ç¼à¶½Ñ§Ï°µÄÇø±ð


2£® ·ÖÀàÓë»Ø¹é
ÔÚÃ÷°×ÁË¼à¶½Ñ§Ï°µÄË¼Ïëºó£¬ÏÂÃæ½éÉÜ¼à¶½Ñ§Ï°ÖÐÁ½Àà·Ç³£ÖØÒªµÄÓ¦ÓÃ¡ª¡ª·ÖÀàÓë»Ø¹é¡£
·ÖÀàµÄ¹ý³ÌÊÇ½«Êý¾Ý»®·ÖÎª¸ø¶¨µÄÀà¡£ÔÚ·ÖÀà¹ý³ÌÖÐ£¬½«Êý¾Ý°²ÅÅµ½¹Ì¶¨ÊýÁ¿µÄÀà±ðÖÐÒÔ±ã¸üÓÐÐ§µØÊ¹ÓÃ¡£Í¨Ë×À´½²£¬·ÖÀà¾ÍÊÇ¸ù¾ÝËù¸øÊý¾ÝµÄÊôÐÔ»òÕßÌØÕ÷ÊÇ·ñÀàËÆ£¬À´°ÑËüÃÇ¹éÎªÒ»Àà¡£ÀýÈç·¿×Ó£¬°´ÕÕ·¿×ÓµÄ¼¶±ð£¬¿ÉÒÔ·ÖÎª¸ßµµ×¡Õ¬¡¢ÆÕÍ¨×¡Õ¬¡¢¹«Ô¢Ê½×¡Õ¬¡¢±ðÊûµÈ£¬ÈçÍ¼3ª²4ËùÊ¾£¬Õâ¾ÍÊÇ·ÖÀà¡£


Í¼3ª²4·¿ÎÝµÄ·ÖÀà




Í¼3ª²5ÑµÁ·Êý¾Ý¼¯


ÔÚ»úÆ÷Ñ§Ï°ÖÐ£¬·ÖÀà½â¾öÁËÊ¶±ðÐÂÊý¾ÝµãËùÊôÀà±ðµÄÎÊÌâ¡£ÎÒÃÇ»ùÓÚ°üº¬Êý¾ÝµãºÍÏàÓ¦±êÇ©µÄÑµÁ·Êý¾Ý¼¯½¨Á¢·ÖÀàÄ£ÐÍ¡£ÀýÈç£¬¼ÙÉèÏëÒª¼ì²é¸ø¶¨µÄÍ¼ÏñÊÇ·ñ°üº¬Ò»¸öÈËµÄÁ³¡£ÎÒÃÇ½«¹¹½¨Ò»¸ö°üº¬ÓëÕâÁ½¸öÀàÏà¶ÔÓ¦µÄÀàµÄÑµÁ·Êý¾Ý¼¯£º faceºÍno face£¬È»ºó¸ù¾ÝÑµÁ·Ñù±¾À´ÑµÁ·Ä£ÐÍ£¬ÈçÍ¼3ª²5ËùÊ¾¡£Õâ¸ö¾­¹ýÑµÁ·µÄÄ£ÐÍ±»ÓÃÓÚÍÆÀí¡£
Ò»¸öºÃµÄ·ÖÀàÏµÍ³ºÜÈÝÒ×ÕÒµ½Êý¾ÝºÍ¼ìË÷Êý¾Ý¡£ÕâÔÚÈËÁ³Ê¶±ð¡¢À¬»øÓÊ¼þÊ¶±ð¡¢ÍÆ¼öÒýÇæµÈ·½ÃæµÃµ½ÁË¹ã·ºµÄÓ¦ÓÃ¡£Êý¾Ý·ÖÀàµÄËã·¨½«»áÌá³öÕýÈ·µÄ±ê×¼£¬½«¸ø¶¨µÄÊý¾Ý·ÖÀëµ½¸ø¶¨µÄÀàÖÐ£¬ÈçÍ¼3ª²6ËùÊ¾¡£


Í¼3ª²6·ÖÀàÏµÍ³µÄÓ¦ÓÃ


»úÆ÷Ñ§Ï°ÐèÒªÌá¹©×ã¹»¶àµÄÑù±¾À´ÍÆ¹ãÕâÐ©±ê×¼¡£Èç¹ûÑù±¾ÊýÁ¿²»×ã£¬Ëã·¨¾Í»áÓëÑµÁ·Êý¾Ý²»ÄâºÏ¡£Õâ¾ÍÒâÎ¶×ÅËüÔÚÎ´ÖªÊý¾ÝÉÏ²»»á±íÏÖµÃºÜºÃ£¬ÒòÎªËü¶ÔÄ£ÐÍ½øÐÐÁËÌ«¶àµÄµ÷Õû£¬ÒÔÊÊÓ¦ÔÚÑµÁ·Êý¾ÝÖÐ¹Û²ìµ½µÄÄ£Ê½¡£ÕâÆäÊµÊÇ»úÆ÷Ñ§Ï°ÖÐ¾­³£³öÏÖµÄÎÊÌâ¡£µ±¹¹½¨²»Í¬µÄ»úÆ÷Ñ§Ï°Ä£ÐÍÊ±ÕâÊÇÒ»¸öÖµµÃ¿¼ÂÇµÄÒòËØ¡£

»Ø¹éÊÇÆÀ¹ÀÊäÈë±äÁ¿ºÍÊä³ö±äÁ¿Ö®¼ä¹ØÏµµÄ¹ý³Ì£¬ÈçÍ¼3ª²7ËùÊ¾¡£»Ø¹é´ÓÒ»×éÊý¾Ý³ö·¢£¬È·¶¨Ä³Ð©±äÁ¿Ö®¼äµÄ¶¨Á¿¹ØÏµÊ½£¬¼´½¨Á¢ÊýÑ§Ä£ÐÍ²¢¹À¼ÆÎ´Öª²ÎÊý¡£»Ø¹éµÄÄ¿µÄÊÇÔ¤²âÊýÖµÐÍµÄÄ¿±êÖµ£¬ËüµÄÄ¿±êÊÇ½ÓÊÜÁ¬ÐøÊý¾Ý£¬Ñ°ÕÒ×îÊÊºÏÊý¾ÝµÄ·½³Ì£¬²¢ÄÜ¹»¶ÔÌØ¶¨Öµ½øÐÐÔ¤²â¡£


Í¼3ª²7»Ø¹é

Õâ¸ö·½³Ì³ÆÎª»Ø¹é·½³Ì£¬¶øÇó»Ø¹é·½³ÌÏÔÈ»¾ÍÊÇÇó¸Ã·½³ÌµÄ»Ø¹éÏµÊý£¬ÇóÕâÐ©»Ø¹éÏµÊýµÄ¹ý³Ì¾ÍÊÇ»Ø¹é£¬Òò´Ë£¬ÓÐÎÞÊýÖÖ¿ÉÄÜÐÔ¡£
ÕâÓë·ÖÀàÊÇÏà·´µÄ¡£ÔÚ·ÖÀàÖÐ£¬Êä³öÀàµÄÊýÁ¿ÊÇ¹Ì¶¨µÄ¡£ÔÚ»Ø¹éÖÐ£¬Ò»°ãÈÏÎªÊä³ö±äÁ¿È¡¾öÓÚÊäÈë±äÁ¿£¬ËùÒÔÈËÃÇÏë¿´¿´ËüÃÇÊÇÈçºÎ¹ØÁªµÄ¡£ÊäÈë±äÁ¿±»³ÆÎª×Ô±äÁ¿£¬Ò²³ÆÎªÔ¤²âÒò×Ó£¬¶øÊä³ö±äÁ¿±»³ÆÎªÒò±äÁ¿£¬Ò²³ÆÎª±ê×¼±äÁ¿¡£ÊäÈë±äÁ¿²»ÐèÒª±Ë´ËÏà»¥¶ÀÁ¢¡£ÔÚºÜ¶àÇé¿öÏÂÊäÈë±äÁ¿Ö®¼ä´æÔÚÏà¹ØÐÔ¡£
ÕâÀï¼òµ¥½âÊÍÒ»ÏÂ·ÖÀàºÍ»Ø¹éµÄÇø±ð¡£·ÖÀàÄ£ÐÍºÍ»Ø¹éÄ£ÐÍ±¾ÖÊÉÏÊÇÒ»ÑùµÄ£¬ËüÃÇµÄÇø±ðÔÚÓÚÊä³ö±äÁ¿µÄÀàÐÍ¡£·ÖÀàµÄÊä³öÊÇÀëÉ¢µÄ£¬»Ø¹éµÄÊä³öÊÇÁ¬ÐøµÄ¡£·ÖÀàÎÊÌâÊÇ´Ó²»Í¬ÀàÐÍµÄÊý¾ÝÖÐÑ§Ï°µ½Êý¾ÝµÄ±ß½ç£¬ÀýÈçÍ¨¹ýÓãµÄÌå³¤¡¢ÖÊÁ¿¡¢ÓãÁÛÉ«ÔóµÈÎ¬¶ÈÀ´·ÖÀàöÓÓãºÍÀðÓã£¬ÕâÊÇÒ»¸ö¶¨ÐÔÎÊÌâ£» »Ø¹éÎÊÌâÔòÊÇ´ÓÍ¬Ò»ÀàÐÍµÄÊý¾ÝÖÐÑ§Ï°µ½ÕâÖÖÊý¾ÝÖÐ²»Í¬Î¬¶È¼äµÄ¹æÂÉ£¬È¥ÄâºÏÕæÊµ¹æÂÉ£¬ÀýÈçÍ¨¹ýÊý¾ÝÑ§Ï°µ½Ãæ»ý¡¢·¿¼äÊý¡¢·¿¼Û¼¸¸öÎ¬¶ÈµÄ¹ØÏµ£¬ÓÃÓÚ¸ù¾ÝÃæ»ýºÍ·¿¼äÊýÔ¤²â·¿¼Û£¬ÕâÊÇÒ»¸ö¶¨Á¿ÎÊÌâ¡£
»Ø¹é·ÖÎöÓÐÖúÓÚÈËÃÇÀí½âÔÚ±£³ÖÆäËûÊäÈë±äÁ¿²»±äµÄÍ¬Ê±£¬µ±¸Ä±äÒ»Ð©ÊäÈë±äÁ¿Ê±£¬Êä³ö±äÁ¿µÄÖµÊÇÈçºÎ±ä»¯µÄ¡£ÔÚÏßÐÔ»Ø¹éÖÐ£¬¼ÙÉèÊäÈëºÍÊä³öÖ®¼äµÄ¹ØÏµÊÇÏßÐÔµÄ¡£ÕâÏÞÖÆÁË½¨Ä£¹ý³Ì£¬µ«ËüÊÇ¿ìËÙºÍ¸ßÐ§µÄ¡£ÔÚÖ»ÓÐÒ»¸ö±äÁ¿µÄÇé¿öÏÂ£¬ÏßÐÔ»Ø¹é¿ÉÒÔÓÃ·½³Ìy=ax+b±íÊ¾¡£¶øÈç¹ûÓÐ¶à¸ö±äÁ¿£¬Ò²¾ÍÊÇnÔªÏßÐÔ»Ø¹éµÄÐÎÊ½£¬Èç£º

hx1,x2,¡­,xn=¡Æni=1aixi+b

ÓÐÊ±£¬ÏßÐÔ»Ø¹é²»×ãÒÔ½âÊÍÊäÈëºÍÊä³öÖ®¼äµÄ¹ØÏµ£¬Òò´Ë¿ÉÒÔÊ¹ÓÃ¶àÏîÊ½»Ø¹é¡£¿ÉÒÔÓÃÒ»¸ö¶àÏîÊ½À´½âÊÍÊäÈëºÍÊä³öÖ®¼äµÄ¹ØÏµ¡£ÕâÔÚ¼ÆËãÉÏ¸ü¸´ÔÓ£¬µ«¸ü¾«È·¡£»Ø¹é¾­³£±»ÓÃÓÚÔ¤²â¼Û¸ñ¡¢¾­¼Ã¡¢±ä»¯µÈ¡£ÏßÐÔ»Ø¹éºÍ¶àÏîÊ½»Ø¹éÊ¾ÀýÈçÍ¼3ª²8ËùÊ¾¡£


Í¼3ª²8ÏßÐÔ»Ø¹éºÍ¶àÏîÊ½»Ø¹éÊ¾Àý


 3£®3Êý¾ÝÔ¤´¦ÀíÓëÌØÕ÷¹¤³Ì
Êý¾ÝÖÊÁ¿¶Ô»úÆ÷Ñ§Ï°µÄËã·¨Ó°ÏìºÜ´ó£¬Êµ¼ÊÒµÎñ³¡¾°ÖÐ£¬´ó¶à¶¼ÐèÒª¶ÔÊý¾Ý½øÐÐÔ¤´¦Àí£¬Ìá¸ßËã·¨µÄ¾«¶È¡£ÏÂÃæ½éÉÜ¼¸ÖÖ³£ÓÃµÄÊý¾ÝÔ¤´¦Àí·½·¨¡£
1£® Êý¾ÝÇåÏ´
Êý¾ÝÇåÏ´µÄÄ¿µÄÊÇ½«Êý¾Ý¼¯ÖÐµÄ¡°Ôà¡±Êý¾ÝÈ¥³ý¡£ÕâÐ©¡°Ôà¡±Êý¾ÝÖ÷Òª°üÀ¨È±Ê§µÄÊý¾Ý¡¢Òì³£µÄÊý¾ÝºÍÖØ¸´µÄÊý¾ÝµÈ¡£ÀýÈç£¬ÔÚÍøÉÏÅÀÈ¡µÄÊý¾ÝÖÐÄ³¸öÊôÐÔ¿ÉÄÜ°üÀ¨È±Ê§Öµ¡¢¸öÈËÐÅÏ¢ÖÐÐÔ±ðÃ»ÓÐÌîÐ´¡¢ÈËµÄÉí¸ß3m¡¢ÈËµÄÄêÁä201ËêµÈ¡£¶ÔÓÚÕâÐ©¡°Ôà¡±Êý¾Ý£¬Èç¹ûÁ¿¼«ÉÙ£¬Èç10 000¸öÑù±¾ÖÐÓÐ5¸öÑù±¾ÊÇ¡°Ôà¡±Êý¾Ý£¬ÇÒÊÇËæ»ú³öÏÖµÄ£¬Ôò¿ÉÒÔÖ±½ÓÉ¾³ý£¬ÒòÎªÕâ5¸öÑù±¾¶ÔÊý¾Ý¼¯Ó°Ïì²»´ó£¬µ«Èç¹ûÓÐ20%µÄ¡°Ôà¡±Êý¾Ý£¬Ö±½ÓÉ¾³ý¡°Ôà¡±Êý¾Ý»á¶ÔÕû¸öÊý¾Ý¼¯Ó°ÏìºÜ´ó¡£Òò´ËÒª¿¼ÂÇ½«¡°Ôà¡±Êý¾ÝÐÞ¸ÄÎªºÏÀíµÄÊý¾Ý¡£
¶ÔÓÚÈ±Ê§Êý¾Ý£¬ÓÐÒÔÏÂ¼¸ÖÖ³£ÓÃ´¦Àí·½·¨¡£
(1) Ö±½ÓÉ¾È¥£ºÕâÖÖÇé¿öÒ»°ãÏÞÓÚÈ±Ê§Êý¾ÝÉÙ£¬É¾È¥¶ÔÊý¾Ý¼¯Ó°Ïì²»´óµÄÇé¿ö¡£
(2) Ìî³äÎªÒ»¸ö³£Á¿£º ÀýÈçÊýÖµÐÍµÄÊý¾Ý¸³ÖµÎª0£¬ÎÄ±¾Êý¾Ý¸³ÖµÎª¿Õ»òunknownµÈ¡£ÕâÑù´¦ÀíÐ§¹û²»Ò»¶¨ºÃ£¬ÒòÎªËã·¨¿ÉÄÜ»á¶ÔÕâÖÖ³£Á¿µ±³ÉÊý¾Ý¼¯±¾ÉíµÄÊôÐÔ¡£
(3) È¡¾ùÖµ¡¢ÖÐÎ»Êý»òÊ¹ÓÃÆµÂÊ¸ßµÄÖµ£º Ñ¡ÔñÊý¾ÝµÄ¾ùÖµ¡¢ÖÐÎ»Êý»òÊ¹ÓÃÆµÂÊ¸ßÖµ½øÐÐÌî³ä£¬Ìî³ä½á¹û¿ÉÄÜ»á´æÔÚÆ«²î¡£
(4) ²åÖµÌî³ä£º ÏßÐÔ²åÖµ¡¢À­¸ñÀÊÈÕ²åÖµ¡¢Å£¶Ù²åÖµ¡£
(5) Ä£ÐÍÌî³ä£º ¿ÉÒÔ¸ù¾ÝÊý¾Ý¼¯µÄÆäËûÊôÐÔ£¬Í¨¹ýÒÑÖªµÄÆäËûÊôÐÔÖµÀ´Ô¤²âÈ±Ê§ÊôÐÔÖµ£¬¸ù¾ÝÊý¾ÝÀàÐÍ£¬¶¨ÒåÏàÓ¦µÄ»Ø¹é»ò·ÖÀàÎÊÌâ¡£½«Î´¶ªÊ§Êý¾ÝµÄÄÇ²¿·ÖÑù±¾×÷ÎªÐÂÎÊÌâµÄÑµÁ·Êý¾Ý¡£ÕâÖÖ·½·¨ÊÇ×îÎªÁ÷ÐÐµÄ·½·¨¡£
Òì³£Êý¾ÝÒ²³ÆÎªÔëÉùÊý¾Ý¡£Òì³£Êý¾ÝµÄ·¢ÏÖÓÐÒÔÏÂ¼¸ÖÖ³£ÓÃ´¦Àí·½·¨¡£
(1) ½¨Ä£·¨£º ÀýÈçÊ¹ÓÃ»Ø¹é£¬ÕÒµ½Ç¡µ±µÄ»Ø¹éº¯ÊýÀ´Æ½»¬Êý¾Ý¡£ÏßÐÔ»Ø¹éÒªÕÒ³öÊÊºÏÁ½¸ö±äÁ¿µÄ¡°×î¼Ñ¡±Ö±Ïß£¬Ê¹µÃÒ»¸ö±äÁ¿ÄÜÔ¤²âÁíÒ»¸ö±äÁ¿¡£¶àÏßÐÔ»Ø¹éÉæ¼°¶à¸ö±äÁ¿£¬Êý¾ÝÒªÊÊºÏÒ»¸ö¶àÎ¬Ãæ¡£ÄÇÐ©²»ÄÜºÜºÃÄâºÏµÄÊý¾Ý£¬¿ÉÒÔÅÐ¶¨ÎªÒì³£Êý¾Ý¡£
(2) ¼ÆËã»ú¼ì²éºÍÈË¹¤¼ì²éÏà½áºÏ£º ¿ÉÒÔÍ¨¹ý¼ÆËã»ú½«±»ÅÐ¶¨Êý¾ÝÓëÒÑÖªµÄÕý³£Öµ±È½Ï£¬½«²îÒì³Ì¶È´óÓÚÄ³¸öãÐÖµµÄÄ£Ê½Êä³öµ½Ò»¸ö±íÖÐ£¬ÈË¹¤ÉóºËºóÊ¶±ð³öÔëÉùÊý¾Ý¡£
(3) ¾ÛÀà£º ½«ÀàËÆµÄÖµ×é³ÉÈº»ò¾ÛÀà£¬ÂäÔÚ¾ÛÀà¼¯ºÏÖ®ÍâµÄÖµ±»ÊÓÎª¹ÂÁ¢µã»òÀëÈºµã£¬Ò²¾ÍÊÇÒì³£Êý¾Ý¡£¹ÂÁ¢µã¿ÉÄÜÊÇÀ¬»øÊý¾Ý£¬Ò²¿ÉÄÜÊÇÌá¹©ÐÅÏ¢µÄÖØÒªÊý¾Ý¡£ÐèÒª¸ù¾ÝÊµ¼ÊÇé¿ö½øÒ»²½´¦Àí¡£
(4) ÃÜ¶È·¨£º Èç¹ûÒ»¸öÊý¾ÝµÄ¾Ö²¿ÃÜ¶ÈµÍÓÚËüµÄ´ó²¿·ÖÁÙ½üÊý¾ÝµÄÃÜ¶È£¬Õâ¸öÊý¾Ý¿ÉÒÔ±»ÈÏ¶¨ÎªÊÇÔëÉùÊý¾Ý¡£
¼ì²âµ½Êý¾Ý¼¯ÓÐÔëÉùÊý¾Ýºó£¬Òª¶ÔÊý¾ÝÔëÉùÊý¾Ý½øÐÐ´¦Àí£¬´¦Àí·½Ê½ÀàËÆÓÚÈ±Ê§Êý¾ÝµÄ´¦Àí·½·¨¡£
2£® Êý¾Ý±ä»»
Êý¾Ý±ä»»ÊÇ¶Ô¶ÔÏóµÄÊôÐÔÔÚÊýÖµÉÏ½øÐÐ´¦Àí£¬°üÀ¨¹æ·¶»¯¡¢ÀëÉ¢»¯¡¢Ï¡Êè»¯¡£ÏÂÃæÖ÷Òª½éÉÜ¹æ·¶»¯´¦Àí¡£
¹æ·¶»¯´¦ÀíÊÇ¶ÔÊý¾ÝµÄ¹éÒ»»¯ºÍ±ê×¼»¯¹ý³Ì¡£Êý¾ÝÖÐ²»Í¬µÄÌØÕ÷ÓÉÓÚÁ¿¸ÙÍùÍù²»Í¬£¬ÊýÖµ¼ä²î¾à¿ÉÄÜ·Ç³£´ó£¬»áÓ°Ïìµ½Êý¾Ý·ÖÎöµÄ½á¹û¡£ÐèÒª¶ÔÊý¾Ý°´ÕÕÒ»¶¨±ÈÀý½øÐÐËõ·Å£¬±£³ÖÊý¾ÝËù·´Ó³µÄÌØÕ÷ÐÅÏ¢µÄÍ¬Ê±£¬Ê¹Ö®ÂäÔÚºÏÀí·¶Î§ÄÚ£¬±ãÓÚ½øÐÐ×ÛºÏ·ÖÎö¡£
Ò»°ã»ùÓÚÑù±¾¼ä¾àÀëµÄ»úÆ÷Ñ§Ï°·½·¨£¬¶¼Àë²»¿ª¶ÔÊý¾ÝµÄ¹æ·¶»¯´¦Àí¡£ÓÐÒ»Ð©Ä£ÐÍÓÉÓÚÆä²»¹ØÐÄ±äÁ¿µÄÖµ£¬Ö»¹ØÐÄ·Ö²¼Çé¿ö£¬¿ÉÄÜ²»ÐèÒª½øÐÐ¹æ·¶»¯´¦Àí¡£ÀýÈç»ùÓÚ¸ÅÂÊÄ£ÐÍµÄ·½·¨¡¢C4£®5·ÖÀà¾ö²ßÊ÷£¬ÒÀ¿¿Êý¾Ý¼¯¹ØÓÚÌØÕ÷µÄÐÅÏ¢ÔöÒæ±È£¬¹éÒ»»¯²»»áÓ°Ïì½á¹û¡£
3£® Êý¾Ý¹ýÂË
ÔÚÊý¾Ý¼¯ÖÐ£¬¿ÉÄÜÄ³¸öÊôÐÔ¶ÔÓÚÕû¸öÊý¾Ý¼¯Ã»ÓÐÊ²Ã´ÒâÒå£¬Ó°ÏìºÜÐ¡£¬¿ÉÒÔ°ÑËü¹ýÂËµô£¬ÀýÈçÓÃ»§id¶ÔÓÚÅÐ¶Ï²úÆ·ÕûÌå¹ºÂòÓëÎ´¹ºÂòÊýÁ¿¼°Ç÷ÊÆ¾ÍÒâÒå²»´ó£¬Ö±½Ó¹ýÂËµô¾Í¿ÉÒÔ¡£
4£® ÌØÕ÷¹¤³Ì
ÌØÕ÷¹¤³ÌÊÇ»úÆ÷Ñ§Ï°ÖÐ×îÎªÖØÒªµÄÒ»²¿·Ö¡£Ê²Ã´ÊÇÌØÕ÷¹¤³Ì£¿ÀýÈç£¬Éè¼ÆÒ»¸öÉí²Ä·ÖÀàÆ÷¡£ÊäÈëÊý¾ÝÎªÉí¸ßXºÍÌåÖØW£¬±êÇ©ÎªY£¬¼´Éí²ÄµÈ¼¶(ÅÖ£¬²»ÅÖ)¡£ÏÔÈ»£¬²»ÄÜµ¥´¿µØ¸ù¾ÝÌåÖØÀ´ÅÐ¶ÏÒ»¸öÈËÅÖ²»ÅÖ¡£Õë¶ÔÕâ¸öÎÊÌâ£¬Ò»¸ö·Ç³£¾­µäµÄÌØÕ÷¹¤³ÌÊÇBMIÖ¸Êý£¬BMI=ÌåÖØ/(Éí¸ßµÄÆ½·½)¡£ÕâÑù£¬Í¨¹ýBMIÖ¸Êý¾ÍÄÜ·Ç³£ÏÔÈ»µØ°ïÖúÎÒÃÇ¿Ì»­Ò»¸öÈËÉí²ÄÈçºÎ¡£ÉõÖÁËµ¿ÉÒÔÅ×ÆúÔ­Ê¼µÄÌåÖØºÍÉí¸ßÊý¾Ý¡£ÔÙÀýÈç£¬Êý¾ÝÈç¹ûÊÇÍ¼ÏñÀàÐÍ£¬¸ù¾ÝÑ§Ï°µÄÄ¿±ê£¬Òª¿¼ÂÇÊÇ·ñ»ñÈ¡Í¼ÏñµÄÌØÕ÷¡ª¡ªÍ¨µÀ£¬¶ø²»ÊÇÍ¼Ïñ±¾Éí¡£
¶ÔÓÚÒ»¸öÕæÊµµÄÊý¾Ý¼¯¶øÑÔ£¬¿ÉÄÜ»ñÈ¡·Ç³£¶àµÄÌØÕ÷£¬µ«ÊÇÌØÕ÷²¢²»ÊÇÔ½¶àÔ½ºÃ£¬ÓÐµÄÌØÕ÷¿ÉÄÜÑ¹¸ù¾ÍÓëÊµ¼ÊµÄ½á¹ûÃ»ÓÐ¹ØÏµ£¬ÌØÕ÷ÊýÁ¿¹ý¶à¶Ô¼ÆËã»úµÄ¿ªÏúÒ²»áÔö¶à¡£Í¨³£À´¿´£¬»á´ÓÒÔÏÂÁ½¸ö´óµÄ·½Ãæ½øÐÐÑ¡Ôñ¡£ 
ÌØÕ÷ÊÇ·ñ·¢É¢£º Èç¹ûÄ³¸öÌØÕ÷²»·¢É¢£¬ÌØÕ÷¼¸ºõÊÇ²»±äµÄ£¬Òò´ËÒ²¾ÍÎÞ·¨µÃÖª¸ÃÌØÕ÷¶Ô½á¹ûµÄÓ°Ïì¡£
ÌØÕ÷ÓëÑ§Ï°Ä¿±êµÄÏà¹ØÐÔ£º ÓëÑ§Ï°Ä¿±êÏà¹ØÐÔ¸ßµÄÌØÕ÷£¬¿Ï¶¨ÊÇÒªÓÅÏÈÑ¡ÔñµÄ£¬¶øÓëÄ¿±ê¼¸ºõ²»Ïà¹ØµÄÌØÕ÷¿ÉÒÔ¿¼ÂÇÊÇ·ñ·ÅÆú¡£ÎªÁË±ÜÃâÌØÕ÷¹ý¶à´øÀ´Ñ§Ï°ÉÏµÄÎÊÌâ£¬ÌØÕ÷½µÎ¬Ò²±»¹ã·ºÓ¦ÓÃ¡£ÌØÕ÷½µÎ¬ÊÇÌØÕ÷¹¤³ÌÖÐµÄÒ»ÏîÖØÒª¹¤×÷£¬Èç¹ûÊý¾Ý¼¯µÄÌØÕ÷ºÜ¶à£¬²»ÀûÓÚËã·¨µÄÑ§Ï°£¬ÐèÒª½øÐÐÌØÕ÷½µÎ¬¡£ÌØÕ÷½µÎ¬ÊÇÖ¸´ÓÊý¾Ý¼¯µÄÈ«²¿ÌØÕ÷Ñ¡Ôñ³öÒ»¸ö×îÓÅÌØÕ÷×Ó¼¯£¬ÔÚÄ³ÖÖÆÀ¼ÛÖ¸±êÏÂ£¬ÑµÁ·¼¯ºÍ²âÊÔ¼¯µÄÆÀ¹ÀÐ§¹û×îºÃ¡£



09 sklearn
µÄÊ¹ÓÃ



 3£®4sklearn¿â¼ò½é
¾­¹ýÊý¾ÝÔ¤´¦ÀíºÍÌØÕ÷Ñ¡Ôñ¹ý³Ì£¬µÃµ½ÁË»úÆ÷Ñ§Ï°µÄ»ù±¾Êý¾Ý¼¯¡£½ÓÏÂÀ´Òª¸ù¾ÝÑ§Ï°Ä¿±ê£¬Ñ¡ÔñÏàÓ¦µÄÑ§Ï°Ä£ÐÍ¡£ÔÚÃ»ÓÐ½éÉÜ¾ßÌåµÄÑ§Ï°Ä£ÐÍÖ®Ç°£¬½éÉÜÒ»ÏÂPythonÖÐµÄScikitª²learn¿âµÄÊ¹ÓÃ£¬²¢ÊµÏÖÇ°Ãæ½éÉÜµÄÊý¾ÝÔ¤´¦ÀíºÍÌØÕ÷¹¤³ÌµÄ»ù±¾·½·¨¡£
Scikitª²learn¿âÓÉDavid CournapeauÔÚ2007ÄêÊ×´Î¿ª·¢¡£Ëü°üº¬Ò»ÏµÁÐÈÝÒ×ÊµÏÖºÍµ÷ÕûµÄÓÐÓÃËã·¨£¬¿ÉÒÔÓÃÀ´ÊµÏÖ·ÖÀàºÍÆäËû»úÆ÷Ñ§Ï°µÄÈÎÎñ¡£ÔÚ¹Ù·½ÍøÕ¾ÏÂÔØÊ±Ö»ÓÐScikitª²learn£¬µ«ÊÇÔÚPythonÖÐµ÷ÓÃ¸Ã¿âÊ±Ð´·¨Îªsklearn£¬ºóÃæÔÚ´úÂëÖÐµ÷ÓÃ¸Ã¿âÒ²¾ùÎªsklearn£¬ÕâÀï¿ÉÒÔ½«sklearn¿´×÷ÊÇScikitª²learnµÄËõÐ´¡£
sklearnµÄ»ù±¾¹¦ÄÜÖ÷Òª·ÖÎªÁù´ó²¿·Ö£¬°üÀ¨Êý¾ÝÔ¤´¦Àí¡¢Êý¾Ý½µÎ¬¡¢Ä£ÐÍÑ¡Ôñ¡¢·ÖÀà¡¢»Ø¹é¡¢¾ÛÀà¡£sklearn»ù±¾¹¦ÄÜÈç±í3ª²1ËùÊ¾¡£


±í3ª²1sklearn»ù±¾¹¦ÄÜ



»ù±¾¹¦ÄÜËµÃ÷
Êý¾ÝÔ¤´¦Àí(preprocessing)Êý¾ÝÌØÕ÷ÌáÈ¡¡¢¹éÒ»»¯
Êý¾Ý½µÎ¬
(dimensionality reduction)Ö÷³É·Ö·ÖÎö(PCA)¡¢·Ç¸º¾ØÕó·Ö½â(NMF)¡¢ÌØÕ÷Ñ¡Ôñ(eature_selection)µÈ
Ä£ÐÍÑ¡Ôñ(model selection)pipeline(Á÷Ë®Ïß)¡¢grid_search(Íø¸ñËÑË÷)¡¢cross_validation(½»²æÑéÖ¤)¡¢metrics(¶ÈÁ¿)¡¢learning_curve(Ñ§Ï°ÇúÏß)µÈ
·ÖÀà(classification)Âß¼­»Ø¹é¡¢Ö§³ÖÏòÁ¿»ú(SVM)¡¢Kª²½üÁÚ¡¢Ëæ»úÉ­ÁÖ¡¢Âß¼­»Ø¹é¡¢Éñ¾­ÍøÂçµÈ
»Ø¹é(regression)ÏßÐÔ»Ø¹é¡¢Ö§³ÖÏòÁ¿»Ø¹é(SVR)¡¢¼¹»Ø¹é¡¢µ¯ÐÔ»Ø¹é¡¢±´Ò¶Ë¹»Ø¹é¡¢Lasso»Ø¹é¡¢×îÐ¡½Ç»Ø¹é(LARS)µÈ
¾ÛÀà(clustering)Kª²Means(¾ùÖµ¾ÛÀà)¡¢spectral clustering(Æ×¾ÛÀà)¡¢meanª²shift(¾ùÖµÆ¯ÒÆ)¡¢·Ö²ã¾ÛÀà¡¢DBSCAN¾ÛÀà

1£® Ñ¡ÔñÊý¾Ý¼¯
ÔÚ»úÆ÷Ñ§Ï°¹ý³ÌÖÐ£¬¾­³£ÐèÒªÊ¹ÓÃ¸÷ÖÖ¸÷ÑùµÄÊý¾Ý¼¯£¬¿ÉÒÔÕÒÒ»Ð©Í¨ÓÃµÄÊý¾Ý¼¯À´Á·Ï°Ê¹ÓÃ¡£ÔÚsklearn¿âÖÐÌá¹©Ò»Ð©³£ÓÃµÄÊý¾Ý¼¯¡£
(1) ×Ô´øµÄÐ¡Êý¾Ý¼¯(packaged dataset)£º sklearn£®datasets£®load_<name>£¬Èç±í3ª²2ËùÊ¾¡£


±í3ª²2×Ô´øµÄÐ¡Êý¾Ý¼¯



Êý¾Ý¼¯Ãû³Æµ÷ÓÃ·½Ê½Êý ¾Ý Ãè Êö

ð°Î²»¨Êý¾Ý¼¯load_iris()ÓÃÓÚ·ÖÀàÈÎÎñµÄÊý¾Ý¼¯
ÊÖÐ´Êý×ÖÊý¾Ý¼¯load_digits()ÓÃÓÚ·ÖÀàÈÎÎñ»òÕß½µÎ¬ÈÎÎñµÄÊý¾Ý¼¯
ÈéÏÙ°©Êý¾Ý¼¯loadª²barestª²cancer()¼òµ¥¾­µäµÄÓÃÓÚ¶þ·ÖÀàÈÎÎñµÄÊý¾Ý¼¯
ÌÇÄò²¡Êý¾Ý¼¯loadª²diabetes()¾­µäµÄÓÃÓÚ»Ø¹éÈÎÎñµÄÊý¾Ý¼¯
²¨Ê¿¶Ù·¿¼ÛÊý¾Ý¼¯loadª²boston()¾­µäµÄÓÃÓÚ»Ø¹éÈÎÎñµÄÊý¾Ý¼¯
ÌåÄÜÑµÁ·Êý¾Ý¼¯ loadª²linnerud()¾­µäµÄÓÃÓÚ¶à±äÁ¿»Ø¹éÈÎÎñµÄÊý¾Ý¼¯
(2) ¿ÉÔÚÏßÏÂÔØµÄÊý¾Ý¼¯(downloaded dataset)£º sklearn£®datasets£®fetch_<name>£¬Èç±í3ª²3ËùÊ¾¡£


±í3ª²3¿ÉÔÚÏßÏÂÔØµÄÊý¾Ý¼¯



Êý¾Ý¼¯Ãû³Æµ÷ ÓÃ ·½ Ê½

Á³²¿Í¼Æ¬Êý¾Ý¼¯fetch_olivetti_faces(data_home=None, shuffle=False, random_state=0,download_if_missing=True)

(3) ¼ÆËã»úÉú³ÉµÄÊý¾Ý¼¯(generated dataset)£º sklearn£®datasets£®make_<name>£¬Èç±í3ª²4ËùÊ¾¡£


±í3ª²4¼ÆËã»úÉú³ÉµÄÊý¾Ý¼¯



Êý¾Ý¼¯Ãû³ÆÊý ¾Ý Ãè Êö

make_blobs¶àÀàµ¥±êÇ©Êý¾Ý¼¯£¬ÎªÃ¿¸öÀà¶¼·ÖÅäÒ»¸ö»ò¶à¸öÕýÌ¬·Ö²¼µÄµã¼¯
make_classification¶àÀàµ¥±êÇ©Êý¾Ý¼¯£¬ÎªÃ¿¸öÀà¶¼·ÖÅäÒ»¸ö»ò¶à¸öÕýÌ¬·Ö²¼µÄµã¼¯£¬Ìá¹©ÁËÎªÊý¾ÝÌí¼ÓÔëÉùµÄ·½Ê½£¬°üÀ¨Î¬¶ÈÏà¹ØÐÔ¡¢ÎÞÐ§ÌØÕ÷ÒÔ¼°ÈßÓàÌØÕ÷µÈ
make_gaussianª²quantiles½«Ò»¸öµ¥¸ßË¹·Ö²¼µÄµã¼¯»®·ÖÎªÁ½¸öÊýÁ¿¾ùµÈµÄµã¼¯£¬×÷ÎªÁ½Àà
make_hastieª²10ª²2²úÉúÒ»¸öÏàËÆµÄ¶þÔª·ÖÀàÊý¾Ý¼¯£¬ÓÐ10¸öÎ¬¶È 
make_circle¡¢make_moom²úÉú¶þÎ¬¶þÔª·ÖÀàÊý¾Ý¼¯À´²âÊÔÄ³Ð©Ëã·¨µÄÐÔÄÜ£¬¿ÉÒÔÎªÊý¾Ý¼¯Ìí¼ÓÔëÉù£¬»¹¿ÉÒÔÎª¶þÔª·ÖÀàÆ÷²úÉúÒ»Ð©ÇòÐÎÅÐ¾ö½çÃæµÄÊý¾Ý

½ÓÏÂÀ´ÒÔð°Î²»¨Êý¾Ý¼¯ÎªÀý£¬Ñ§Ï°ÈçºÎÔÚsklearnÖÐµ÷ÓÃÊý¾Ý¼¯¡¢Íê³ÉÔ¤´¦Àí¼°·ÖÀàµÈÈÎÎñ¡£ð°Î²»¨iris·ÖÎªÈý¸ö²»Í¬µÄÀàÐÍ£º É½ð°Î²»¨Setosa¡¢±äÉ«ð°Î²»¨Versicolor¡¢Î¤¶û¼ªÄáæ«ð°Î²»¨Virginica£¬·ÖÀàÖ÷ÒªÊÇÒÀ¾Ýð°Î²»¨µÄ»¨Ýà³¤¶È¡¢¿í¶ÈºÍ»¨°êµÄ³¤¶È¡¢¿í¶ÈËÄ¸öÖ¸±ê¡£Ö²ÎïÑ§¼ÒÒÑ¾­Îª150¶ä²»Í¬µÄð°Î²»¨½øÐÐÁË·ÖÀà¼ø¶¨£¬¼ø¶¨µÄ½á¹û·ÅÔÚÁËÕâ¸öÊý¾Ý¼¯ÖÐ¡£¸ÃÊý¾Ý¼¯Ò»°ãÓÃÓÚ¼à¶½Ñ§Ï°ÖÐµÄ¶à·ÖÀàÎÊÌâ¡£ÎÒÃÇÒª½â¾öµÄÎÊÌâÊÇ£º Èç¹û×Ô¼º¼ÒµÄÒ»Öêð°Î²»¨¿ª»¨ÁË£¬²âÁ¿ÁËÒ»ÏÂ»¨ÝàµÄ³¤¿í¡¢»¨°êµÄ³¤¿í·Ö±ðÊÇ3£®1¡¢2£®3¡¢1£®2¡¢0£®5£¬È»ºóÏëÖªµÀÕâ¶äð°Î²»¨µ½µ×ÊôÓÚÄÄ¸ö·ÖÀà¡£
2£®  µ÷ÓÃÊý¾Ý¼¯
Ê×ÏÈÒª·ÖÎöÕâ¸öÊý¾Ý¼¯µÄ×é³É¡£ÔÚÏÂÃæµÄ³ÌÐòÖÐ¶ÁÈ¡Êý¾Ý¼¯²¢ÏÔÊ¾»ù±¾ÐÅÏ¢¡£

³ÌÐò3£®1µ÷ÓÃÊý¾Ý¼¯



1£ºfrom sklearn£®datasets import load_iris

2£ºiris =load_iris()

3£ºprint(iris£®data)

4£ºprint(iris£®target)#Êä³öÊý¾ÝËùÊôµÄÕæÊµ±êÇ©

5£ºprint(iris£®data£®shape)#Êä³öÊý¾ÝµÄÎ¬¶È

6£ºprint(iris£®target_names) #Êä³öÊý¾Ý±êÇ©µÄÃû×Ö


Êä³ö£º














·ÖÎö£º Êä³öµÄÄÚÈÝÊÇ²¿·ÖµÄÊý¾Ý¼¯ÄÚÈÝ¼°»ù±¾ÐÅÏ¢¡£iris£®dataÊÇÒ»¸ö¾ØÕó£¬ÓÐ150ÐÐ4ÁÐÊý¾Ý£¬Ã¿Ò»ÐÐÊý¾ÝÎª»¨Ýà³¤¶È¡¢¿í¶ÈºÍ»¨°êµÄ³¤¶È¡¢¿í¶ÈËÄ¸öÖ¸±ê¡£iris£®targetÊÇ¾ßÌåµÄ·ÖÀàÏòÁ¿£¬ÓÃ0,1,2´ú±í3¸ö²»Í¬µÄÀà±ð£¬ÀàÐÍµÄÃû³Æ´æ´¢ÔÚiris£®target_namesÖÐ¡£
3£®  »®·ÖÊý¾Ý¼¯
ÔÚÄ£ÐÍÑµÁ·Ê±£¬Ò»°ã»á°ÑÊý¾Ý¼¯»®·Ö³ÉÑµÁ·¼¯¡¢ÑéÖ¤¼¯ºÍ²âÊÔ¼¯£¬ÆäÖÐÑµÁ·¼¯ÓÃÀ´¹À¼ÆÄ£ÐÍ£¬ÑéÖ¤¼¯ÓÃÀ´È·¶¨ÍøÂç½á¹¹»ò¿ØÖÆÄ£ÐÍ¸´ÔÓ³Ì¶ÈµÄ²ÎÊý£¬¶ø²âÊÔ¼¯ÔòÓÃÓÚ¼ìÑé×îÖÕÑ¡ÔñµÄ×îÓÅÄ£ÐÍµÄÐÔÄÜÓÅÁÓ¡£
sklearnÖÐÊ¹ÓÃsklearn£®model_selectionÄ£¿é¶ÔÊý¾Ý¼¯½øÐÐ»®·Ö£¬¶ø¸ÃÄ£¿éÖÐµÄtrain_test_split()ÊÇ½»²æÑéÖ¤ÖÐ³£ÓÃµÄº¯Êý£¬Æä¹¦ÄÜÊÇ´ÓÑù±¾ÖÐËæ»ú°´±ÈÀýÑ¡È¡train_dataºÍtest_data£¬ÏêÇéÈçÏÂ¡£

³ÌÐò3£®2Ê¹ÓÃtrain_test_split()¶ÔÊý¾Ý¼¯½øÐÐ»®·Ö



1£ºfrom sklearn£®model_selection import train_test_split

2£ºfrom sklearn£®datasets import load_iris

3£ºiris =load_iris()

4£ºX_train,X_test,Y_train,Y_test = train_test_split(iris£®data,iris£®target,test_size = 0£®4,random_state = 0)

5£ºprint('irisÊý¾Ý¼¯µÄ´óÐ¡£º ',iris£®data£®shape)

6£ºprint('Ä¿±êÊý¾Ý¼¯µÄ´óÐ¡£º ',iris£®target£®shape)

7£ºprint('Éú³ÉµÄÑµÁ·¼¯µÄÌØÕ÷¸öÊý(Êý¾Ý¸öÊý)£º ',X_train£®shape)

8£ºprint('Éú³ÉµÄÑµÁ·¼¯µÄ±êÇ©¸öÊý(Ñù±¾¸öÊý)£º ',Y_train£®shape)

9£ºprint('Éú³ÉµÄ²âÊÔ¼¯µÄÌØÕ÷(Êý¾Ý¸öÊý)£º ',X_test£®shape)

10£ºprint('Éú³ÉµÄ²âÊÔ¼¯µÄ±êÇ©¸öÊý(Ñù±¾¸öÊý)£º ',Y_test£®shape)

11£ºprint('irisÊý¾Ý¼¯Ç°5ÐÐµÄÊý¾Ý£º ',iris£®data£Û:5£Ý)

12£ºprint('Éú³ÉµÄÑµÁ·¼¯µÄÇ°5ÐÐµÄÊý¾Ý£º ',X_train£Û:5£Ý)


Êä³ö£º













4£®  Êý¾ÝÔ¤´¦Àí
¹éÒ»»¯£º ½«ÊäÈë±äÁ¿±ä»»µ½Ä³Ò»·¶Î§£¬Èç£Û0£¬1£ÝÇø¼ä¡£ÔÚsklearn¿âÖÐ£¬Ê¹ÓÃ MinMaxScaler ÀàÊµÏÖ£» ³£ÓÃÓÚÀàËÆÌÝ¶ÈÏÂ½µµÄÓÅ»¯Ëã·¨¡¢»Ø¹éºÍÉñ¾­ÍøÂçÖÐµÄ¼ÓÈ¨ÊäÈëÒÔ¼°ÀàËÆKª²½üÁÚµÄ¾àÀë¶ÈÁ¿¡£ 
±ê×¼»¯£º Í¨³£ÊÊÓÃÓÚ¸ßË¹·Ö²¼µÄÊäÈë±äÁ¿¡£¾ßÌåÀ´Ëµ£¬½«ÊäÈë±äÁ¿ÖÐµÄÃ¿¸öÊôÐÔÖµ¼õÈ¥ÆäÆ½¾ùÖµ£¬È»ºó³ýÒÔ±ê×¼²î£¬µÃµ½±ê×¼ÕýÌ¬·Ö²¼µÄÊôÐÔÖµ¡£ÔÚsklearn¿âÖÐ£¬Ê¹ÓÃ StandardScaler ÀàÊµÏÖ£» ³£ÓÃÓÚ¼Ù¶¨ÊäÈë±äÁ¿¸ßË¹·Ö²¼µÄÏßÐÔ»Ø¹é¡¢Âß¼­»Ø¹éºÍÏßÐÔÅÐ¾ö·ÖÎö¡£
Õý¹æ»¯£º ½«ÊäÈë±äÁ¿±ä»»Îª¾ßÓÐµ¥Î»·¶Êý³¤¶ÈµÄÊý¾Ý¡£³£ÓÃµÄ·¶ÊýÓÐL1¡¢L2¡£ÔÚsklearn¿âÖÐ£¬Ê¹ÓÃNormalizerÀàÊµÏÖ£» ³£ÓÃÓÚº¬ÓÐÐí¶à0µÄÏ¡ÊèÊý¾Ý¼¯£¬ÏñÉñ¾­ÍøÂç²ÉÓÃ¼ÓÈ¨ÊäÈëµÄËã·¨ºÍKª²½üÁÚ²ÉÓÃ¾àÀë¶ÈÁ¿µÄËã·¨¡£
¶þÖµ»¯£º Ê¹ÓÃÃÅÏÞÖµ£¬½«ÊäÈëÊý¾Ý±äÎª0»ò1Á½¸öÖµ¡£µ±ÊäÈë±äÁ¿Öµ´óÓÚÃÅÏÞÖµÊ±£¬±ä»»Îª 1£» µ±ÊäÈë±äÁ¿ÖµÐ¡ÓÚ»òµÈÓÚÃÅÏÞÖµÊ±£¬±ä»»Îª 0¡£ÔÚsklearn¿âÖÐ£¬Ê¹ÓÃ Binarizer ÀàÊµÏÖ£» ³£ÓÃÓÚ»ñÈ¡ÇåÎúµÄÖµµÄ¸ÅÂÊ£¬²úÉúÐÂµÄÓÐÒâÒåµÄÊôÐÔµÄÌØÕ÷¹¤³Ì¡£

³ÌÐò3£®3Êý¾ÝÔ¤´¦ÀíÁ·Ï°



1£ºfrom sklearn import datasets

2£ºimport numpy as np

3£ºdata =datasets£®load_iris()

4£ºX, y =data£®data, data£®target

5£ºnp£®set_printoptions(precision=3)

6£ºprint ("Ô­Ê¼Êý¾Ý: ")

7£ºprint (X£Û:4, :£Ý)

8£º

9£ºfrom sklearn£®preprocessing import MinMaxScaler

10£ºscaler = MinMaxScaler(feature_range=(0,1))

11£ºrescaledX = scaler£®fit_transform(X)

12£º# Print transformed data

13£ºprint ("¹éÒ»»¯: ")

14£ºprint(rescaledX£Û0:4,:£Ý)

15£º

16£ºfrom sklearn£®preprocessing import StandardScaler

17£ºscaler = StandardScaler()£®fit(X)







18£ºstandardizedX = scaler£®transform(X)

19£ºprint ("±ê×¼»¯: ")

20£ºprint (standardizedX£Û0:4,:£Ý)

21£º

22£ºfrom sklearn£®preprocessing import Normalizer

23£ºscaler = Normalizer()£®fit(X)

24£ºnormalizedX = scaler£®transform(X)

25£ºprint ("Õý¹æ»¯: ")

26£ºprint (normalizedX£Û0:4,:£Ý)

27£º

28£ºfrom sklearn£®preprocessing import Binarizer

29£ºbinarizer = Binarizer(threshold=0£®0)£®fit(X)

30£ºbinaryX = binarizer£®transform(X)

31£ºprint ("¶þÖµ»¯: ")

32£ºprint (binaryX£Û0:4,:£Ý)


Êä³ö£º



Ô­Ê¼Êý¾Ý

£Û£Û5£®1 3£®5 1£®4 0£®2£Ý

£Û4£®9 3£®1£®4 0£®2£Ý

£Û4£®7 3£®21£®3 0£®2£Ý

£Û4£®6 3£®11£®5 0£®2£Ý£Ý

¹éÒ»»¯: 

£Û£Û0£®2220£®6250£®0680£®042£Ý

£Û0£®1670£®4170£®0680£®042£Ý

£Û0£®1110£®50£®0510£®042£Ý

£Û0£®0830£®4580£®0850£®042£Ý£Ý

±ê×¼»¯: 

£Û£Û-0£®9011£®019-1£®34-1£®315£Ý

£Û-1£®143-0£®132-1£®34-1£®315£Ý

£Û-1£®3850£®328-1£®397-1£®315£Ý

£Û-1£®5070£®098-1£®283-1£®315£Ý£Ý

Õý¹æ»¯: 

£Û£Û0£®8040£®5520£®2210£®032£Ý

£Û0£®8280£®5070£®2370£®034£Ý

£Û0£®8050£®5480£®2230£®034£Ý

£Û0£®80£®5390£®2610£®035£Ý£Ý

¶þÖµ»¯: 

£Û£Û1£® 1£® 1£® 1£®£Ý

£Û1£® 1£® 1£® 1£®£Ý

£Û1£® 1£® 1£® 1£®£Ý

£Û1£® 1£® 1£® 1£®£Ý£Ý


5£® Êý¾Ý½µÎ¬
Êý¾Ý½µÎ¬ÊÇÖ¸Ê¹ÓÃÖ÷³É·Ö·ÖÎö¡¢·Ç¸º¾ØÕó·Ö½â»òÌØÕ÷Ñ¡ÔñµÈ½µÎ¬¼¼ÊõÀ´¼õÉÙÒª¿¼ÂÇµÄËæ»ú±äÁ¿¸öÊý£¬ÆäÖ÷ÒªÓ¦ÓÃ³¡¾°°üÀ¨¿ÉÊÓ»¯´¦ÀíºÍÐ§ÂÊÌáÉý¡£


³ÌÐò3£®4Ö÷³É·Ö·ÖÎö



1£ºimport matplotlib£®pyplot as plt

2£ºfrom mpl_toolkits£®mplot3d import Axes3D

3£ºfrom sklearn import datasets

4£ºfrom sklearn£®decomposition import PCA

5£º

6£ºiris =datasets£®load_iris()

7£ºX =iris£®data£Û:, :2£Ý#½ö¿¼²éÇ°Á½¸öÌØÕ÷

8£ºy =iris£®target

9£ºx_min, x_max = X£Û:, 0£Ý£®min() - £®5, X£Û:, 0£Ý£®max() + £®5

10£ºy_min, y_max = X£Û:, 1£Ý£®min() - £®5, X£Û:, 1£Ý£®max() + £®5

11£ºplt£®figure(2, figsize=(8, 6))

12£ºplt£®clf()

13£ºplt£®scatter(X£Û:, 0£Ý, X£Û:, 1£Ý, c=y, cmap=plt£®cm£®Set1,

14£ºedgecolor='k')

15£ºplt£®xlabel('Sepal length')

16£ºplt£®ylabel('Sepal width')

17£ºplt£®xlim(x_min, x_max)

18£ºplt£®ylim(y_min, y_max)

19£ºplt£®xticks(())

20£ºplt£®yticks(())

21£ºfig =plt£®figure(1, figsize=(8, 6))

22£ºax = Axes3D(fig,elev=-150, azim=110)

23£ºX_reduced = PCA(n_components=3)£®fit_transform(iris£®data)

24£ºax£®scatter(X_reduced£Û:, 0£Ý, X_reduced£Û:, 1£Ý, X_reduced£Û:, 2£Ý, c=y,

cmap=plt£®cm£®Set1, edgecolor='k', s=40)

25£ºax£®set_title("First three PCA directions")

26£ºax£®set_xlabel("1st eigenvector")

27£ºax£®w_xaxis£®set_ticklabels(£Û£Ý)

28£ºax£®set_ylabel("2nd eigenvector")

29£ºax£®w_yaxis£®set_ticklabels(£Û£Ý)

30£ºax£®set_zlabel("3rd eigenvector")

31£ºax£®w_zaxis£®set_ticklabels(£Û£Ý)

32£ºplt£®show()


Êä³ö£º









10 »Ø¹é



 3£®5Âß¼­»Ø¹é·ÖÀà
Âß¼­»Ø¹éÊÇÓÃÀ´½âÊÍÊäÈë±äÁ¿ºÍÊä³ö±äÁ¿Ö®¼ä¹ØÏµµÄÒ»ÖÖ¼¼Êõ¡£ÊäÈë±äÁ¿ÊÇ×Ô±äÁ¿£¬Êä³ö±äÁ¿ÊÇÒò±äÁ¿¡£Òò±äÁ¿Ö»ÄÜÈ¡Ò»×é¹Ì¶¨µÄÖµ¡£ÕâÐ©Öµ¶ÔÓ¦ÓÚ·ÖÀàÎÊÌâÖÐµÄÀà¡£
Âß¼­»Ø¹éµÄÑ§Ï°¹ý³ÌÈçÍ¼3ª²9ËùÊ¾¡£


Í¼3ª²9Âß¼­»Ø¹éµÄÑ§Ï°¹ý³Ì


Ñ§Ï°µÄÄ¿±êÊÇÍ¨¹ýÊ¹ÓÃÂß¼­º¯Êý¹À¼Æ¸ÅÂÊÀ´È·¶¨×Ô±äÁ¿ºÍÒò±äÁ¿Ö®¼äµÄ¹ØÏµ¡£Õâ¸öÂß¼­º¯ÊýÊÇÒ»¸ösigmoid()º¯Êý£¬ÓÃÀ´¹¹½¨¾ßÓÐ¸÷ÖÖ²ÎÊýµÄº¯Êý¡£ËüÓë¹ãÒåÏßÐÔÄ£ÐÍ·ÖÎö·Ç³£½Ó½ü£¬ÊÔ×Å½«Ò»ÌõÖ±ÏßÓëÒ»¶ÑµãÏàÆ¥ÅäÒÔ×îÐ¡»¯Îó²î¡£²»ÓÃÏßÐÔ»Ø¹é£¬¶øÊÇÊ¹ÓÃÂß¼­»Ø¹é¡£ÓÉÓÚËüµÄ¼òµ¥ÐÔÊ¹µÃËüÔÚ»úÆ÷Ñ§Ï°ÖÐºÜ³£¼û¡£
sigmoid()º¯ÊýÐÎÊ½Îª£º
sigmoid(x)=g(x)=11+e-x
Âß¼­»Ø¹éËäÈ»Ãû×ÖÀï´øÓÐ¡°»Ø¹é¡±£¬µ«ËüÊµ¼ÊÉÏÊÇÒ»ÖÖ·ÖÀàËã·¨£¬Ö÷ÒªÓÃÓÚ¶þ·ÖÀàÎÊÌâ¡£Âß¼­»Ø¹éÍ¨³£ÊÇÀûÓÃÒÑÖªµÄ×Ô±äÁ¿À´Ô¤²âÒ»¸öÀëÉ¢ÐÍÒò±äÁ¿µÄÖµ(Ïñ¶þ½øÖÆÖµ0ºÍ1)¡£¼òµ¥À´Ëµ£¬Ëü¾ÍÊÇÍ¨¹ýÄâºÏÒ»¸öÂß¼­º¯ÊýÀ´Ô¤²âÒ»¸öÊÂ¼þ·¢ÉúµÄ¸ÅÂÊ¡£ËùÒÔËüÔ¤²âµÄÊÇÒ»¸ö¸ÅÂÊÖµ£¬ËüµÄÊä³öÖµÓ¦¸ÃÎª0~1µÄÒ»¸öÊýÖµ¡£
sigmoid()º¯ÊýµÄ·Ö²¼ÈçÍ¼3ª²10ËùÊ¾¡£


Í¼3ª²10sigmoid()º¯ÊýµÄ·Ö²¼


Ê¹ÓÃsigmoid()º¯Êý£¬¾ÍÊÇÈÃÑù±¾µã¾­¹ýÔËËãºóµÃµ½µÄ½á¹ûÏÞÖÆÔÚ0~1£¬Ñ¹ËõÊý¾ÝµÄ¾Þ·ùÕðµ´£¬´Ó¶ø·½±ãµÃµ½Ñù±¾µãµÄ·ÖÀà±êÇ©(·ÖÀà¿ÉÒÔÒÔsigmoid()º¯ÊýµÄ¼ÆËã½á¹ûÊÇ·ñ´óÓÚ0£®5ÎªÒÀ¾Ý)¡£
¼ÙÉèÄãµÄÒ»¸öÅóÓÑÈÃÄã»Ø´ðÒ»¸öÎÊÌâ¡£¿ÉÄÜµÄ½á¹ûÖ»ÓÐÁ½ÖÖ£º Äã´ð¶ÔÁË»òÃ»ÓÐ´ð¶Ô¡£ÎªÁËÑÐ¾¿Äã×îÉÃ³¤µÄÌâÄ¿ÁìÓò£¬Äã×öÁË¸÷ÖÖÁìÓòµÄÌâÄ¿¡£ÄÇÃ´Õâ¸öÑÐ¾¿µÄ½á¹û¿ÉÄÜÊÇÕâÑùµÄ£º Èç¹ûÊÇÒ»µÀ³õÖÐ¶þÄê¼¶µÄÊýÑ§Ìâ£¬ÄãÓÐ70%µÄ¿ÉÄÜÐÔÄÜ½â³öËü¡£µ«Èç¹ûÊÇÒ»µÀ³õÖÐÒ»Äê¼¶µÄµØÀíÌâ£¬Äã»áµÄ¸ÅÂÊ¿ÉÄÜÖ»ÓÐ30%¡£Âß¼­»Ø¹é¾ÍÊÇ¸øÄãÕâÑùµÄ¸ÅÂÊ½á¹û¡£
Âß¼­»Ø¹éÖ÷ÒªÔÚÁ÷ÐÐ²¡Ñ§ÖÐÓ¦ÓÃ½Ï¶à£¬±È½Ï³£ÓÃµÄÇéÐÎÊÇÌ½Ë÷Ä³¼²²¡µÄÎ£ÏÕÒòËØ£¬¸ù¾ÝÎ£ÏÕÒòËØÔ¤²âÄ³¼²²¡·¢ÉúµÄ¸ÅÂÊµÈ¡£ÀýÈç£¬ÏëÌ½ÌÖÎ¸°©·¢ÉúµÄÎ£ÏÕÒòËØ£¬¿ÉÒÔÑ¡ÔñÁ½×éÈËÈº£º Ò»×éÊÇÎ¸°©×é£» ÁíÒ»×éÊÇ·ÇÎ¸°©×é¡£Á½×éÈËÈº¿Ï¶¨ÓÐ²»Í¬µÄÌåÕ÷ºÍÉú»î·½Ê½µÈ¡£ÕâÀïµÄÒò±äÁ¿¾ÍÊÇÊÇ·ñ»¼ÓÐÎ¸°©£¬¼´¡°ÊÇ¡±»ò¡°·ñ¡±£¬×Ô±äÁ¿¿ÉÒÔ°üÀ¨ºÜ¶à£¬ÀýÈçÄêÁä¡¢ÐÔ±ð¡¢ÒûÊ³Ï°¹ß¡¢ÓÄÃÅÂÝ¸Ë¾ú¸ÐÈ¾µÈ¡£×Ô±äÁ¿¼È¿ÉÒÔÊÇÁ¬ÐøµÄ£¬Ò²¿ÉÒÔÊÇ·ÖÀàµÄ¡£
µ÷ÓÃsklearn£®linear_model£®LogisticRegression()¿ÉÒÔÊµÏÖÂß¼­»Ø¹é·ÖÀà¡£ËüÊ¹ÓÃÒ»Ð©²ÎÊý£¬³£ÓÃµÄ²ÎÊýÈçÏÂ¡£ 
(1) penalty: ÕýÔò»¯Ñ¡Ôñ²ÎÊý¡£ËüÄ¬ÈÏ·½Ê½ÎªL2ÕýÔò»¯£¬¿ÉÒÔÑ¡ÓÃL1¡£
(2) C: ÕýÔòÏîÏµÊýµÄµ¹Êý¡£
(3) solver£º ¾ö¶¨ÁËÂß¼­»Ø¹éËã·¨ÖÐËðÊ§º¯ÊýµÄÓÅ»¯Ëã·¨£¬ÓÐËÄÖÖËã·¨¿ÉÒÔÑ¡Ôñ£¬·Ö±ðÈçÏÂ¡£
¢Ù liblinear£º Ê¹ÓÃÁË¿ªÔ´µÄliblinear¿âÊµÏÖ£¬ÄÚ²¿Ê¹ÓÃÁË×ø±êÖáÏÂ½µ·¨À´µü´úÓÅ»¯ËðÊ§º¯Êý¡£
¢Ú lbfgs£º ÄâÅ£¶Ù·¨µÄÒ»ÖÖ£¬ÀûÓÃËðÊ§º¯Êý¶þ½×µ¼Êý¾ØÕóÀ´µü´úÓÅ»¯ËðÊ§º¯Êý¡£
¢Û newtonª²cg£º Å£¶Ù·¨µÄÒ»ÖÖ£¬ÀûÓÃËðÊ§º¯Êý¶þ½×µ¼Êý¾ØÕóÀ´µü´úÓÅ»¯ËðÊ§º¯Êý¡£
¢Ü sag£º Ëæ»úÆ½¾ùÌÝ¶ÈÏÂ½µ£¬ÊÇÌÝ¶ÈÏÂ½µ·¨µÄ±äÖÖ£¬ºÍÆÕÍ¨ÌÝ¶ÈÏÂ½µ·¨µÄÇø±ðÊÇÃ¿´Îµü´ú½ö½öÓÃÒ»²¿·ÖÑù±¾À´¼ÆËãÌÝ¶È£¬ÊÊºÏÓÚÑù±¾Êý¾Ý¶àµÄÊ±ºò¡£
lbfgs¡¢newtonª²cgºÍsagÕâÈýÖÖÓÅ»¯Ëã·¨Ê±¶¼ÐèÒªËðÊ§º¯ÊýµÄÒ»½×»òÕß¶þ½×Á¬Ðøµ¼Êý£¬Òò´Ë²»ÄÜÓÃÓÚÃ»ÓÐÁ¬Ðøµ¼ÊýµÄL1ÕýÔò»¯£¬Ö»ÄÜÓÃÓÚL2ÕýÔò»¯¡£¶øliblinear¿ÉÒÔÊ¹ÓÃL1ÕýÔò»¯ºÍL2ÕýÔò»¯¡£
(4) multi_class: Ä¬ÈÏÖµÎªovr£¬ÊÊÓÃÓÚ¶þ·ÖÀàÎÊÌâ¡£¶ÔÓÚ¶à·ÖÀàÎÊÌâ£¬ÓÃmultinomial£¬ÔÚÈ«¾ÖµÄ¸ÅÂÊ·Ö²¼ÉÏ×îÐ¡»¯ËðÊ§¡£
Èç¹ûÑ¡ÔñÁËovr£¬ËðÊ§º¯ÊýµÄËÄÖÖÓÅ»¯·½·¨liblinear¡¢lbfgs¡¢newtonª²cgºÍsag¶¼¿ÉÒÔÑ¡Ôñ¡£µ«ÊÇÈç¹ûÑ¡ÔñÁËmultinomial£¬ÔòÖ»ÄÜÑ¡Ôñlbfgs¡¢newtonª²cgºÍsag¡£
sklearnÖÐ£¬ËùÓÐµÄ¹À¼ÆÆ÷¶¼´øÓÐ**fit()ºÍpredict()·½·¨¡£**fit()ÓÃÀ´·ÖÎöÄ£ÐÍ£¬predict()ÊÇÍ¨¹ý**fit()Ëã³öµÄÄ£ÐÍ£¬¶Ô±äÁ¿½øÐÐÔ¤²â»ñµÃµÄÖµ¡£
ÏÂÃæ¹¹½¨Ò»¸öÂß¼­»Ø¹é·ÖÀàÆ÷£¬ÓÃÓÚÔ¤²âð°Î²»¨µÄÀà±ð¡£

³ÌÐò3£®5Âß¼­»Ø¹é·ÖÀà



1£ºfrom sklearn£®datasets import load_iris

2£ºimport pandas as pd

3£ºfrom sklearn£®linear_model import LogisticRegression

4£ºimport numpy as np

5£ºimport matplotlib£®pyplot as plt

6£ºfrom sklearn£®model_selection import train_test_split

7£º

8£ºiris =load_iris()






9£ºx =iris£®data

10£ºy =iris£®target

11£ºx_train,x_test,y_train,y_test=train_test_split(x,y,random_state=0,test_size=0£®20)

12£ºclf = LogisticRegression(C=1,solver='newton-cg',multi_class='multinomial')

13£ºclf£®fit(x_train, y_train)

14£ºprint("Êµ¼ÊÖµ:",y_test)

15£ºprint("Ô¤²âÖµ:",clf£®predict(x_test))

16£ºprint(clf£®score(x_train,y_train))

17£ºprint(clf£®score(x_test,y_test))

18£ºprint(clf£®predict(£Û£Û3£®1,2£®3,1£®2,0£®5£Ý£Ý))


Êä³ö£º



Êµ¼ÊÖµ: £Û2 1 0 2 0 2 0 1 1 1 2 1 1 1 1 0 1 1 0 0 2 1 0 0 2 0 0 1 1 0£Ý

Ô¤²âÖµ: £Û2 1 0 2 0 2 0 1 1 1 2 1 1 1 1 0 1 1 0 0 2 1 0 0 2 0 0 1 1 0£Ý

0£®9666666666666667

1£®0

£Û0£Ý

·ÖÎö£º ÔÚÕâ¸öÊµÀýÖÐ£¬²¢Ã»ÓÐ½øÐÐÊý¾ÝÔ¤´¦ÀíµÈ´¦Àí£¬¶øÊÇÖ±½Ó½«Êý¾Ý¼¯·ÖÎªÑµÁ·¼¯ºÍ²âÊÔ¼¯£¬Êý¾Ý¼¯µÄ80%ÓÃÓÚÑµÁ·£¬20%ÓÃÓÚ²âÊÔ¡£Êä³öµÄµÚ1ÐÐÊÇ²âÊÔ¼¯µÄÊµ¼Ê·ÖÀà£¬0¡¢1ºÍ2·Ö±ð±íÊ¾ð°Î²»¨µÄÈý¸ö·ÖÀà¡£Êä³öµÄµÚ2ÐÐÊÇÑ§Ï°Ä£ÐÍµÄÔ¤²âÖµ¡£¶Ô±È·¢ÏÖ£¬·ÖÀàµÄÐ§¹û·Ç³£ºÃ¡£Êä³öµÄµÚ3ÐÐÊÇÄ£ÐÍÊ¹ÓÃÑµÁ·¼¯µÄÊ¶±ð×¼È·ÂÊ£¬Êä³öµÄµÚ4ÐÐÊÇÄ£ÐÍ²âÊÔ¼¯ÑéÖ¤µÄ×¼È·ÂÊ¡£µÚ5ÐÐÊÇÀûÓÃÄ£ÐÍ¶Ô£Û3£®1,2£®3,1£®2,0£®5£ÝÊý¾Ý½øÐÐ·ÖÀàµÄ½á¹û¡£
 3£®6ÏßÐÔ»Ø¹éÔ¤²â
ÏßÐÔ»Ø¹éÊÇÀûÓÃÊýÀíÍ³¼ÆÖÐ»Ø¹é·ÖÎöÀ´È·¶¨Á½ÖÖ»òÁ½ÖÖÒÔÉÏ±äÁ¿¼äÏà»¥ÒÀÀµµÄ¶¨Á¿¹ØÏµµÄÒ»ÖÖÍ³¼Æ·ÖÎö·½·¨£¬ÔËÓÃÊ®·Ö¹ã·º¡£Æä±í´ïÐÎÊ½Îªy=wx+e£¬eÎªÎó²î·þ´Ó¾ùÖµÎª0µÄÕýÌ¬·Ö²¼¡£
»Ø¹é·ÖÎöÖÐ£¬Ö»°üÀ¨Ò»¸ö×Ô±äÁ¿ºÍÒ»¸öÒò±äÁ¿£¬ÇÒ¶þÕßµÄ¹ØÏµ¿ÉÓÃÒ»ÌõÖ±Ïß½üËÆ±íÊ¾£¬³ÆÎªÒ»ÔªÏßÐÔ»Ø¹é·ÖÎö¡£Èç¹û»Ø¹é·ÖÎöÖÐ°üÀ¨Á½¸ö»òÁ½¸öÒÔÉÏµÄ×Ô±äÁ¿£¬ÇÒÒò±äÁ¿ºÍ×Ô±äÁ¿Ö®¼äÊÇÏßÐÔ¹ØÏµ£¬Îª¶àÔªÏßÐÔ»Ø¹é·ÖÎö¡£
ÓÅµã£º ¼ÆËã±È½Ï¼òµ¥£¬½á¹ûÈÝÒ×Àí½â¡£
È±µã£º ¶Ô·ÇÏßÐÔÊý¾ÝÄâºÏ½Ï²î¡£
ÏÂÃæÒÔsklearn¿âÌá¹©µÄ²¨Ê¿¶Ù·¿¼ÛÊý¾Ý¼¯BostonÎªÀý£¬Ñ¡ÓÃsklearn¿âÖÐ»ùÓÚ×îÐ¡¶þ³Ë·¨µÄÏßÐÔ»Ø¹éÄ£ÐÍ£¬Ê¹ÓÃÑµÁ·¼¯½øÐÐÄâºÏ£¬²¢Ê¹ÓÃ²âÊÔ¼¯½øÐÐÑéÖ¤¡£
1£® Êý¾Ý¼¯µÄ»ù±¾Çé¿ö
²¨Ê¿¶Ù·¿¼ÛµÄÊý¾Ý¼¯Ô´ÓÚÃÀ¹úÄ³¾­¼ÃÑ§ÔÓÖ¾¡£Êý¾Ý¼¯¹²ÓÐ506ÐÐ14ÁÐÊý¾Ý£¬ÆäÖÐÃ¿Ò»ÐÐÊý¾Ý¶¼ÊÇ¶Ô²¨Ê¿¶ÙÖÜ±ß»ò³ÇÕò·¿¼ÛµÄÇé¿öÃèÊö£¬Ã¿Ò»ÁÐÊý¾Ý¶ÔÓ¦µÄÊµ¼ÊÒâÒåÈçÏÂ¡£
CRIM£º ³ÇÕòÈË¾ù·¸×ïÂÊ¡£
ZN£º ×¡Õ¬ÓÃµØËùÕ¼±ÈÀý¡£
INDUS£º ³ÇÕòÖÐ·Ç×¡Õ¬ÓÃµØËùÕ¼±ÈÀý¡£
CHAS£º ÐéÄâ±äÁ¿£¬ÓÃÓÚ»Ø¹é·ÖÎö¡£
NOX£º »·±£Ö¸Êý¡£
RM£º Ã¿¶°×¡Õ¬µÄ·¿¼äÊý¡£
AGE£º 1940ÄêÒÔÇ°½¨³ÉµÄ×Ô×¡µ¥Î»µÄ±ÈÀý¡£
DIS£º ¾àÀëÎå¸ö²¨Ê¿¶ÙµÄ¾ÍÒµÖÐÐÄµÄ¼ÓÈ¨¾àÀë¡£
RAD£º ¾àÀë¸ßËÙ¹«Â·µÄ±ãÀûÖ¸Êý¡£
TAX£º Ã¿Ò»ÍòÃÀÔªµÄ²»¶¯²úË°ÂÊ¡£
PTRATIO£º ³ÇÕòÖÐµÄ½ÌÊ¦¡¢Ñ§Éú±ÈÀý¡£
B£º ³ÇÕòÖÐµÄºÚÈË±ÈÀý¡£
LSTAT£º µØÇøÖÐÓÐ¶àÉÙ·¿¶«ÊôÓÚµÍÊÕÈëÈËÈº¡£
MEDV£º ×Ô×¡·¿ÎÝ·¿¼ÛÖÐÎ»Êý(Ò²¾ÍÊÇ¾ù¼Û)¡£
sklearn¿âÌá¹©ÁË²»ÉÙ»Ø¹éËã·¨£¬±¾ÀýÀûÓÃÏßÐÔ»Ø¹éËã·¨ÔËÐÐÔ¤²â£¬ÆäËûµÄ·½·¨¿ÉÒÔ×÷ÎªÁ·Ï°¡£sklearnÌá¹©µÄ³£ÓÃ»Ø¹éÄ£ÐÍÈç±í3ª²5ËùÊ¾¡£


±í3ª²5sklearnÌá¹©µÄ³£ÓÃ»Ø¹éÄ£ÐÍ



Ä£¿éÃû³Æº¯ÊýÃûËã·¨Ãû

linear_modelLinearRegressionÏßÐÔ»Ø¹é
svmSVRÖ§³ÖÏòÁ¿»ú
neighborsKNeighborsRegressor×î½üÁÚ»Ø¹é
treeDecisionTreeRegression»Ø¹é¾ö²ßÊ÷
ensembleRandomForestRegressorËæ»úÉ­ÁÖ»Ø¹é
ensembleGrandientBoostingRegressorÌÝ¶ÈÌáÉýÊ÷»Ø¹é
2£® ·ÖÎöÊý¾Ý¼¯
µ¼ÈëÊý¾Ýºó£¬Êý¾ÝÌØÕ÷ºÜ¶à£¬Ò»°ãÒª×öÌØÕ÷Ñ¡Ôñ¡£ÔÚ²¨Ê¿¶Ù·¿¼ÛÔ¤²âÊµÀýÖÐ£¬ÕÒµ½Óë·¿¼Û×îÇ¿Ïà¹ØµÄÈý¸öÊôÐÔ¡£sklearn¿âÖÐµÄSelectKBestÄ£¿é¹¦ÄÜÊÇÌØÕ÷Ñ¡Ôñ£¬¿ÉÒÔÉèÖÃÁ½¸ö²ÎÊý¡£
(1) score_func£º ÐèÒªÒ»¸öµÃ·Öº¯Êý£¬¶ÔÓÚ»Ø¹éÎÊÌâ¿ÉÒÔÑ¡Ôñf_regressioinºÍmutual_info_regression£» ¶ÔÓÚ·ÖÀàÎÊÌâ£¬¿ÉÒÔÑ¡Ôñchi2¡¢f_classifºÍmutual_info_classif¡£Ä¬ÈÏº¯ÊýÎªf_classif¡£
(2) k£º ÕûÊý¡¢Ä¬ÈÏ»òall¡£Ê¹ÓÃk´ú±íÑ¡Ôñk¸öÌØÕ÷£¬Ä¬ÈÏÎª10¸öÌØÕ÷¡£allÑ¡ÏîÔòÈÆ¹ýÑ¡Ôñ£¬ÓÃÓÚ²ÎÊýËÑË÷¡£
SelectKBestÄ£¿éÌá¹©µÄ³£ÓÃ·½·¨ÈçÏÂ¡£
(1) fit(X,y)£º ÔÚ(X£¬y)ÉÏÔËÐÐ¼Ç·Öº¯Êý²¢µÃµ½ÊÊµ±µÄÌØÕ÷¡£
(2) fit_transform(X£Û, y£Ý)£º ÄâºÏÊý¾Ý£¬È»ºó×ª»»Êý¾Ý¡£
(3) get_params(£Ûdeep£Ý)£º »ñµÃ´Ë¹À¼ÆÆ÷µÄ²ÎÊý¡£
ÏÂÃæÊ¹ÓÃSelectKBestÄ£¿é½øÐÐÊý¾Ý¼¯µÄÌØÕ÷Ñ¡Ôñ¡£

³ÌÐò3£®6²¨Ê¿¶ÙÊý¾Ý¼¯Ïà¹ØÐÔ·ÖÎö



1£ºfrom sklearn import datasets

2£ºfrom sklearn£®feature_selection import SelectKBest

3£ºfrom sklearn£®feature_selection import f_regression






4£º

5£ºdataset =datasets£®load_boston()

6£ºx =dataset£®data

7£ºy =dataset£®target

8£ºnames =dataset£®feature_names

9£ºs= SelectKBest(f_regression, k=3)

10£ºs£®fit_transform(x,y)

11£ºarr = s£®get_support()

12£ºi = 0

13£ºfor t in arr:

14£ºif t:

15£ºprint(names£Ûi£Ý)

16£ºi=i+1


Êä³ö£º



RM
PTRATIO
LSTAT


·ÖÎö£º ½á¹ûÊä³öÊÇRM¡¢PTRATIOºÍLSTATÈý¸öÌØÕ÷£¬Óë·¿¼ÛÏà¹Ø×î¸ß¡£RMÊÇÃ¿¶°×¡Õ¬µÄ·¿¼äÊý£¬PTRATIOÊÇ³ÇÕòÖÐµÄ½ÌÊ¦¡¢Ñ§Éú±ÈÀý£¬LSTATÊÇµØÇøÖÐÓÐ¶àÉÙ·¿¶«ÊôÓÚµÍÊÕÈëÈËÈº¡£ÕâÈý¸ö°´ÕÕÊµ¼ÊµÄÒâÒå£¬»¹¾ß±¸Ò»¶¨Âß¼­ÐÔ¡£
3£® Òì³£Êý¾Ý´¦Àí
²ÉÓÃÉ¢µãÍ¼À´Õ¹Ê¾²¢·ÖÎöÊý¾Ý¡£XÖáµÄÖµÎªÃ¿Ò»¸öÌØÕ÷Öµ£¬YÖáÊÇ·¿¼Û¡£

³ÌÐò3£®7²¨Ê¿¶ÙÊý¾Ý¼¯µÄÉ¢µãÍ¼



1£ºimport pandas as pd

2£ºimport numpy as np

3£ºimport matplotlib£®pyplot as plt

4£ºfrom sklearn import datasets

5£ºfrom sklearn£®linear_model import LinearRegression

6£º

7£ºdataset =datasets£®load_boston()

8£ºx =dataset£®data

9£ºy =dataset£®target

10£ºnames =dataset£®feature_names

11£ºfori in range(13):

12£ºplt£®plot(7,2,i+1)

13£ºplt£®scatter(x£Û:,i£Ý,y,s = 10)

14£ºplt£®title(names£Ûi£Ý)

15£ºplt£®show())


Êä³ö£º ÓÐ13¸öÉ¢µãÍ¼£¬ÕâÀïÖ»Õ¹Ê¾ÆäÖÐµÄ4¸ö¡£








·ÖÎö£º ¹Û²ìRM¡¢LSTAT¡¢PTRATIOÕâÈý¸öÉ¢µãÍ¼£¬YÖµÎª50µã¶ÔÓ¦µÄXÖáµÄÖµ²»Í¬£¬²¢ÇÒºÜ·ÖÉ¢£¬¿ÉÒÔÅÐ¶¨ÎªÒì³£Êý¾Ý£¬¿¼ÂÇÉ¾³ý£¬ÆäËûÖµ¶¼½ÏÎªÕý³£¡£
¾­¹ýÒÔÉÏÁ½²½£¬µÃµ½´¦ÀíºóµÄÊý¾Ý¼¯¡£½ÓÏÂÀ´Í¨¹ýÊ¹ÓÃÕâ¸öÊý¾Ý¼¯£¬²¢ÀûÓÃÏßÐÔ»Ø¹éËã·¨½øÐÐÑ§Ï°¡£
4£® ÏßÐÔ»Ø¹é·ÖÎö
µ÷ÓÃsklearn£®linear_model£®LinearRegression()¿ÉÊµÏÖÏßÐÔ»Ø¹é·ÖÎö£¬ËùÐè²ÎÊýÈçÏÂ¡£
(1) fit_intercept£º ²¼¶ûÐÍ²ÎÊý£¬±íÊ¾ÊÇ·ñ¼ÆËã¸ÃÄ£ÐÍ½Ø¾à¡£¿ÉÑ¡²ÎÊý¡£Ä¬ÈÏÖµÎªTrue¡£
(2) normalize£º ²¼¶ûÐÍ²ÎÊý£¬ÈôÎªTrue£¬ÔòXÔÚ»Ø¹éÇ°½øÐÐ¹éÒ»»¯¡£¿ÉÑ¡²ÎÊý¡£Ä¬ÈÏÖµÎªFalse¡£
(3) copy_X£º ²¼¶ûÐÍ²ÎÊý£¬ÈôÎªTrue£¬ÔòX½«±»¸´ÖÆ£» ·ñÔò½«±»¸²¸Ç¡£¿ÉÑ¡²ÎÊý¡£Ä¬ÈÏÖµÎªTrue¡£
(4) n_jobs£º ÕûÐÍ²ÎÊý£¬±íÊ¾ÓÃÓÚ¼ÆËãµÄ×÷ÒµÊýÁ¿¡£ÈôÎª-1£¬ÔòÓÃËùÓÐµÄCPU¡£¿ÉÑ¡²ÎÊý¡£Ä¬ÈÏÖµÎª1¡£

³ÌÐò3£®8²¨Ê¿¶ÙÊý¾Ý¼¯ÏßÐÔ»Ø¹é·ÖÎö



1£ºimport matplotlib£®pyplot as plt

2£ºfrom sklearn import datasets

3£ºfrom sklearn£®linear_model import LinearRegression

4£ºimport pandas as pd






5£ºfrom sklearn£®model_selection import train_test_split

6£ºfrom pandas importDataFrame

7£ºfrom sklearn£®metrics import r2_score

8£º

9£ºbos = datasets£®load_boston()#»ñÈ¡Êý¾Ý

10£ºx =bos£®data

11£ºy =bos£®target

12£ºdf = pd£®DataFrame(x,columns=bos£®feature_names)

13£ºfeatures = £Û'CRIM', 'ZN', 'INDUS','CHAS','NOX','AGE','DIS','RAD','TAX','B'£Ý

14£ºtmp=df£®drop(features,axis=1)#É¾³ýfeatures´æ´¢µÄ¶ÔÓ¦ÁÐ

15£ºtmp_row=£Û£Ý#´æ´¢É¾³ýµÄÐÐºÅ

16£ºfori in range(len(y)):

17£ºif y£Ûi£Ý == 50:

18£ºtmp_row£®append(i)#´æ´¢·¿¼ÛµÈÓÚ50 µÄÒì³£ÖµÏÂ±ê

19£ºx=tmp£®drop(tmp_row)

20£ºy=pd£®DataFrame(y)£®drop(tmp_row)

21£º#·Ö¸îÊý¾Ý¼¯

22£ºX_train,X_test,y_train,y_test=train_test_split(x,y,random_state=0,test_size=0£®20)

23£ºprint(len(X_train))

24£ºprint(len(X_test))

25£ºlr=LinearRegression()

26£º#Ê¹ÓÃÑµÁ·Êý¾Ý½øÐÐ²ÎÊý¹À¼Æ

27£ºprint(lr£®intercept_)  #½Ø¾à

28£ºprint(lr£®coef_)  #ÏßÐÔÄ£ÐÍµÄÏµÊý

29£º

30£ºlr£®fit(X_train,y_train)

31£º#»Ø¹éÔ¤²â

32£ºy_pred=lr£®predict(X_test)

33£ºfig =plt£®figure(figsize=(12, 6))

34£ºplt£®plot(range(y_test£®shape£Û0£Ý), y_test, color='blue', linewidth=1£®5, linestyle='-')

35£ºplt£®plot(range(y_test£®shape£Û0£Ý), y_pred, color='red', linewidth=1£®5, linestyle='-£®')

36£ºplt£®legend(£Û"source", "predict "£Ý)

37£ºplt£®show()

38£ºscore = r2_score(y_test,y_pred)

39£ºprint(score)


Êä³öµÄÇúÏßÍ¼ÐÎºÍÊýÖµ£º










392

98

£Û19£®81059047£Ý

£Û£Û 3£®88235108 -0£®85618638 -0£®51535387£Ý£Ý

0£®7062014880668344

·ÖÎö£º Ê×ÏÈ¶ÔÊý¾Ý¼¯½øÐÐÁË´¦Àí£¬Ö»±£Áô3ÁÐÊý¾Ý£¬²¢É¾³ýÁËÒì³£Êý¾Ý¡£½«Êý¾Ý¼¯·ÖÎªÑµÁ·¼¯ºÍ²âÊÔ¼¯£¬Êý¾Ý¼¯µÄ80%×÷ÎªÑµÁ·¼¯£¬20%×÷Îª²âÊÔ¼¯¡£ÑµÁ·¼¯ÓÐ392ÌõÊý¾Ý£¬²âÊÔ¼¯ÓÐ98ÌõÊý¾Ý¡£lr=LinearRegression()»ñÈ¡ÏßÐÔ»Ø¹éº¯Êý£¬lr£®fit(X_train,y_train)½øÐÐÑµÁ·Ñ§Ï°¡££Û19£®81059047£ÝÎªÏßÐÔÄ£ÐÍµÄ½Ø¾à£¬£Û£Û3£®88235108-0£®85618638-0£®51535387£Ý£ÝÎªÏßÐÔÄ£ÐÍµÄÏµÊý¡£È»ºóÒÔÍ¼ÐÎ·½Ê½Êä³öÔ¤²âºÍÊµ¼ÊÊý¾Ý¶Ô±ÈÍ¼¡£´ÓÊä³öµÄÇúÏßÖÐ¿ÉÒÔÇåÎúµØ¿´³ö£¬sourceÑùÊ½ÊÇÔ­À´µÄÊý¾ÝÇúÏß£¬predictÎªÔ¤²âºóµÄÊý¾ÝÇúÏß¡£Ê¹ÓÃR2_score¶ÔÄ£ÐÍÆÀ¹À£¬r2_score()º¯Êý¼ÆËãRµÄÆ½·½£¬¼´È·¶¨ÏµÊý£¬¿ÉÒÔ±íÊ¾ÌØÕ÷Ä£ÐÍ¶ÔÌØÕ÷Ñù±¾Ô¤²âµÄºÃ»µ£¬ËüµÄÊä³öÊýÖµÎª0£®7062014880668344¡£
 3£®7¾ÛÀà
¾ÛÀàÊÇ¸ù¾ÝÏàËÆÐÔÔ­Ôò£¬½«¾ßÓÐ½Ï¸ßÏàËÆ¶ÈµÄÊý¾Ý¶ÔÏó»®·ÖÖÁÍ¬Ò»Àà´Ø£¬½«¾ßÓÐ½Ï¸ßÏàÒì¶ÈµÄÊý¾Ý¶ÔÏó»®·ÖÖÁ²»Í¬Àà´Ø¡£¾ÛÀàÓë·ÖÀà×î´óµÄÇø±ðÔÚÓÚ£¬¾ÛÀà¹ý³ÌÎªÎÞ¼à¶½¹ý³Ì£¬¼´´ý´¦ÀíÊý¾Ý¶ÔÏóÃ»ÓÐÈÎºÎÏÈÑéÖªÊ¶£¬¶ø·ÖÀà¹ý³ÌÎªÓÐ¼à¶½¹ý³Ì£¬¼´´æÔÚÓÐÏÈÑéÖªÊ¶µÄÑµÁ·Êý¾Ý¼¯¡£
¾ÛÀàµÄÄ¿±êÊÇÊ¶±ðÊý¾ÝµãµÄÄÚÔÚÊôÐÔ£¬Ê¹ËüÃÇÊôÓÚÏàÍ¬µÄ×Ó×é¡£Ã»ÓÐÒ»ÖÖÍ¨ÓÃµÄÏàËÆÐÔ¶ÈÁ¿·½·¨ÊÊÓÃÓÚËùÓÐÇé¿ö¡£ÕâÈ¡¾öÓÚµ±Ç°µÄÎÊÌâ¡£ÀýÈç£¬¿ÉÄÜ¶Ô²éÕÒÃ¿¸ö×Ó×éµÄ´ú±íÐÔÊý¾Ýµã¸ÐÐËÈ¤£¬»òÕß¶Ô²éÕÒÊý¾ÝÖÐµÄÒì³£Öµ¸ÐÐËÈ¤¡£¸ù¾ÝÇé¿ö£¬×îÖÕ»áÑ¡ÔñºÏÊÊµÄ¶ÈÁ¿·½·¨¡£
Kª²MeansËã·¨ÊÇÒ»ÖÖÖøÃûµÄÊý¾Ý¾ÛÀàËã·¨¡£¸ÃËã·¨ÖÐµÄK´ú±íÀà´Ø¸öÊý£¬Kª²Means´ú±íÀà´ØÄÚÊý¾Ý¶ÔÏóµÄ¾ùÖµ(ÕâÖÖ¾ùÖµÊÇÒ»ÖÖ¶ÔÀà´ØÖÐÐÄµÄÃèÊö)£¬Òò´Ë£¬Kª²MeansËã·¨ÓÖ³ÆÎªKª²¾ùÖµËã·¨¡£Kª²MeansËã·¨ÊÇÒ»ÖÖ»ùÓÚ»®·ÖµÄ¾ÛÀàËã·¨£¬ÒÔ¾àÀë×÷ÎªÊý¾Ý¶ÔÏó¼äÏàËÆÐÔ¶ÈÁ¿µÄ±ê×¼£¬¼´Êý¾Ý¶ÔÏó¼äµÄ¾àÀëÔ½Ð¡£¬ÔòËüÃÇµÄÏàËÆÐÔÔ½¸ß£¬ËüÃÇÔ½ÓÐ¿ÉÄÜÔÚÍ¬Ò»¸öÀà´Ø¡£Êý¾Ý¶ÔÏó¼ä¾àÀëµÄ¼ÆËãÓÐºÜ¶àÖÖ£¬Kª²MeansËã·¨Í¨³£²ÉÓÃÅ·ÊÏ¾àÀëÀ´¼ÆËãÊý¾Ý¶ÔÏó¼äµÄ¾àÀë¡£
ÎªÁËÊ¹ÓÃÕâ¸öËã·¨£¬ÐèÒª¼ÙÉè¼¯ÈºµÄÊýÁ¿ÊÇÔ¤ÏÈÖªµÀµÄ¡£È»ºóÊ¹ÓÃ²»Í¬µÄÊý¾ÝÊôÐÔ½«Êý¾Ý·Ö¸î³ÉK¸ö×Ó×é¡£Ê×ÏÈÈ·¶¨¼¯ÈºµÄÊýÁ¿£¬²¢»ùÓÚ´Ë¶ÔÊý¾Ý½øÐÐ·ÖÀà¡£ÕâÀïµÄºËÐÄË¼ÏëÊÇ£¬ÐèÒªÔÚÃ¿´Îµü´úÖÐ¸üÐÂÕâÐ©K¸öÖÊÐÄµÄÎ»ÖÃ¡£¼ÌÐøµü´ú£¬Ö±µ½½«ÖÊÐÄ·ÅÖÃÔÚËüÃÇµÄ×î¼ÑÎ»ÖÃ¡£¿É¼û£¬ÖÊÐÄµÄ³õÊ¼Î»ÖÃÔÚËã·¨ÖÐÆð×ÅÖØÒªµÄ×÷ÓÃ¡£ÕâÐ©ÖÊÐÄÓ¦¸ÃÒÔÒ»ÖÖÇÉÃîµÄ·½Ê½·ÅÖÃ£¬ÒòÎªÕâÖ±½ÓÓ°Ïì½á¹û¡£Ò»¸öºÃµÄ²ßÂÔÊÇ°ÑËüÃÇ¾¡¿ÉÄÜµØ·ÅÔÚÔ¶Àë±Ë´ËµÄµØ·½¡£
»ù±¾µÄKª²MeansËã·¨½«ÕâÐ©ÖÊÐÄËæ»ú·ÅÖÃ£¬½Ó×Å´ÓÊý¾ÝµãµÄÊäÈëÁÐ±íÖÐ¸ù¾ÝËã·¨À´Ñ¡ÔñÕâÐ©µã¡£ËüÊÔÍ¼°Ñ×î³õµÄÖÊÐÄ±Ë´Ë·ÅÖÃµÃºÜÔ¶£¬ÕâÑùËü¾ÍÄÜºÜ¿ìµØÊÕÁ²¡£È»ºó£¬±éÀúÑµÁ·Êý¾Ý¼¯£¬²¢½«Ã¿¸öÊý¾Ýµã¶¼·ÖÅäµ½ÀëËü×î½üµÄÖÊÐÄÖÐÈ¥¡£Ò»µ©±éÀúÍêÕû¸öÊý¾Ý¼¯£¬µÚÒ»´Îµü´ú¾Í½áÊøÁË¡£Ëã·¨ÒÑ¾­¸ù¾Ý³õÊ¼»¯µÄÖÊÐÄ¶ÔÕâÐ©µã½øÐÐÁË·Ö×é¡£ÏÖÔÚ£¬ÐèÒª¸ù¾ÝÔÚµÚÒ»´Îµü´ú½áÊøÊ±»ñµÃµÄÐÂ¼¯ÈºÖØÐÂ¼ÆËãÖÊÐÄµÄÎ»ÖÃ¡£»ñµÃÐÂµÄK¸öÖÊÐÄ£¬ÐèÒªÔÙ´ÎÖØ¸´ÉÏÊö¹ý³Ì£¬±éÀúÊý¾Ý¼¯²¢½«Ã¿¸öµã¶¼·ÖÅä¸ø×î½üµÄÖÊÐÄ¡£


Í¼3ª²11Kª²Means¾ÛÀàËã·¨Á÷³Ì

µ±²»¶ÏÖØ¸´ÕâÐ©²½ÖèÊ±£¬ÖÊÐÄ»á²»¶ÏÒÆ¶¯µ½ËüÃÇµÄÆ½ºâÎ»ÖÃ¡£¾­¹ýÒ»¶¨´ÎÊýµÄµü´ú£¬ÖÊÐÄ²»ÔÙ¸Ä±äËüÃÇµÄÎ»ÖÃ¡£ÕâÒâÎ¶×ÅÖÊÐÄÒÑ¾­µ½´ïÁËËüµÄ×îÖÕÎ»ÖÃ¡£×îÖÕÉú³ÉµÄK¸öÖÊÐÄÓÃÓÚÍÆ¶Ï¡£
Kª²Means¾ÛÀàËã·¨µÄ¾ßÌå²½ÖèÈçÏÂ£º
(1) ³õÊ¼»¯ÖÊÐÄ¡£Kª²MeansËã·¨ÐèÒªÊÂÏÈÈ·¶¨Àà´Ø·ÖÖ§Êý£¬²¢³õÊ¼»¯¸÷Àà´ØµÄÖÊÐÄ¡£
(2) ¾ÛÀà¶ÔÏó¡£Kª²MeansËã·¨°´ÕÕ¶ÔÏóÓëÖÊÐÄ¼äµÄ¾àÀë»®·ÖÀà´Ø£¬ÆäÖÐ£¬¾àÀë¿ÉÒÔÊÇÅ·Ê½¾àÀëdEuclidean£º

dEuclidean=(x1-x2)2+(y1-y2)2

»òÊÇÓàÏÒ¾àÀëdcosine£º

dcosine=x1x2+y1y2x21+y21x22+y22

(3) ¸üÐÂÖÊÐÄ¡£Kª²MeansÍê³É¶ÔÏó¾ÛÀàºó£¬¼ÆËã¸÷Àà´ØÖÐ¶ÔÏóµÄÆ½¾ùÖµ£¬²¢ÒÔ´Ë×÷ÎªÐÂµÄÖÊÐÄ¡£
ÊáÀíËã·¨µÄÂöÂç£¬¿É¹¹½¨³öÒ»¸öÍêÕûµÄKª²Means¾ÛÀàËã·¨Á÷³Ì£¬ÈçÍ¼3ª²11ËùÊ¾¡£


11 Kª²Means
Ëã·¨ÑÝÊ¾



ÏÂÃæÊµÏÖKª²MeansËã·¨¡£


³ÌÐò3£®9Kª²MeansËã·¨



1£ºimport numpy as np

2£ºimport matplotlib£®pyplot as plt

3£ºfrom sklearn£®cluster import KMeans

4£º

5£ºX = np£®loadtxt('data_clustering£®txt', delimiter=',')

6£ºnum_clusters = 5

7£º

8£ºplt£®figure()

9£ºplt£®scatter(X£Û:,0£Ý, X£Û:,1£Ý, marker='o', facecolors='none',

10£ºedgecolors='black', s=80)

11£ºx_min, x_max = X£Û:, 0£Ý£®min() - 1, X£Û:, 0£Ý£®max() + 1

12£ºy_min, y_max = X£Û:, 1£Ý£®min() - 1, X£Û:, 1£Ý£®max() + 1

13£ºplt£®title('Input data')

14£ºplt£®xlim(x_min, x_max)

15£ºplt£®ylim(y_min, y_max)

16£ºplt£®xticks(())

17£ºplt£®yticks(())

18£º

19£ºkmeans = KMeans(init='k-means++', n_clusters=num_clusters, n_init=10)

20£ºkmeans£®fit(X)

21£º

22£ºstep_size = 0£®01

23£ºx_min, x_max = X£Û:, 0£Ý£®min() - 1, X£Û:, 0£Ý£®max() + 1






24£ºy_min, y_max = X£Û:, 1£Ý£®min() - 1, X£Û:, 1£Ý£®max() + 1

25£ºx_vals, y_vals = np£®meshgrid(np£®arange(x_min, x_max, step_size),

26£ºnp£®arange(y_min, y_max, step_size))

27£º

28£ºoutput = kmeans£®predict(np£®c_£Ûx_vals£®ravel(), y_vals£®ravel()£Ý)

29£ºoutput = output£®reshape(x_vals£®shape)

30£º

31£ºplt£®figure()

32£ºplt£®clf()

33£ºplt£®imshow(output, interpolation='nearest', extent=(x_vals£®min(), 

34£ºx_vals£®max(), y_vals£®min(), y_vals£®max()), 

35£ºcmap=plt£®cm£®Paired, aspect='auto', origin='lower')

36£ºplt£®scatter(X£Û:,0£Ý, X£Û:,1£Ý, marker='o', facecolors='none',

37£ºedgecolors='black', s=80)

38£º

39£ºcluster_centers = kmeans£®cluster_centers_

40£ºplt£®scatter(cluster_centers£Û:,0£Ý, cluster_centers£Û:,1£Ý,

41£ºmarker='o', s=210, linewidths=4, color='black',

42£ºzorder=12, facecolors='black')

43£ºx_min, x_max = X£Û:, 0£Ý£®min() - 1, X£Û:, 0£Ý£®max() + 1

44£ºy_min, y_max = X£Û:, 1£Ý£®min() - 1, X£Û:, 1£Ý£®max() + 1

45£ºplt£®title('Boundaries of clusters')

46£ºplt£®xlim(x_min, x_max)

47£ºplt£®ylim(y_min, y_max)

48£ºplt£®xticks(())

49£ºplt£®yticks(())

50£ºplt£®show()


Êä³ö£º





·ÖÎö£º Ê×ÏÈ´Ósklearn¿âÖÐµ¼Èë¾ÛÀàÄ£¿éKMeans£¬´Ódata_clustering£®txtÎÄ¼þÖÐ¼ÓÔØÔ´Êý¾Ý£¬²¢¶¨ÒåºÃ¼¯ÈºµÄÊýÁ¿£¬ÕâÀï¼¯ÈºÊýÁ¿¶¨ÒåÎª5¡£½Ó×Å¶ÔÊäÈëÊý¾Ý½øÐÐ¿ÉÊÓ»¯£¬µÚÒ»·ùÍ¼Õ¹Ê¾µÄÊÇÊäÈëÊý¾Ý¡£¿ÉÒÔÖ±¹ÛµØ¿´µ½ÔÚÕâ¸öÊý¾ÝÖÐÓÐÎå¸ö·Ö×é¡£Ê¹ÓÃ³õÊ¼»¯²ÎÊý´´½¨Kª²Means¶ÔÏó¡£init²ÎÊý±íÊ¾Ñ¡Ôñ¼¯Èº³õÊ¼ÖÐÐÄµÄ³õÊ¼»¯·½·¨¡£Ê¹ÓÃKª²Means++ÒÔ¸üÖÇÄÜµÄ·½Ê½Ñ¡ÔñÕâÐ©ÖÐÐÄ£¬¶ø²»ÊÇËæ»úÑ¡ÔñËüÃÇ¡£Õâ±£Ö¤ÁËËã·¨µÄ¿ìËÙÊÕÁ²¡£n_clusters²ÎÊý±íÊ¾¼¯ÈºµÄÊýÁ¿¡£n_init²ÎÊýÊÇÖ¸Ëã·¨ÔÚÈ·¶¨×î¼Ñ½á¹ûÖ®Ç°Ó¦¸ÃÔËÐÐµÄ´ÎÊý¡£½Ó×ÅÓÃÊäÈëÊý¾Ý¶ÔKª²MeansÄ£ÐÍ½øÐÐÑµÁ·¡£×îºó»æÍ¼½«ÑµÁ·½á¹û½øÐÐ¿ÉÊÓ»¯¡£µÚ¶þ·ùÍ¼Õ¹Ê¾ÁËÑµÁ·ºóµÄ½á¹û£¬Ëü³É¹¦µØ½«ÊäÈëÊý¾Ý·ÖÎªÁËÎå¸öÇøÓò£¬²¢ÎªÃ¿¸ö´ØµÄÖÐÐÄÓÃºÚµã±êÁË³öÀ´¡£
 3£®8Ð¡½á
ÔÚ±¾ÕÂÖÐ£¬Ê×ÏÈÁË½âÁËÊ²Ã´ÊÇ»úÆ÷Ñ§Ï°£¬È»ºó¶Ô»úÆ÷Ñ§Ï°×öÁË·ÖÀà£¬Ñ§Ï°ÁË¼à¶½Ñ§Ï°¡¢°ë¼à¶½Ñ§Ï°ºÍ·Ç¼à¶½Ñ§Ï°µÄÇø±ð¡£½Ó×ÅÑ§Ï°ÁËÂß¼­»Ø¹éµÄ¸ÅÄî£¬²¢ÓÃËüÃÇ¹¹½¨ÁË·ÖÀàÆ÷¡£È»ºóÑ§Ï°ÁËÏßÐÔ»Ø¹é£¬²¢½â¾öÁË·¿¼ÛÔ¤²âÎÊÌâ¡£×îºóÑ§Ï°ÁË¾ÛÀàËã·¨²¢ÓÃ³ÌÐòÊµÏÖÁËKª²MeansËã·¨¡£»úÆ÷Ñ§Ï°Ëã·¨»¹ÓÐºÜ¶à£¬±¾ÕÂÖ»ÊÇ¼òµ¥µØ½éÉÜ¼¸ÖÖËã·¨¼°ÆäÓ¦ÓÃ£¬ÓÐÁËÕâÐ©»ù´¡£¬»úÆ÷Ñ§Ï°µÄ»ù±¾Á÷³Ì¾ÍÇå³þÁË£¬¿ÉÒÔ½øÒ»²½ÉîÈëÑ§Ï°¡£
 Ï°Ìâ
1£® Ì¸Ì¸Äã¶Ô»úÆ÷Ñ§Ï°µÄÀí½â£¬°üÀ¨»Ø¹éºÍ·ÖÀàµÄÏàÍ¬µãºÍ²»Í¬µã¡£
2£® ¼òÊö»úÆ÷Ñ§Ï°µÄÁ÷³Ì¡£
3£® ¼òÊö¼à¶½Ñ§Ï°ÓëÎÞ¼à¶½Ñ§Ï°Ö®¼äµÄÇø±ð¡£


4£® Êý¾ÝÔ¤´¦Àí¹ý³ÌÖÐ£¬¶ÔÓÚÒì³£Êý¾Ý´¦ÀíµÄ·½·¨ÓÐÄÄÐ©£¿
5£® ÊµÏÖ±¾ÕÂÂß¼­»Ø¹é·ÖÀà¡¢ÏßÐÔ»Ø¹éºÍ¾ÛÀàµÄÊµÀý¡£

6£® Èí¾ÛÀàÍ¨¹ýÔ¼ÊøÀ´·Å¿í¾ÛÀàµÄ±ß½ç£¬´Ó¶ø½â¾öÖØµþ¾ÛÀà¡¢ÀëÈºµãºÍ²»È·¶¨¶ÔÏóµÄÎÊÌâ(Ò²¾ÍÊÇËµÒ»¸ö¶ÔÏó¿ÉÒÔÊôÓÚ¶à¸ö¾ÛÀà)¡£×÷ÎªÒ»ÖÖµäÐÍÈí¾ÛÀà·½·¨£¬ÈýÖ§¾ÛÀà»ñµÃÁËÖÚ¶àµÄ¹Ø×¢¡£Çë³¢ÊÔÊµÏÖÈýÖ§Kª²MeansËã·¨¡£