µÚ3ÕÂ
CHAPTER 3


±´Ò¶Ë¹·ÖÀàÆ÷




±´Ò¶Ë¹·ÖÀàÆ÷ÊÇÒ»¸öÏàµ±¿í·ºµÄ¶¨Òå£¬Ëü±³ºóµÄÊýÑ§ÀíÂÛ¸ù¾ÝÊÇÏàµ±³öÃûµÄ±´Ò¶Ë¹¾ö²ßÂÛ(Bayesian Decision Theory)¡£±´Ò¶Ë¹¾ö²ßÂÛºÍ´«Í³µÄÍ³¼ÆÑ§ÀíÂÛÓÐ×ÅÇø±ð£¬ÆäÖÐ×î²»¿Éµ÷ºÍµÄ¾ÍÊÇËüÃÇ¸÷×Ô¹ØÓÚ¸ÅÂÊµÄ¶¨Òå¡£Òò´Ë£¬Ê¹ÓÃÁË±´Ò¶Ë¹¾ö²ßÂÛ×÷Îª»ùÊ¯µÄ±´Ò¶Ë¹·ÖÀàÆ÷£¬ÔÚ¸÷¸öPythonËã·¨Ëùµ¼³öµÄ·ÖÀàÆ÷ÖÐÒ²ËãÊÇ±È½Ï±êÐÂÁ¢ÒìµÄ´æÔÚ¡£
3.1±´Ò¶Ë¹Ñ§ÅÉ
±´Ò¶Ë¹·ÖÀàÆ÷ÊÇ¸÷ÖÖ·ÖÀàÆ÷ÖÐ·ÖÀà´íÎó¸ÅÂÊ×îÐ¡»òÕßÔÚÔ¤ÏÈ¸ø¶¨´ú¼ÛµÄÇé¿öÏÂÆ½¾ù·çÏÕ×îÐ¡µÄ·ÖÀàÆ÷¡£ËüµÄÉè¼Æ·½·¨ÊÇÒ»ÖÖ×î»ù±¾µÄÍ³¼Æ·ÖÀà·½·¨¡£Æä·ÖÀàÔ­ÀíÊÇÍ¨¹ýÄ³¶ÔÏóµÄÏÈÑé¸ÅÂÊ£¬ÀûÓÃ±´Ò¶Ë¹¹«Ê½¼ÆËã³öÆäºóÑé¸ÅÂÊ£¬¼´¸Ã¶ÔÏóÊôÓÚÄ³Ò»ÀàµÄ¸ÅÂÊ£¬Ñ¡Ôñ¾ßÓÐ×î´óºóÑé¸ÅÂÊµÄÀà×÷Îª¸Ã¶ÔÏóËùÊôµÄÀà¡£
ÎªÁËÉî¿ÌÀí½â±´Ò¶Ë¹·ÖÀàÆ÷£¬ÐèÒªÏÈ¶Ô±´Ò¶Ë¹Ñ§ÅÉ¼°Æä¾ö²ßÀíÂÛÓÐÒ»¸ö´óÖÂµÄÈÏÊ¶¡£
3.1.1±´Ò¶Ë¹Ñ§ÅÉÂÛÊö
±´Ò¶Ë¹Ñ§ÅÉÇ¿µ÷¸ÅÂÊµÄ¡°Ö÷¹ÛÐÔ¡±£¬ÕâÒ»µãºÍ´«Í³µÄ¡¢ÎÒÃÇ±È½ÏÊìÏ¤µÄÆµÂÊÑ§ÅÉ²»Í¬¡£Ö÷Òª±íÏÖÔÚ£º 
¤r ÆµÂÊÑ§ÅÉÇ¿µ÷ÆµÂÊµÄ¡°×ÔÈ»ÊôÐÔ¡±£¬ÈÏÎªÓ¦¸ÃÊ¹ÓÃÊÂ¼þÔÚÖØ¸´ÊµÑéÖÐ·¢ÉúµÄÆµÂÊ×÷ÎªÆä·¢ÉúµÄ¸ÅÂÊµÄ¹À¼Æ¡£
¤r ±´Ò¶Ë¹Ñ§ÅÉ²»Ç¿µ÷ÊÂ¼þµÄ¡°¿Í¹ÛËæ»úÐÔ¡±£¬ÈÏÎª½ö½öÖ»ÊÇ¡°¹Û²ìÕß¡±²»ÖªµÀÊÂ¼þµÄ½á¹û¡£»»¾ä»°Ëµ£¬±´Ò¶Ë¹Ñ§ÅÉÈÏÎª£º ÊÂ¼þÖ®ËùÒÔ¾ßÓÐËæ»úÐÔ¡£½ö½öÊÇÒòÎª¡°¹Û²ìÕß¡±µÄÖªÊ¶²»Íê±¸£¬¶ÔÓÚ¡°ÖªÇéÕß¡±À´Ëµ£¬¸ÃÊÂ¼þÆäÊµ²»¾ß±¸Ëæ»úÐÔ¡£Ëæ»úÐÔµÄ¸ùÔ´²»ÔÚÓÚÊÂ¼þ£¬¶øÔÚÓÚ¡°¹Û²ìÕß¡±¶Ô¸ÃÊÂ¼þµÄÖªÊ¶×´Ì¬¡£
¾Ù¸öÀý×Ó£º ¼ÙÉèÓÐÒ»¸öÈËÅ×ÁËÒ»Ã¶ÖÊµØ¾ùÔÈµÄÓ²±Òµ½µØÉÏ²¢Ñ¸ËÙ½«Æä²ÈÔÚ½Åµ×£¬¶øÔÚËûÃæÇ°´Ó½üµ½Ô¶×øÁËÈý¸öÈË¡£Ëû±¾ÈË¿´µ½ÁËÓ²±ÒÊÇÕýÃæ³¯ÉÏµÄ£¬¶øÆäËûÈý¸öÈËÒ²¶à¶àÉÙÉÙ¿´µ½ÁËÒ»Ð©ÐÅÏ¢£¬µ«ÏÔÈ»×øµÃÔ½Ô¶£¬¿´µÃ¾ÍÔ½Ä£ºý¡£ÆµÂÊÑ§ÅÉ»áÈÏÎª£¬¸ÃÓ²±ÒÊÇÕýÊÇ·´£¬¸÷×ÔµÄ¸ÅÂÊ¶¼Ó¦¸ÃÊÇ50%£» µ«ÊÇ±´Ò¶Ë¹Ñ§ÅÉ»áÈÏÎª£¬¶ÔÅ×Ó²±ÒµÄÈËÀ´Ëµ£¬Ó²±ÒÊÇÕýÃæµÄ¸ÅÂÊ¾ÍÊÇ100%£¬¶ÔÀëËû×î½üµÄÈËÀ´Ëµ¿ÉÄÜÊÇ80%£¬¶ÔÀëËû×îÔ¶µÄÈËÀ´Ëµ¿ÉÄÜÊÇ50%¡£
ËùÒÔÏà±ÈÆð°ÑÄ£ÐÍ²ÎÊý¹Ì¶¨¡¢×¢ÖØÑù±¾µÄËæ»úÐÔµÄÆµÂÊÑ§ÅÉ¶øÑÔ£¬±´Ò¶Ë¹Ñ§ÅÉ½«Ñù±¾ÊÓÎª¹Ì¶¨µÄ£¬°ÑÄ£ÐÍµÄ²ÎÊýÊÓÎª¹Ø¼ü¡£ÔÚÉÏÃæÕâ¸öÀý×ÓÖÐ£¬Ñù±¾¾ÍÊÇÅ×³öÈ¥µÄÄÇÃ¶Ó²±Ò£¬Ä£ÐÍµÄ²ÎÊý¾ÍÊÇÃ¿¸öÈË´ÓÖÐ»ñµÃµÄ¡°ÐÅÏ¢¡±¡£¶ÔÓÚÆµÂÊÑ§ÅÉ¶øÑÔ£¬Ã¿¸öÈË»ñµÃµÄ¡°ÐÅÏ¢¡±²»Ó¦¸ÃÓÐ²»Í¬£¬ËùÒÔ×ÔÈ»»á¸ù¾Ý¡°¾ùÔÈÓ²±ÒÅ×³öÏÂÃæµÄ¸ÅÂÊÎª50%¡±Õâ¸ö¡°Ñù±¾µÄÐÅÏ¢¡±À´µ¼³ö¡°Ó²±ÒÊÇÕýÃæµÄ¸ÅÂÊÎª50%¡±Õâ¸ö½áÂÛ¡£µ«ÊÇ¶Ô±´Ò¶Ë¹Ñ§ÅÉ¶øÑÔ£¬Ó²±ÒÅ×³öÈ¥¾ÍÅ×³öÈ¥ÁË£¬ÎÊÌâµÄ¹Ø¼üÔÚÓÚÄ£ÐÍµÄ²ÎÊý£¬Òà¼´¡°¹Û²ìÕß¡±´ÓÖÐ»ñµÃµÄÐÅÏ¢£¬ËùÒÔ»áµ¼ÖÂ¡°¶ÔÓÚÅ×Ó²±ÒµÄÈË¶øÑÔ£¬Ó²±ÒÊÇÕýÃæµÄ¸ÅÂÊÎª100%¡±ÕâÒ»ÀàµÄ½áÂÛ¡£




3.1.2±´Ò¶Ë¹¾ö²ßÂÛ
ÔÚ´óÖÂÖªµÀ±´Ò¶Ë¹Ñ§ÅÉµÄË¼Ïëºó£¬¾Í¿ÉÒÔ½éÉÜ±´Ò¶Ë¹¾ö²ßÂÛÁË¡£ÕâÀï²»¿É±ÜÃâµØÒªÉæ¼°¸ÅÂÊÂÛºÍÊýÀíÍ³¼ÆµÄÏà¹Ø¶¨ÒåºÍÖªÊ¶£¬ÐÒÔËµÄÊÇ£¬ËüÃÇ¶¼ÊÇ±È½Ï»ù´¡ÇÒÖ±¹ÛµÄ²¿·Ö£¬ÎÞÐëÌ«¶àµÄÊýÑ§±³¾°¾Í¿ÉÒÔÖªµÀËüÃÇµÄº¬Òå¡£
¤r ÐÐ¶¯¿Õ¼äA£¬ËüÊÇÄ³ÏîÊµ¼Ê¹¤×÷ÖÐ¿ÉÄÜ²ÉÈ¡µÄ¸÷ÖÖ¡°ÐÐ¶¯¡±Ëù¹¹³ÉµÄ¼¯ºÏ¡£
×¢Òâ£º ±´Ò¶Ë¹Ñ§ÅÉ×¢ÒâµÄÊÇÄ£ÐÍ²ÎÊý£¬ËùÒÔÍ¨³£¶øÑÔÎÒÃÇÏëÒª×ö³öµÄ¡°ÐÐ¶¯¡±ÊÇ¡°¾ö²ßÄ£ÐÍµÄ²ÎÊý¡±¡£Òò´ËÎÒÃÇÍ¨³£»á½«ÐÐ¶¯¿Õ¼äÈ¡Îª²ÎÊý¿Õ¼ä£¬Òà¼´A=¦È¡£
¤r ¾ö²ß¦Ä(X¡«)£¬ËüÊÇÑù±¾¿Õ¼äXµ½ÐÐ¶¯¿Õ¼äAµÄÒ»¸öÓ³Éä¡£»»¾ä»°Ëµ£¬¶ÔÓÚÒ»¸öµ¥Ò»µÄÑù±¾X¡«(X¡«¡ÊX)£¬¾ö²ßº¯Êý¿ÉÒÔÀûÓÃËüµÃµ½AÖÐµÄÒ»¸öÐÐ¶¯¡£
×¢Òâ£º ÕâÀïµÄÑù±¾X¡«Í¨³£ÊÇ¸ßÎ¬µÄËæ»úÏòÁ¿£º X¡«=(x1,x2,¡­,xN)T£» ÓÈÆäÐèÒª·ÖÇåµÄÊÇ£¬Õâ¸öX¡«ÆäÊµÊÇÒ»°ãÒâÒåÉÏµÄ¡°ÑµÁ·¼¯¡±£¬xi²ÅÊÇÒ»°ãÒâÒåÉÏµÄ¡°Ñù±¾¡±¡£
¤r ËðÊ§º¯ÊýL(¦È,a)=LL(¦È,¦Ä(X¡«))£¬Ëü±íÊ¾²ÎÊý¦È(¦È¡Ê¦¨£¬¦¨ÊÇ²ÎÊý¿Õ¼ä)Ê±²ÉÈ¡ÐÐ¶¯a(a¡ÊA)ËùÒýÆðµÄËðÊ§¡£
¤r ¾ö²ß·çÏÕR(¦È,¦Ä)£¬ËüÊÇËðÊ§º¯ÊýµÄÆÚÍû£º R(¦È,¦Ä)=EL(¦È,¦Ä(X¡«))¡£
¤r ÏÈÑé·Ö²¼£º ÃèÊöÁË²ÎÊý¦ÈÔÚÒÑÖªÑù±¾X¡«ÖÐµÄ·Ö²¼¡£
¤r Æ½¾ù·çÏÕ¦Ñ(¦Ä)£¬Ëü¶¨ÒåÎª¾ö²ß·çÏÕR(¦È,¦Ä)ÔÚÏÈÑé·Ö²¼ÏÂµÄÆÚÍû£º 


¦Ñ(¦Ä)=E¦ÎR(¦È,¦Ä)

¤r ±´Ò¶Ë¹¾ö²ß¦Ä*£¬ËüÂú×ã£º 


¦Ñ(¦Ä*)= inf¦Ä¦Ñ(¦Ä)
»»¾ä»°Ëµ£¬±´Ò¶Ë¹¾ö²ß¦Ä*ÊÇÔÚÄ³¸öÏÈÑé·Ö²¼ÏÂÊ¹µÃÆ½¾ù·çÏÕ×îÐ¡µÄ¾ö²ß¡£
Ñ°ÕÒÒ»°ãÒâÒåÏÂµÄ±´Ò¶Ë¹¾ö²ßÊÇÏàµ±²»Ò×µÄÊýÑ§ÎÊÌâ£¬Îª¼ò½àÆð¼û£¬ÐèÒª½áºÏ¾ßÌåµÄËã·¨À´ÍÆµ¼ÏàÓ¦µÄ±´Ò¶Ë¹¾ö²ß¡£
3.1.3±´Ò¶Ë¹Ô­Àí
±´Ò¶Ë¹¾ö²ßÂÛÔÚÏà¹Ø¸ÅÂÊÒÑÖªµÄÇé¿öÏÂÀûÓÃÎóÅÐËðÊ§À´Ñ¡Ôñ×îÓÅµÄÀà±ð·ÖÀà¡£
¡°·çÏÕ¡±(ÎóÅÐËðÊ§)= Ô­±¾ÎªcjµÄÑù±¾Îó·ÖÀà³Éci²úÉúµÄÆÚÍûËðÊ§(ÈçÏÂÊ½£¬¸ÅÂÊ³ËÒÔËðÊ§ÎªÆÚÍûËðÊ§)£º 


R(ci|X)=¡ÆNj=1¦ËijP(cj|X)

ÎªÁË×îÐ¡×ÜÌå·çÏÕ£¬Ö»ÐèÔÚÃ¿¸öÑù±¾ÉÏÑ¡ÔñÄÜ¹»Ê¹Ìõ¼þ·çÏÕR(c|X)×îÐ¡µÄÀà±ð±ê¼Ç¡£


h*(x)= argminc¡ÉyR(c|X)

h*³ÆÎª±´Ò¶Ë¹×îÓÅ·ÖÀàÆ÷£¬ÓëÖ®¶ÔÓ¦µÄ×ÜÌå·çÏÕÎª±´Ò¶Ë¹·çÏÕ£¬µ±¦ËµÈÓÚ1Ê±£¬×îÓÅ±´Ò¶Ë¹·ÖÀàÆ÷ÊÇÊ¹ºóÑé¸ÅÂÊP(c|X)×î´ó¡£
ÀûÓÃ±´Ò¶Ë¹ÅÐ¶¨×¼ÔòÀ´×îÐ¡»¯¾ö²ß·çÏÕ£¬Ê×ÏÈÒª»ñµÃºóÑé¸ÅÂÊP(c|X)£¬»úÆ÷Ñ§Ï°ÔòÊÇ»ùÓÚÓÐÏÞµÄÑµÁ·Ñù±¾¼¯¾¡¿ÉÄÜ×¼È·µØ¹À¼Æ³öºóÑé¸ÅÂÊP(c|X)¡£Í¨³£ÓÐÁ½ÖÖÄ£ÐÍ£º 
(1) ÅÐ±ðÊ½Ä£ÐÍ¡£Í¨¹ýÖ±½Ó½¨Ä£P(c|X)À´Ô¤²â(¾ö²ßÊ÷¡¢BPÉñ¾­ÍøÂç¡¢Ö§³ÖÏòÁ¿»ú)¡£
(2) Éú³ÉÊ½Ä£ÐÍ¡£Í¨¹ý¶ÔÁªºÏ¸ÅÂÊÄ£ÐÍP(X,c)½øÐÐ½¨Ä££¬È»ºóÔÙ»ñµÃP(c|X)¡£


P(c|X)=P(X,c)P(X)=P(c)P(X|c)P(X)

P(c)ÊÇÀà¡°ÏÈÑé¡±¸ÅÊö£¬P(X|c)ÊÇÑù±¾XÏà¶ÔÓÚÀà±ê¼ÇÌõ¼þ¸ÅÂÊ£¬»ò³ÆËÆÈ»¡£ËÆÈ»º¯ÊýµÄ¶¨ÒåÎª£º ¶ÔÍ¬Ò»¸öËÆÈ»º¯Êý£¬Èç¹û´æÔÚÒ»¸ö²ÎÊýÖµ£¬Ê¹µÃËüµÄº¯ÊýÖµ´ïµ½×î´ó£¬ÄÇÃ´Õâ¸öÖµ¾ÍÊÇ×îÎª¡°ºÏÀí¡±µÄ²ÎÊýÖµ¡£
P(c)´ú±íÑù±¾¿Õ¼äÖÐ¸÷ÀàÑù±¾ËùÕ¼µÄ±ÈÀý£¬¸ù¾Ý´óÊý¶¨Àí£¬µ±ÑµÁ·¼¯°üº¬³ä×ãµÄ¶ÀÁ¢Í¬·Ö²¼Ñù±¾Ê±£¬¿ÉÍ¨¹ý¸÷ÀàÑù±¾³öÏÖµÄÆµÂÊ½øÐÐ¹À¼Æ¡£¶øP(X|c)Éæ¼°¹ØÓÚËùÓÐÊôÐÔµÄÁªºÏ¸ÅÂÊ£¬ÎÞ·¨¸ù¾ÝÑù±¾³öÏÖµÄÆµÂÊ½øÐÐ¹À¼Æ¡£
¡¾Àý3ª²1¡¿PythonÊµÏÖ¼òµ¥±´Ò¶Ë¹·ÖÀà¡£

import numpy 

#ÏÈÉú³ÉÔ­Ê¼Êý¾Ý

n1=200;n2=40;m=4;h=6

#n1´ú±í×ÜÑùÆ·Êý£¬n2ÊÇ²âÊÔÑùÆ·Êý£¬mÊÇÖÖÀàÊý£¬hÊÇÌØÕ÷Êý



S1=numpy.zeros((200,7))

#×îºóÒ»ÁÐ´ú±íÀà±ð

S1£Û0:30,0:6£Ý=numpy.random.randn(30,6)

S1£Û0:30,6£Ý=1

S1£Û30:60,0:6£Ý=numpy.random.randn(30,6)*3+10

S1£Û30:60,6£Ý=2

S1£Û60:140,0:6£Ý=numpy.random.randn(80,6)*5+20

S1£Û60:140,6£Ý=3

S1£Û140:,0:6£Ý=numpy.random.randn(60,6)*10+30

S1£Û140:,6£Ý=

S2=numpy.zeros((40,6))

S2£Û0:10,:£Ý=numpy.random.randn(10,6)

S2£Û10:20,:£Ý=numpy.random.randn(10,6)*3+10

S2£Û20:30,:£Ý=numpy.random.randn(10,6)*5+20

S2£Û30:,:£Ý=numpy.random.randn(10,6)*10+30 

#siÎªÑù±¾£¬XÎªtestÊý¾Ý

#µ¥¸öÊý¾ÝÔÚÄ£°å¿Õ¼äSiÖÐ³öÏÖµÄ¸ÅÂÊ

def beiyesi(X,Si):

S=numpy.cov(Si.T)

S=numpy.mat(S);m,n=Si.shape

a=1/((2*numpy.pi)**(n/2)*numpy.linalg.det(S)**0.5)

X=X-numpy.mean(Si,axis=0)

ans=numpy.dot(X,S.I)

ans=numpy.dot(ans,X.T)

p=numpy.log(a*(numpy.exp(-0.5*ans)))

return p

def many_beiyesi(X,Si):

#¶à¸öÊý¾ÝÔÚÄ£°å¿Õ¼äSiÖÐ³öÏÖµÄ¸ÅÂÊ

a,b=X.shape

P=£Ûbeiyesi(X£Ûi,:£Ý,Si) for i in range(a)£Ý

return P

def final(X,S,m):

li=£Û£Ý

w=£Û£Ý

a,b=X.shape

n1,h=S.shape

h=h-1

#P£Ûi,j£Ý´ú±íµÚj¸öÊý¾ÝÔÚµÚi¸öÄ£°å¿Õ¼äÖÐ³öÏÖµÄ¸ÅÂÊ

P=numpy.zeros((m,a))

Q=numpy.zeros((m,a))

#Q£Ûi,j£Ý´ú±íµÚj¸öÊý¾ÝÊôÓÚµÚi¸öÄ£°å¿Õ¼äµÄ¸ÅÂÊ

for i in range(m):

li.append(numpy.argwhere(S==i+1)£Û:,0£Ý)

w.append(len(li£Ûi£Ý))

Si=S£Ûli£Ûi£Ý,0:h£Ý

p=many_beiyesi(X,Si)

for j in range(a):

P£Ûi,j£Ý=p£Ûj£Ý

for i in range(m):

w£Ûi£Ý=float(w£Ûi£Ý)/sum(w)

for i in range(m):

for j in range(a):

Q£Ûi,j£Ý=P£Ûi,j£Ý*w£Ûi£Ý/numpy.dot(w,P£Û:,j£Ý)

return P,Q

P,Q=final(S2,S1,m)

ÔËÐÐ³ÌÐò£¬Êä³öÈçÏÂ£º 

test.py:36: RuntimeWarning: divide by zero encountered in log

p=numpy.log(a*(numpy.exp(-0.5*ans)))

test.py:64: RuntimeWarning: invalid value encountered in double_scalars

Q£Ûi,j£Ý=P£Ûi,j£Ý*w£Ûi£Ý/numpy.dot(w,P£Û:,j£Ý)

3.2²ÎÊý¹À¼Æ
ÎÞÂÛÊÇ±´Ò¶Ë¹Ñ§ÅÉ»¹ÊÇÆµÂÊÑ§ÅÉ£¬Ò»¸öÎÞ·¨»Ø±ÜµÄÎÊÌâ¾ÍÊÇÈçºÎ´ÓÒÑÓÐµÄÑù±¾ÖÐ»ñÈ¡ÐÅÏ¢²¢¾Ý´Ë¹À¼ÆÄ¿±êÄ£ÐÍµÄ²ÎÊý¡£±È½ÏÓÐÃûµÄ¡°ÆµÂÊ½üËÆ¸ÅÂÊ¡±ÆäÊµ¾ÍÊÇ(»ùÓÚ´óÊý¶¨ÂÉµÄ)Ïàµ±ºÏÀíµÄ¹À¼ÆÖ®Ò»¡£
3.2.1ËÆÈ»º¯Êý
ÔÚÊýÀíÍ³¼ÆÑ§ÖÐ£¬ËÆÈ»º¯ÊýÊÇÒ»ÖÖ¹ØÓÚÍ³¼ÆÄ£ÐÍ²ÎÊýµÄº¯Êý£¬±íÊ¾Ä£ÐÍ²ÎÊýÖÐµÄËÆÈ»ÐÔ¡£¡°ËÆÈ»ÐÔ¡±Óë¡°»òÈ»ÐÔ¡±»ò¡°¸ÅÂÊ¡±ÒâË¼Ïà½ü£¬¶¼ÊÇÖ¸Ä³ÖÖÊÂ¼þ·¢ÉúµÄ¿ÉÄÜÐÔ£¬µ«ÊÇÔÚÍ³¼ÆÑ§ÖÐ£¬¡°ËÆÈ»ÐÔ¡±ºÍ¡°»òÈ»ÐÔ¡±»ò¡°¸ÅÂÊ¡±ÓÖÓÐÃ÷È·µÄÇø·Ö¡£¸ÅÂÊÓÃÓÚÔÚÒÑÖªÒ»Ð©²ÎÊýµÄÇé¿öÏÂ£¬Ô¤²â½ÓÏÂÀ´µÄ¹Û²âËùµÃµ½µÄ½á¹û£¬¶øËÆÈ»ÐÔÔòÊÇÓÃÓÚÔÚÒÑÖªÄ³Ð©¹Û²âËùµÃµ½µÄ½á¹ûÊ±£¬¶ÔÓÐ¹ØÊÂÎïµÄÐÔÖÊµÄ²ÎÊý½øÐÐ¹À¼Æ¡£
ÀýÈç£¬ÔÚÒÑÖªÄ³¸ö²ÎÊý¦ÈµÄÇé¿öÏÂÊÂ¼þX»á·¢ÉúµÄ¸ÅÂÊÐ´×÷£º 


p(X|¦È)=p(X,¦È)p(¦È)
¸ù¾Ý±´Ò¶Ë¹¶¨Àí£¬ÓÐ£º 


p(X|¦È)=p(X|¦È)p(¦È)p(X)

Òò´Ë£¬¿ÉÒÔ·´¹ýÀ´¹¹Ôì±íÊ¾ËÆÈ»ÐÔµÄ·½·¨£º ÒÑÖªÓÐÊÂ¼þX·¢Éú£¬ÔËÓÃËÆÈ»º¯ÊýL(¦È|X)¹À¼Æ²ÎÊýYµÄ¿ÉÄÜÐÔ¡£
3.2.2¼«´óËÆÈ»¹À¼ÆÔ­Àí
ÆµÂÊÑ§ÅÉÈÏÎªÒÑÖªÒ»¸ö·Ö²¼£¬ËäÈ»²»ÖªµÀ·Ö²¼µÄ¾ßÌå²ÎÊý£¬µ«ÊÇÈ´¿Í¹ÛÉÏ´æÔÚ¹Ì¶¨µÄ²ÎÊýÖµ¡£Òò´Ë¿ÉÒÔÍ¨¹ýÒ»Ð©×¼ÔòÀ´È·¶¨²ÎÊýÖµ¡£ÕâÀï½éÉÜµÄ¼«´óËÆÈ»¹À¼Æ¾ÍÊÇÒ»ÖÖ¸ù¾Ý²ÉÑùÀ´¹À¼Æ¸ÅÂÊ·Ö²¼²ÎÊýµÄ¾­µä·½·¨¡£
×î´óËÆÈ»¹À¼Æ»áÑ°ÕÒ¹ØÓÚ¦ÈµÄ×î¿ÉÄÜµÄÖµ(¼´£¬ÔÚËùÓÐ¿ÉÄÜµÄ¦ÈÈ¡ÖµÖÐ£¬Ñ°ÕÒÒ»¸öÖµÊ¹Õâ¸ö²ÉÑùµÄ¡°¿ÉÄÜÐÔ¡±×î´ó»¯£¬Ïàµ±ÓÚÊÇÀûÓÃ¸ÅÂÊÃÜ¶Èº¯Êý²ÎÊýÈ¥ÄâºÏ²ÉÑùµÄ½á¹û)¡£ÏÖÔÚµÄ¹¤×÷¾ÍÊÇ×î´ó»¯ËÆÈ»º¯Êý£º 


p(¦È|X)=p(X|¦È)p(¦È)p(X)
¸ù¾Ý´óÊý¶¨ÂÉ£¬µ±ÑµÁ·¼¯°üº¬³ä×ãµÄ¶ÀÁ¢Í¬·Ö²¼Ñù±¾Ê±£¬p(X)¿ÉÒÔÍ¨¹ý¸÷ÀàÑù±¾³öÏÖµÄÆµÂÊÀ´½øÐÐ¹À¼Æ¡£ÔÚÕâÀï£¬ÒÑÖªÑù±¾Ö®ºó£¬¾Í¿ÉÒÔ¹ÀËã³öp(X)µÄÖµ£¬²¢½«Æäµ±×÷¹Ì¶¨Öµ´¦Àí¡£
ÏÖÔÚÐèÒª¸ù¾ÝËùÓÐ¿ÉÄÜ¦ÈµÄÈ¡Öµ£¬Ñ¡È¡Ò»¸öÈÃp(¦È|X)×î´ó»¯µÄÖµ¡£ÕâÀï»¹ÊÇÒÔÕýÌ¬·Ö²¼ÎªÀý¡£ÎªÁË¼ò»¯ÔËËã£¬ÎÒÃÇ¶ÔËÆÈ»º¯ÊýÈ¡¶ÔÊý¡£×î´ó»¯Ò»¸öËÆÈ»º¯ÊýÍ¬×î´ó»¯ËüµÄ×ÔÈ»¶ÔÊýÊÇµÈ¼ÛµÄ£¬ÒòÎª×ÔÈ»¶ÔÊýlogÊÇÒ»¸öÁ¬ÐøÇÒÔÚËÆÈ»º¯ÊýµÄÖµÓòÄÚÑÏ¸ñµÝÔöµÄÉÏÍ¹º¯Êý¡£
3.2.3¼«´óËÆÈ»¹À¼Æ(ML¹À¼Æ)
Èç¹û½«Ä£ÐÍÃèÊö³ÉÒ»¸ö¸ÅÂÊÄ£ÐÍ£¬ÄÇÃ´Ò»¸ö×ÔÈ»µÄÏë·¨ÊÇÏ£ÍûµÃµ½µÄÄ£ÐÍ²ÎÊý¦ÈÄÜ¹»Ê¹µÃÔÚÑµÁ·¼¯X¡«×÷ÎªÊäÈëÊ±¡¢Ä£ÐÍÊä³öµÄ¸ÅÂÊ´ïµ½¼«´ó¡£ÕâÀï¾ÍÓÐÒ»¸öËÆÈ»º¯ÊýµÄ¸ÅÄî£¬ËüÄÜ¹»Êä³öX¡«=(x1,x2,¡­,xN)TÔÚÄ£ÐÍ²ÎÊý¦ÈÏÂµÄ¸ÅÂÊ£º 


p(X¡«|¦È)=¡ÇNi=1p(xi|¦È)

ÎÒÃÇÏ£ÍûÕÒµ½µÄ¦È^£¬¾ÍÊÇÊ¹µÃËÆÈ»º¯ÊýÔÚX¡«×÷ÎªÊäÈëÊ±´ïµ½¼«´óµÄ²ÎÊý¡£


¦È^= argmax¦Èp(X¡«|¦È)= argmax¦È¡ÇNi=1p(xi|¦È)

¾Ù¸öÀý×Ó£º ¼ÙÉèÒ»¸ö°µÏäÖÐÓÐ°×Çò¡¢ºÚÇò¹²Á½¸ö£¬ÏÔÈ»²»ÖªµÀ¾ßÌåµÄÑÕÉ«·Ö²¼Çé¿ö£¬µ«ÊÇÖªµÀÕâÁ½¸öÇòÊÇÍêÈ«Ò»ÑùµÄ¡£ÏÖÔÚÓÐ·Å»ØµØ´ÓÏä×ÓÀï³éÁËÁ½¸öÇò£¬·¢ÏÖÁ½´Î³é³öÀ´µÄ½á¹ûÊÇÒ»ºÚÒ»°×£¬ÄÇÃ´¸ÃÈçºÎ¹À¼ÆÏä×ÓÀïÃæÇòµÄÑÕÉ«£¿´ÓÖ±¹ÛÉÏÀ´Ëµ£¬ËÆºõÏä×ÓÖÐÒ²ÊÇÒ»ºÚÒ»°×±È½ÏºÏÀí£¬ÏÂÃæ¾ÍÀ´ËµÃ÷¡°Ò»ºÚÒ»°×¡±Õâ¸ö¹À¼Æ¾ÍÊÇ¼«´óËÆÈ»¹À¼Æ¡£
ÔÚÕâ¸öÎÊÌâÖÐ£¬Ä£ÐÍµÄ²ÎÊý¦È¿ÉÒÔÉèÎª´Ó°µÏäÖÐ³é³öºÚÇòµÄ¸ÅÂÊ£¬Ñù±¾xi¿ÉÒÔÃèÊöÎªµÚi´ÎÈ¡³öµÄÇòÊÇ·ñÊÇºÚÇò£» Èç¹ûÊÇ¾ÍÊÇÈ¡1£¬·ñÔòÈ¡0¡£ÕâÑù£¬ËÆÈ»º¯Êý¾Í¿ÉÒÔÃèÊöÎª£º 


p(X¡«|¦È)=¦Èx1+x2(1-¦È)2-x1-x2

Ö±½Ó¶ÔËüÇó¼«´óÖµ(ËäÈ»¿ÉÐÐµ«ÊÇ)²»Ì«·½±ã£¬Í¨³£µÄ×ö·¨ÊÇ½«ËÆÈ»º¯ÊýÈ¡¶ÔÊýÖ®ºóÔÙ½øÐÐ¼«´óÖµµÄÇó½â£º 


lnp(X¡«|¦È)=(x1+x2)ln¦È+2-x1-x2ln(1-¦È)

ªÝªµlnpªµ¦È=x1+x2¦È-2-x1-x21-¦È
´Ó¶ø¿ÉÖª£º 


ªµlnpªµ¦È=0ªÝ¦È=x1+x2¦È

ÓÉÓÚx1+x2=1£¬ËùÒÔµÃ¦È^=0.5£¬Òà¼´Ó¦¸Ã¹À¼Æ´Ó°µÏäÖÐ³é³öºÚÇòµÄ¸ÅÂÊÊÇ50%£» ¼ÈÈ»°µÏäÖÐµÄÁ½¸öÇòÍêÈ«Ò»Ñù£¬ÎÒÃÇÓ¦¸Ã¹À¼Æ°µÏäÖÐµÄÑÕÉ«·Ö²¼ÎªÒ»ºÚÒ»°×¡£
´ÓÒÔÉÏµÄÌÖÂÛ¿ÉÒÔ¿´³ö£¬¼«´óËÆÈ»¹À¼ÆÊÓ´ý¹À¼Æ²ÎÊýÎªÒ»¸öÎ´Öªµ«¹Ì¶¨µÄÁ¿£¬²»¿¼ÂÇ¡°¹Û²ìÕß¡±µÄÓ°Ïì(Òà¼´²»¿¼ÂÇÏÈÑéÖªÊ¶µÄÓ°Ïì)£¬ÊÇ´«Í³µÄÆµÂÊÑ§ÅÉµÄ×ö·¨¡£
¡¾Àý3ª²2¡¿ÀûÓÃPython¶ÔÕýÌ¬·Ö²¼µÄÊý¾Ý½øÐÐ×î´óËÆÈ»¹À¼Æ¡£

import numpy as np

import matplotlib.pyplot as plt

fig = plt.figure()

mu = 30#·ÖÅäµÄÆ½¾ùÖµ

sigma = 2#·Ö²¼µÄ±ê×¼Æ«²î

x = mu + sigma * np.random.randn(10000)

def mle(x):

"""

¼«´óËÆÈ»¹À¼Æ

:param x:

:return:

"""

u = np.mean(x)

return u, np.sqrt(np.dot(x - u, (x - u).T) / x.shape£Û0£Ý)

print(mle(x))

num_bins = 100

plt.hist(x, num_bins)

plt.show()

ÔËÐÐ³ÌÐò£¬Ð§¹ûÈçÍ¼3ª²1ËùÊ¾¡£


Í¼3ª²1×î´óËÆÈ»¹À¼Æ


3.2.4¼«´óºóÑé¸ÅÂÊ¹À¼Æ(MAP¹À¼Æ)
Ïà±ÈÆð¼«´óËÆÈ»¹À¼Æ£¬¼«´óºóÑé¸ÅÂÊ¹À¼ÆÊÇ¸üÌùºÏ±´Ò¶Ë¹Ñ§ÅÉË¼ÏëµÄ×ö·¨¡£ÊÂÊµÉÏ£¬ÉõÖÁÒ²ÓÐ²»ÉÙÈËÖ±½Ó³ÆÆäÎª¡°±´Ò¶Ë¹¹À¼Æ¡±¡£
ÔÚÌÖÂÛMAP¹À¼ÆÖ®Ç°£¬ÓÐ±ØÒªÏÈÖªµÀºÎÎªºóÑé¸ÅÂÊp(¦È|X¡«)¡£Ëü¿ÉÒÔÀí½âÎª²ÎÊý¦ÈÔÚÑµÁ·¼¯X¡«ÏÂËùÎ½µÄ¡°ÕæÊµµÄ³öÏÖ¸ÅÂÊ¡±£¬ÄÜ¹»ÀûÓÃ²ÎÊýµÄÏÈÑé¸ÅÂÊp(¦È)¡¢Ñù±¾µÄÏÈÑé¸ÅÂÊp(X¡«)ºÍÌõ¼þ¸ÅÂÊp(X¡«|¦È)=¡ÇNi=1p(xi|¦È)Í¨¹ý±´Ò¶Ë¹¹«Ê½µ¼³ö¡£
¶øMAP¹À¼ÆµÄºËÐÄË¼Ïë£¬¾ÍÊÇ½«´ý¹À²ÎÊý¦È¿´³ÉÊÇÒ»¸öËæ»ú±äÁ¿£¬´Ó¶øÒýÈëÁË¼«´óËÆÈ»¹À¼ÆÖÐÃ»ÓÐÒýÈëµÄ¡¢²ÎÊý¦ÈµÄÏÈÑé·Ö²¼¡£MAP¹À¼Æ¦È^MAPµÄ¶¨ÒåÎª£º 


¦È^MAP= argmax¦Èp(¦È|X¡«)= argmax¦Èp(¦È)¡ÇNi=1p(xi|¦È)
Í¬Ñù£¬ÎªÁË¼ÆËã¼ò±ã£¬Í¨³£¶Ô´ËÊ½È¡¶ÔÊý£º 


¦È^MAP= argmax¦Èlnp(¦È|X¡«)= argmax¦Èlnp(¦È)+¡ÆNi=1lnp(xi|¦È)


¿ÉÒÔ¿´µ½£¬´ÓÐÎÊ½ÉÏ£¬¼«´óºóÑé¸ÅÂÊ¹À¼ÆÖ»±È¼«´óËÆÈ»¹À¼Æ¶àÁËlnp(¦È)ÕâÒ»Ïî£¬µ«ËüÃÇ±³ºóµÄË¼ÏëÏàµ±²»Í¬¡£ÏÂÃæÔÚ¾ßÌåÌÖÂÛÆÓËØ±´Ò¶Ë¹Ëã·¨Ê±½«»á¿´µ½£º ÆÓËØ±´Ò¶Ë¹ÔÚ¹À¼Æ²ÎÊýÊ±Ñ¡ÓÃÁË¼«´óËÆÈ»¹À¼Æ·¨£¬µ«ÊÇÔÚ×ö¾ö²ßÊ±ÔòÑ¡ÓÃÁËMAP¹À¼Æ¡£
ºÍ¼«´óËÆÈ»¹À¼ÆÏà±È£¬MAP¹À¼ÆµÄÒ»¸öÏÔÖøÓÅÊÆÔÚÓÚËü¿ÉÒÔÒýÈëËùÎ½µÄ¡°ÏÈÑéÖªÊ¶¡±£¬ÕâÕýÊÇ±´Ò¶Ë¹Ñ§ÅÉµÄ¾«Ëè¡£µ±È»Õâ¸öÓÅÊÆÍ¬Ê±Ò²°éËæ×ÅÁÓÊÆ£º ËüÒªÇóÎÒÃÇ¶ÔÄ£ÐÍ²ÎÊýÓÐÏà¶Ô½ÏºÃµÄÈÏÖª£¬·ñÔò»áÏàµ±´óµØÓ°Ïìµ½½á¹ûµÄºÏÀíÐÔ¡£
¼ÈÈ»ÏÈÑé·Ö²¼Èç´ËÖØÒª£¬ÄÇÃ´¶ÔÓÚÏÈÑé·Ö²¼ÊÇ·ñÓÐ±È½ÏºÏÀíµÄÑ¡È¡·½·¨ÄØ£¿ÊÂÊµÉÏ£¬ÈçºÎÈ·¶¨ÏÈÑé·Ö²¼Õâ¸öÎÊÌâ£¬ÕýÊÇ±´Ò¶Ë¹Í³¼ÆÖÐ×îÀ§ÄÑ¡¢×î¾ßÓÐÕùÒéÐÔÈ´ÓÖ±ØÐë½â¾öµÄÎÊÌâ¡£ËäÈ»Õâ¸öÎÊÌâÈ·ÊµÓÐÐí¶àÏÖ´úµÄÑÐ¾¿³É¹û£¬µ«ÒÅº¶µÄÊÇ£¬ÉÐÎ´ÄÜÓÐÒ»¸ö½ÏÍêÉÆµÄÀíÂÛºÍÆÕÊÊµÄ·½·¨¡£
ËùÑ¡ÔñµÄ²ÎÊý¦ÈµÄÏÈÑé·Ö²¼£¬Ó¦¸ÃÓëÓÉËüºÍÑµÁ·¼¯È·¶¨µÄºóÑé·Ö²¼ÊôÍ¬Ò»ÀàÐÍ¡£
´ËÊ±ÏÈÑé·Ö²¼ÓÖ½Ð¹²éîÏÈÑé·Ö²¼¡£ÕâÀïÃæËùÎ½µÄ¡°Í¬Ò»ÀàÐÍ¡±ÆäÊµÓÖÊÇÄÑÓÐÇ¡µ±¶¨ÒåµÄ¸ÅÄî£¬µ«ÊÇ¿ÉÒÔÖ±¹ÛµØÀí½âÎª£º ¸ÅÂÊÐÔÖÊÏàËÆµÄËùÓÐ·Ö²¼¹éÎª¡°Í¬Ò»ÀàÐÍ¡±¡£±ÈÈç£¬ËùÓÐµÄÕýÌ¬·Ö²¼¶¼ÊÇ¡°Í¬Ò»ÀàÐÍ¡±µÄ¡£
3.3ÆÓËØ±´Ò¶Ë¹
ÔÚÆÓËØ±´Ò¶Ë¹Õâ¸öÃû×ÖÖÐ£¬¡°ÆÓËØ¡±¶þ×Ö¶ÔÓ¦×Å¡°¶ÀÁ¢ÐÔ¼ÙÉè¡±ÕâÒ»¸öÆÓËØµÄ¼ÙÉè£¬¡°±´Ò¶Ë¹¡±Ôò¶ÔÓ¦¡°ºóÑé¸ÅÂÊ×î´ó»¯¡±ÕâÒ»±´Ò¶Ë¹Ñ§ÅÉµÄË¼Ïë¡£
3.3.1»ù±¾¿ò¼Ü
ÆÓËØ±´Ò¶Ë¹Ëã·¨Ò»¸ö·Ç³£ÖØÒªµÄ»ù±¾¼ÙÉè³ÆÎª¶ÀÁ¢ÐÔ¼ÙÉè£¬Æä´óÖÂÐðÊöÈçÏÂ£º 
Èç¹ûÑù±¾¿Õ¼äXÊÇnÎ¬µÄ£¬ÄÇÃ´¶ÔªÐx=(x(1),x(2),¡­,x(n))T¡ÊX£¬¼ÙÉèx(i)ÊÇÓÉËæ»ú±äÁ¿X(i)Éú³ÉµÄ£¬ÇÒX(1),X(2),¡­£¬X(n)Ö®¼äÔÚ¸÷ÖÖÒâÒåÏÂÏà»¥¶ÀÁ¢¡£
ÔÚÆÓËØ±´Ò¶Ë¹Ëã·¨Ë¼ÏëÏÂ£¬Ò»°ãÀ´Ëµ»áÑÜÉú³öÒÔÏÂ3ÖÖ²»Í¬µÄÄ£ÐÍ¡£
¤r ÀëÉ¢ÐÍÆÓËØ±´Ò¶Ë¹(MultinomialNB)£º ËùÓÐÎ¬¶ÈµÄÌØÕ÷¶¼ÊÇÀëÉ¢ÐÍËæ»ú±äÁ¿¡£
¤r Á¬ÐøÐÍÆÓËØ±´Ò¶Ë¹(GaussianNB)£º ËùÓÐÎ¬¶ÈµÄÌØÕ÷¶¼ÊÇÁ¬ÐøÐÍËæ»ú±äÁ¿¡£
¤r »ìºÏÐÍÆÓËØ±´Ò¶Ë¹(MergedNB)£º ¸÷¸öÎ¬¶ÈµÄÌØÕ÷ÓÐÀëÉ¢ÐÍÒ²ÓÐÁ¬ÐøÐÍ¡£
ÓÉÇ³ÈëÉî£¬ÎÒÃÇÏÈÓÃÀëÉ¢ÐÍÆÓËØ±´Ò¶Ë¹À´ËµÃ÷Ò»Ð©ÆÕÊÊÐÔµÄ¸ÅÄî£¬Á¬ÐøÐÍºÍ»ìºÏÐÍµÄÏà¹Ø¶¨ÒåÊÇÀàËÆµÄ¡£
¤r ÆÓËØ±´Ò¶Ë¹µÄÄ£ÐÍ²ÎÊý¼´ÊÇÀà±ðµÄÑ¡Ôñ¿Õ¼ä(¼ÙÉèÒ»¹²ÓÐKÀà£º c1,c2,¡­,cK)£º 


¦¨={y=c1,y=c2,¡­,y=cK}

¤r ÆÓËØ±´Ò¶Ë¹×ÜµÄ²ÎÊý¿Õ¼ä¦¨~±¾Ó¦°üÀ¨Ä£ÐÍ²ÎÊýµÄÏÈÑé¸ÅÂÊp(¦Èk)=p(y=ck)¡¢Ñù±¾¿Õ¼äÔÚÄ£ÐÍ²ÎÊýÏÂµÄÌõ¼þ¸ÅÂÊp(X|¦Èk)=p(X|y=ck)ºÍÑù±¾¿Õ¼ä±¾ÉíµÄ¸ÅÂÊp(X)¡£
µ«ÓÉÓÚÎÒÃÇ²ÉÈ¡Ñù±¾¿Õ¼äµÄ×Ó¼¯X¡«×÷ÎªÑµÁ·¼¯£¬ËùÒÔÔÚ¸ø¶¨µÄX¡«ÏÂ£¬p(X)=p(X¡«)ÊÇ³£Êý£¬Òò´Ë¿ÉÒÔ°ÑËü´Ó²ÎÊý¿Õ¼äÖÐÉ¾È¥¡£»»¾ä»°Ëµ£¬ÎÒÃÇ¹ØÐÄµÄÖ»ÓÐÄ£ÐÍ²ÎÊýµÄÏÈÑé¸ÅÂÊºÍÑù±¾¿Õ¼äÔÚÄ£ÐÍ²ÎÊýÏÂµÄÌõ¼þ¸ÅÂÊ£º 


¦¨~={p(¦È),p(X|¦È):¦È¡Ê¦¨}

¤r ÐÐ¶¯¿Õ¼äAÊÇÆÓËØ±´Ò¶Ë¹×ÜµÄ²ÎÊý¿Õ¼ä¦¨~¡£
¤r ¾ö²ß¾ÍÊÇºóÑé¸ÅÂÊ×î´ó»¯£º 


¦Ä(X¡«)=¦È^= argmax¦È~¡Ê¦¨~p(¦È~|X¡«)
ÔÚ¦È^È·¶¨ºó£¬Ä£ÐÍµÄ¾ö²ß¾Í¿ÉÒÔ¾ßÌåÐ´³É(ÕâÒ»²½ÓÃµ½ÁË¶ÀÁ¢ÐÔ¼ÙÉè)£º 


f(x*)= argmaxckp^(ck|X=x*)

= argmaxckp^(y=ck)¡ÇNj=1p^(X(j)=x*(j)|y=ck)


¤r ËðÊ§º¯Êý»áËæÄ£ÐÍµÄ²»Í¬¶ø²»Í¬¡£ÔÚÀëÉ¢ÐÍÆÓËØ±´Ò¶Ë¹ÖÐ£¬ËðÊ§º¯Êý¾ÍÊÇ±È½Ï¼òµ¥µÄ0ª²1ËðÊ§º¯Êý£º 


L(¦È,¦Ä(X¡«))=¡ÆNi=1L¡«(yi,f(xi))=¡ÆNi=1I(yi¡Ùf(xi))
ÕâÀïµÄIÊÇÊ¾ÐÔº¯Êý£¬ËüÂú×ã£º 


I(yi¡Ùf(xi))=1,yi¡Ùf(xi)


0,yi=f(xi)
´ÓÉÏÊö¶¨Òå³ö·¢£¬¿ÉÒÔÀûÓÃÁ½ÖÖ²ÎÊý¹À¼Æ·½·¨µ¼³öÀëÉ¢ÐÍ¼ÆËãÆÓËØ±´Ò¶Ë¹µÄËã·¨¡£ÏÂÃæ½éÉÜÆäËã·¨¡£
ÊäÈë£º ÑµÁ·Êý¾Ý¼¯D={(x1,y1),(x2,y2),¡­,(xN,yN)}¡£
¹ý³Ì(ÀûÓÃML¹À¼Æµ¼³öÄ£ÐÍµÄ¾ßÌå²ÎÊý)£º 
(1) ¼ÆËãÏÈÑé¸ÅÂÊp(y=ck)µÄ¼«´óËÆÈ»¹À¼Æ


p^(y=ck)=¡ÆNi=1I(yi=ck)N,k=1,2,¡­,K

(2) ¼ÆËãÌõ¼þ¸ÅÂÊp(X(j)=aji|y=ck)µÄ¼«´óËÆÈ»¹À¼Æ(ÉèÃ¿Ò»¸öµ¥¶ÀÊäÈëµÄnÎ¬ÏòÁ¿xµÄjÎ¬ÌØÕ÷x(j)¿ÉÄÜµÄÈ¡Öµ¼¯ºÏÎª{aji,aj£¨i+1£©,¡­,ajsj})£º 


p(X(j)=aji|y=ck)=¡ÆNi=1I(x(j)i=ajl,yi=ck)¡ÆNi=1I(yi=ck)

Êä³ö(ÀûÓÃMAP¹À¼Æ½øÐÐ¾ö²ß)£º ÆÓËØ±´Ò¶Ë¹Ä£ÐÍ£¬ÄÜ¹»¹À¼ÆÊý¾Ýx*=(x*(1),x*(2),¡­,x*(n))TµÄÀà±ð£º 


y=f(x*)= argmaxckp^(y=ck)¡Çnj=1p^(X(j)=x*(j)|y=ck)
ÓÉÉÏÊöËã·¨¿ÉÒÔÇåÎúµØÊáÀí³öÆÓËØ±´Ò¶Ë¹Ëã·¨±³ºóµÄÊýÑ§Ë¼Ïë£º 
¤r Ê¹ÓÃ¼«´óËÆÈ»¹À¼Æµ¼³öÄ£ÐÍµÄ¾ßÌå²ÎÊý(ÏÈÑé¸ÅÂÊ¡¢Ìõ¼þ¸ÅÂÊ)¡£
¤r Ê¹ÓÃ¼«´óºóÑé¸ÅÂÊ¹À¼Æ³ö×÷ÎªÄ£ÐÍµÄ¾ö²ß(Êä³öÊ¹µÃÊý¾ÝºóÑé¸ÅÂÊ×î´ó»¯µÄÀà±ð)¡£
¡¾Àý3ª²3¡¿ÔÚÒ»¸ö¼òµ¥¡¢ÐéÄâµÄÊý¾Ý¼¯ÉÏÓ¦ÓÃÀëÉ¢ÐÍÆÓËØ±´Ò¶Ë¹Ëã·¨ÒÔ¼ÓÉî¶ÔËã·¨µÄÀí½â¡£¸ÃÊý¾Ý¼¯Èç±í3ª²1ËùÊ¾¡£


±í3ª²1ÆøÇòÊý¾Ý¼¯1.0



ÑÕÉ«´óÐ¡²â ÊÔ ÈË Ô±²â ÊÔ ¶¯ ×÷½á¹û

»ÆÉ«Ð¡³ÉÈËÓÃÊÖ´ò²»±¬Õ¨
»ÆÉ«Ð¡³ÉÈËÓÃ½Å²È±¬Õ¨
»ÆÉ«Ð¡Ð¡º¢ÓÃÊÖ´ò²»±¬Õ¨
»ÆÉ«Ð¡Ð¡º¢ÓÃ½Å²È²»±¬Õ¨
»ÆÉ«´ó³ÉÈËÓÃÊÖ´ò±¬Õ¨
»ÆÉ«´ó³ÉÈËÓÃ½Å²È±¬Õ¨
»ÆÉ«´óÐ¡º¢ÓÃÊÖ´ò²»±¬Õ¨
»ÆÉ«´óÐ¡º¢ÓÃ½Å²È±¬Õ¨
×ÏÉ«Ð¡³ÉÈËÓÃÊÖ´ò²»±¬Õ¨
×ÏÉ«Ð¡Ð¡º¢ÓÃÊÖ´ò²»±¬Õ¨
×ÏÉ«´ó³ÉÈËÓÃ½Å²È±¬Õ¨
×ÏÉ«´óÐ¡º¢ÓÃ½Å²È±¬Õ¨

¸ÃÊý¾Ý¼¯µÄµç×Ó°æ±¾¿É²Î¼ûhttps://github.com/cr=arefree0910/MachineLearning/blob/master/_Data/balloon1.0.txt¡£ÎÒÃÇÏëÔ¤²âµÄÊÇÑù±¾£º 





×ÏÉ«Ð¡Ð¡º¢ÓÃ½Å²È


Ëùµ¼ÖÂµÄ½á¹û¡£ÈÝÒ×¹Û²ìµ½µÄÊÇ£¬ÆøÇòµÄÑÕÉ«¶Ô½á¹û²»ÆðË¿ºÁÓ°Ïì£¬ËùÒÔÔÚËã·¨ÖÐ¸ÃÏîÌØÕ÷¿ÉÒÔÖ±½ÓÈ¥µô¡£Òò´Ë´ÓÖ±¹ÛÉÏÀ´Ëµ£¬ÒÔÑù±¾Ëùµ¼ÖÂµÄ½á¹ûÓ¦¸ÃÊÇ¡°²»±¬Õ¨¡±£¬ÎÒÃÇÓÃÀëÉ¢ÐÍÆÓËØ±´Ò¶Ë¹Ëã·¨À´¿´¿´ÊÇ·ñÈ·ÊµÈç´Ë¡£Ê×ÏÈÐèÒª¼ÆËãÀà±ðµÄÏÈÑé¸ÅÂÊ£¬Ò×µÃ£º 


p(²»±¬Õ¨)=p(±¬Õ¨)=0.5

Ò²¿ÉµÃµ½Àà±ðµÄÏÈÑé¸ÅÂÊ¶Ô¾ö²ß²»Æð×÷ÓÃ¡£¼Ì¶øÐèÒªÒÀ´ÎÇó³öµÚ2¡¢3¡¢4¸öÌØÕ÷(´óÐ¡¡¢²âÊÔÈËÔ±¡¢²âÊÔ¶¯×÷)µÄÌõ¼þ¸ÅÂÊ£¬ËüÃÇ²ÅÊÇ¾ö¶¨ÐÂÑù±¾ËùÊôÀà±ðµÄ¹Ø¼ü¡£Ò×µÃ£º 

p(Ð¡ÆøÇò|²»±¬Õ¨)=56£¬p(´óÆøÇò|²»±¬Õ¨)=16

p(Ð¡ÆøÇò|±¬Õ¨)=16£¬p(´óÆøÇò|²»±¬Õ¨)=16

p(³ÉÈË|²»±¬Õ¨)=13£¬p(Ð¡º¢|²»±¬Õ¨)=23

p(³ÉÈË|±¬Õ¨)=23£¬p(Ð¡º¢|±¬Õ¨)=13

p(ÓÃÊÖ´ò|²»±¬Õ¨)=56£¬p(ÓÃ½Å²È|²»±¬Õ¨)=16

p(ÓÃÊÖ´ò|±¬Õ¨)=16£¬p(ÓÃ½Å²È|±¬Õ¨)=56
ÄÇÃ´ÔÚÌõ¼þ¡°×ÏÉ«Ð¡ÆøÇò¡¢Ð¡º¢ÓÃ½Å²È¡±ÏÂ£¬Öª(×¢Òâ¿ÉÒÔºöÂÔÑÕÉ«ºÍÏÈÑé¸ÅÂÊ)£º 


p^(²»±¬Õ¨)=p(Ð¡ÆøÇò|²»±¬Õ¨)¡Áp(Ð¡º¢|²»±¬Õ¨)¡Áp(ÓÃ½Å²È|±¬Õ¨)=554

p^(±¬Õ¨)=p(Ð¡ÆøÇò|±¬Õ¨)¡Áp(Ð¡º¢|±¬Õ¨)¡Áp(ÓÃ½Å²È|±¬Õ¨)=5108
ËùÒÔÈ·¶¨ÈÏÎª£¬¸ø¶¨Ñù±¾Ëùµ¼ÖÂµÄ½á¹ûÊÇ¡°²»±¬Õ¨¡±¡£
ÐèÒªÖ¸³öµÄÊÇ£¬¸ÃËã·¨´æÔÚÒ»¸öÎÊÌâ£º Èç¹ûÑµÁ·¼¯ÖÐÄ³¸öÀà±ðckµÄÊý¾ÝÃ»ÓÐº­¸ÇµÚjÎ¬ÌØÕ÷µÄµÚ1¸öÈ¡Öµ£¬ÏàÓ¦¹À¼ÆµÄÌõ¼þ¸ÅÂÊp^(X(j)=ajl|y=ck)¾ÍÊÇ0£¬´Ó¶øµ¼ÖÂÄ£ÐÍ¿ÉÄÜ»áÔÚ²âÊÔ¼¯ÉÏµÄ·ÖÀà²úÉúÎó²î¡£½â¾öÕâ¸öÎÊÌâµÄ°ì·¨ÊÇÔÚ¸÷¸ö¹À¼ÆÖÐ¼ÓÈëÆ½»¬Ïî(Ò²ÓÐÕâÖÖ×ö·¨¾ÍÊÇ½Ð±´Ò¶Ë¹¹À¼ÆµÄËµ·¨)£¬Æä¹ý³ÌÎª£º 
(1) ¼ÆËãÏÈÑé¸ÅÂÊ¡£


p¦Ë(y=ck)=¡ÆNi=1I(yi=ck)+¦ËN+K¦Ë,k=1,2,¡­,K

(2) ¼ÆËãÌõ¼þ¸ÅÂÊ¡£


p¦Ë(X(j)=ajl|y=ck)=¡ÆNi=1I(x(j)iajl,yi=ck)+¦Ë¡ÆNi=1I(yi=ck)+Sj¦Ë

¦Ë=0Ê±¾ÍÊÇ¼«´óËÆÈ»¹À¼Æ£¬¦Ë=1Ê±Ôò½Ð×÷À­ÆÕÀ­Ë¹Æ½»¬(Laplace Smoothing)¡£À­ÆÕÀ­Ë¹Æ½»¬ÊÇ³£¼ûµÄ×ö·¨£¬ÔÚÊµÏÖÖÐÒ²»áÄ¬ÈÏÊ¹ÓÃËü¡£½«ÆøÇòÊý¾Ý¼¯1.0ÉÔ×ö±ä¶¯ÒÔÕÃÏÔ¼ÓÈëÆ½»¬ÏîµÄÖØÒªÐÔ¡£ÐÂÊý¾Ý¼¯Èç±í3ª²2ËùÊ¾¡£


±í3ª²2ÆøÇòÊý¾Ý¼¯1.5



ÑÕÉ«´óÐ¡²â ÊÔ ÈË Ô±²â ÊÔ ¶¯ ×÷½á¹û

»ÆÉ«Ð¡³ÉÈËÓÃÊÖ´ò²»±¬Õ¨
»ÆÉ«Ð¡³ÉÈËÓÃ½Å²È±¬Õ¨
»ÆÉ«Ð¡Ð¡º¢ÓÃÊÖ´ò²»±¬Õ¨
»ÆÉ«Ð¡Ð¡º¢ÓÃ½Å²È±¬Õ¨
»ÆÉ«Ð¡Ð¡º¢ÓÃ½Å²È±¬Õ¨
»ÆÉ«Ð¡Ð¡º¢ÓÃ½Å²È±¬Õ¨
»ÆÉ«´ó³ÉÈËÓÃÊÖ´ò±¬Õ¨
»ÆÉ«´ó³ÉÈËÓÃ½Å²È±¬Õ¨
»ÆÉ«´óÐ¡º¢ÓÃÊÖ´ò²»±¬Õ¨
×ÏÉ«Ð¡³ÉÈËÓÃÊÖ´ò²»±¬Õ¨
×ÏÉ«Ð¡Ð¡º¢ÓÃÊÖ´ò²»±¬Õ¨
×ÏÉ«´óÐ¡º¢ÓÃÊÖ´ò²»±¬Õ¨

¸ÃÊý¾Ý¼¯µÄµç×Ó°æ±¾¿ÉÒÔ²Î¼ûhttps://github.com/cr=arefree0910/MachineLearning/blob/master/_Data/balloon1.5.txt¡£¿ÉÒÔ¿´µ½£¬Õâ¸öÊý¾Ý¼¯ÊÇ¡°²»Ì«¾ùºâ¡±µÄ£º Ëü¶ÔÑù±¾¡°»ÆÉ«Ð¡ÆøÇò£¬Ð¡º¢ÓÃ½Å²È¡±ÖØ¸´½øÐÐÁË3´ÎÊµÑé£¬¶ø¶ÔËùÓÐ×ÏÉ«ÆøÇòÑù±¾ÊµÑéµÄ½á¹û¶¼ÊÇ¡°²»±¬Õ¨¡±¡£Èç¹û´ËÊ±ÏëÔ¤²â¡°×ÏÉ«Ð¡ÆøÇò£¬Ð¡º¢ÓÃ½Å²È¡±µÄ½á¹û£¬ËäÈ»´ÓÖ±¹ÛÉÏÀ´ËµÓ¦¸ÃÊÇ¡°±¬Õ¨¡±£¬µ«ÎÒÃÇ»á·¢ÏÖ£¬´ËÊ±ÓÉÓÚ


p(ÓÃ½Å²È|²»±¬Õ¨)=p(×ÏÉ«|±¬Õ¨)=0
ËùÒÔ»áÖ±½Óµ¼ÖÂ


p^(²»±¬Õ¨)= p^(±¬Õ¨)=0

´Ó¶øÖ»ÄÜËæ»ú½øÐÐ¾ö²ß¡£´ËÊ±¼ÓÈëÆ½»¬Ïî¾ÍÏÔµÃ±È½ÏÖØÒªÁË£¬ÓÉÀ­ÆÕÀ­Ë¹Æ½»¬£¬¿ÉÖª(×¢ÒâÀà±ðµÄÏÈÑé¸ÅÂÊÈÔÈ»²»Ôì³ÉÓ°Ïì)£º 


p(»ÆÉ«|²»±¬Õ¨)=3+16+2£¬p(×ÏÉ«|²»±¬Õ¨)=3+16+2

p(»ÆÉ«|±¬Õ¨)=1+16+2£¬p(×ÏÉ«|±¬Õ¨)=0+16+2

p(Ð¡ÆøÇò|²»±¬Õ¨)=4+16+2£¬p(´óÆøÇò|²»±¬Õ¨)=2+16+2

p(Ð¡ÆøÇò|±¬Õ¨)=4+16+2£¬p(´óÆøÇò|±¬Õ¨)=2+16+2

p(³ÉÈË|²»±¬Õ¨)=2+16+2£¬p(Ð¡º¢|²»±¬Õ¨)=4+16+2

p(³ÉÈË|±¬Õ¨)=3+16+2£¬p(Ð¡º¢|±¬Õ¨)=3+16+2

p(ÓÃÊÖ´ò|²»±¬Õ¨)=6+16+2£¬p(ÓÃ½Å²È|²»±¬Õ¨)=0+16+2

p(ÓÃÊÖ´ò|±¬Õ¨)=1+16+2£¬p(ÓÃ½Å²È|±¬Õ¨)=5+16+2

´Ó¶ø¿ÉËãµÃ£º 


p^(²»±¬Õ¨)=251024£¬p^(±¬Õ¨)=25512
Òò´Ë£¬ÎÒÃÇÈ·ÊµÓ¦¸ÃÈÏÎª¸ø¶¨Ñù±¾Ëùµ¼ÖÂµÄ½á¹ûÊÇ¡°±¬Õ¨¡±¡£
½Ó×ÅÎÒÃÇÀ´¿´¿´ÈçºÎ½øÐÐ3ÖÖÄ£ÐÍµÄÊµÏÖ¡£¿¼ÂÇµ½´úÂëÖØÓÃºÍ¿ÉÍØÕ¹ÐÔ£¬ÐèÒª´î½¨Ò»¸ö»ù±¾¼Ü¹¹£¬ËüÓ¦¸Ã¶¨ÒåºÃ3ÖÖÄ£ÐÍ¶¼»áÓÃµ½µÄÍ¨ÓÃ¹¦ÄÜ£¬ÀýÈç£º 
¤r ¶¨Òå»ñÈ¡ÑµÁ·¼¯ÀïÀà±ðÏÈÑé¸ÅÂÊµÄº¯Êý£» 
¤r ½«ºËÐÄÑµÁ·²½ÖèÒÔÍâµÄÑµÁ·²½Öè½øÐÐ¶¨Òå£¬ÆäÖÐºËÐÄÑµÁ·²½ÖèÐèÒªÑµÁ·³öÒ»¸ö¾ö²ßº¯Êý£¬¸Ã¾ö²ßº¯ÊýÄÜ¹»Êä³ö¸ø¶¨Êý¾ÝµÄºóÑé¸ÅÂÊ£» 
¤r ÀûÓÃ¾ö²ßº¯Êý¶¨ÒåÔ¤²âº¯ÊýºÍÆÀ¹Àº¯Êý¡£
ÎÒÃÇÏÈÀ´¿´¿´Õâ¸ö¼Ü¹¹µÄ»ù±¾¿ò¼Ü£º 

import numpy as np

#¶¨ÒåºÃ±´Ò¶Ë¹Ä£ÐÍµÄ»ùÀà£¬·½±ãÒÔºóµÄÍØÕ¹

class NaiveBayes(ClassifierBase):

"""

self._x,self._y: ¼ÇÂ¼ÑµÁ·¼¯µÄ±äÁ¿

self._data£º ºËÐÄÊý×é£¬´æ´¢Êµ¼ÊÊ¹ÓÃµÄÌõ¼þ¸ÅÂÊµÄÏà¹ØÐÅÏ¢

self._func£º Ä£ÐÍºËÐÄ¡ª¡ª¾ö²ßº¯Êý£¬ÄÜ¹»¸ù¾ÝÊäÈëµÄx¡¢yÊä³ö¶ÔÓ¦µÄºóÑé¸ÅÂÊ

self._n_possibilities£º ¼ÇÂ¼¸÷¸öÎ¬¶ÈÌØÕ÷È¡Öµ¸öÊýµÄÊý×é£º £ÛS1,S2,¡­,SN£Ý

self._labelled_x£º ¼ÇÂ¼°´Àà±ð·Ö¿ªºóµÄÊäÈëÊý¾ÝµÄÊý×é

self._label_zip£º ¼ÇÂ¼Àà±ðÏà¹ØÐÅÏ¢µÄÊý×é£¬ÊÓ¾ßÌåËã·¨£¬¶¨Òå»áÓÐËù²»Í¬

self._cat_counter£º ºËÐÄÊý×é£¬¼ÇÂ¼µÚiÀàÊý¾ÝµÄ¸öÊý(catÊÇcategoryµÄËõÐ´)

self._con_counter£º ºËÐÄÊý×é£¬ÓÃÓÚ¼ÇÂ¼Êý¾ÝÌõ¼þ¸ÅÂÊµÄÔ­Ê¼¼«´óËÆÈ»¹À¼Æ

self._label_dic£º ºËÐÄ×Öµä£¬ÓÃÓÚ¼ÇÂ¼ÊýÖµ»¯Àà±ðÊ±µÄ×ª»»¹ØÏµ

self._feat_dice£º ºËÐÄ×Öµä£¬ÓÃÓÚ¼ÇÂ¼ÊýÖµ»¯¸÷Î¬¶ÈÌØÕ÷(feat)Ê±µÄ×ª»»¹ØÏµ

"""

NaiveBayesTiming = Timing()

def __init__(self, **kwargs):

super(NaiveBayes, self).__init__(**kwargs)

self._x = self._y = None

self._data = self._func = None

self._n_possibilities = None

self._labelled_x = self._label_zip = None

self._cat_counter = self._con_counter = None

self.label_dict = self._feat_dicts = None

self._params£Û"lb"£Ý = kwargs.get("lb", 1)

#ÖØÔØ_getitem_ÔËËã·ûÒÔ±ÜÃâ¶¨Òå´óÁ¿property

def_getitem_(self,item):

if isinstance(item,str):

return getattr(self,"_"+item)

#ÁôÏÂ³éÏó·½·¨ÈÃ×ÓÀà¶¨Òå£¬ÕâÀïµÄtar_idx²ÎÊýºÍself._tar_idxµÄÒâÒåÒ»ÖÂ

def feed_data(self,x,y,sample_weight=None):

pass

#ÁôÏÂ³éÏó·½·¨ÈÃ×ÓÀà¶¨Òå£¬ÕâÀïµÄsample_weight²ÎÊý´ú±í×ÅÑù±¾È¨ÖØ

def feed_sample_weight(self,sample_weight=None):

pass

×¢Òâ£º ÈÃÄ£ÐÍÖ§³ÖÊäÈëÑù±¾È¨ÖØ£¬¸ü¶àµÄÊÇÎªÁËÊ¹Ä£ÐÍÄÜ¹»Ó¦ÓÃÔÚÌáÉý·½·¨ÖÐ¡£ÕâÀïÖ»ËµÒ»¸öÖ±¹ÛÀí½â£º Ñù±¾È¨ÖØÌåÏÖÁË¸÷¸öÑù±¾µÄ¡°ÖØÒªÐÔ¡±¡£
ÉÏÃæÕâÐ©´úÂë¶¨ÒåµÄ»ù±¾¿ò¼Ü»áÔÚ±¾ÊéºÜ¶àËã·¨ÖÐ³öÏÖ£¬¶ÔÓÚÏàÍ¬µÄ½á¹¹£¬²»»áÔÙ½øÐÐÏê¾¡µÄÏà¹Ø×¢ÊÍ¡£Í¬Ñù£¬¼´Ê¹ÊÇÔÚ½ÓÏÂÀ´½éÉÜµÄÆÓËØ±´Ò¶Ë¹Ïà¹ØËã·¨µÄÊµÏÖÖÐ£¬Ò²ÓÐ²»ÉÙÊÇ¾ßÓÐÆÕÊÊÐÔµÄ¡£

#¶¨Òå¾ßÓÐÆÕÊÊÐÔµÄÑµÁ·º¯Êý

@NaiveBayesTiming.timeit(level=2, prefix="£ÛAPI£Ý ")

def fit(self, x=None, y=None, sample_weight=None, lb=None):

if sample_weight is None:

sample_weight = self._params£Û"sample_weight"£Ý

if lb is None:

lb = self._params£Û"lb"£Ý

#Èç¹ûÃ»ÓÐ´«Èëx,y£¬ÄÇÃ´¾ÍÓÃ´«ÈëµÄx,yµÄ³õÊ¼»¯Ä£ÐÍ

if x is not None and y is not None:

self.feed_data(x, y, sample_weight)

#µ÷ÓÃºËÐÄËã·¨µÃµ½¾ö²ßº¯Êý

self._func = self._fit(lb)

#ÁôÏÂ³éÏóºËÐÄËã·¨ÈÃ×ÓÀà¶¨Òå

def _fit(self, lb):

pass

ÒÔÉÏÊÇÄ£ÐÍÑµÁ·Ïà¹ØµÄ¹ý³Ì£¬ÏÂÃæ¾ÍÊÇÄ£ÐÍµÄÔ¤²âºÍÆÀ¹À¹ý³Ì¡£ÓÉÇ³ÈëÉî£¬ÎÒÃÇÏÈ½øÐÐ¡°ÆÓËØµÄ¡±ÊµÏÖ¡£

#¶¨ÒåÔ¤²âµ¥Ò»Ñù±¾µÄº¯Êý

#²ÎÊýget_raw_result¿ØÖÆ¸Ãº¯ÊýÊÇÊä³öÔ¤²âµÄÀà±ð»¹ÊÇÊä³öÏàÓ¦µÄºóÑé¸ÅÂÊ

#get_raw_result=FalseÔòÊä³öÀà±ð£¬get_raw_result=TrueÔòÊä³öºóÑé¸ÅÂÊ

@NaiveBayesTiming.timeit(level=1, prefix="£ÛAPI£Ý ")

def predict_one(self, x, get_raw_result=False):

#ÔÚ½øÐÐÔ¤²âÖ®Ç°£¬ÒªÏÈ°ÑÐÂµÄÊäÈëÊý¾ÝÊýÖµ»¯

#Èç¹ûÊäÈëµÄÊÇNumpyÊý×é£¬ÒªÏÈ½«Ëü×ª»»³ÉPythonµÄÊý×é

#ÕâÊÇÒòÎªPythonÊý×éÔÚÊýÖµ»¯Õâ¸ö²Ù×÷ÉÏÒª¸ü¿ì

if type(x) is np.ndarray:

x = x.tolist()

#·ñÔò£¬¸´ÖÆÊý×é

else:

x = x£Û:£Ý

#µ÷ÓÃÏà¹Ø·½·¨½øÐÐÊýÖµ»¯£¬¸Ã·½·¨Ëæ¾ßÌåÄ£ÐÍµÄ²»Í¬¶ø²»Í¬

x = self._transfer_x(x)

m_arg, m_probability = 0, 0

#±éÀú¸÷Àà±ð¡¢ÕÒµ½ÄÜÊ¹ºóÑé¸ÅÂÊ×î´ó»¯µÄÀà±ð

for i in range(len(self._cat_counter)):

p = self._func(x, i)

if p > m_probability:

m_arg, m_probability = i, p

if not get_raw_result:

return self.label_dict£Ûm_arg£Ý

return m_probability

#¶¨ÒåÔ¤²â¶àÑù±¾µÄº¯Êý£¬±¾ÖÊÊÇ²»¶Ïµ÷ÓÃÉÏÃæ¶¨ÒåµÄpredict_oneº¯Êý

@NaiveBayesTiming.timeit(level=3, prefix="£ÛAPI£Ý ")

def predict(self, x, get_raw_result=False, **kwargs):

return np.array(£Ûself.predict_one(xx, get_raw_result) for xx in x£Ý)

#¶¨ÒåÄÜ¶ÔÐÂÊý¾Ý½øÐÐÆÀ¹ÀµÄ·½·¨£¬ÕâÀïÔÝÒÔ¼òµ¥µØÊä³ö×¼È·ÂÊ×÷ÎªÑÝÊ¾

def evalute(self, x,y):

y_pred=self.predict(x)

print("Acc:{:12.6}%".format(100*np.sum(y_pred==y)/len(y)))

×¢Òâ£º Ö®ËùÒÔ³ÆÉÏÊöÊµÏÖÊÇ¡°ÆÓËØµÄ¡±£¬ÊÇÒòÎªÔ¤²âµ¥Ò»Ñù±¾µÄº¯ÊýÖ»ÊÇÔÚËã·¨Ã»ÓÐÏòÁ¿»¯Ê±µÄÒ»¸öÁÙÊ±²úÎï¡£ÔÚËã·¨Íê³ÉÏòÁ¿»¯ºó£¬Ä£ÐÍ¾ÍÄÜ½øÐÐÅúÁ¿Ô¤²â£¬¸Ãº¯Êý¾Í¿ÉÒÔÉ¾È¥ÁË¡£
3.3.2ÆÓËØ±´Ò¶Ë¹·ÖÀàËã·¨ÊµÏÖ¶þ·ÖÀà
ÆÓËØ±´Ò¶Ë¹ÊÇÒ»ÖÖÓÐ¼à¶½µÄ·ÖÀàËã·¨£¬¿ÉÒÔ½øÐÐ¶þ·ÖÀà»òÕß¶à·ÖÀà¡£
¡¾Àý3ª²4¡¿Ò»¸öÊý¾Ý¼¯ÊµÀýÈç±í3ª²3ËùÊ¾¡£ÏÖÔÚÓÐÒ»¸öÐÂµÄÑù±¾£¬X=(ÄêÁä:<=30,ÊÕÈë:ÖÐ,ÊÇ·ñÑ§Éú:ÊÇ,ÐÅÓþ:ÖÐ)£¬Ä¿±êÊÇÀûÓÃÆÓËØ±´Ò¶Ë¹·ÖÀàÀ´½øÐÐ·ÖÀà¡£


±í3ª²3Êý¾Ý¼¯ÊµÀý



±àºÅ
Ãè Êö Êô ÐÔÀà ±ð Êô ÐÔ
ÄêÁäÊÕÈëÑ§ÉúÐÅÓþ¹ºÂò¼ÆËã»ú

1¡Ü30¸ß·ñÖÐ·ñ
2¡Ü30¸ß·ñÓÅ·ñ
331~40¸ß·ñÖÐÊÇ
4>40ÖÐ·ñÖÐÊÇ
5>40µÍÊÇÖÐÊÇ
6>40µÍÊÇÓÅ·ñ
731~40µÍÊÇÓÅÊÇ
8¡Ü30ÖÐ·ñÖÐ·ñ
9¡Ü30µÍÊÇÖÐÊÇ
10>40ÖÐÊÇÖÐÊÇ
11¡Ü30ÖÐÊÇÓÅÊÇ
1231~40ÖÐ·ñÓÅÊÇ
1331~40¸ßÊÇÖÐÊÇ
14>40ÖÐ·ñÓÅ·ñ

¼ÙÉèÀà±ðÎªC(c1=ÊÇ,c2=·ñ)£¬ÎÒÃÇµÄÄ¿±êÊÇÇó³öp(c1|X)ºÍp(c2|X)£¬±È½ÏË­¸ü´ó£¬¾Í½«X·ÖÎªÄ³¸öÀà¡£
¿ÉÒÔ½«Õâ¸öÊµÀýÖÐµÄÃèÊöÊôÐÔºÍÀà±ðÊôÐÔÓë¹«Ê½¶ÔÓ¦ÆðÀ´£¬È»ºó¼ÆËã¡£
ÃèÊöÊôÐÔA={A1,A2,A3,A4}={ÄêÁä,ÊÕÈë,Ñ§ÉúÓë·ñ,ÐÅÓþ}
A1È¡Öµ·Ö±ðÎªa11='<=30'£¬a12='30~40'£¬a13='>40'
A2È¡Öµ·Ö±ðÎªa21='µÍ'£¬a22='ÖÐ'£¬a23='¸ß'
A3È¡Öµ·Ö±ðÎªa31='ÊÇ'£¬a32='·ñ'
A4È¡Öµ·Ö±ðÎªa41='ÖÐ'£¬a42='ÓÅ'
Àà±ðÊôÐÔC£º c1='ÊÇ'£¬c2='·ñ'
Ñù±¾¿ÉÒÔ±íÊ¾ÎªX=(a11,a22,a31,a41)£¬´ýÇóµÄ¸ÅÂÊ·Ö±ðÊÇ


p(c1X)=p(c1)p(a11|c1)p(a22|c1)p(a31|c1)p(a41|c1)

p(c2X)=p(c2)p(a11|c2)p(a22|c2)p(a31|c2)p(a41|c2)

¼ÆËã¹ý³Ì£º 


p(c1)=914,p(a11|c1)=29,p(a22|c1)=49,p(a31|c1)=69,p(a41|c1)=69

p(c2)=514,p(a11|c2)=35,p(a22|c2)=25,p(a31|c2)=15,p(a41|c2)=25
ËùÒÔ£¬


p(c1X)=914¡Á29¡Á49¡Á59¡Á59¡Ö0.02821

p(c2X)=514¡Á35¡Á25¡Á15¡Á25¡Ö0.006857
ÓÉp(c1X)>p(c2X)¿ÉÖª£¬Ñù±¾X½«±»·ÖÀàÎªc1='ÊÇ'£¬»á¹ºÂò¼ÆËã»ú¡£
ÀûÓÃPython±àÐ´ÉÏÊöÊµÀý¶ÔÓ¦µÄ´úÂëÎª£º 

#Õë¶Ô"Âò¼ÆËã»ú"ÊµÀý½øÐÐÆÓËØ±´Ò¶Ë¹·ÖÀà

if __name__ == '__main__': 

#ÃèÊöÊôÐÔ·Ö±ðÓÃÊý×ÖÌæ»»

#ÄêÁä, <=30-->0, 31~40-->1, >40-->2

#ÊÕÈë, 'µÍ'-->0, 'ÖÐ'-->1, '¸ß'-->2

#ÊÇ·ñÑ§Éú, 'ÊÇ'-->0, '·ñ'-->1

#ÐÅÓþ: 'ÖÐ'-->0, 'ÓÅ'-->1

#Àà±ðÊôÐÔÓÃÊý×ÖÌæ»»

#ÊÇ·ñ¹ºÂò¼ÆËã»úÊÇ-->0, ·ñ-->1

MAP = £Û{'<=30': 0, '31~40': 1, '>40': 2},

{'µÍ': 0, 'ÖÐ': 1, '¸ß': 2},

{'ÊÇ': 0, '·ñ': 1},

{'ÖÐ': 0, 'ÓÅ': 1},

{'ÊÇ': 0, '·ñ': 1}£Ý

#ÑµÁ·Ñù±¾

train_samples = £Û"<=30 ¸ß·ñÖÐ·ñ",

"<=30 ¸ß·ñÓÅ·ñ",

"31~40 ¸ß·ñÖÐÊÇ",

">40 ÖÐ·ñÖÐÊÇ",

">40 µÍÊÇÖÐÊÇ",

">40 µÍÊÇÓÅ·ñ",

"31~40 µÍÊÇÓÅÊÇ",

"<=30 ÖÐ·ñÖÐ·ñ",

"<=30 µÍÊÇÖÐÊÇ",

">40 ÖÐÊÇÖÐÊÇ",

"<=30 ÖÐÊÇÓÅÊÇ",

"31~40 ÖÐ·ñÓÅÊÇ",

"31~40 ¸ßÊÇÖÐÊÇ",

">40 ÖÐ·ñÓÅ·ñ"£Ý

#ÏÂÃæ²½Öè½«ÎÄ×Ö×ª»¯Îª¶ÔÓ¦Êý×Ö

train_samples = £Ûsample.split(' ') for sample in train_samples£Ý

#print(train_samples)

#exit()

train_samples = £Û£ÛMAP£Ûi£Ý£Ûattr£Ý for i, attr in enumerate(sample)£Ýfor sample in train_samples£Ý

#print(train_samples) 

#´ý·ÖÀàÑù±¾

X = '<=30 ÖÐÊÇÖÐ'

X = £ÛMAP£Ûi£Ý£Ûattr£Ý for i, attr in enumerate(X.split(' '))£Ý 

#ÑµÁ·Ñù±¾ÊýÁ¿

n_sample = len(train_samples) 

#µ¥¸öÑù±¾µÄÎ¬¶È£º ÃèÊöÊôÐÔºÍÀà±ðÊôÐÔ¸öÊý

dim_sample = len(train_samples£Û0£Ý) 

#¼ÆËãÃ¿¸öÊôÐÔÓÐÄÄÐ©È¡Öµ

attr = £Û£Ý

for i in range(0, dim_sample):

attr.append(£Û£Ý) 

for sample in train_samples:

for i in range(0, dim_sample):

if sample£Ûi£Ý not in attr£Ûi£Ý:

attr£Ûi£Ý.append(sample£Ûi£Ý) 

#Ã¿¸öÊôÐÔÈ¡ÖµµÄ¸öÊý

n_attr = £Ûlen(attr) for attr in attr£Ý 

#¼ÇÂ¼²»Í¬Àà±ðµÄÑù±¾¸öÊý

n_c = £Û£Ý

for i in range(0, n_attr£Ûdim_sample-1£Ý):

n_c.append(0) 

#¼ÆËã²»Í¬Àà±ðµÄÑù±¾¸öÊý

for sample in train_samples:

n_c£Ûsample£Ûdim_sample-1£Ý£Ý += 1 

#¼ÆËã²»Í¬Àà±ðÑù±¾ËùÕ¼¸ÅÂÊ

p_c = £Ûn_cx / sum(n_c) for n_cx in n_c£Ý

#print(p_c) 

#½«ÓÃ»§°´ÕÕÀà±ð·ÖÀà

samples_at_c = {}

for c in attr£Ûdim_sample-1£Ý:

samples_at_c£Ûc£Ý = £Û£Ý

for sample in train_samples:

samples_at_c£Ûsample£Ûdim_sample-1£Ý£Ý.append(sample) 

#¼ÇÂ¼Ã¿¸öÀà±ðµÄÑµÁ·Ñù±¾ÖÐ£¬È¡´ý·ÖÀàÑù±¾µÄÄ³¸öÊôÐÔÖµµÄÑù±¾¸öÊý

n_attr_X = {}

for c in attr£Ûdim_sample-1£Ý:

n_attr_X£Ûc£Ý = £Û£Ý

for j in range(0, dim_sample-1):

n_attr_X£Ûc£Ý.append(0) 

#¼ÆËãÃ¿¸öÀà±ðµÄÑµÁ·Ñù±¾ÖÐ£¬È¡´ý·ÖÀàÑù±¾µÄÄ³¸öÊôÐÔÖµµÄÑù±¾¸öÊý

for c, samples_at_cx in zip(samples_at_c.keys(), samples_at_c.values()):

for sample in samples_at_cx:

for i in range(0, dim_sample-1):

if X£Ûi£Ý == sample£Ûi£Ý:

n_attr_X£Ûc£Ý£Ûi£Ý += 1 

#×Öµä×ª»¯Îªlist

n_attr_X = list(n_attr_X.values())

#print(n_attr_X) 

#´æ´¢×îÖÕµÄ¸ÅÂÊ

result_p = £Û£Ý

for i in range(0, n_attr£Ûdim_sample-1£Ý):

result_p.append(p_c£Ûi£Ý) 

#¼ÆËã¸ÅÂÊ

for i in range(0, n_attr£Ûdim_sample-1£Ý):

n_attr_X£Ûi£Ý = £Ûx/n_c£Ûi£Ý for x in n_attr_X£Ûi£Ý£Ý

for x in n_attr_X£Ûi£Ý:

result_p£Ûi£Ý *= x 

print('¸ÅÂÊ·Ö±ðÎª', result_p) 

#ÕÒµ½¸ÅÂÊ×î´ó¶ÔÓ¦µÄÄÇ¸öÀà±ð£¬¾ÍÊÇÔ¤²âÑù±¾µÄ·ÖÀàÇé¿ö

predict_class = result_p.index(max(result_p))

print(predict_class)

ÔËÐÐ³ÌÐò£¬Êä³öÈçÏÂ£º 

¸ÅÂÊ·Ö±ðÎª £Û0.0011757789535567313, 0.16457142857142862£Ý

1

Êä³ö½á¹û±íÃ÷£º Ñù±¾±»·ÖÎªµÚÒ»Àà£¬¼´»á¹ºÂò¼ÆËã»ú¡£¶ÔÓ¦µÄ¸ÅÂÊÓëÊÖ¶¯¼ÆËãµÄ½á¹ûÏàÍ¬¡£
3.3.3±´Ò¶Ë¹Ëã·¨ÊµÏÖÀ¬»øÓÊ¼þ·ÖÀà
ÊµÀýËù½²½âµÄÊÇÈçºÎÍ¨¹ýPython½«ÎÄ±¾¶ÁÈ¡£¬²¢ÇÒ½«Ã¿Ò»¸öÎÄ±¾Éú³É¶ÔÓ¦µÄ´ÊÏòÁ¿²¢·µ»Ø¡£ÊµÀýµÄ±³¾°ÊÇ¶Ô30·âÓÊ¼þ(°üº¬15·âÕý³£ÓÊ¼þ¡¢15·âÀ¬»øÓÊ¼þ)Í¨¹ý±´Ò¶Ë¹Ëã·¨½øÐÐ·ÖÀà¡£
Ö÷Òª·ÖÎªÈçÏÂ¼¸¸ö²¿·Ö£º 
£¨1£© ¶ÁÈ¡ËùÓÐÓÊ¼þ£» 
£¨2£© ½¨Á¢´Ê»ã±í£» 
£¨3£© Éú³ÉÃ¿·âÓÊ¼þ¶ÔÓ¦µÄ´ÊÏòÁ¿(´Ê¼¯Ä£ÐÍ)£» 
£¨4£© ÓÃsklearnÖÐµÄÆÓËØ±´Ò¶Ë¹Ëã·¨½øÐÐ·ÖÀà£» 
£¨5£© Éú³ÉÐÔÄÜÆÀ¹À±¨¸æ¡£
ÏÂÃæÏÈ½éÉÜÐèÒªÓÃµ½µÄ¹¦ÄÜº¯Êý¡£Ë¼Â·£º ÓÃËù¸øµÄÎÄ±¾½¨Á¢Ò»¸ö´Ê»ã±í£¬¾ÍÊÇ½«ÓÃËùÓÐ³öÏÖµÄµ¥´Ê¹¹³ÉÒ»¸ö²»ÖØ¸´µÄ¼¯ºÏ£¬¼´²»º¬Í¬Ò»¸öµ¥´Ê¡£

def createVocabList(dataSet):

vocabSet = set(£Û£Ý)#´´½¨¿Õ¼¯

for document in dataSet:

vocabSet = vocabSet | set(document) #Á½¸ö²¢¼¯

return list(vocabSet)

postingList=£Û£Û'my', 'dog', 'dog','has'£Ý£Ý

print(createVocabList(postingList))

>>>£Û'has', 'my', 'dog'£Ý

½«ËùÓÐµÄ´óÐ´×ÖÄ¸×ª»»³ÉÐ¡Ð´×ÖÄ¸£¬²¢ÇÒÈ¥µô³¤¶ÈÐ¡ÓÚÁ½¸ö×Ö·ûµÄµ¥´Ê£º 

def textParse(bigString):#ÊäÈëÒ»¸ö´ó×Ö·û´®£¬Êä³öÊÇµ¥´ÊÁÐ±í

import re

listOfTokens = re.split(r'£ÜW*', bigString)

return £Ûtok.lower() for tok in listOfTokens if len(tok) > 2£Ý

#È¥µô³¤¶ÈÐ¡ÓÚÁ½¸ö×Ö·ûµÄµ¥´Ê£¬2¿ÉÒÔ×Ô¼ºµ÷½Ú

s = 'i Love YYUU'

print(textParse(s))

>> £Û'love', 'yyuu'£Ý

¹¹½¨´ÊÏòÁ¿ÓÐÁ½ÖÖ·½Ê½£º µÚÒ»ÖÖÊÇÓÃÎÄ±¾ÖÐ³öÏÖµÄµ¥´Ê£¬Í¬´Ê»ã±íÏòÁ¿½øÐÐ¶Ô±È£¬Èç¹û³öÏÖÔÚ´Ê»ã±íÖÐ£¬Ôò¶ÔÓ¦Î»ÖÃÎª1£¬·´Ö®Îª0¡£ÕâÖÖ·½Ê½Ö»¹ÜÓÐÎÞ³öÏÖ£¬²»¹Ü³öÏÖ´ÎÊý£¬³ÆÎª´Ê¼¯Ä£ÐÍ(setª²ofª²words model)£» µÚ¶þÖÖÊÇÍ¬Ê±Í³¼Æ³öÏÖ´ÎÊý£¬³ÆÎª´Ê´üÄ£ÐÍ(bagª²ofª²words model)¡£

def setOfWords2Vec(vocabList, inputSet):

returnVec = £Û0£Ý*len(vocabList)

for word in inputSet:

if word in vocabList:

returnVec£ÛvocabList.index(word)£Ý = 1

else: print( "the word: %s is not in my Vocabulary!" % word)

return returnVec

vocabulary = £Û'wo','do','like','what','go'£Ý

text = £Û'do','go','what','do'£Ý

print(setOfWords2Vec(vocabulary,text))

>> £Û0, 1, 0, 1, 1£Ý

def bagOfWords2Vec(vocabList, inputSet):

returnVec = £Û0£Ý*len(vocabList)

for word in inputSet:

if word in vocabList:

returnVec£ÛvocabList.index(word)£Ý += 1

else: print("the word: %s is not in my Vocabulary!" % word)

return returnVec

vocabulary = £Û'wo','do','like','what','go'£Ý

text = £Û'do','go','what','do'£Ý

print(setOfWords2Vec(vocabulary,text))

>> £Û0, 2, 0, 1, 1£Ý

½«ÉÏÃæ3¸öº¯ÊýÐ´ÔÚÒ»Æð£» ÏÂÃæµÄ²Ù×÷·½Ê½Ö»ÊÇÕë¶Ô±¾Àý£¬µ«ÊÇÖ»ÒªÉÔ×öÐÞ¸ÄÍ¬ÑùÄÜ¹»ÊÊÓÃÓÚÆäËû³¡ºÏ¡£

def createVocabList(dataSet):#½¨Á¢´Ê»ã±í

vocabSet = set(£Û£Ý)#´´½¨¿Õ¼¯

for document in dataSet:

vocabSet = vocabSet | set(document) #Á½¸ö²¢¼¯

return list(vocabSet)

def setOfWords2Vec(vocabList, inputSet):#½¨Á¢´ÊÏòÁ¿

returnVec = £Û0£Ý*len(vocabList)

for word in inputSet:

if word in vocabList:

returnVec£ÛvocabList.index(word)£Ý = 1

else: print("the word: %s is not in my Vocabulary!" % word)

return returnVec

def textParse(bigString):#ÊäÈëÒ»¸ö´ó×Ö·û´®£¬Êä³öÊÇµ¥´ÊÁÐ±í

import re

listOfTokens = re.split(r'£ÜW*', bigString)

return £Ûtok.lower() for tok in listOfTokens if len(tok) > 2£Ý

def preProcessing():

docList=£Û£Ý; classList = £Û£Ý; fullText =£Û£Ý

for i in range(1,26):

wordList = textParse(open('email/spam/%d.txt' % i).read())

docList.append(wordList)#¶ÁÈ¡ÎÄ±¾

classList.append(1)#¶ÁÈ¡Ã¿¸öÎÄ±¾µÄ±êÇ©

wordList = textParse(open('email/ham/%d.txt' % i).read())

docList.append(wordList)

classList.append(0)

vocabList = createVocabList(docList)#create vocabulary#Éú³É´ÊÏò±í

data = £Û£Ý

target = classList

for docIndex in range(30):#±¾ÀýÒ»¹²ÓÐ30¸öÎÄ±¾

data.append(setOfWords2Vec(vocabList,docList£ÛdocIndex£Ý))Éú³É´ÊÏòÁ¿

return data,target#·µ»Ø´¦ÀíºÃµÄ´ÊÏòÁ¿ºÍ±êÇ©

¶ÔÊý¾Ý½øÐÐÑµÁ·²¢Ô¤²â£º 

import textProcess as tp

from sklearn.naive_bayes import MultinomialNB

from sklearn.cross_validation import train_test_split

from sklearn.metrics import classification_report

data,target= tp.preProcessing()

X_train,X_test,y_train,y_test = train_test_split(data,target,test_size=0.25)

mnb = MultinomialNB()

mnb.fit(X_train,y_train)

y_pre = mnb.predict((X_test))

print (y_pre) #Ô¤²â½á¹û

print (y_test) #Êµ¼Ê½á¹û

print ('The accuracy of Naive Bayes Classifier is',mnb.score(X_test,y_test))

print (classification_report(y_test,y_pre))

3.3.4MultinomialNBµÄÊµÏÖ
¶ÔÓÚÀëÉ¢ÐÍÆÓËØ±´Ò¶Ë¹Ä£ÐÍµÄÊµÏÖ£¬ÓÉÓÚºËÐÄËã·¨¶¼ÊÇÔÚ½øÐÐ¡°¼ÆÊý¡±¹¤×÷£¬ËùÒÔÎÊÌâµÄ¹Ø¼ü¾Í×ª»»ÎªÈçºÎ½øÐÐ¼ÆÊý¡£ÐÒÔËµÄÊÇ£¬NumpyÖÐµÄÒ»¸ö·½·¨¡ª¡ªbincount¾ÍÊÇ×¨ÃÅÓÃÀ´¼ÆÊýµÄ£¬ËüÄÜ¹»·Ç³£¿ìËÙµØÊý³öÒ»¸öÊý×éÖÐ¸÷¸öÊý×Ö³öÏÖµÄÆµÂÊ£» ¶øÇÒÓÉÓÚËüÊÇNumpy×Ô´øµÄ·½·¨£¬ÆäËÙ¶È±ÈPython±ê×¼¿âcollectionsÖÐµÄ¼ÆÊýÆ÷Counter»¹Òª¿ìÉÏÐí¶à¡£²»ÐÒµÄÊÇ£¬¸Ã·½·¨ÓÐÁ½¸öÈ±µã£º 
¤r Ö»ÄÜ´¦Àí·Ç¸ºÕûÊýÐÍµÄÊý×é£» 
¤r ÏòÁ¿ÖÐµÄ×î´óÖµ¼´Îª·µ»ØµÄÊý×éµÄ³¤¶È£¬»»¾ä»°Ëµ£¬Èç¹ûÓÃbincount·½·¨¶ÔÒ»¸ö³¤¶ÈÎª1¡¢ÔªËØÎª1000µÄÊý×é¼ÆÊý£¬·µ»ØµÄ½á¹û¾ÍÊÇ999¸ö0¼Ó1¸ö1¡£
ËùÒÔÔÚ×öÊý¾ÝÔ¤´¦ÀíÊ±¾ÍÒª³ä·Ö¿¼ÂÇµ½ÕâÁ½µã£¬¾ßÌå´úÂëÎª£º 

#µ¼Èë»ù±¾¼Ü¹¹Basic

from b_NaiveBayes.Original.Basic import *

class MultinomialNB(NaiveBayes):

#¶¨ÒåÔ¤´¦ÀíÊý¾ÝµÄ·½·¨

def feed_data(self, x, y, sample_weight=None):

#·ÖÇé¿ö½«ÊäÈëÏòÁ¿x½øÐÐ×ªÖÃ

if isinstance(x,list):

features=map(list,zip(*x))

else:

features=x.T

#ÀûÓÃPythonÖÐÄÚÖÃµÄ¸ß¼¶Êý¾Ý½á¹¹¡ª¡ª¼¯ºÏ£¬»ñÈ¡¸÷¸öÎ¬¶ÈµÄÌØÕ÷ºÍÀà±ð

#ÎªÁËÀûÓÃbincount·½·¨À´ÓÅ»¯Ëã·¨£¬½«ËùÓÐÌØÕ÷´Ó0¿ªÊ¼ÊýÖµ»¯

#×¢Òâ£º ÐèÒª½«ÊýÖµ»¯¹ý³ÌÖÐµÄ×ª»»¹ØÏµ¼ÇÂ¼³É×Öµä£¬·ñÔòÎÞ·¨¶ÔÐÂÊý¾Ý½øÐÐÅÐ¶Ï

features=£Ûset(feat) for feat in features£Ý

feat_dics=£Û{_1:i for i,_1 in enumerate(feats)} for feats in features£Ý

label_dic={_1:i for i, _1 in enumerate(set(y))}

#ÀûÓÃ×ª»»×Öµä¸üÐÂÑµÁ·¼¯

x=np.array(£Û£Ûfeat_dics£Ûi£Ý£Û_1£Ý for i,_1 in enumerate(sample)£Ýfor sample in features£Ý)

y=np.array(£Ûlabel_dic£Ûyy£Ý for yy in y£Ý)

#ÀûÓÃNumpyÖÐµÄbincount·½·¨£¬»ñµÃ¸÷Àà±ðµÄÊý¾ÝµÄ¸öÊý

cat_counter = np.bincount(y)

#¼ÇÂ¼¸÷Î¬¶ÈÌØÕ÷µÄÈ¡Öµ¸öÊý

n_possibilities = £Ûlen(feats) for feats in features£Ý

#»ñÈ¡¸÷Àà±ðÊý¾ÝµÄÏÂ±ê

labels = £Ûy == value for value in range(len(cat_counter))£Ý

#ÀûÓÃÏÂ±ê»ñÈ¡¼ÇÂ¼°´Àà±ð·Ö¿ªºóµÄÊäÈëÊý¾ÝµÄÊý×é

labelled_x = £Ûx£Ûci£Ý.T for ci in labels£Ý

#¸üÐÂÄ£ÐÍµÄ¸÷¸öÊôÐÔ

self._x, self._y = x, y

self._labelled_x, self._label_zip = labelled_x, list(zip(labels, labelled_x))

self._cat_counter, self._feat_dicts, self._n_possibilities = cat_counter, feat_dicts, n_possibilities

self.label_dict = label_dict

#µ÷ÓÃ´¦ÀíÑù±¾È¨ÖØµÄº¯Êý£¬ÒÔ¸üÐÂ¼ÇÂ¼Ìõ¼þ¸ÅÂÊµÄÊý×é

self.feed_sample_weight(sample_weight)

#¶¨Òå´¦ÀíÑù±¾È¨ÖØµÄº¯Êý

def feed_sample_weight(self, sample_weight=None):

self._con_counter = £Û£Ý

#ÀûÓÃNumpyµÄbincount·½·¨»ñÈ¡´øÈ¨ÖØµÄÌõ¼þ¸ÅÂÊµÄ¼«´óËÆÈ»¹À¼Æ

for dim, p in enumerate(self._n_possibilities):

if sample_weight is None:

self._con_counter.append(£Û

np.bincount(xx£Ûdim£Ý, minlength=p) for xx in self._labelled_x£Ý)

else:

local_weights = sample_weight * len(sample_weight)

self._con_counter.append(£Û

np.bincount(xx£Ûdim£Ý, weights=local_weights£Ûlabel£Ý, minlength=p)

for label, xx in self._label_zip£Ý)

×¢Òâ£º ÕâÑù×öÈ·Êµ»áÈÃÑµÁ·¹ý³Ì¼ÓËÙºÜ¶à£¬µ«ÊÇÍ¬Ê±Ò²»áÊ¹Ô¤²â¹ý³ÌµÄËÙ¶ÈÏÂ½µÒ»Ð©(ÒòÎªÔ¤²âÊ±ÒªÏÈ½«ÊäÈëÊý¾ÝÊýÖµ»¯)£» ÊÓ¾ßÌåÇé¿öµÄ²»Í¬£¬Êý¾ÝÔ¤´¦Àí²¿·ÖµÄÊµÏÖ¿ÉÒÔÓÐËù²»Í¬¡£
ÏÂÃæµÄºËÐÄº¯Êý¾Í±äÎªµ÷ÓÃÓëÕûºÏÊý¾ÝÔ¤´¦ÀíÊ±¼ÇÂ¼ÏÂÀ´µÄÐÅÏ¢µÄ¹ý³Ì£º 

#¶¨ÒåºËÐÄÑµÁ·º¯Êý

def _fit(self, lb):

n_dim = len(self._n_possibilities)

n_category = len(self._cat_counter)

p_category = self.get_prior_probability(lb)

#data¼´Îª´æ´¢¼ÓÁËÆ½»¬ÏîºóµÄÌõ¼þ¸ÅÂÊµÄÊý×é

data = £Û£Û£Ý for _ in range(n_dim)£Ý

for dim, n_possibilities in enumerate(self._n_possibilities):

data£Ûdim£Ý = £Û

£Û(self._con_counter£Ûdim£Ý£Ûc£Ý£Ûp£Ý + lb) / (self._cat_counter£Ûc£Ý + lb * n_possibilities)

for p in range(n_possibilities)£Ý for c in range(n_category)£Ý

self._data = £Ûnp.asarray(dim_info) for dim_info in data£Ý

#ÀûÓÃdataÉú³É¾ö²ßº¯Êý

def func(input_x, tar_category):

rs = 1

#±éÀú¸÷¸öÎ¬¶È£¬ÀûÓÃdataºÍÌõ¼þ¶ÀÁ¢ÐÔ¼ÙÉè¼ÆËãÁªºÏÌõ¼þ¸ÅÂÊ

for d, xx in enumerate(input_x):

rs *= data£Ûd£Ý£Ûtar_category£Ý£Ûxx£Ý

#ÀûÓÃÏÈÑé¸ÅÂÊºÍÁªºÏÌõ¼þ¸ÅÂÊ¼ÆËãºóÑé¸ÅÂÊ

return rs * p_category£Ûtar_category£Ý

#·µ»Ø¾ö²ßº¯Êý

return func

#¶¨ÒåÊýÖµ»¯Êý¾ÝµÄº¯Êý

def _transfer_x(self, x):

for j, char in enumerate(x):

x£Ûj£Ý = self._feat_dicts£Ûj£Ý£Ûchar£Ý

return x

ÖÁ´Ë£¬µÚÒ»¸öÍ¨ÓÃµÄÆÓËØ±´Ò¶Ë¹Ä£ÐÍ¾ÍÍêÈ«´î½¨Íê±ÏÁË£¬¿ÉÒÔÓÃÖ®Ç°µÄÆøÇòÊý¾Ý¼¯1.0¡¢1.5À´¼òµ¥µØÆÀ¹ÀÎÒÃÇµÄÄ£ÐÍ¡£Ê×ÏÈÒª¶¨ÒåÒ»¸öÄÜ¹»½«ÎÄ¼þµÄÊý¾Ý×ª»¯ÎªPythonÊý×éµÄÀà£º 

def get_dataset(name, path, n_train=None, tar_idx=None, shuffle=True,

quantize=False, quantized=False, one_hot=False, **kwargs):

x = £Û£Ý

#½«±àÂëÉèÎªutf8ÒÔ±ã¶ÁÈëÖÐÎÄµÈÌØÊâ×Ö·û

with open(path, "r", encoding="utf8") as file:

if DataUtil.is_naive(name):

#Èç¹ûÊÇÆøÇòÊý¾Ý¼¯µÄ»°£¬Ö±½ÓÒÀ¶ººÅ·Ö¸ôÊý¾Ý¼´¿É

if "balloon" in name:

for sample in file:

x.append(sample.strip().split(","))

#Ä¬ÈÏ´òÂÒÊý¾Ý

if shuffle:

np.random.shuffle(x)

#Ä¬ÈÏÀà±ðÔÚ×îºóÒ»ÁÐ

tar_idx = -1 if tar_idx is None else tar_idx

y = np.array(£Ûxx.pop(tar_idx) for xx in x£Ý)

x=np.array(x)

#Ä¬ÈÏÈ«²¿¶¼ÊÇÑµÁ·Ñù±¾

if quantized:

return x, y

#Èç¹û´«ÈëÁËÑµÁ·Ñù±¾Êý£¬ÔòÒÀÖ®½«Êý¾Ý¼¯ÇÐ·ÖÎªÑµÁ·¼¯ºÍ²âÊÔ¼¯

return(x£Û:n_train£Ý, y£Û:n_train£Ý), (x£Ûn_train:£Ý, y£Ûn_train:£Ý)

ÒÔÏÂÎªMultinomialNBµÄÆÀ¹À´úÂë£º 

if __name__ == '__main__':

#µ¼Èë±ê×¼¿âtimeÒÔ¼ÆÊ±£¬µ¼ÈëDataUtilÀàÒÔ»ñÈ¡Êý¾Ý

from Util import DataUtil

import time

#±éÀú1.0¡¢1.5Á½¸ö°æ±¾µÄÆøÇòÊý¾Ý¼¯

for dataset in ("balloon1.0", "balloon1.5"):

#¶ÁÈëÊý¾Ý

_x, _y = DataUtil.get_dataset(dataset, "../../_Data/{}.txt".format(dataset))

#ÊµÀý»¯Ä£ÐÍ²¢½øÐÐÑµÁ·£¬Í¬Ê±¼ÇÂ¼Õû¸ö¹ý³Ì»¨·ÑµÄÊ±¼ä

learning_time = time.time()

nb = MultinomialNB()

nb.fit(_x, _y)

learning_time = time.time() - learning_time

print("=" * 30)

print(dataset)

print("-" * 30)

#ÆÀ¹ÀÄ£ÐÍµÄ±íÏÖ£¬Í¬Ê±¼ÇÂ¼ÆÀ¹À¹ý³Ì»¨·ÑµÄÊ±¼ä

estimation_time = time.time()

nb.evaluate(_x, _y)

estimation_time = time.time() - estimation_time

#½«¼ÇÂ¼ÏÂÀ´µÄºÄÊ±Êä³ö

print(

"Model building: {:12.6} s£Ün"

"Estimation: {:12.6} s£Ün"

"Total : {:12.6} s".format(

learning_time, estimation_time,

learning_time + estimation_time

)

)

ÔËÐÐÒÔÉÏ´úÂë£¬µÃµ½½á¹û£º 

balloo1.0

Acc:100.0%

Model building: 0.0s

Estimation: 0.0s

Total : 0.0s

------------------------------------------------

balloo1.5

Acc:91.6667%

Model building: 0.0s

Estimation: 0.0s

Total : 0.0s

ÓÉÓÚÊý¾ÝÁ¿Ì«ÉÙ£¬ËùÒÔ½¨Ä£ºÍÆÀ¹ÀµÄ¹ý³ÌºÄ·ÑµÄÊ±¼äÒÑÊÇ¿ÉÒÔºöÂÔ²»¼ÆµÄ³Ì¶È¡£ÆøÇòÊý¾Ý¼¯1.5ÊÇ¡°²»Ì«¾ùºâ¡±µÄÊý¾Ý¼¯£¬ËùÒÔÆÓËØ±´Ò¶Ë¹ÔÚÆäÉÏµÄ±íÏÖ»á±È½Ï²î¡£
½ö½öÔÚÒ»¸öÐé¹¹µÄÊý¾Ý¼¯ÉÏ½øÐÐÆÀ¹À¿ÉÄÜ²»Ì«ÓÐËµ·þÁ¦£¬ÏÂÃæÍ¨¹ý×Ô´øµÄdigitsÊý¾ÝÀ´ÆÀ¹ÀÎÒÃÇµÄÄ£ÐÍ¡£
¡¾Àý3ª²5¡¿Í¨¹ýdigitsÊý¾ÝÀ´ÆÀ¹ÀÄ£ÐÍ¡£
(1) µ¼Èë±ØÒªµÄ¿â¡£

from sklearn import datasets,cross_validation,naive_bayes

import numpy as np

import matplotlib.pyplot as plt

(2) ÏÔÊ¾Digit DatasetÊý¾Ý¼¯¡£

def show_digits():

digits=datasets.load_digits()

fig=plt.figure()

print("vector from images 0:",digits.data£Û0£Ý)

for i in range(25):

ax=fig.add_subplot(5,5,i+1)

ax.imshow(digits.images£Ûi£Ý,cmap=plt.cm.gray_r,interpolation='nearest')

plt.show()#Ð§¹ûÈçÍ¼3ª²2ËùÊ¾

show_digits()

vector from images 0: £Û 0.0.5. 13.9.1.0.0.0.0. 13. 15. 10. 15.5.0.0.3.

15.2.0. 11.8.0.0.4. 12.0.0.8.8.0.0.5.8.0.

0.9.8.0.0.4. 11.0.1. 12.7.0.0.2. 14.5. 10. 12.

0.0.0.0.6. 13. 10.0.0.0.£Ý



Í¼3ª²2Digit DatasetÊý¾Ý¼¯


(3) ¼ÓÔØÊý¾Ý¡£

def load_data():

digits=datasets.load_digits()

return cross_validation.train_test_split(digits.data,digits.target,test_size=0.25,random_state=0)

(4) ²âÊÔ¶àÏîÊ½±´Ò¶Ë¹·ÖÀàÆ÷¡£

def test_MultinomialNB(*data):

X_train,X_test,y_train,y_test=data

cls=naive_bayes.MultinomialNB()

cls.fit(X_train,y_train)

print('Training Score:%.2f'%cls.score(X_train,y_train))

print('Testing Score:%.2f'%cls.score(X_test,y_test))

X_train,X_test,y_train,y_test=load_data()

test_MultinomialNB(X_train,X_test,y_train,y_test)

(5) ¼ìÑé²»Í¬µÄa¶Ô¶àÏîÊ½±´Ò¶Ë¹·ÖÀàÆ÷µÄÔ¤²âÐÔÄÜµÄÓ°Ïì¡£

def test_MultinomialNB_alpha(*data):

X_train,X_test,y_train,y_test=data

alphas=np.logspace(-2,5,num=200)

train_scores=£Û£Ý

test_scores=£Û£Ý

for alpha in alphas:

cls=naive_bayes.MultinomialNB(alpha=alpha)

cls.fit(X_train,y_train)

train_scores.append(cls.score(X_train,y_train))

test_scores.append(cls.score(X_test,y_test))

#»æÍ¼

fig=plt.figure()

ax=fig.add_subplot(1,1,1)

ax.plot(alphas,train_scores,label="Training Score")

ax.plot(alphas,test_scores,label="Testing Score")

ax.set_xlabel(r"$alpha$")

ax.set_ylabel("score")

ax.set_ylim(0,1.0)

ax.set_title("MultinomialNB")

ax.set_xscale("log")

plt.show() #Ð§¹ûÈçÍ¼3ª²3ËùÊ¾

X_train,X_test,y_train,y_test=load_data()

test_MultinomialNB_alpha(X_train,X_test,y_train,y_test)

Training Score:0.91

Testing Score:0.91



Í¼3ª²3MultinomialNBÔ¤²âÐÔÄÜÇúÏßÍ¼


3.3.5GaussianNBµÄÊµÏÖ
ÓÐÁËÊµÏÖÀëÉ¢ÆÓËØ±´Ò¶Ë¹µÄ¾­Ñé£¬¾Í¿ÉÒÔ´¥ÀàÅÔÍ¨µØÊµÏÖÁ¬ÐøÆÓËØ±´Ò¶Ë¹Ä£ÐÍÁË¡£
´¦ÀíÁ¬ÐøÐÍ±äÁ¿ÓÐÒ»¸ö×îÖ±¹ÛµÄ·½·¨£º Ê¹ÓÃÐ¡Çø¼äÇÐ¸î£¬Ö±½ÓÊ¹ÆäÀëÉ¢»¯¡£ÓÉÓÚÕâÖÖ·½·¨½ÏÄÑ¿ØÖÆÐ¡Çø¼äµÄ´óÐ¡£¬¶øÇÒ¶ÔÑµÁ·¼¯ÖÊÁ¿µÄÒªÇó±È½Ï¸ß£¬ËùÒÔÑ¡ÓÃµÚ¶þÖÖ·½·¨£º ¼ÙÉè¸Ã±äÁ¿·þ´ÓÕýÌ¬·Ö²¼(»ò³Æ¸ßË¹·Ö²¼£¬Gaussian Distribution)£¬ÔÙÀûÓÃ¼«´óËÆÈ»¹À¼ÆÀ´¼ÆËã¸Ã±äÁ¿µÄ¡°Ìõ¼þ¸ÅÂÊ¡±(½öÕ¹Ê¾ºÍÀëÉ¢ÐÍËã·¨ÖÐ²»Í¬µÄ²¿·Ö)£¬¾ßÌå¹ý³ÌÎª£º 
(1) ÓëÀëÉ¢ÐÍËã·¨Ò»ÖÂ¡£
(2) ¼ÆËã¡°Ìõ¼þ¸ÅÂÊ¡±p(X(j)=ajl|y=ck)£º 


p(X(j)=ajl|y=ck)=12¦Ð¦Òjke-(ajl-¦Ìjk)22¦Ò2jk

ÕâÀïÓÐÁ½¸ö²ÎÊý¦Ìjk¡¢¦Òjk£¬ËüÃÇ¿ÉÒÔÓÃ¼«´óËÆÈ»¹À¼Æ·¨¶¨Òå£º 


¦Ì^jk=1Nk¡ÆNi=1x(j)iI(yi=ck)

¦Ò2jk=1Nk¡ÆNi=1(x(j)i-¦Ìjk)2I(yi=ck)

×¢Òâ£º ÕâÀïµÄ¡°Ìõ¼þ¸ÅÂÊ¡±ÆäÊµÊÇ¡°Ìõ¼þ¸ÅÂÊÃÜ¶È¡±£¬ÕæÕýµÄÌõ¼þ¸ÅÂÊÆäÊµÊÇ0(ÒòÎªÁ¬ÐøÐÍ±äÁ¿µ¥µã¸ÅÂÊÎª0)¡£ÕâÑù×öµÄºÏÀíÐÔÉæ¼°±È½ÏÉîµÄ¸ÅÂÊÂÛÖªÊ¶£¬´Ë´¦²»½éÉÜ¡£
ËùÒÔÔÚÊµÏÖGaussianNBÖ®Ç°£¬ÐèÒªÏÈÊµÏÖÒ»¸öÄÜ¹»¼ÆËãÕýÌ¬·Ö²¼ÃÜ¶ÈºÍ½øÐÐÕýÌ¬·Ö²¼¼«´óËÆÈ»¹À¼ÆµÄÀà£º 

import numpy as np

from math import pi, exp

#¼ÇÂ¼sqrt(2¦Ð)£¬±ÜÃâ¸ÃÏîµÄÖØ¸´ÔËËã

sqrt_pi = (2 * pi) ** 0.5

class NBFunctions:

#¶¨ÒåÕýÌ¬·Ö²¼µÄÃÜ¶Èº¯Êý

@staticmethod

def gaussian(x, mu, sigma):

return exp(-(x - mu) ** 2 / (2 * sigma ** 2)) / (sqrt_pi * sigma) 

#¶¨Òå½øÐÐ¼«´óËÆÈ»¹À¼ÆµÄº¯Êý

#ËüÄÜ·µ»ØÒ»¸ö´æ´¢×Å¼ÆËãÌõ¼þ¸ÅÂÊÃÜ¶ÈµÄº¯ÊýµÄÁÐ±í

@staticmethod

def gaussian_maximum_likelihood(labelled_x, n_category, dim):

mu = £Ûnp.sum(

labelled_x£Ûc£Ý£Ûdim£Ý) / len(labelled_x£Ûc£Ý£Ûdim£Ý) for c in range(n_category)£Ý

sigma = £Ûnp.sum(

(labelled_x£Ûc£Ý£Ûdim£Ý-mu£Ûc£Ý)**2)/len(labelled_x£Ûc£Ý£Ûdim£Ý) for c in range(n_category)£Ý

#ÀûÓÃ¼«´óËÆÈ»¹À¼ÆµÃµ½µÄ¦ÌºÍ¦Ò£¬¶¨ÒåÉú³É¼ÆËãÌõ¼þ¸ÅÂÊÃÜ¶ÈµÄº¯Êýfunc

def func(_c):

def sub(x):

return NBFunctions.gaussian(x, mu£Û_c£Ý, sigma£Û_c£Ý)

return sub

#ÀûÓÃfunc·µ»ØÄ¿±êÁÐ±í

return £Ûfunc(_c=c) for c in range(n_category)£Ý

ÓÉÓÚËã·¨ÖÐÖ»ÓÐÌõ¼þ¸ÅÂÊÏà¹ØµÄ¶¨Òå±äÁË£¬ËùÒÔÖ»ÐèÒª½«Ïà¹ØµÄº¯ÊýÖØÐÂ¶¨Òå¼´¿É¡£´ËÍâ£¬ÓÉÓÚÊäÈëÊý¾Ý¿Ï¶¨ÊÇÊýÖµÊý¾Ý£¬ËùÒÔÊý¾ÝÔ¤´¦Àí»á¼òµ¥²»ÉÙ(ÖÁÉÙ²»ÓÃÒòÎªÒª¶ÔÊäÈë½øÐÐÌØÊâµÄÊýÖµ»¯´¦Àí¶ø¼ÇÂ¼Æä×ª»»×ÖµäÁË)¡£¿¼ÂÇµ½MultinomialNB´¦µÄ×¢ÊÍ»ù±¾ÉÏ°Ñ¿ò¼ÜµÄË¼Ïë¶¼ËµÃ÷Çå³þÁË£¬Òò´ËÔÚ½ÓÏÂÀ´µÄGaussianNBµÄ´úÂëÊµÏÖÖÐ»áÊÊµ±¼õÉÙ×¢ÊÍ¡£
¡¾Àý3ª²6¡¿Á¬ÐøÐÍÆÓËØ±´Ò¶Ë¹µÄÊµÏÖ¡£

from b_NaiveBayes.Original.Basic import *

class GaussianNB(NaiveBayes):

GaussianNBTiming = Timing()

def feed_data(self, x, y, sample_weight=None):

#¼òµ¥µØµ÷ÓÃPython×Ô´øµÄfloat·½·¨½«ÊäÈëÊý¾ÝÊýÖµ»¯

x = np.array(£Ûlist(map(lambda c: float(c), sample)) for sample in x£Ý)

#ÊýÖµ»¯Àà±ðÏòÁ¿

labels = list(set(y))

label_dict = {label: i for i, label in enumerate(labels)}

y = np.array(£Ûlabel_dict£Ûyy£Ý for yy in y£Ý)

cat_counter = np.bincount(y)

labels = £Ûy == value for value in range(len(cat_counter))£Ý

labelled_x = £Ûx£Ûlabel£Ý.T for label in labels£Ý

#¸üÐÂÄ£ÐÍµÄ¸÷¸öÊôÐÔ

self._x, self._y = x.T, y

self._labelled_x, self._label_zip = labelled_x, labels

self._cat_counter, self.label_dict = cat_counter, {i: l for l, i in label_dict.items()}

self.feed_sample_weight(sample_weight)

¿ÉÒÔ¿´µ½£¬Êý¾ÝÔ¤´¦ÀíÕâÒ»²½È·ÊµÒªÇáËÉºÜ¶à¡£½Ó×ÅÖ»ÐèÒªÔÙ¶¨ÒåÑµÁ·ÓÃµÄ´úÂë¾Í¿ÉÒÔÁË£¬ËüÃÇºÍMultinomialNBÖÐµÄÊµÏÖ´óÍ¬Ð¡Òì£º 

#¶¨Òå´¦ÀíÑù±¾È¨ÖØµÄº¯Êý

def feed_sample_weight(self, sample_weight=None):

if sample_weight is not None:

local_weights = sample_weight * len(sample_weight)

for i, label in enumerate(self._label_zip):

self._labelled_x£Ûi£Ý *= local_weights£Ûlabel£Ý

@GaussianNBTiming.timeit(level=1, prefix="£ÛCore£Ý ")

def _fit(self, lb):

n_category = len(self._cat_counter)

p_category = self.get_prior_probability(lb)

#ÀûÓÃ¼«´óËÆÈ»¹À¼Æ»ñµÃ¼ÆËãÌõ¼þ¸ÅÂÊµÄº¯Êý£¬Ê¹ÓÃÊý×é±äÁ¿data½øÐÐ´æ´¢

data = £Û

NBFunctions.gaussian_maximum_likelihood(

self._labelled_x, n_category, dim) for dim in range(len(self._x))£Ý

self._data = data

def func(input_x, tar_category):

rs = 1

for d, xx in enumerate(input_x):

#ÓÉÓÚdataÖÐ´æ´¢µÄÊÇº¯Êý£¬ËùÒÔÐèÒªµ÷ÓÃËüÀ´½øÐÐÌõ¼þ¸ÅÂÊµÄ¼ÆËã

rs *= data£Ûd£Ý£Ûtar_category£Ý(xx)

return rs * p_category£Ûtar_category£Ý

return func

ÓÉÓÚÊý¾Ý±¾Éí¾ÍÊÇÊýÖµµÄ£¬ËùÒÔÊý¾Ý×ª»»º¯ÊýÖ»ÐèÖ±½Ó·µ»ØÊäÈëÖµ¼´¿É£º 

@staticmethod

def _transfer_x(x):

return x

ÖÁ´Ë£¬Á¬ÐøÐÍÆÓËØ±´Ò¶Ë¹Ä£ÐÍ¾Í´î½¨Íê±Ï£¬ÔËÐÐ³ÌÐò£¬Êä³öÈçÏÂ£º 

Acc: 48.3333%

Acc: 47.8343%

Model building: 0.0551443 s

Estimation : 0.715473 s

Total: 0.770618 s

¿É¿´µ½£¬½¨Ä£µÄËÙ¶È±ÈMultionialNBÒª¿ì£¬µ«ÊÇÔ¤²âµÄËÙ¶È·Ç³£Âý(MultinomialNB±ÈËü¿ìËÄÎå±¶)¡£ÕâÊÇÒòÎªGaussianNBÔÚÔ¤²âÊ±Òª½øÐÐ´óÁ¿ÕýÌ¬·Ö²¼ÃÜ¶ÈµÄ¼ÆËã£¬¶øÎÒÃÇ»¹Ã»ÓÐ½øÐÐËã·¨µÄÏòÁ¿»¯¡£
Á¬ÐøÐÍÆÓËØ±´Ò¶Ë¹Í¬ÑùÄÜ¹»½øÐÐºÍÀëÉ¢ÐÍÆÓËØ±´Ò¶Ë¹ÀàËÆµÄ¿ÉÊÓ»¯£¬ÏÂÃæÓÃ×Ô´øµÄdigitsÊý¾ÝÀ´ÆÀ¹ÀÎÒÃÇµÄÄ£ÐÍ¡£
¡¾Àý3ª²7¡¿ÀûÓÃ¸ßË¹ÆÓËØ±´Ò¶Ë¹Ä£ÐÍÊµÏÖ¹âÑ§×Ö·ûÊ¶±ð¡£
¹âÑ§×Ö·ûÊ¶±ðÎÊÌâ£º ÊÖÐ´Êý×ÖÊ¶±ð¡£¼òµ¥µØËµ£¬Õâ¸öÎÊÌâ°üÀ¨Í¼ÏñÖÐ×Ö·ûµÄ¶¨Î»ºÍÊ¶±ðÁ½²¿·Ö¡£ÎªÁËÑÝÊ¾·½±ã£¬ÎÒÃÇÑ¡ÔñÊ¹ÓÃScikitª²LearnÖÐ×Ô´øµÄÊÖÐ´Êý×ÖÊý¾Ý¼¯¡£
(1) ¼ÓÔØ²¢¿ÉÊÓ»¯ÊÖÐ´Êý×Ö¡£
Ê×ÏÈÓÃ Scikitª²Learn µÄÊý¾Ý»ñÈ¡½Ó¿Ú¼ÓÔØÊý¾Ý£¬²¢¼òµ¥Í³¼ÆÒ»ÏÂ£º 

>>> from sklearn.datasets import load_digits

>>> digits = load_digits()

>>> digits.images.shape

(1797, 8, 8)

>>> import matplotlib.pyplot as plt

>>> fig,axes = plt.subplots(10,10, figsize=(8, 8),subplot_kw={'xticks':£Û£Ý, 'yticks':£Û£Ý},gridspec_kw=dict(hspace=0.1, wspace=0.1))

>>>for i, ax in enumerate(axes.flat):

... ax.imshow(digits.images£Ûi£Ý, cmap='binary', interpolation='nearest')

...ax.text(0.05, 0.05, str(digits.target£Ûi£Ý),transform=ax.transAxes, color='green')

>>>plt.show() 

Õâ·ÝÍ¼ÏñÊý¾ÝÊÇÒ»¸öÈýÎ¬¾ØÕó£º ¹²ÓÐ 1797 ¸öÑù±¾£¬Ã¿ÕÅÍ¼Ïñ¶¼ÊÇ8¡Á8ÏñËØ¡£¶ÔÇ°100 ÕÅÍ¼½øÐÐ¿ÉÊÓ»¯£¬ÈçÍ¼3ª²4ËùÊ¾¡£


Í¼3ª²4Ô­Ê¼¹âÑ§×Ö·û


ÎªÁËÔÚScikitª²LearnÖÐÊ¹ÓÃÊý¾Ý£¬ÐèÒªÒ»¸öÎ¬¶ÈÎª£Ûn_samples, n_features£ÝµÄ¶þÎ¬ÌØÕ÷¾ØÕó¡ª¡ª¿ÉÒÔ½«Ã¿¸öÑù±¾Í¼ÏñµÄËùÓÐÏñËØ¶¼×÷ÎªÌØÕ÷£¬Ò²¾ÍÊÇ½«Ã¿¸öÊý×ÖµÄ8¡Á8ÏñËØÆ½ÆÌ³É³¤¶ÈÎª64µÄÒ»Î¬Êý×é¡£ÁíÍâ£¬»¹ÐèÒªÒ»¸öÄ¿±êÊý×é£¬ÓÃÀ´±íÊ¾Ã¿¸öÊý×ÖµÄÕæÊµÖµ(±êÇ©)¡£ÕâÁ½·ÝÊý¾ÝÒÑ¾­·ÅÔÚÊÖÐ´Êý×ÖÊý¾Ý¼¯µÄdataÓëtargetÊôÐÔÖÐ£¬Ö±½ÓÊ¹ÓÃ¼´¿É£º 

>>> X = digits.data

>>> X.shape

(1797, 64)

>>> y = digits.target

>>> y.shape

(1797,)

(2) ÎÞ¼à¶½Ñ§Ï°£º ½µÎ¬¡£
ËäÈ»Ïë¶Ô¾ßÓÐ64Î¬²ÎÊý¿Õ¼äµÄÑù±¾½øÐÐ¿ÉÊÓ»¯£¬µ«ÊÇÔÚÈç´Ë¸ßÎ¬¶ÈµÄ¿Õ¼äÖÐ½øÐÐ¿ÉÊÓ»¯Ê®·ÖÀ§ÄÑ¡£Òò´Ë£¬ÐèÒª½èÖúÎÞ¼à¶½Ñ§Ï°·½·¨½«Î¬¶È½µµ½¶þÎ¬¡£ÔÚ´ËÊÔÊÔÁ÷ÐÎÑ§Ï°Ëã·¨ÖÐµÄ IsomapËã·¨¶ÔÊý¾Ý½øÐÐ½µÎ¬£º 

>>> from sklearn.manifold import Isomap

>>> iso = Isomap(n_components=2)

>>> iso.fit(digits.data)

Isomap(eigen_solver='auto', max_iter=None, n_components=2, n_jobs=1,

n_neighbors=5, neighbors_algorithm='auto', path_method='auto', tol=0)

>>> data_projected = iso.transform(digits.data)

>>> data_projected.shape

(1797, 2)

ÏÖÔÚÊý¾ÝÒÑ¾­Í¶Ó°µ½¶þÎ¬£¬°ÑÊý¾Ý»­³öÀ´£¬¿´¿´´Ó½á¹¹ÖÐÄÜ·¢ÏÖÊ²Ã´£º 

>>>plt.scatter(data_projected£Û:, 0£Ý, data_projected£Û:, 1£Ý, c=digits.target,edgecolor='none',alpha=0.5,cmap=plt.cm.get_cmap('Spectral',10))

>>>plt.colorbar(label='digit label', ticks=range(10))

>>>plt.clim(-0.5, 9.5)

>>>plt.show()#Ð§¹ûÈçÍ¼3ª²5ËùÊ¾



Í¼3ª²5¶þÎ¬Í¶Ó°É¢µãÍ¼


Õâ·ùÍ¼³ÊÏÖ³öÁË·Ç³£Ö±¹ÛµÄÐ§¹û£¬ÈÃÎÒÃÇÖªµÀÊý×ÖÔÚ64Î¬¿Õ¼äÖÐµÄ·ÖÀë(¿ÉÊ¶±ð)³Ì¶È¡£ËäÈ»ÓÐÐ©è¦´Ã£¬µ«´Ó×ÜÌåÉÏ¿´£¬¸÷¸öÊý×ÖÔÚ²ÎÊý¿Õ¼äÖÐµÄ·ÖÀë³Ì¶È»¹ÊÇÁîÈËÂúÒâµÄ¡£ÕâÆäÊµ¸æËßÎÒÃÇ£º ÓÃÒ»¸ö·Ç³£¼òµ¥µÄÓÐ¼à¶½·ÖÀàËã·¨¾Í¿ÉÒÔÍê³ÉÈÎÎñ¡£ÏÂÃæÀ´ÑÝÊ¾Ò»ÏÂ¡£
(3) Êý×Ö·ÖÀà¡£
ÎÒÃÇÐèÒªÕÒµ½Ò»¸ö·ÖÀàËã·¨£¬¶ÔÊÖÐ´Êý×Ö½øÐÐ·ÖÀà¡£ÏÈ½«Êý¾Ý·Ö³ÉÑµÁ·¼¯ºÍ²âÊÔ¼¯£¬È»ºóÓÃ¸ßË¹ÆÓËØ±´Ò¶Ë¹Ä£ÐÍÀ´ÄâºÏ£º 

>>> from sklearn.model_selection import train_test_split

>>> Xtrain,Xtest,ytrain,ytest = train_test_split(X,y,random_state=0)

>>> from sklearn.naive_bayes import GaussianNB

>>> model = GaussianNB()

>>> model.fit(Xtrain,ytrain)

GaussianNB(priors=None)

>>> y_model = model.predict(Xtest)

Ä£ÐÍÔ¤²âÒÑ¾­Íê³É£¬ÏÖÔÚÓÃÄ£ÐÍÔÚÑµÁ·¼¯ÖÐµÄÕýÈ·Ê¶±ðÑù±¾Á¿Óë×ÜÑµÁ·Ñù±¾Á¿½øÐÐ¶Ô±È£¬»ñµÃÄ£ÐÍµÄ×¼È·ÂÊ£º 

>>> from sklearn.metrics import accuracy_score

>>> accuracy_score(ytest,y_model)

0.8333333333333334


¿ÉÒÔ¿´³ö£¬Í¨¹ýÒ»¸ö·Ç³£¼òµ¥µÄÄ£ÐÍ£¬Êý×ÖÊ¶±ðÂÊ¾Í¿ÉÒÔ´ïµ½ 80% ÒÔÉÏ¡£µ«½öÒÀ¿¿Õâ¸öÖ¸±ê£¬ÎÒÃÇÎÞ·¨ÖªµÀÄ£ÐÍÄÄÀï×öµÃ²»¹»ºÃ£¬½â¾öÕâ¸öÎÊÌâµÄ°ì·¨¾ÍÊÇÓÃ»ìÏý¾ØÕó(confusion matrix)¡£¿ÉÒÔÓÃScikitª²Learn¼ÆËã»ìÏý¾ØÕó£¬È»ºóÓÃSeaborn»­³öÀ´£º 

>>> from sklearn.metrics import confusion_matrix

>>> mat = confusion_matrix(ytest,y_model)

>>> import seaborn as sns

>>> sns.heatmap(mat, square=True, annot=True, cbar=False)

<matplotlib.axes._subplots.AxesSubplot object at 0x000001636AC15438>

>>> plt.xlabel('predicted value')

Text(0.5,64.2268,'predicted value')

>>> plt.ylabel('true value')

Text(633.841,0.5,'true value')

>>> plt.show()#Ð§¹ûÈçÍ¼3ª²6ËùÊ¾



Í¼3ª²6Êý×ÖÊ¶±ðÄ£ÐÍÍ¼


´ÓÍ¼3ª²6¿ÉÒÔ¿´³ö£¬ÎóÅÐµÄÖ÷ÒªÔ­ÒòÔÚÓÚÐí¶àÊý×Ö2±»ÎóÅÐ³ÉÁËÊý×Ö1»òÊý×Ö8¡£ÁíÒ»ÖÖÏÔÊ¾Ä£ÐÍÌØÕ÷µÄÖ±¹Û·½Ê½ÊÇ½«Ñù±¾»­³öÀ´£¬È»ºó°ÑÔ¤²â±êÇ©·ÅÔÚ×óÏÂ½Ç£¬ÓÃÂÌÉ«±íÊ¾Ô¤²âÕýÈ·£¬ÓÃºìÉ«±íÊ¾Ô¤²â´íÎó£º 

>>> fig, axes = plt.subplots(10, 10, figsize=(8, 8),subplot_kw={'xticks':£Û£Ý, 'yticks':£Û£Ý},gridspec_kw=dict(hspace=0.1, wspace=0.1))

>>> test_images=Xtest.reshape(-1,8,8)

>>> for i, ax in enumerate(axes.flat):

ax.imshow(test_images£Ûi£Ý, cmap='binary', interpolation='nearest')

ax.text(0.05, 0.05, str(y_model£Ûi£Ý),transform=ax.transAxes,color='green' if (ytest£Ûi£Ý == y_model£Ûi£Ý) else 'red')

>>> plt.show()#Ð§¹ûÈçÍ¼3ª²7ËùÊ¾




Í¼3ª²7¹âÑ§×Ö·ûÊ¶±ð½á¹û




²ÊÉ«Í¼Æ¬
Í¼3ª²7


3.3.6MergedNBµÄÊµÏÖ
»ìºÏÐÍ±´Ò¶Ë¹Ëã·¨Ö÷ÒªÓÐÁ½ÖÖÌáÊ¾£º 
¤r ÓÃÄ³ÖÖ·Ö²¼µÄÃÜ¶Èº¯ÊýËã³öÑµÁ·¼¯ÖÐ¸÷¸öÑù±¾Á¬ÐøÐÍÌØÕ÷ÏàÓ¦Î¬¶ÈµÄÃÜ¶ÈÖ®ºó£¬¸ù¾ÝÕâÐ©ÃÜ¶ÈµÄÇé¿ö½«¸ÃÎ¬¶ÈÀëÉ¢»¯£¬×îºóÔÙÑµÁ·ÀëÉ¢ÐÍÆÓËØ±´Ò¶Ë¹Ä£ÐÍ¡£
¤r Ö±½Ó½áºÏÀëÉ¢ÐÍÆÓËØ±´Ò¶Ë¹ºÍÁ¬ÐøÐÍÆÓËØ±´Ò¶Ë¹£º 


y=f(x*)= argmaxckp(y=ck)¡Çj¡ÊS1p(X(j)=x*(j)=ck)¡Çj¡ÊS2p(X(j)=x*(j)=ck)
ÆäÖÐ£¬S1ºÍS2´ú±íÀëÉ¢¡¢Á¬ÐøÎ¬¶ÈµÄ¼¯ºÏ£¬Ìõ¼þ¸ÅÂÊÓÉ3.3.1½Ú¼°3.3.5½ÚµÄËã·¨¸ø³ö¡£
¿ÉÒÔÖ±¹Û¿´³ö£¬µÚ¶þÖÖÌá·¨¿ÉÄÜ»á±ÈµÚÒ»ÖÖÌá·¨Òª¡°¼¤½ø¡±Ò»Ð©£¬ÒòÎªÈç¹ûÄ³¸öÁ¬ÐøÐÍÎ¬¶È²ÉÓÃµÄ·Ö²¼ÌØ±ð¡°´óÆð´óÂä¡±£¬ÄÇÃ´¸ÃÎ¬¶È¿ÉÄÜ»áÖ±½Ó¡°Ö÷µ¼¡±Õû¸ö¾ö²ß¡£µ«ÊÇ¿¼ÂÇµ½ÊµÏÖµÄ¼ò½àºÍÖ±¹Û£¬ÎÒÃÇ»¹ÑÝÊ¾ÁËµÚ¶þÖÖÌá·¨µÄÊµÏÖ¡£
¿ÉÒÔ¶ÔÆøÇòÊý¾Ý¼¯1.0ÉÔ×ö±ä¶¯£¬½«¡°ÆøÇò´óÐ¡¡±Õâ¸öÌØÕ÷¸ÄÎª¡°ÆøÇòÖ±¾¶¡±£¬È»ºóÔÙÊÖ¶¯×öÒ»´Î·ÖÀà£¬ÒÔ¼ÓÉî¶Ô»ìºÏÐÍÆÓËØ±´Ò¶Ë¹Ëã·¨µÄÀí½â¡£ÐÂÊý¾Ý¼¯Èç±í3ª²4ËùÊ¾¡£


±í3ª²4ÆøÇòÊý¾Ý¼¯2.0



ÑÕÉ«Ö±¾¶²â ÊÔ ÈË Ô±²â ÊÔ ¶¯ ×÷½á¹û

»ÆÉ«10³ÉÈËÓÃÊÖ´ò²»±¬Õ¨
»ÆÉ«15³ÉÈËÓÃ½Å²È±¬Õ¨
»ÆÉ«9Ð¡º¢ÓÃÊÖ´ò²»±¬Õ¨
»ÆÉ«9Ð¡º¢ÓÃ½Å²È²»±¬Õ¨
»ÆÉ«19³ÉÈËÓÃÊÖ´ò±¬Õ¨
»ÆÉ«21³ÉÈËÓÃ½Å²È±¬Õ¨
»ÆÉ«16Ð¡º¢ÓÃÊÖ´ò²»±¬Õ¨
»ÆÉ«22Ð¡º¢ÓÃ½Å²È±¬Õ¨
×ÏÉ«10³ÉÈËÓÃÊÖ´ò²»±¬Õ¨
×ÏÉ«12Ð¡º¢ÓÃÊÖ´ò²»±¬Õ¨
×ÏÉ«22³ÉÈËÓÃ½Å²È±¬Õ¨
×ÏÉ«21Ð¡º¢ÓÃ½Å²È±¬Õ¨

¸ÃÊý¾Ý¼¯µÄµç×Ó°æ±¾¿É²Î¼ûhttps://github.com/carefree0910/MachineLearning/blob/master/_Data/balloon2.0.txt¡£ÎÒÃÇÐèÒªÔ¤²âµÄÊÇÑù±¾£º 





×ÏÉ«10Ð¡º¢ÓÃ½Å²È


³ýÁË¡°´óÐ¡¡±±ä³É¡°Ö±¾¶¡±£¬ÆäÓàÌØÕ÷¶¼Ò»µãÎ´±ä£¬ËùÒÔÖ»ÐèÔÙ¼ÆËãÖ±¾¶µÄÌõ¼þ¸ÅÂÊ(ÃÜ¶È)¡£ÓÉGaussianNBµÄËã·¨¿ÉÖª£º 


¦Ì^²»±¬Õ¨=10+9+9+16+10+126=11

¦Ì^±¬Õ¨=15+19+21+22+22+216=20

¦Ò^²»±¬Õ¨=16£Û(10-¦Ì^²»±¬Õ¨)2+¡­+(12-¦Ì^²»±¬Õ¨)2£Ý=6

¦Ò^±¬Õ¨=16£Û(15-¦Ì^±¬Õ¨)2+¡­+(21-¦Ì^±¬Õ¨)2£Ý=6

´Ó¶ø£¬


p^(²»±¬Õ¨)=12¦Ð¦Ò^²»±¬Õ¨e-((10-¦Ì^²»±¬Õ¨)2)2¦Ò^2²»±¬Õ¨¡Áp(Ð¡º¢|²»±¬Õ¨)¡Áp(ÓÃ½Å²È|²»±¬Õ¨)¡Ö0.0073

p^(±¬Õ¨)=12¦Ð¦Ò^±¬Õ¨e-((10-¦Ì^±¬Õ¨)2)2¦Ò^2±¬Õ¨¡Áp(Ð¡º¢|±¬Õ¨)¡Áp(ÓÃ½Å²È|±¬Õ¨)¡Ö0.0046
Òò´ËÓ¦ÈÏÎª¸ø¶¨Ñù±¾Ëùµ¼ÖÂµÄ½á¹ûÊÇ¡°²»±¬Õ¨¡±£¬ÕâºÍÖ±¹Û¸ÐÊÜ´óÌåÏà·û¡£½Ó×Å¿´Ò»ÏÂ¾ßÌåÈçºÎÊµÏÖ£º 

from b_NaiveBayes.Original.Basic import *

from b_NaiveBayes.Original.MultinomialNB import MultinomialNB

from b_NaiveBayes.Original.GaussianNB import GaussianNB



class MergedNB(NaiveBayes):

MergedNBTiming = Timing()

""" 

³õÊ¼»¯½á¹¹

self._whether_discrete:¼ÇÂ¼¸÷¸öÎ¬¶ÈµÄ±äÁ¿ÊÇ·ñÊÇÀëÉ¢ÐÍ±äÁ¿

self._whether_continuous:¼ÇÂ¼¸÷¸öÎ¬¶ÈµÄ±äÁ¿ÊÇ·ñÊÇÁ¬ÐøÐÍ±äÁ¿

self._multinomial,self._gaussian:ÀëÉ¢ÐÍ¡¢Á¬ÐøÐÍÆÓËØ±´Ò¶Ë¹Ä£ÐÍ

"""

def __init__(self, **kwargs):

self._multinomial, self._gaussian = MultinomialNB(), GaussianNB()



if wc is None:

self._whether_discrete = self._whether_continuous = None

else:

self._whether_continuous = np.asarray(wc)

self._whether_discrete = ~self._whether_continuous

¶ÔÄ£ÐÍµÄÑµÁ·½øÐÐÊµÏÖ£¬´úÂëÎª£º 

#·Ö±ðÀûÓÃMultinomialNBºÍGaussianNBµÄÊý¾ÝÔ¤´¦Àí·½·¨½øÐÐÊý¾Ý´¦Àí

def feed_data(self, x, y, sample_weight=None):

if sample_weight is not None:

sample_weight = np.asarray(sample_weight)

x, y, wc, features, feat_dicts, label_dict = DataUtil.quantize_data(

x, y, wc=self._whether_continuous, separate=True)

#Èç¹ûÃ»ÓÐÖ¸¶¨ÄÄÐ©Î¬¶ÈÁ¬Ðø£¬ÔòÓÃquantize_dataÖÐÆÓËØµÄ·½·¨ÅÐ¶¨ÄÄÐ©Î¬¶ÈÁ¬Ðø

if self._whether_continuous is None:

#Í¨¹ýNumpyÖÐ¶ÔÂß¼­·ÇµÄÖ§³Ö½øÐÐ¿ìËÙÔËËã

self._whether_continuous = wc

self._whether_discrete = ~self._whether_continuous

self.label_dict = label_dict

discrete_x, continuous_x = x

cat_counter = np.bincount(y)

self._cat_counter = cat_counter

labels = £Ûy == value for value in range(len(cat_counter))£Ý

#ÑµÁ·ÀëÉ¢ÐÍÆÓËØ±´Ò¶Ë¹

labelled_x = £Ûdiscrete_x£Ûci£Ý.T for ci in labels£Ý

self._multinomial._x, self._multinomial._y = x, y

self._multinomial._labelled_x, self._multinomial._label_zip = labelled_x, list(zip(labels, labelled_x))

self._multinomial._cat_counter = cat_counter

self._multinomial._feat_dicts = £Ûdic for i, dic in enumerate(feat_dicts) if self._whether_discrete£Ûi£Ý£Ý

self._multinomial._n_possibilities = £Ûlen(feats) for i, feats in enumerate(features)

if self._whether_discrete£Ûi£Ý£Ý

self._multinomial.label_dict = label_dict

#ÑµÁ·Á¬ÐøÐÍÆÓËØ±´Ò¶Ë¹

labelled_x = £Ûcontinuous_x£Ûlabel£Ý.T for label in labels£Ý

self._gaussian._x, self._gaussian._y = continuous_x.T, y

self._gaussian._labelled_x, self._gaussian._label_zip = labelled_x, labels

self._gaussian._cat_counter, self._gaussian.label_dict = cat_counter, label_dict

#´¦ÀíÑù±¾È¨ÖØ

self.feed_sample_weight(sample_weight)

#·Ö±ðÀûÓÃMultinomialNBºÍGaussianNB´¦ÀíÑù±¾È¨ÖØµÄ·½·¨À´´¦ÀíÑù±¾È¨ÖØ

def feed_sample_weight(self, sample_weight=None):

self._multinomial.feed_sample_weight(sample_weight)

self._gaussian.feed_sample_weight(sample_weight)

#·Ö±ðÀûÓÃMultinomialNBºÍGaussianNBµÄÑµÁ·º¯ÊýÀ´½øÐÐÑµÁ·

def _fit(self, lb):

self._multinomial.fit()

self._gaussian.fit()

p_category = self._multinomial.get_prior_probability(lb)

discrete_func, continuous_func = self._multinomial£Û"func"£Ý, self._gaussian£Û"func"£Ý

#½«MultinomialNBºÍGaussianNBµÄ¾ö²ßº¯ÊýÖ±½ÓºÏ³ÉMergedNBµÄ¾ö²ßº¯Êý

#ÓÉÓÚÕâÁ½¸ö¾ö²ßº¯Êý¶¼³ËÁËÏÈÑé¸ÅÂÊ£¬ËùÒÔÐèÒª³ýµôÒ»¸öÏÈÑé¸ÅÂÊ

def func(input_x, tar_category):

input_x = np.asarray(input_x)

return discrete_func(

input_x£Ûself._whether_discrete£Ý.astype(np.int), tar_category) * continuous_func(

input_x£Ûself._whether_continuous£Ý, tar_category) / p_category£Ûtar_category£Ý

return func

ÉÏÊöÊµÏÖÓÐÒ»¸öÏÔ¶øÒ×¼ûµÄ¿ÉÒÔÓÅ»¯µÄµØ·½£º ÎÒÃÇÒ»¹²ÔÚ´úÂëÖÐÖØ¸´¼ÆËãÁË3´ÎÏÈÑé¸ÅÂÊ£¬µ«ÆäÊµÖ»¼ÆËãÒ»´Î¾Í¿ÉÒÔÁË£¬¿¼ÂÇµ½ÕâÒ»µã²»ÊÇÐÔÄÜÆ¿¾±£¬ÎªÁË´úÂëµÄÁ¬¹áÐÔºÍ¿É¶ÁÐÔ£¬¾ÍÃ»ÓÐ½øÐÐÕâ¸öÓÅ»¯¡£Êý¾Ý×ª»»º¯ÊýÔòÏà¶Ô¶øÑÔÒª¸´ÔÓÒ»Ð©£¬ÒòÎªÐèÒªÌø¹ýÁ¬ÐøÎ¬¶È£¬½«ÀëÉ¢Î¬¶ÈÌô³öÀ´½øÐÐÊýÖµ»¯£º 

#ÊµÏÖ×ª»»»ìºÏÐÍÊý¾ÝµÄ·½·¨£¬Òª×¢ÒâÀûÓÃMultinomialNBµÄÏàÓ¦±äÁ¿

def _transfer_x(self, x):

feat_dicts = self._multinomial£Û"feat_dicts"£Ý

idx = 0

for d, discrete in enumerate(self._whether_discrete):

#Èç¹ûÊÇÁ¬ÐøÎ¬¶È£¬Ö±½Óµ÷ÓÃfloat·½·¨½«Æä×ªÎª¸¡µãÊý

if not discrete:

x£Ûd£Ý = float(x£Ûd£Ý)

else:

#Èç¹ûÊÇÀëÉ¢Î¬¶È£¬ÀûÓÃ×ª»»×Öµä½øÐÐÊýÖµ»¯

x£Ûd£Ý = feat_dicts£Ûidx£Ý£Ûx£Ûd£Ý£Ý

if discrete:

idx += 1

return x

ÖÁ´Ë£¬»ìºÏÐÍÆÓËØ±´Ò¶Ë¹Ä£ÐÍ¾Í´î½¨Íê±ÏÁË¡£
3.3.7BernoulliNB·ÖÀàÆ÷ÊµÏÖ
BernoulliNBÊÇ²®Å¬Àû±´Ò¶Ë¹·ÖÀàÆ÷£¬Ëü¼ÙÉèÌØÕ÷µÄÌõ¼þ¸ÅÂÊ·Ö²¼Âú×ã¶þÏî·Ö²¼£º 


P(X(j)|y=ck)=pX(j)+(1-p)(1-X(j))
ÆäÖÐ£¬ÒªÇóÌØÕ÷µÄÈ¡ÖµÎªX(j)¡Ê{0,1}£¬ÇÒP(X(j)=1|y=ck)=p¡£
¡¾Àý3ª²8¡¿ÓÃ×Ô´øµÄdigitsÊý¾ÝÀ´ÆÀ¹ÀBernoulliNB·ÖÀàÆ÷¡£
(1) ÔØÈë±ØÒªµÄ¿â¡£

from sklearn import datasets,cross_validation,naive_bayes

import numpy as np

import matplotlib.pyplot as plt

(2) ¹Û²ìdigit Dataset¡£

def show_digits():

digits = datasets.load_digits()

fig = plt.figure()

print('vector fromimages 0:',digits.data£Û0£Ý)

for i in range(25):

ax = fig.add_subplot(5,5,i+1)

ax.imshow(digits.images£Ûi£Ý,cmap=plt.cm.gray_r,interpolation='nearest')

plt.show()

show_digits()

vector fromimages 0:£Û 0.0.5. 13.9.1.0.0.0.0. 13. 15. 10. 15.5.0.0.3.

15.2.0. 11.8.0.0.4. 12.0.0.8.8.0.0.5.8.0.

0.9.8.0.0.4. 11.0.1. 12.7.0.0.2. 14.5. 10. 12.

0.0.0.0.6. 13. 10.0.0.0.£Ý

(3) ¼ÓÔØÊý¾Ý¼¯¡£

def load_data():

digits = datasets.load_digits()

return cross_validation.train_test_split(digits.data,digits.target,test_size=0.25,random_state=0)

(4) ²®Å¬Àû±´Ò¶Ë¹·ÖÀàÆ÷¡£

def test_BernoulliNB(*data):

X_train, X_test, y_train, y_test = data

cls = naive_bayes.BernoulliNB()

cls.fit(X_train,y_train)

print("Training score:%.2f" % cls.score(X_train, y_train))

print("Testing score:%.2f"%cls.score(X_test,y_test))

X_train, X_test, y_train, y_test = load_data()

test_BernoulliNB(X_train, X_test, y_train, y_test)

Training score:0.87

Testing score:0.85

(5) ¼ìÑé²»Í¬µÄa¶Ô²®Å¬Àû±´Ò¶Ë¹·ÖÀàÆ÷µÄÔ¤²âÐÔÄÜµÄÓ°Ïì¡£

def test_BernoulliNB_alpha(*data):

X_train, X_test, y_train, y_test = data

alphas = np.logspace(-2,5,num=200)

train_scores = £Û£Ý

test_scores = £Û£Ý

for alpha in alphas:

cls = naive_bayes.BernoulliNB(alpha=alpha)

cls.fit(X_train,y_train)

train_scores.append(cls.score(X_train,y_train))

test_scores.append(cls.score(X_test,y_test))

(6) »æÍ¼¡£

fig = plt.figure()

ax = fig.add_subplot(1,1,1)

ax.plot(alphas,train_scores,label='Training Score')

ax.plot(alphas,test_scores,label='Testing Score')

ax.set_xlabel(r'$£Üalpha$')

ax.set_ylabel('score')

ax.set_ylim(0,1.0)

ax.set_title('BernoulliNB')

ax.set_xscale('log')

ax.legend(loc='best')

plt.show()#Ð§¹ûÈçÍ¼3ª²8ËùÊ¾

X_train, X_test, y_train, y_test = load_data()

test_BernoulliNB_alpha(X_train, X_test, y_train, y_test)



Í¼3ª²8BernoulliNBÔ¤²âÐÔÄÜÇúÏßÍ¼


(7) ¿¼ÂÇbinarize²ÎÊý¶Ô²®Å¬Àû±´Ò¶Ë¹·ÖÀàÆ÷µÄÓ°Ïì¡£

def test_BernoulliNB_binarize(*data):

X_train, X_test, y_train, y_test = data

min_x = min(np.min(X_train.ravel()),np.min(X_test.ravel())) - 0.1

max_x = max(np.max(X_train.ravel()),np.max(X_test.ravel())) + 0.1

binarizes = np.linspace(min_x,max_x,endpoint=True,num=100)

train_scores = £Û£Ý

test_scores = £Û£Ý

for binarize in binarizes:

cls = naive_bayes.BernoulliNB(binarize=binarize)

cls.fit(X_train,y_train)

train_scores.append(cls.score(X_train,y_train))

test_scores.append(cls.score(X_test,y_test))

#»æÍ¼

fig = plt.figure()

ax = fig.add_subplot(1,1,1)

ax.plot(binarizes,train_scores,label='Training Score')

ax.plot(binarizes,test_scores,label='Testing Score')

ax.set_xlabel('binarize')

ax.set_ylabel('score')

ax.set_ylim(0,1.0)

ax.set_xlim(min_x-1,max_x+1)

ax.set_title('BernoulliNB')

ax.legend(loc='best')

plt.show()#Ð§¹ûÈçÍ¼3ª²9ËùÊ¾

X_train, X_test, y_train, y_test = load_data()

test_BernoulliNB_binarize(X_train, X_test, y_train, y_test)



Í¼3ª²9binarize²ÎÊý¶ÔBernoulliNBµÄÓ°Ïì


3.4°ëÆÓËØ±´Ò¶Ë¹
ÆÓËØ±´Ò¶Ë¹µ¼³öµÄ·ÖÀàÆ÷Ö»ÊÇ±´Ò¶Ë¹·ÖÀàÆ÷ÖÐµÄÒ»Ð¡Àà£¬ËüËù×öµÄ¶ÀÁ¢ÐÔ¼ÙÉèÔÚ¾ø´ó¶àÊýµÄÇé¿öÏÂ¶¼ÏÔµÃÌ«Ç¿£¬ÏÖÊµÈÎÎñÖÐÕâ¸ö¼ÙÉèÍùÍùÄÑÒÔ³ÉÁ¢¡£ÎªÁË×ö³ö¸Ä½ø£¬ÈËÃÇ³¢ÊÔÔÚ²»¹ýÓÚÔö¼ÓÄ£ÐÍ¸´ÔÓ¶ÈµÄÇ°ÌáÏÂ£¬½«¶ÀÁ¢ÐÔ¼ÙÉè½øÐÐ¸÷ÖÖÈõ»¯¡£ÔÚÓÉ´ËÑÜÉú³öÀ´µÄÄ£ÐÍÖÐ£¬±È½Ï¾­µäµÄ¾ÍÊÇ°ëÆÓËØ±´Ò¶Ë¹(Semiª²Naive Bayes)Ä£ÐÍºÍ±´Ò¶Ë¹ÍøÄ£ÐÍ(Bayesian Network)Á½ÖÖ¡£
ÓÉÓÚÌá³öÌõ¼þ¶ÀÁ¢ÐÔ¼ÙÉèµÄÔ­ÒòÕýÊÇÁªºÏ¸ÅÂÊÄÑÒÔÇó½â£¬ËùÒÔÔÚÈõ»¯¼ÙÉèµÄÊ±ºòÍ¬ÑùÓ¦¸Ã±ÜÃâÒýÈë¹ý¶àµÄÁªºÏ¸ÅÂÊ£¬ÕâÒ²ÕýÊÇ°ëÆÓËØ±´Ò¶Ë¹µÄ»ù±¾Ïë·¨¡£±È½Ï³£¼ûµÄ°ëÆÓËØ±´Ò¶Ë¹Ëã·¨ÓÐÈçÏÂ3ÖÖ¡£
3.4.1ODEËã·¨
¹ËÃûË¼Òå£¬ODEËã·¨(Oneª²Dependent Estimator£¬¶ÀÒÀÀµ¹À¼Æ)¸÷¸öÎ¬¶ÈµÄÌØÕ÷ÖÁ¶àÒÀÀµÒ»¸öÆäËûÎ¬¶ÈµÄÌØÕ÷¡£´Ó¹«Ê½ÉÏÀ´Ëµ£¬ËüÔÚÃèÊöÌõ¼þ¸ÅÂÊÊ±»á¶à³öÒ»¸öÌõ¼þ£º 


p(ck|X=x)=p(y=ck)¡Çni=1p(X(j)=x(j)|Y=ck,X(paj)=x(paj))
ÕâÀïµÄpaj´ú±íÎ¬¶ÈjËù¡°¶ÀÒÀÀµ¡±µÄÎ¬¶È¡£
3.4.2SPODEËã·¨
SPODEËã·¨(Superª²Parent ODE£¬³¬¸¸¶ÀÒÀÀµ¹À¼Æ)ÊÇODEËã·¨µÄÒ»¸öÌØÀý¡£ÔÚ¸ÃËã·¨ÖÐ£¬ËùÓÐÎ¬¶ÈµÄÌØÕ÷¶¼¶ÀÒÀÀµÓÚÍ¬Ò»¸öÎ¬¶ÈµÄÌØÕ÷£¬Õâ¸ö±»¹²Í¬ÒÀÀµµÄÌØÕ÷¾Í½Ð×÷¡°³¬¸¸¡±(Superª²Parent)¡£Èç¹ûËüµÄÎ¬¶ÈÊÇµÚpaÎ¬£¬Öª£º 


p(ck|X=x)=p(y=ck)¡Çni=1p(X(j)=x(j)|Y=ck,X(pa)=x(pa))
Ò»°ã¶øÑÔ£¬»áÑ¡ÔñÍ¨¹ý½»²æÑéÖ¤À´Ñ¡Ôñ³¬¸¸¡£
3.4.3AODEËã·¨
AODEËã·¨(Averaged Oneª²Dependent Estimator£¬¼¯³É¶ÀÒÀÀµ¹À¼Æ)µÄ±³ºóÓÐÌáÉý·½·¨µÄË¼Ïë¡£AODEËã·¨»áÀûÓÃSPODEËã·¨²¢³¢ÊÔ½«Ðí¶à¸öÑµÁ·ºóµÄ¡¢ÓÐ×ã¹»µÄÑµÁ·Êý¾ÝÁ¿Ö§³ÅµÄSPODEÄ£ÐÍ¼¯³ÉÔÚÒ»ÆðÀ´¹¹½¨×îÖÕµÄÄ£ÐÍ¡£Ò»°ãÀ´Ëµ£¬AODE»áÒÔËùÓÐÎ¬¶ÈµÄÌØÕ÷×÷Îª³¬¸¸ÑµÁ·n¸öSPODEÄ£ÐÍ£¬È»ºóÏßÐÔ×éºÏ³ö×îÖÕµÄÄ£ÐÍ¡£
3.5±´Ò¶Ë¹Íø
±´Ò¶Ë¹ÍøÓÖ³Æ¡°ÐÅÄîÍø¡±(Belief Network)£¬±ÈÆðÆÓËØ±´Ò¶Ë¹£¬Ëü±³ºó»¹ÔÌº¬ÁËÍ¼ÂÛµÄË¼Ïë¡£±´Ò¶Ë¹ÍøÓÐÐí¶àÆæÃîµÄÐÔÖÊ£¬ÏêÏ¸ÌÖÂÛµÄ²»¿É±ÜÃâµØÒªÊ¹ÓÃµ½Í¼ÂÛµÄÊõÓï£¬ÕâÀï½ö½ö¶ÔÆä×öÒ»¸öÖ±¹ÛµÄ½éÉÜ¡£
±´Ò¶Ë¹ÍøÂç¼ÈÈ»´øÁË¡°Íø¡±×Ö£¬ËüµÄ½á¹¹×ÔÈ»¿ÉÒÔÖ±¹ÛµØ¿´×÷Ò»ÕÅÍøÂç£¬ÆäÖÐ£¬
ÍøÂçµÄ½Úµã¾ÍÊÇµ¥Ò»Ñù±¾µÄ¸÷¸öÎ¬¶ÈÉÏµÄËæ»ú±äÁ¿X(1),X(2),¡­,X(n)£¬
Á¬½Ó½ÚµãµÄ±ß¾ÍÊÇ½ÚµãÖ®¼äµÄÒÀÀµ¹ØÏµ¡£
×¢Òâ£º ±´Ò¶Ë¹ÍøÂçÒ»°ãÒªÇóÕâÐ©±ßÊÇ¡°ÓÐ·½ÏòµÄ¡±£¬Í¬Ê±ÕûÕÅÍøÂçÖÐ²»ÄÜ³öÏÖ¡°»·¡±¡£ÎÞÏòµÄ±´Ò¶Ë¹ÍøÂçÍ¨³£ÊÇÓÉÓÐÏò±´Ò¶Ë¹ÍøÂçÎÞÏò»¯µÃµ½µÄ£¬´ËÊ±Ëü±»³ÆÎªmoral graph(³ýÁË°ÑËùÓÐÓÐÏò±ß¸Ä³ÉÎÞÏò±ßÒÔÍâ£¬moral graph»¹ÐèÒª½«ÓÐÏòÍøÂçÖÐ²»Ïà»¥¶ÀÁ¢µÄËæ»ú±äÁ¿Ö®¼äÁ¬ÉÏÒ»ÌõÎÞÏò±ß£¬Ï¸½ÚÂÔ)£¬»ùÓÚËüÄÜ¹»·Ç³£Ö±¹Û£¬¹Ê¿ÉÑ¸ËÙµØ¿´³ö±äÁ¿¼äµÄÌõ¼þ¶ÀÁ¢ÐÔ¡£
ÏÔÈ»£¬ÓÐÁË´ú±í¸÷¸öÎ¬¶ÈËæ»ú±äÁ¿µÄ½ÚµãºÍ´ú±íÕâÐ©½ÚµãÖ®¼äÒÀÀµ¹ØÏµµÄ±ßÖ®ºó£¬¸÷¸öËæ»ú±äÁ¿Ö®¼äµÄÌõ¼þÒÀÀµ¹ØÏµ¶¼¿ÉÒÔÍ¨¹ýÕâÕÅÍøÂç±íÊ¾³öÀ´¡£ÀàËÆµÄÔÚÌõ¼þËæ»ú³¡ÖÐÒ²ÓÐÓÃµ½£¬¿ÉÒÔËµÊÇÒ»¸öÊÊÓÃ·¶Î§·Ç³£·ºµÄË¼Ïë¡£
±´Ò¶Ë¹ÍøÂçµÄÑ§Ï°ÔÚÍøÂç½á¹¹ÒÑ¾­È·¶¨µÄÇé¿öÏÂÏà¶Ô¼òµ¥£¬ÆäË¼ÏëºÍÆÓËØ±´Ò¶Ë¹ÀàËÆ£º Ö»ÐèÒª¶ÔÑµÁ·¼¯ÏàÓ¦µÄÌõ¼þ½øÐÐ¡°¼ÆÊý¡±¼´¿É£¬ËùÒÔ±´Ò¶Ë¹ÍøµÄÑ§Ï°ÈÎÎñÖ÷Òª¹é½áÓÚÈçºÎÕÒµ½×îÇ¡µ±µÄÍøÂç½á¹¹¡£³£¼ûµÄ×ö·¨ÊÇ¶¨ÒåÒ»¸öÓÃÀ´´ò·ÖµÄº¯Êý²¢»ùÓÚ¸Ãº¯ÊýÍ¨¹ýÄ³ÖÖËÑË÷ÊÖ¶ÎÀ´¾ö¶¨½á¹¹¡£ÈçÍ¬ºÜ¶à×îÓÅ»¯Ëã·¨Ò»Ñù£¬ÔÚËùÓÐ¿ÉÄÜµÄ½á¹¹¿Õ¼äÖÐËÑË÷×îÓÅ½á¹¹ÊÇÒ»¸öNPÍêÈ«ÎÊÌâ£¬ÎÞ·¨ÔÚºÏÀíµÄÊ±¼äÄÚÇó½â£¬ËùÒÔÒ»°ã»áÊ¹ÓÃÌæ´úµÄ·½·¨Çó½üËÆ×îÓÅ½â¡£³£¼ûµÄ·½·¨ÓÐÁ½ÖÖ£º Ò»ÖÖÊÇÌ°ÐÄ·¨£¬±ÈÈç£¬ÏÈÈ·¶¨Ò»¸ö³õÊ¼µÄÍøÂç½á¹¹²¢´Ó¸Ã½á¹¹³ö·¢£¬Ã¿´ÎÔöÌíÒ»Ìõ±ß¡¢É¾È¥Ò»Ìõ±ß»òµ÷ÕûÒ»Ìõ±ßµÄ·½Ïò£¬ÆÚÍûÍ¨¹ýÕâÐ©ÊÖ¶ÎÄÜ¹»Ê¹ÆÀ·Öº¯ÊýµÄÖµ±ä´ó£» ÁíÒ»ÖÖÊÇÖ±½ÓÏÞ¶¨¼ÙÉè¿Õ¼ä£¬±ÈÈç£¬¼ÙÉèÒªÇóµÄ±´Ò¶Ë¹ÍøÂçÒ»¶¨ÊÇÒ»¸öÊ÷ÐÎ½á¹¹¡£
ÓëÑ§Ï°·½·¨Ïà±È£¬±´Ò¶Ë¹ÍøµÄ¾ö²ß·½·¨²¢²»¼òµ¥¡£ËäËµ×îÀíÏëµÄÇé¿öÊÇÖ±½Ó¸ù¾Ý±´Ò¶Ë¹ÍøÂçµÄ½á¹¹Ëù¾ö¶¨µÄÁªºÏ¸ÅÂÊÃÜ¶ÈÀ´¼ÆËãºóÑé¸ÅÂÊ£¬µ«ÊÇÕâÑùµÄ¼ÆËã±»Ö¤Ã÷ÊÇNPÍêÈ«ÎÊÌâ¡£»»¾ä»°Ëµ£¬Ö»Òª±´Ò¶Ë¹ÍøÂçÉÔÎ¢¸´ÔÓÒ»µã£¬ÕâÖÖ¾«È·µÄ¼ÆËã¾ÍÎÞ·¨ÔÚºÏÀíµÄÊ±¼äÄÚÍê³É¡£ËùÒÔÍ¬ÑùÒª½èÖú½üËÆ·¨Çó½â£¬Ò»ÖÖ³£¼ûµÄ×ö·¨ÊÇ¼ª²¼Ë¹²ÉÑù(Gibbs Sampling)£¬ËüµÄ¶¨ÒåÉæ¼°Âí¶û¿É·òÁ´µÄÏà¹ØÖªÊ¶£¬ÕâÀï²»Õ¹¿ª½éÉÜ¡£
3.6Ï°Ìâ
1. ÔÚÊýÀíÍ³¼ÆÑ§ÖÐ£¬ÊÇÒ»ÖÖ¹ØÓÚÍ³¼ÆÄ£ÐÍÖÐµÄ²ÎÊýµÄº¯Êý£¬±íÊ¾Ä£ÐÍ²ÎÊýÖÐµÄ¡£
2. ±´Ò¶Ë¹Ñ§ÅÉÇ¿µ÷¸ÅÂÊµÄ¡°Ö÷¹ÛÐÔ¡±Óë´«Í³µÄÆµÂÊÑ§ÅÉ²»Í¬ÓÐÊ²Ã´²»Í¬£¿
3. ºÍ¼«´óËÆÈ»¹À¼ÆÏà±È£¬MAPÓÐÒ»¸öÏÔÖøµÄÓÅÊÆ£¬ÊÇÊ²Ã´£¿
4. ÔÚÆÓËØ±´Ò¶Ë¹Ëã·¨ÏÂÑÜÉú³ö3ÖÖ²»Í¬µÄÄ£ÐÍ£¬ÊÇÄÄ3ÖÖ£¿
5. ÀûÓÃ¸ßË¹±´Ò¶Ë¹·ÖÀàÆ÷¶Ô×Ô´øµÄdigitsÊý¾Ý¼¯½øÐÐÑµÁ·Óë²âÊÔ¡£