µÚ3ÕÂ ¹ØÁª¹æÔòÓëÍÆ¼öËã·¨
¹ØÁª¹æÔòºÍÍÆ¼öËã·¨¶¼¿ÉÓÃÀ´Îª¿Í»§ÍÆ¼öÉÌÆ·µÈÐÅÏ¢¡£¹ØÁª¹æÔòÊÇ¸ù¾ÝÉÌÆ·Ö®¼äµÄ
¹ØÁªÐÔÍÆ¼ö,ÆäËã·¨¸´ÔÓ¶È½Ï¸ß,ÊÊºÏÀëÏß¼ÆËã,ÍÆ¼öËã·¨¸ù¾ÝÉÌÆ·Ö®¼äµÄÏàËÆÐÔ»òÓÃ»§
Ö®¼äµÄÏàËÆÐÔÍÆ¼ö,ÆäËã·¨¸´ÔÓ¶ÈµÍ,ÊÊºÏÔÚÏß¼ÆËã¡£
3.1 ¹ØÁª¹æÔòÍÚ¾ò
¹ØÁª¹æÔò(associationrules)ÓÃÀ´·´Ó³Ò»¸öÊÂÎñÓëÆäËûÊÂÎñÖ®¼äµÄÏà»¥ÒÀ´æÐÔºÍ¹ØÁª
ÐÔ,ÊÇÊý¾ÝÍÚ¾òµÄÒ»ÏîÖØÒª¼¼Êõ,ÓÃÓÚ´Ó´óÁ¿Êý¾ÝÖÐÍÚ¾òÓÐ¼ÛÖµµÄÊý¾ÝÏîÖ®¼äµÄÏà¹Ø
¹ØÏµ¡£¹Ø
Áª¹æÔòÍÚ¾òÔ´ÓÚ¹ºÎïÀº·ÖÎö,¼´ÔÚ³¬ÊÐÖÐÓÃÀ´·ÖÎö¹Ë¿ÍËù¹ºÂòµÄÉÌÆ·Ö®¼äµÄ¹ØÁª
ÐÔ,ÕâÓÐÖúÓÚ¾ö¶¨³¬ÊÐÉÌÆ·µÄ°Ú·ÅºÍÉÌÆ·µÄÀ¦°óÏúÊÛ²ßÂÔ¡£
3.1.1 »ù±¾¸ÅÄî
¹ØÁª¹æÔòÍÚ¾òÓÃÀ´·¢ÏÖÊý¾Ý¼¯ÖÐÏî¼¯Ö®¼äÓÐÈ¤µÄ¹ØÁªÁªÏµ¡£Èç¹ûÁ½Ïî»ò¶àÏîÖ®¼ä´æ
ÔÚ¹ØÁª,¾Í¿ÉÒÔ¸ù¾ÝÆäÖÐÒ»ÏîÍÆ¼öÏà¹ØÁªµÄÁíÒ»Ïî¡£¹ØÁª¹æÔòµÄÒ»°ã±íÏÖÎªÔÌº¬Ê½¹æÔò
ÐÎÊ½:X .Y¡£X ³ÆÎª¹ØÁª¹æÔòµÄÇ°Ìá»òÏÈµ¼Ìõ¼þ,Y ³ÆÎª¹ØÁª¹æÔòµÄ½á¹û»òºó¼Ì¡£¶¨Òå
ºÍ±íÊ¾¹ØÁª¹æÔòÐèÒªÒýÈëÖÃÐÅ¶È(confidence)ºÍÖ§³Ö¶È(support)Á½¸öÖ¸±ê¡£ÀýÈç: 
buys(x, "diapers")==>buys(x, "beers") [0.5%, 60%] 
±íÊ¾¹ºÂòÄò²¼µÄ¿Í»§Ò²»á¹ºÂòÆ¡¾Æ,¸Ã¹æÔòµÄÖ§³Ö¶ÈÎª0.5%,ÖÃÐÅ¶ÈÎª60%¡£¸Ã¹æÔòÒ²
¿É¼òÐ´Îª:diapers.beers[0.5%,60%]¡£ÓÖÈç: 
major(x, "CS") ^ takes(x, "DB")==>grade(x, "A") [1%, 75%] 
±íÊ¾×¨ÒµÎª¼ÆËã»úÑ¡ÐÞÊý¾Ý¿âµÄÑ§Éú³É¼¨µÃA µÄÖ§³Ö¶ÈÎª1%,ÖÃÐÅ¶ÈÎª75%¡£¸Ã¹æÔò
Ò²¿É¼òÐ´Îª:CS^DB.A[1%,75%]¡£
¹ØÁª¹æÔòÖÐµÄ»ù±¾¸ÅÄîÈçÏÂ¡£
1)ÏîÓëÏî¼¯
Êý¾Ý¿âÖÐ²»¿É·Ö¸îµÄ×îÐ¡ÐÅÏ¢µ¥Î»(¼´¼ÇÂ¼)³ÆÎªÏî(»òÏîÄ¿),ÓÃ·ûºÅi ±íÊ¾,ÏîµÄ¼¯
ºÏ³ÆÎªÏî¼¯¡£Éè¼¯ºÏI={i1,i2,¡­,ik}ÎªÏî¼¯,I ÖÐÏîµÄ¸öÊýÎªk,Ôò¼¯ºÏI ³ÆÎªk-Ïî¼¯¡£
ÀýÈç,¼¯ºÏ{Æ¡¾Æ,Äò²¼,ÄÌ·Û}ÊÇÒ»¸ö3-Ïî¼¯,¶øÄÌ·Û¾ÍÊÇÒ»¸öÏî¡£

2)ÊÂÎñ

Ã¿Ò»¸öÊÂÎñ¶¼ÊÇÒ»¸öÏî¼¯¡£ÉèI={i1,i2,¡­,
k 
}

iÊÇÓÉÊý¾Ý¿âÖÐËùÓÐÏî¹¹³ÉµÄÈ«¼¯, 
ÔòÃ¿Ò»¸öÊÂÎñt¶ÔÓ¦µÄÏî¼¯¶¼ÊÇ
I 
µÄ×Ó¼¯¡£ÊÂÎñÊý¾Ý¿âT={t2,¡­,
n 
}ÊÇÓÉÒ»ÏµÁÐ

t1,t

¾ßÓÐÎ¨Ò»±êÊ¶µÄ(i) ÊÂÎñ×é³ÉµÄ¼¯ºÏ¡£ÀýÈç,Èç¹û°Ñ³¬ÊÐÖÐµÄËùÓÐÉÌÆ·¿´³ÉI,ÔòÃ¿¸ö¹Ë¿ÍÃ¿

ÕÅÐ¡Æ±ÖÐµÄÉÌÆ·¼¯ºÏ¾ÍÊÇÒ»¸öÊÂÎñ,ºÜ¶à¹Ë¿ÍµÄ¹ºÎïÐ¡Æ±¾Í¹¹³ÉÒ»¸öÊÂÎñÊý¾Ý¿â¡£

3)Ïî¼¯µÄÆµÊý

°üº¬Ä³¸öÏî¼¯µÄÊÂÎñÔÚÊÂÎñÊý¾Ý¿âÖÐ³öÏÖµÄ´ÎÊý³ÆÎªÏî¼¯µÄÆµÊý¡£ÀýÈç,ÊÂÎñÊý¾Ý

¿âÖÐÓÐÇÒ½öÓÐ3¸öÊÂÎñt1={Æ¡¾Æ,ÄÌ·Û}¡¢t2={Æ¡¾Æ,Äò²¼,ÄÌ·Û,Ãæ°ü}¡¢t3={Æ¡¾Æ,Äò

²¼,ÄÌ·Û}, ËüÃÇ¶¼°üº¬ÁËÏî¼¯I1={Æ¡¾Æ,ÄÌ·Û}, Ôò³ÆÏî¼¯I1 µÄÆµÊýÎª3,Ïî¼¯µÄÆµÊý´ú

±íÁËÖ§³Ö¶È¼ÆÊý¡£

4)¹ØÁª¹æÔò

¹ØÁª¹æÔòÊÇÐÎÈç
X 
.
Y 
µÄÔÌº¬Ê½,ÆäÖÐ
X 
¡¢
Y 
·Ö±ðÊÇÏî¼¯
I 
µÄÕæ×Ó¼¯,²¢ÇÒ
X 
¡ÉY= 

.,
X 
³ÆÎª¹æÔòµÄÇ°Ìá,
Y 
ÖÐµÄ

Y 
³ÆÎª¹æÔòµÄ½á¹û¡£¹ØÁª¹æÔò·´Ó³ÁË
X 
ÖÐµÄÏîÄ¿³öÏÖÊ±,

ÏîÄ¿Ò²¸ú×Å³öÏÖµÄ¹æÂÉ¡£

5)Ö§³Ö¶È

¹ØÁª¹æÔòµÄÖ§³Ö¶ÈÊÇÊÂÎñ¼¯ÖÐÍ¬Ê±°üº¬Ïî
X 
ºÍ
Y 
µÄÊÂÎñÊýÓëÊÂÎñ¼¯ÖÐ×ÜÊÂÎñÊýµÄ
±ÈÖµ¡£Ëü·´Ó³ÁË
X 
ºÍ
Y 
ÖÐËù°üº¬µÄÏîÔÚÊÂÎñ¼¯ÖÐÍ¬Ê±³öÏÖµÄ¸ÅÂÊ,¼ÇÎªsupport(
X 
. 
Y), ¼´
support(
X 
.Y)=support(
X 
¡ÈY)=P(XY) (3-1)

6)ÖÃÐÅ¶È
¹ØÁª¹æÔòµÄÖÃÐÅ¶ÈÊÇÊÂÎñ¼¯ÖÐÍ¬Ê±°üº¬
X 
ºÍ
Y 
µÄÊÂÎñÊýÓë°üº¬
X 
µÄÊÂÎñÊýµÄ±È
Öµ,¼ÇÎªconfidence(
X 
.Y)¡£ÖÃÐÅ¶È·´Ó³ÁË°üº¬
X 
µÄÊÂÎñÖÐ³öÏÖ
Y 
µÄÌõ¼þ¸ÅÂÊ,¼´

nice(support(
X 
¡ÈY) Y|X)(-2)

cofdenX 
.Y)=X) P(3

7)×îÐ¡Ö§³Ö¶ÈÓë×îÐ¡ÖÃÐÅ¶È
support(

Í¨³£,Ö§³Ö¶ÈÓëÖÃÐÅ¶È±ØÐë¶¼´óÓÚ(»òµÈÓÚ)ÈËÎªÉèÖÃµÄãÐÖµ,²Å±íÃ÷ÏîÓëÏîÖ®¼ä´æÔÚ
¹ØÁª¡£Ö§³Ö¶ÈµÄãÐÖµ³ÆÎª×îÐ¡Ö§³Ö¶È(minsup), ËüÃèÊöÁË¹ØÁª¹æÔòµÄ×îµÍÖØÒª³Ì¶È;ÖÃ
ÐÅ¶ÈµÄãÐÖµ³ÆÎª×îÐ¡ÖÃÐÅ¶È(min_conf), Ëü·´(_) Ó³ÁË¹ØÁª¹æÔò±ØÐëÂú×ãµÄ×îÐ¡¿É¿¿ÐÔ¡£

8)Ç¿¹ØÁª¹æÔò

Èç¹ûÄ³Ìõ¹ØÁª¹æÔò
X 
.
Y 
µÄÖ§³Ö¶È´óÓÚ»òµÈÓÚ×îÐ¡Ö§³Ö¶È,ÖÃÐÅ¶È´óÓÚ»òµÈÓÚ×îÐ¡

ÖÃÐÅ¶È,Ôò³Æ¹ØÁª¹æÔòX.
Y 
ÎªÇ¿¹ØÁª¹æÔò,·ñÔò³Æ
X 
.
Y 
ÎªÈõ¹ØÁª¹æÔò¡£Ö»ÓÐÇ¿¹ØÁª¹æ

Ôò²ÅÓÐÊµ¼ÊÒâÒå,Òò´ËÍ¨³£ËùËµµÄ¹ØÁª¹æÔò¶¼Ö¸Ç¿¹ØÁª¹æÔò¡£

9)Æµ·±Ïî¼¯
X,µÄÖ§³Ö¶ÈspprX.Èç¹ûÄ³¸öÏî¼¯µÄÖ§³Ö¶È´óÓÚ»òµÈÓÚ×îÐ¡Ö§³Ö¶È,¼´Ïî¼¯{Y} uot(
Y)¡Ýminsup,Ôò³Æ¸ÃÏî¼¯ÎªÆµ·±Ïî¼¯¡£ÇóÆµ·±Ïî¼¯ÊÇÇóÇ¿¹ØÁª¹æÔòµÄµÚÒ»²½¡£
Ö§³Ö¶È(_) ºÍÖÃÐÅ¶ÈµÄÊ¾ÒâÍ¼ÈçÍ¼3-1ËùÊ¾¡£ÆäÖÐ,Èô
T 
´ú±íÊÂÎñÊý¾Ý¿â,Ôò
A 
µÄÖ§³Ö
¶È¾ÍÊÇA/T,A.
C 
»òC.
A 
µÄÖ§³Ö¶ÈÎª(A¡ÉC)/T,A.
C 
µÄÖÃÐÅ¶ÈÎª(A¡ÉC)/A¡£
¡¾Àý3-1¡¿ÏÖÓÐÊÂÎñÊý¾Ý¿â
T 
Èç±í3-1ËùÊ¾,Éè×îÐ¡Ö§³Ö¶ÈÎª50%,×îÐ¡¿ÉÐÅ¶ÈÎª

68 


Í¼3-1 Ö§³Ö¶ÈºÍÖÃÐÅ¶ÈµÄÊ¾ÒâÍ¼
50%,ÇóËùÓÐÆµ·±Ïî¼¯(2Ïî¼¯ÒÔÉÏ)ºÍÇ¿¹ØÁª¹æÔò¡£

±í3-
1 
ÊÂÎñÊý¾Ý¿â
T 

½»Ò×ID 1001 1002 1003 1004 
¹ºÂòµÄÉÌÆ·A,B,
C 
A,
D 
A,
C 
B,E,
F 

½â:ÊÂÎñÊý¾Ý¿â
T 
ÖÐ¹²4¸öÊÂÎñ,Ïî¼¯{A,C}ÔÚËùÓÐÊÂÎñÖÐ³öÏÖÁË2´Î,Òò´Ë{A,C}
µÄÖ§³Ö¶ÈÎª2/4=50%,²»Ð¡ÓÚ×îÐ¡Ö§³Ö¶È,ÆäÓàÏî¼¯(2Ïî¼¯ÒÔÉÏ)¾ùÖ»³öÏÖ¹ý1´Î,¹ÊÏî
¼¯{A,C}Îª
T 
ÖÐÎ¨Ò»µÄÆµ·±Ïî¼¯¡£

ÔÚÆµ·±Ïî¼¯µÄ»ù´¡ÉÏÇóÇ¿¹ØÁª¹æÔò,Ïî¼¯{A,C}¿ÉÒÔ¹¹³ÉµÄ¹ØÁª¹æÔòÓÐ2Ìõ,¼´
A.
C 
ºÍC.
A 
confidence(A.C)=support(
A 
¡ÈC)/support(A)=(2/4)/(3/4)=2/3=66% 
confidence(C.A)=support(
C 
¡ÈA)/support(C)=2/2=100% 

ÒòÎªA.
C 
ºÍC.
A 
µÄÖÃÐÅ¶È¾ù´óÓÚ×îÐ¡ÖÃÐÅ¶È,Òò´ËËüÃÇ¶¼ÊÇÇ¿¹ØÁª¹æÔò¡£
ËµÃ÷: 

¢ÙÔÚÍ¬Ò»¸öÊÂÎñÊý¾Ý¿âÖÐ,ËùÓÐÏî¼¯µÄÖ§³Ö¶ÈµÄ·ÖÄ¸¶¼ÏàÍ¬,ÀýÈç±¾ÀýÎª4¡£Òò´Ë, 
ÔÚÇóÖÃÐÅ¶ÈÊ±,Á½¸öÏî¼¯Ö§³Ö¶ÈµÄ·ÖÄ¸¿ÉÒÔÔ¼È¥,¹Ê¿ÉÖ±½ÓÓÃÏî¼¯µÄÆµÊýÏà³ýÇóÖÃÐÅ¶È¡£
¢ÚÎªÊ²Ã´ÓÃÖ§³Ö¶ÈºÍÖÃÐÅ¶È¾ÍÄÜ±íÊ¾¹ØÁªÐÔÄØ,ÕâÊÇÒòÎª: 
¼ÙÉèÒ»¸ö³¬ÊÐÒ»ÌìÓÐ10000 ÌõÏúÊÛ¼ÇÂ¼,Èç¹û100 ÌõÏúÊÛ¼ÇÂ¼ÖÐ¶¼Í¬Ê±ÏúÊÛÁË
A 
ÉÌ
Æ·ºÍ
C 
ÉÌÆ·,µ±È»¿ÉÒÔÈÏÎªÉÌÆ·
A 
ºÍ
C 
Ö®¼ä¾ßÓÐÄ³ÖÖÏúÊÛ¹ØÁªÐÔ,Õâ¾ÍÊÇÖ§³Ö¶È¡£µ«ÊÇ, 
Èç¹ûÁíÍâ900 ÌõÏúÊÛ¼ÇÂ¼ÀïÒ²ÏúÊÛÁË
A 
ÉÌÆ·,µ«È´Ã»³öÏÖ
C 
ÉÌÆ·,ÕâÊ±ËÆºõ¾Í²»ÄÜÈÏÎª
Âò
A 
ÉÌÆ·µÄ¹Ë¿ÍÒ»¶¨Ò²»áÂò
C 
ÉÌÆ·,Õâ¾ÍÊÇÖÃÐÅ¶È,Òò´ËÉÌÆ·Ö®¼äµÄ¹ØÁªÐÔÓëÖ§³Ö¶ÈºÍ
ÖÃÐÅ¶È¶¼ÓÐ¹ØÏµ¡£

¡¾Á·Ï°3-1¡¿ÒÑÖª×Ü½»Ò×±ÊÊý(ÊÂÎñÊý)Îª1000,ÆäÖÐ°üº¬Ä³Ð©ÉÌÆ·µÄ½»Ò×ÊýÈçÏÂ¡£
°üº¬¡°Å£ÄÌ¡±:50,°üº¬¡°Ãæ°ü¡±:80,°üº¬¡°¼¦µ°¡±:20; 
°üº¬¡°Å£ÄÌ¡±ºÍ¡°Ãæ°ü¡±:15,°üº¬¡°¼¦µ°¡±ºÍ¡°Ãæ°ü¡±:10,°üº¬¡°Å£ÄÌ¡±ºÍ¡°¼¦µ°¡±:10,°üº¬

¡°Å£ÄÌ¡±¡°¼¦µ°¡±¡°Ãæ°ü¡±:5¡£
Çó¡°Å£ÄÌºÍÃæ°ü¡±µÄÖ§³Ö¶È,¡°Å£ÄÌ¡¢Ãæ°üºÍ¼¦µ°¡±µÄÖ§³Ö¶È;
¡°Å£ÄÌ.Ãæ°ü¡±µÄÖÃÐÅ¶È,¡°Ãæ°ü.Å£ÄÌ¡±µÄÖÃÐÅ¶È; 

69 


¡°Å£ÄÌºÍÃæ°ü.¼¦µ°¡±µÄÖÃÐÅ¶È,¡°¼¦µ°.Å£ÄÌºÍÃæ°ü¡±µÄÖÃÐÅ¶È¡£

3.1.2 
AprioriËã·¨
¹ØÁª¹æÔòÍÚ¾ò¿É·Ö½âÎªÁ½¸ö×ÓÎÊÌâ:µÚÒ»²½ÊÇÕÒ³öÊÂÎñÊý¾Ý¿âÖÐËùÓÐ´óÓÚ»òµÈÓÚÓÃ

»§Ö¸¶¨µÄ×îÐ¡Ö§³Ö¶ÈµÄÊý¾ÝÏî¼¯,¼´Æµ·±Ïî¼¯;µÚ¶þ²½ÊÇÀûÓÃÆµ·±Ïî¼¯Éú³ÉËùÐèÒªµÄ¹ØÁª

¹æÔò,·½·¨ÊÇ¸ù¾ÝÓÃ»§Éè¶¨µÄ×îÐ¡ÖÃÐÅ¶È½øÐÐÈ¡Éá,´Ó¶øµÃµ½Ç¿¹ØÁª¹æÔò¡£Ê¶±ð»ò·¢ÏÖËù

ÓÐÆµ·±Ïî¼¯ÊÇ¹ØÁª¹æÔò·¢ÏÖËã·¨µÄºËÐÄ¡£

1993 Äê,AgrawalµÈÊ×ÏÈÌá³ö¹ØÁª¹æÔò¸ÅÄî,1994 Äê,ÓÖÌá³öÖøÃûµÄAprioriËã·¨,Ö®
ºó¸ÃËã·¨³ÉÎª¹ØÁª¹æÔòÍÚ¾òµÄ¾­µäËã·¨¡£

1.AprioriËã·¨µÄÔ­ÀíºÍÊµÀý
AprioriËã·¨µÄ»ù±¾Ë¼ÏëÊÇ:Í¨¹ý¶ÔÊÂÎñÊý¾Ý¿âµÄ¶à´ÎÉ¨Ãè¼ÆËãÏî¼¯µÄÖ§³Ö¶È,·¢ÏÖ
ËùÓÐµÄÆµ·±Ïî¼¯,´Ó¶øÉú³É¹ØÁª¹æÔò¡£AprioriËã·¨¶ÔÊý¾Ý¼¯½øÐÐ¶à´ÎÉ¨Ãè¡£µÚÒ»´ÎÉ¨Ãè
Ïî¼¯µÄ¼¯ºÏL1, k>1)´ÎÉ¨ÃèÊ×ÏÈÀûÓÃµÚk

µÃµ½Æµ·±1-µÚk(1´ÎÉ¨ÃèµÄ½á¹ûLk-1²úÉú

ºòÑ¡k-Ïî¼¯µÄ¼¯ºÏCk 
,È»ºóÔÚÉ¨ÃèµÄ¹ý³ÌÖÐÈ·¶¨Ck 
ÖÐÔªËØµÄÖ§³Ö¶È,×îºóÔÚÃ¿Ò»´ÎÉ¨Ãè

½áÊøÊ±¼ÆËãÆµ·±k-Ïî¼¯µÄ¼¯ºÏLk 
,Ëã·¨µ±ºòÑ¡k-Ïî¼¯µÄ¼¯ºÏCk 
Îª¿ÕÊ±½áÊø¡£

¿É¼û,AprioriËã·¨ÊÇÍ¨¹ýÆµ·±1-Ïî¼¯ÇóÆµ·±2-Ïî¼¯,ÔÙÍ¨¹ýÆµ·±2-Ïî¼¯Éú³ÉÆµ·±
3-Ïî¼¯,Èç´Ëµü´ú¡£ÕâÑù×öµÄÀíÂÛÒÀ¾ÝÊÇ:Æµ·±Ïî¼¯µÄÈÎºÎ×Ó¼¯Ò²Ò»¶¨ÊÇÆµ·±µÄ;·´Ö®, 
ÈÎºÎÒ»¸öÏî¼¯ÊÇ·ÇÆµ·±µÄ,ÄÇÃ´ËüµÄ³¬¼¯Ò²Ò»¶¨²»ÊÇÆµ·±Ïî¼¯¡£ÀýÈç,Èç¹û{A,C}²»ÊÇ
Æµ·±Ïî¼¯,ÄÇÃ´{A,B,C}Ò²Ò»¶¨²»»áÊÇÆµ·±Ïî¼¯¡£

¡¾Àý3-2¡¿ÏÖÓÐA¡¢B¡¢C¡¢D¡¢
E 
5ÖÖÉÌÆ·µÄ½»Ò×¼ÇÂ¼±í(¼û±í3-2), ÊÔÕÒ³ö3ÖÖÉÌÆ·µÄ
k=insup¡Ý50%, incon

¹ØÁªÏúÊÛÇé¿ö(3), Éè×îÐ¡Ö§³Ö¶Èm_×îÐ¡ÖÃÐÅ¶Èm_f¡Ý75% ¡£

±í3-
2 
½»Ò×¼ÇÂ¼±í

½»Ò×ºÅ101 102 103 104 
ÉÌÆ·´úÂëA,C,
D 
B,C,
E 
A,B,C,
E 
B,
E 

½â:ÒòÎªÒªÕÒ³ö3ÖÖÉÌÆ·µÄ¹ØÁªÏúÊÛÇé¿ö,ËùÒÔÒªÕÒ³öËùÓÐµÄÆµ·±3-Ïî¼¯¡£ÄÇÃ´,±Ø
ÐëÏÈÕÒÆµ·±1-Ïî¼¯,ÔÙÕÒÆµ·±2-Ïî¼¯¡£

(1)Ê×ÏÈ,µÚ1´ÎÉ¨ÃèÊý¾Ý¿â,²¢¼ÆËãÃ¿¸ö1-Ïî¼¯µÄÖ§³Ö¶È,µÃµ½ºòÑ¡1-Ïî¼¯C1¡£ÔÚ
ºòÑ¡1-Ïî¼¯ÖÐÈ¥µôÖ§³Ö¶ÈÐ¡ÓÚ×îÐ¡Ö§³Ö¶ÈµÄÏî¼¯,µÃµ½Æµ·±1-Ïî¼¯,ÈçÍ¼3-2ËùÊ¾¡£
Í¼3-2 ´ÓºòÑ¡1-Ïî¼¯ÖÐÕÒÆµ·±1-Ïî¼¯

70 


71 
(2)µÚ2´ÎÉ¨Ãè,ÎªÁËµÃµ½ºòÑ¡2-Ïî¼¯,Ëã·¨Ê¹ÓÃC2=L1¡ÞL1,¼´°ÑL1 ÖÐµÄ4¸ö1 
Ïî¼¯Á½Á½×éºÏ,µÃµ½6¸öºòÑ¡2-Ïî¼¯,ÔÙÔÚºòÑ¡2-Ïî¼¯ÖÐÈ¥µô²»Âú×ã×îÐ¡Ö§³Ö¶ÈµÄÏî¼¯, 
µÃµ½Æµ·±2-Ïî¼¯,ÈçÍ¼3-3ËùÊ¾¡£
Í¼3-3 ´ÓºòÑ¡2-Ïî¼¯ÕÒÆµ·±2-Ïî¼¯
(3)µÚ3´ÎÉ¨Ãè,ÎªÁËµÃµ½ºòÑ¡3-Ïî¼¯,Ëã·¨Ê¹ÓÃC3=L2¡ÞL2,¼´°ÑL2 ÖÐµÄ4¸ö2 
Ïî¼¯Á½Á½×éºÏ,²úÉúµÄÏêÏ¸Ïî¼¯ÁÐ±íÈçÏÂ¡£
¢ÙC3=L2¡ÞL2={{A ,B,C},{A ,B,C,E},{A ,C,E},{B,C,E}}¡£
¢Ú Ê¹ÓÃApriori¼ôÖ¦Ëã·¨,ÒòÎª{A ,B,C,E}ÊÇ4Ïî¼¯,¹Ê´ÓC3 ÖÐÉ¾³ý¡£ÁíÍâ,Æµ·±
Ïî¼¯µÄËùÓÐ×Ó¼¯Ò²Ó¦¸ÃÊÇÆµ·±Ïî¼¯,ÈôÄ³¸öºòÑ¡3-Ïî¼¯µÄ×Ó¼¯ÖÐ´æÔÚ·ÇÆµ·±Ïî¼¯,ÔòÓ¦
¸Ã½«¸ÃºòÑ¡3-Ïî¼¯É¾³ý,Õâ³ÆÎªApriori¼ôÖ¦¡£ÔÚC3 ÖÐ,ºòÑ¡3-Ïî¼¯{A ,C,E }µÄ×Ó¼¯
{A ,E}ÊÇ·ÇÆµ·±Ïî¼¯,¹ÊÓ¦½«{A ,C,E}É¾³ý¡£{A ,B,C}µÄ×Ó¼¯{A ,B}Ò²ÊÇ·ÇÆµ·±Ïî¼¯, 
¹ÊÓ¦½«{A ,B,C}É¾³ý,×îÖÕµÃµ½C3 Îª{{B,C,E}}¡£
¢Û ÔÚºòÑ¡3-Ïî¼¯C3 ÖÐÈ¥µô²»Âú×ã×îÐ¡Ö§³Ö¶ÈµÄÏî¼¯,µÃµ½Æµ·±3-Ïî¼¯L3,ÈçÍ¼3-4 
ËùÊ¾¡£
Í¼3-4 ´ÓÆµ·±2-Ïî¼¯µÃµ½ºòÑ¡3-Ïî¼¯µÄ¹ý³Ì
(4)µÃµ½Æµ·±3-Ïî¼¯ºó,¾Í¿ÉÒÔÕÒ³ö3ÖÖÉÌÆ·µÄ¹ØÁªÏúÊÛÇé¿ö,·½·¨ÊÇ:ÕÒ³öÆµ·±3- 
Ïî¼¯{B,C,E}µÄËùÓÐÕæ×Ó¼¯,²¢¼ÆËãÕâÐ©Õæ×Ó¼¯µÄÖ§³Ö¶È¡£ÔÙÓÃÕæ×Ó¼¯µÄÖ§³Ö¶È³ýÒÔ
L3 µÄÖ§³Ö¶È,¾ÍµÃµ½¹ØÁª¹æÔòµÄÖÃÐÅ¶È,ÖÃÐÅ¶È´óÓÚmin_confµÄ¾ÍÊÇÇ¿¹ØÁª¹æÔò,Èç
Í¼3-5ËùÊ¾¡£
ËùÒÔ,×îÖÕµÃµ½µÄÇ¿¹ØÁª¹æÔòÓÐ2Ìõ,¼´B ^C .E [50%,100%]¡¢C ^E .B [50%, 
100%],±íÊ¾¹ºÂòÁËÉÌÆ·B¡¢C µÄ¹Ë¿Í¿ÉÄÜ»á¹ºÂòÉÌÆ·E,¹ºÂòÁËÉÌÆ·C¡¢E µÄ¹Ë¿Í¿ÉÄÜ»á
¹ºÂòÉÌÆ·B¡£

72 
Í¼3-5 ´ÓÆµ·±3-Ïî¼¯ÖÐÕÒÇ¿¹ØÁª¹æÔò
2.AprioriËã·¨µÄÊµÏÖ
AprioriËã·¨µÄÖ÷Òª²½ÖèÈçÏÂ¡£
(1)É¨ÃèÕû¸öÊÂÎñÊý¾Ý¿â,²úÉúºòÑ¡1-Ïî¼¯µÄ¼¯ºÏC1¡£
(2)¸ù¾Ý×îÐ¡Ö§³Ö¶È,ÓÉºòÑ¡1-Ïî¼¯µÄ¼¯ºÏC1 ²úÉúÆµ·±1-Ïî¼¯µÄ¼¯ºÏL1¡£
(3)Éèk ±íÊ¾k-Ïî¼¯,¶Ôk>1,ÖØ¸´ÖÃÐÅ²½Öè(4)~²½Öè(6)¡£
(4)ÓÉLk Ö´ÐÐÁ¬½ÓºÍ¼ôÖ¦²Ù×÷,²úÉúºòÑ¡(k+1)-Ïî¼¯µÄ¼¯ºÏCk+1¡£
(5)¸ù¾Ý×îÐ¡Ö§³Ö¶È,ÓÉºòÑ¡(k+1)-Ïî¼¯µÄ¼¯ºÏCk+1,²úÉúÆµ·±(k+1)-Ïî¼¯µÄ¼¯
ºÏLk+1¡£
(6)ÈôLk+1¡Ù.,Ôòk=k+1,ÌøÍù²½Öè(4);·ñÔò×ªµ½²½Öè(7)¡£
(7)¸ù¾Ý×îÐ¡ÖÃÐÅ¶È,ÓÉÆµ·±Ïî¼¯²úÉúÇ¿¹ØÁª¹æÔò,Ëã·¨½áÊø¡£
AprioriËã·¨ÇóÆµ·±Ïî¼¯µÄÎ±´úÂëÃèÊöÈçÏÂ¡£
ÊäÈë:ÊÂÎñÊý¾Ý¿âD ,×îÐ¡Ö§³Ö¶Èmin_sup¡£
Êä³ö:D ÖÐµÄÆµ·±Ïî¼¯L(k)¡£ 
L1=find_frequent_1-itemsets(D); //ÕÒ³öÆµ·±1-Ïî¼¯
for(k=2;Lk-1 ¡Ù.;k++) { 
Ck =apriori_gen(Lk-1); //²úÉúºòÑ¡k-Ïî¼¯ 
for each ÊÂÎñt in D { //É¨ÃèÊÂÎñÊý¾Ý¿â 
Ct =subset(Ck, t); //µÃµ½t µÄ×Ó¼¯ 
for each candidate c in Ct 
c.count++; 
} 
//·µ»ØºòÑ¡Ïî¼¯ÖÐ²»Ð¡ÓÚ×îÐ¡Ö§³Ö¶ÈµÄÏî¼¯ 
Lk ={c¡ÊCk | c.count¡Ýmin_sup} 
}r
eturn L=ËùÓÐÆµ·±Ïî¼¯Lk µÄ²¢¼¯; 
ÔÚ¸ÃËã·¨ÖÐ,ºòÑ¡Ïî¼¯µÄÉú³ÉÊÇÕû¸öËã·¨µÄºËÐÄ,ÊÇÍ¨¹ýapriori_gen()º¯ÊýµÄÁ¬½Ó
ºÍ¼ôÖ¦Á½²½Éú³ÉµÄ¡£apriori_gen()º¯ÊýµÄ²ÎÊýÎªLk-1,¼´ËùÓÐÆµ·±(k-1)-Ïî¼¯µÄ¼¯ºÏ¡£
Ëü·µ»ØËùÓÐÆµ·±k-Ïî¼¯µÄÒ»¸ö³¬¼¯(superset)¡£·½·¨ÊÇ:Ê×ÏÈ,ÔÚÁ¬½Ó²½,½«Lk-1ÓëLk-1 
×ÔÁ¬½Ó,»ñµÃÒ»¸ök ½×ºòÑ¡Ïî¼¯Ck ,Ìõ¼þp[k-1]<q[k-1]±£Ö¤²»»á³öÏÖÏàÍ¬µÄÀ©Õ¹Ïî

73 
¼¯,¾­¹ýºÏ²¢ÔËËã,Ck .Lk ¡£apriori_gen()º¯ÊýµÄÎ±´úÂëÈçÏÂ¡£ 
Procedure apriori_gen(Lk-1) 
for each Ïî¼¯p in Lk-1 
for each Ïî¼¯q in Lk-1 
if((p[1]=q[1])&& (p[2]=q[2])&&¡­&& (p[k-2]=q[k-2])&& (p[k-1]< 
q[k-1])) { 
c=q Á¬½Óp 
//Èôk-1 Ïî¼¯ÖÐÒÑ¾­´æÔÚ×Ó¼¯c,Ôò½øÐÐ¼ôÖ¦ 
if has_infrequent_subset(c, Lk-1) then 
delete c; //¼ôÖ¦²½,É¾³ý·ÇÆµ·±ºòÑ¡Ïî¼¯ 
else add c to Ck 
} 
return Ck; 
ÆäÖÐ,ÔÚ¼ôÖ¦²½,¶ÔÓÚËùÓÐÏî¼¯c¡ÊCk ,ÈôËüµÄÄ³Ïî(k-1)-Ïî¼¯²»ÔÚLk-1ÖÐ,Ôò½«¸ÃÏî¼¯
c É¾³ý¡£¼ì²âÊÇ·ñ´æÔÚ·ÇÆµ·±Ïî¼¯µÄÎ±´úÂëÈçÏÂ¡£ 
Procedure has_infrequent_subset(c, Lk-1) //¼ì²âÊÇ·ñ´æÔÚ·ÇÆµ·±Ïî¼¯ 
for each(k-1)-subset s of c 
if(s.Lk-1) {return true;} 
return false; 
ÀýÈç,¼ÙÉèÆµ·±2-Ïî¼¯L2={{A ,B},{A ,C},{A ,E},{B,C},{B,D },{B,E}},Ôò
µÃµ½ºòÑ¡3-Ïî¼¯µÄÁ¬½ÓºÍ¼ôÖ¦¹ý³ÌÈçÏÂ¡£
Á¬½Ó²½:L2 °´ÕÕÉÏÃæµÄ²½Öè×ÔÁ¬½ÓµÃµ½{{A,B,C},{A,B,E},{A,C,E},{B,C,D}, 
{B,C,E},{B,D ,E}}¡£
¼ôÖ¦²½:{A ,B,C}µÄËùÓÐ2Ïî×Ó¼¯{A ,B},{A ,C},{B,C}¶¼ÊÇL2 ÖÐµÄÔªËØ,Òò´Ë, 
±£Áô{A ,B,C}ÔÚC3 ÖÐ¡£{B,C,E}µÄ2Ïî×Ó¼¯ÖÐµÄ{C,E }²»ÊÇL2 ÖÐµÄÔªËØ,Òò´Ë,ÔÚ
C3 ÖÐÉ¾³ý{B,C,E},×îÖÕ¼ôÖ¦ºóµÄ½á¹ûÊÇC3={{A ,B,C},{A ,B,E}}¡£
3.AprioriËã·¨µÄÓÅÈ±µã¼°Ó¦ÓÃ
AprioriËã·¨µÄÈ±µãÖ÷Òª±íÏÖÔÚ¼ÆËãÐÔÄÜÉÏ,Æä¼ÆËã¿ªÏúºÄ·ÑÔÚÁ½·½Ãæ:Ò»ÊÇ»á²úÉú
¾Þ´óµÄºòÑ¡¼¯Ck ,Ëã·¨²ÉÓÃ×ÔÁ¬½ÓµÄ·½Ê½²úÉúºòÑ¡¼¯,ÀýÈç,104 ¸öÆµ·±1-Ïî¼¯i ½«Éú³É
107¸öºòÑ¡2-Ïî¼¯,Èç¹ûÒªÕÒ³ß´çÎª100µÄÆµ·±Ä£Ê½,Èç{a1,a2,¡­,a100},Ôò±ØÐëÏÈ²úÉú
2100¡Ö1030¸öºòÑ¡¼¯¡£ÏÔÈ»,Õâ½«ºÄ·Ñ¾Þ´óµÄÄÚ´æ¿Õ¼ä¡£¶þÊÇÐèÒª¶à´ÎÉ¨ÃèÊÂÎñÊý¾Ý¿â, 
Ã¿´Î²úÉúºòÑ¡¼¯¶¼ÒªÉ¨ÃèÒ»´ÎÊý¾Ý¿â,Èç¹û×î³¤µÄÄ£Ê½ÊÇn,ÔòÐèÒª(n+1)´ÎÊý¾Ý¿â
É¨Ãè¡£
AprioriËã·¨µÄÓÅµãÓÐ:ËüÊÇÒ»¸öµü´úËã·¨;Êý¾Ý²ÉÓÃË®Æ½×éÖ¯·½Ê½;¿É²ÉÓÃApriori 
ÓÅ»¯·½·¨;ÊÊºÏÊÂÎñÊý¾Ý¿âµÄ¹ØÁª¹æÔòÍÚ¾ò;ÊÊºÏÏ¡ÊèÊý¾Ý¼¯¡£
AprioriËã·¨¹ã·ºÓ¦ÓÃÓÚÉÌÒµ,ÒÔ¼°Ïû·ÑÊÐ³¡¼Û¸ñ·ÖÎöÖÐ,ËüÄÜºÜ¿ìµØÇó³ö¸÷ÖÖ²úÆ·

74 
Ö®¼äµÄ¼Û¸ñ¹ØÏµ,ÒÔ¼°ËüÃÇÖ®¼äµÄÓ°Ïì¡£Í¨¹ýÊý¾ÝÍÚ¾ò,ÊÐ³¡ÉÌÈË¿ÉÒÔÃé×¼Ä¿±ê¿Í»§,²É
ÓÃ×îÐÂÐÅÏ¢¡¢ÌØÊâµÄÊÐ³¡ÍÆ¹ã»î¶¯»òÆäËûÒ»Ð©ÌØÊâµÄÐÅÏ¢ÊÖ¶Î,¼«´óµØ¼õÉÙ¹ã¸æÔ¤ËãºÍÔö
¼ÓÊÕÈë¡£°Ù»õÉÌ³¡¡¢³¬ÊÐºÍÒ»Ð©ÁãÊÛµêÒ²ÔÚ½øÐÐÊý¾ÝÍÚ¾ò,ÒÔ±ã²Â²âÕâÐ©Äê¹Ë¿ÍµÄÏû·Ñ
Ï°¹ß¡£
AprioriËã·¨Ò²Ó¦ÓÃÓÚÍøÂç°²È«ÁìÓò,ÈçÍøÂçÈëÇÖ¼ì²â¼¼ÊõÖÐ¡£ÔçÆÚÖÐ´óÐÍµÄ¼ÆËã»ú
ÏµÍ³ÖÐ¶¼ÊÕ¼¯Éó¼ÆÐÅÏ¢À´½¨Á¢¸ú×Ùµµ,ÕâÐ©Éó¼Æ¸ú×ÙµÄÄ¿µÄ¶àÊÇÎªÁËÐÔÄÜ²âÊÔ»ò¼Æ·Ñ,Òò
´Ë¶Ô¹¥»÷¼ì²âÌá¹©µÄÓÐÓÃÐÅÏ¢±È½ÏÉÙ¡£AprioriËã·¨Í¨¹ýÄ£Ê½µÄÑ§Ï°ºÍÑµÁ·¿ÉÒÔ·¢ÏÖÍø
ÂçÓÃ»§µÄÒì³£ÐÐÎªÄ£Ê½,Ê¹ÍøÂçÈëÇÖ¼ì²âÏµÍ³¿ÉÒÔ¿ìËÙ·¢ÏÖÓÃ»§µÄÐÐÎªÄ£Ê½,ÄÜ¹»¿ìËÙËø
¶¨¹¥»÷Õß,Ìá¸ßÁË»ùÓÚ¹ØÁª¹æÔòµÄÈëÇÖ¼ì²âÏµÍ³µÄ¼ì²âÐÔ¡£
3.1.3 AprioriËã·¨µÄ³ÌÐòÊµÏÖ
ÓÉÓÚSklearn¿ò¼ÜÖÐÃ»ÓÐÌá¹©¹ØÁª¹æÔò·ÖÎöµÄ¹¦ÄÜ,Òò´ËÃ»ÓÐAprioriºÍFp-growth 
Ëã·¨,µ«ÊÇÆäËûÒ»Ð©Python¹¤¾ß°üÖÐÌá¹©ÁËAprioriËã·¨,¿ÉÒÔÍ¨¹ýhttps://pypi.orgËÑ
Ë÷PythonµÄ¹¤¾ß°ü¡£±¾½ÚÑ¡Ôñefficient-apriori1.1.1,½«Æä°²×°ÎÄ¼þefficient_apriori- 
1.1.1-py3-none-any.whlÏÂÔØÏÂÀ´,È»ºóÖ´ÐÐ¡°pipinstall°²×°ÎÄ¼þÂ·¾¶ºÍÎÄ¼þÃû¡±ÃüÁî¼´
Íê³É°²×°¡£
efficient-aprioriÄ£¿éÌá¹©ÁËaprioriÀà,¸ÃÀàµÄ¹¹Ôìº¯ÊýÓÐ3¸ö²ÎÊý,·Ö±ðÊÇÊý¾Ý¼¯¡¢
×îÐ¡Ö§³Ö¶ÈºÍ×îÐ¡ÖÃÐÅ¶È,Êä³öÊÇËùÓÐµÄÆµ·±Ïî¼¯ºÍ¹ØÁª¹æÔò¡£
¡¾³ÌÐò3-1¡¿ Ê¹ÓÃAprioriËã·¨ÍÚ¾òÊÂÎñÊý¾Ý¼¯dataµÄÆµ·±Ïî¼¯,²¢Êä³ö¹ØÁª¹æÔò¡£ 
from efficient_apriori import apriori #µ¼ÈëÄ£¿é 
#ÉèÖÃÊÂÎñÊý¾Ý¼¯data 
data=[('Å£ÄÌ','Ãæ°ü','Ïã½¶'), 
('¿ÉÀÖ','Ãæ°ü', 'Ïã½¶', 'Æ¡¾Æ'), 
('Å£ÄÌ','Ïã½¶', 'Æ¡¾Æ', '¼¦µ°'), 
('Ãæ°ü', 'Å£ÄÌ', 'Ïã½¶', 'Æ¡¾Æ'), 
('Ãæ°ü', 'Å£ÄÌ', 'Ïã½¶', '¿ÉÀÖ')] 
#ÍÚ¾òÆµ·±Ïî¼¯ºÍÆµ·±¹æÔò
itemsets, rules=apriori(data, min_support=0.5, min_confidence=1) 
print(itemsets) #Êä³öÆµ·±Ïî¼¯
print(rules) #Êä³ö¹ØÁª¹æÔò
¸Ã³ÌÐòµÄÊä³ö½á¹ûÈçÏÂ¡£ 
{1: {('Ïã½¶',): 5, ('Ãæ°ü',): 4, ('Å£ÄÌ',): 4, ('Æ¡¾Æ',): 3}, 
2: {('Å£ÄÌ', 'Ãæ°ü'): 3, ('Å£ÄÌ', 'Ïã½¶'): 4, ('Ãæ°ü', 'Ïã½¶'): 4, ('Æ¡¾Æ', 
'Ïã½¶'): 3}, 
3: {('Å£ÄÌ', 'Ãæ°ü', 'Ïã½¶'): 3}} 
[{Å£ÄÌ} ->{Ïã½¶}, {Ãæ°ü} ->{Ïã½¶}, {Æ¡¾Æ} ->{Ïã½¶}, {Å£ÄÌ, Ãæ°ü} ->{Ïã½¶}] 
ÆäÖÐ,¡°1:¡±±íÊ¾Æµ·±1-Ïî¼¯,¡°('Ïã½¶',):5¡±±íÊ¾Ïã½¶µÄÖ§³Ö¶È¼ÆÊýÎª5¡£

3.4 
FPGothËã·¨
1.-rw

AprioriËã·¨ÓÉÓÚ»áÖØ¸´É¨ÃèÊý¾Ý¿â,²¢ÇÒ²úÉú¾Þ´óµÄºòÑ¡¼¯,µ¼ÖÂÆäËã·¨ÐÔÄÜ½Ï²î¡£
2000Äê,ÓÉº«¼Îì¿µÈÌá³öµÄÒ»ÖÖ²»²úÉúºòÑ¡Ïî¼¯µÄËã·¨,³ÆÎªFP-Growth(Frequent 
PaternGrowth,Æµ·±Ä£Ê½Ê÷Ôö³¤)Ëã·¨,Ëü²ÉÓÃ·Ö¶øÖÎÖ®µÄË¼Ïë,½«Êý¾Ý¿âÖÐµÄÆµ·±Ïî¼¯
Ñ¹Ëõµ½Ò»¿ÃÆµ·±Ä£Ê½Ê÷ÖÐ,Í¬Ê±±£³ÖÏî¼¯Ö®¼äµÄ¹ØÁª¹ØÏµ¡£È»ºó,½«ÕâÐ©Ñ¹ËõºóµÄÆµ·±Ä£
Ê½Ê÷·Ö³ÉÒ»Ð©Ìõ¼þ×ÓÊ÷,Ã¿¸öÌõ¼þ×ÓÊ÷¶ÔÓ¦Ò»¸öÆµ·±Ïî,´Ó¶ø»ñµÃÆµ·±Ïî¼¯,×îºóÍÚ¾ò
³ö¹ØÁª¹æÔò¡£¸ÃËã·¨×Ü¹²Ðè¶ÔÊý¾Ý¿â½øÐÐÁ½´ÎÉ¨Ãè,Òò´ËÄÜÏÔÖø¼Ó¿ì·¢ÏÖÆµ·±Ïî¼¯µÄ

ËÙ¶È¡£
hËã·¨µÄÖ÷ÒªÈÎÎñÊÇ½«Êý¾Ý¼¯´æ´¢ÔÚFPe(Æµ·±Ä£Ê½Ê÷)ÖÐ,Í¨¹ýFP

FP-Growt-Tr-Tre 
¿ÉÒÔ¸ßÐ§µØ·¢ÏÖÆµ·±Ïî¼¯,Ö´ÐÐËÙ¶ÈÍ¨³£±ÈAprioriËã·¨¿ìÁ½¸öÊýÁ¿¼¶¡£FP-GrowthËã
·¨Ö»¸ø³öÁË¸ßÐ§µØ·¢ÏÖÆµ·±Ïî¼¯µÄ·½·¨,µ«²»ÄÜÓÃÓÚ·¢ÏÖ¹ØÁª¹æÔò¡£

1.FP-GrowthËã·¨µÄÔ­Àí¼°ÊµÀý
FP-GrowthËã·¨µÄ»ù±¾Ë¼Â·ÈçÏÂ¡£

(1)±éÀúÒ»´ÎÊý¾Ý¿â,ÕÒ³öÆµ·±1-Ïî¼¯,°´µÝ¼õË³ÐòÅÅÐò¡£
(2)½¨Á¢FP-Tre
¡£
(3)ÀûÓÃFP-Tre 
ÎªÆµ·±1-Ïî¼¯µÄÃ¿Ò»Ïî¹¹ÔìÌõ¼þFP-Tre
¡£
(4)µÃµ½Æµ·±Ïî¼¯¡£
¡¾Àý3-3¡¿±í3-3ÊÇÒ»¸öÊÂÎñÊý¾Ý¿â,ÊÔÀûÓÃFP-GrowthËã·¨ÕÒ³öËùÓÐº¬2ÏîÒÔÉÏ
µÄÆµ·±Ïî¼¯(Éè×îÐ¡Ö§³Ö¶È¼ÆÊýÎª2)¡£

±í3-
3 
ÊÂÎñÊý¾Ý¿â

½»Ò×ºÅÉÌÆ·´úÂë½»Ò×ºÅÉÌÆ·´úÂë
1 A,B,
E 
6 B,
C 
2 B,
D 
7 A,
C 
3 B,
C 
8 A,B,C,
E 
4 A,B,
D 
9 A,B,
C 
5 A,
C 

½â:(1)É¨ÃèÊÂÎñÊý¾Ý¿âµÃµ½Æµ·±1-Ïî¼¯,Èç±í3-4ËùÊ¾,ÕâÊÇµÚ1´ÎÉ¨ÃèÊý¾Ý¿â¡£
±í3-
4 
Æµ·±1-Ïî¼¯

A B C D E 
6 7 6 2 2 

(2)¶ÔÆµ·±1-Ïî¼¯°´Ïî¼¯µÄÆµÊý´Ó´óµ½Ð¡ÅÅÐò,µÃµ½ÅÅÐòºóµÄÆµ·±1-Ïî¼¯,Èç±í3-5 
ËùÊ¾¡£
75 


±í3-
5 
ÅÅÐòºóµÄÆµ·±1-Ïî¼¯

B A C D E 
7 6 6 2 2 

(3)°´Æµ·±1-Ïî¼¯Ö§³Ö¶ÈµÝ¼õµÄË³ÐòÖØÐÂÅÅÐòÊÂÎñÊý¾Ý¿âÖÐµÄÏî,Èç±í3-6ËùÊ¾¡£
±í3-
6 
°´Ö§³Ö¶È¼ÆÊýµÝ¼õÅÅÐòµÄÊÂÎñÊý¾Ý¿â

½»Ò×ºÅÉÌÆ·´úÂë½»Ò×ºÅÉÌÆ·´úÂë
1 B,A,
E 
6 B,
C 
2 B,
D 
7 A,
C 
3 B,
C 
8 B,A,C,
E 
4 B,A,
D 
9 B,A,
C 
5 A,
C 

(4)´´½¨FP-Tre 
µÄ¸ù½áµãºÍÆµ·±ÏîÄ¿±í,FP-Tre 
µÄ¸ù½áµã×ÜÊÇNul
¡£
(5)ÏòFP-Tre 
ÖÐ¼ÓÈëÃ¿¸öÊÂÎñ,ÕâÊÇµÚ2´ÎÉ¨ÃèÊý¾Ý¿â¡£ÀýÈç,¾­ÅÅÐòºóµÄµÚ1¸ö
ÊÂÎñÊÇ{B,A,E},Ôò°´ÕÕ¸ÃÅÅÐòË³Ðò½«B¡¢A¡¢
E 
ÒÀ´ÎÌí¼Óµ½FP-Tre 
µÄÒ»¸ö·ÖÖ§ÖÐ,²¢
½«¼ÆÊýÖµÉèÎª1,ÈçÍ¼3-6ËùÊ¾¡£ÎªÁË·½±ã±éÀú,FP-GrowthËã·¨»¹ÐèÒªÒ»¸ö³ÆÎª½áµãÍ·
(Node-head)Ö¸Õë±íµÄÊý¾Ý½á¹¹,ÕâÊÇÒ»¸öÓÃÀ´¼ÇÂ¼¸÷¸öÔªËØÏîµÄ×Ü³öÏÖ´ÎÊýµÄÊý×é,ÔÙ¸½
´øÒ»¸öÖ¸ÕëÖ¸ÏòFP-Tre 
ÖÐ¸ÃÔªËØÏîµÄµÚÒ»¸ö½áµã,ÕâÑùÃ¿¸öÔªËØÏî¶¼¹¹³ÉÒ»Ìõµ¥Á´±í¡£
Í¼3-6 ÏòFP-Tre 
ÖÐ¼ÓÈëµÚ1¸öÊÂÎñ

(6)È»ºóÒÀ´Î¼ÓÈëµÚ2¸öÊÂÎñ(¼û3-7)ºÍµÚ3¸öÊÂÎñ(¼ûÍ¼3-8),Èç¹ûFP-Tre 
ÖÐÒÑ
¾­ÓÐ¸ÃÊÂÎñ,Ôò½«¸ÃÊÂÎñµÄ¼ÆÊý¼Ó1¡£
Í¼3-7 ¼ÓÈëµÚ2¸öÊÂÎñ

76 


77 
Í¼3-8 ¼ÓÈëµÚ3¸öÊÂÎñ
(7)°´ÕÕÉÏÊö·½·¨¼ÓÈëÊ£ÏÂµÄµÚ4~9¸öÊÂÎñ¡£×îÖÕÉú³ÉµÄFP-TreeÈçÍ¼3-9ËùÊ¾¡£
Í¼3-9 ×îÖÕÉú³ÉµÄFP-Tree 
ÔÚFP-Tree½¨Á¢ºÃÖ®ºó,Ö»ÒªÑ°ÕÒ½áµãµÄÌõ¼þÄ£Ê½»ù(conditionalpatternbase),¾Í
ÄÜ¿ìËÙµÃµ½Æµ·±Ïî¼¯¡£Ìõ¼þÄ£Ê½»ùÊÇÒÔËù²éÕÒÔªËØÏîÎª½áÎ²µÄÂ·¾¶¼¯ºÏ¡£Ã¿Ò»ÌõÂ·¾¶Æä
Êµ¶¼ÊÇÒ»ÌõÇ°×ºÂ·¾¶¡£
ÀýÈç,ÒªÕÒ°üº¬E µÄÆµ·±Ïî¼¯,·½·¨ÊÇ:´ÓÔªËØE ÏòÉÏÕÒËüµÄÇ°×ºÂ·¾¶,Í¼3-9ÖÐÓÐ
2¸ö½áµãE,Òò´ËE µÄÇ°×ºÂ·¾¶ÓÐ2Ìõ¡£Ìõ¼þÄ£Ê½»ùµÄ¼ÆÊýÎªE µÄ¼ÆÊýÖµ(±¾Àý¾ùÎª1)¡£
µÃµ½E µÄÌõ¼þÄ£Ê½»ùÎª 
<(B,A):1>,<(B,A,C):1> 
½«Ìõ¼þÄ£Ê½»ùÖÐ½áµãµÄ³öÏÖ´ÎÊýºÏ²¢,µÃµ½°üº¬E µÄÆµ·±Ïî¼¯Îª 
{{B,E:2},{A,E:2},{A,B,E:2}} 
Í¬Àí,¶ÔÓÚÔªËØC,µÃµ½µÄÌõ¼þÄ£Ê½»ùÎª 
<(B,A):2>,<B:2>,<A:2> 
µÃµ½C µÄÆµ·±Ïî¼¯Îª 
{{B,C:4},{A,C:4},{A,B,C:2}}

ÆäËû½áµãµÄÆµ·±Ïî¼¯Ò²ÊÇ°´ÉÏÊö²½ÖèÉú³ÉµÄ,´Ó¶øµÃµ½ËùÓÐÆµ·±Ïî¼¯,ÔÙ¸ù¾ÝÆµ·±Ïî
¼¯Éú³É¹ØÁª¹æÔò¼´¿ÉÍê³É¹ØÁª¹æÔòµÄÍÚ¾ò¡£

2.FP-GrowthËã·¨µÄ³ÌÐòÊµÏÖ
FP-GrowthËã·¨µÄ³ÌÐòÊµÏÖ²½ÖèÈçÏÂ¡£

(1)½¨Á¢Í·Ö¸Õë:±éÀúÊý¾Ý¼¯,ÕÒ³öËùÓÐµÄÆµ·±Ò»Ïî¼¯,¹¹³ÉÍ·Ö¸Õë,²¢¸ù¾ÝÖ§³Ö¶È
¶ÔÒ»Ïî¼¯ÅÅÐò¡£
(2)½¨Á¢FP-Tre:¶¨Òå¸ù½áµã,±éÀúÊý¾Ý¼¯,¶ÔÓÚÃ¿Ìõ¼ÇÂ¼,¸ù¾ÝÍ·Ö¸ÕëµÄË³ÐòÏòÊ÷
ÖÐÌí¼Ó½áµã¡£Èç¹û¼ÇÂ¼ÖÐÉÏÒ»¸ö½áµãµÄ×Ó½áµãÖÐµ±Ç°½áµãÒÑ´æÔÚ,Ôò½áµãÖ§³Ö¶È+¼ÇÂ¼
Ö§³Ö¶È;Èç¹û½áµã²»´æÔÚ,ÔòÔÚÉÏÒ»½áµãÖÐÌí¼Óµ±Ç°×Ó½áµã,²¢ÉèÖÃÖ§³Ö¶ÈÎª¼ÇÂ¼Ö§³Ö¶È¡£
(3)²éÕÒÌõ¼þÄ£Ê½»ù:¸ù¾ÝÍ·Ö¸Õë²éÕÒÃ¿¸öÒ»Ïî¼¯µÄÇ°×ºÂ·¾¶,×÷ÎªÌõ¼þÄ£Ê½»ù,ÇÒ
µ±Ç°Ò»Ïî¼¯×÷ÎªÆµ·±Ïî»ù¡£
(4)²éÕÒÆµ·±Ïî:Éî¶È±éÀú,ÖØ¸´²½Öè(3)¡£Ã¿´Î²éÕÒÍê³Éºó,½«Ã¿Ò»²ã±éÀúµÄÆµ·±Ïî¼¯
+ÐÂµÄÍ·Ö¸ÕëÖÐµÄÆµ·±Ò»Ïî¼¯×÷ÎªÆµ·±Ïî,ÖØ¸´´Ë²½Öè,Ö±µ½FP-Tre 
µÄÍ·Ö¸ÕëÎª¿Õ¡£
ÏÂÃæ¸ø³öFP-GrowthËã·¨µÄÃèÊö¡£
ÊäÈë:ÊÂÎñ¼¯D¡¢×îÐ¡Ö§³Ö¶È¡£
Êä³ö:FP-Tre
¡¢Í·Ö¸Õë±í¡£
Ëã·¨²½ÖèÈçÏÂ¡£
(1)±éÀúÊÂÎñ¼¯D,Í³¼Æ¸÷ÔªËØÏî³öÏÖµÄ´ÎÊý,´´½¨Í·Ö¸Õë±í¡£
(2)ÒÆ³ýÍ·Ö¸Õë±íÖÐ²»Âú×ã×îÐ¡Ö§³Ö¶ÈµÄÔªËØÏî¡£
(3)µÚ¶þ´Î±éÀúÊý¾Ý¼¯,´´½¨FP-Tre
¡£¶ÔÃ¿¸öÊÂÎñ¼¯ÖÐµÄÏî¼¯¡£
¢Ù³õÊ¼»¯¿ÕFP-Tre; 
¢Ú¶ÔÃ¿¸öÏî¼¯½øÐÐ¹ýÂËºÍÖØÅÅÐò; 
¢ÛÊ¹ÓÃÕâ¸öÏî¼¯¸üÐÂFP-Tre,´ÓFP-Tre 
µÄ¸ù½áµã¿ªÊ¼: 
¡ñ Èç¹ûµ±Ç°Ïî¼¯µÄµÚÒ»¸öÔªËØÏî´æÔÚÓÚFP-Tre 
µ±Ç°½áµãµÄ×Ó½áµãÖÐ,Ôò¸üÐÂÕâ¸ö
×Ó½áµãµÄ¼ÆÊýÖµ¡£
·ñÔò,´´½¨ÐÂµÄ×Ó½áµã,¸üÐÂÍ·Ö¸Õë±í¡£
¡ñ

¡ñ ¶Ôµ±Ç°Ïî¼¯µÄÆäÓàÔªËØÏîºÍµ±Ç°ÔªËØÏîµÄ¶ÔÓ¦×Ó½áµãµÝ¹é¢ÛµÄ¹ý³Ì¡£
3.FP-GrowthËã·¨µÄÌØµã
FP-GrowthËã·¨µÄÓÅµã°üÀ¨²»Éú³ÉºòÑ¡¼¯,²»ÓÃºòÑ¡²âÊÔ;Ê¹ÓÃ½ôËõµÄÊý¾Ý½á¹¹;±Ü
ÃâÖØ¸´Êý¾Ý¿âÉ¨Ãè;»ù±¾²Ù×÷ÊÇ¼ÆÊýºÍ½¨Á¢FP-Tre
¡£È±µãÊÇ:ÊµÏÖ±È½ÏÀ§ÄÑ,ÔÚÄ³Ð©Êý
¾Ý¼¯ÉÏÐÔÄÜ»áÏÂ½µ¡£

3.ÍÆ¼öÏµÍ³¼°Ëã·¨
2 

ÍÆ¼öÏµÍ³ÔÚ»¥ÁªÍøÁìÓòÓÐ·Ç³£¹ã·ºµÄÓ¦ÓÃ,ÍÆ¼ö¿ÉÒÔÂú×ãÓÃ»§·ÇÃ÷È·µÄÇ±ÔÚÐèÇó,¶ø
ËÑË÷ÓÃÀ´Âú×ãÓÃ»§Ö÷¶¯±í´ïµÄÐèÇó¡£¿É¼û,ÍÆ¼öÊÇËÑË÷¹¦ÄÜµÄÖØÒª²¹³ä¡£¾ÝÍ³¼Æ,ÔÚµç×Ó

78 


ÉÌÎñÍøÕ¾ÖÐ,ÓÐ35%µÄÏúÊÛÀ´Ô´ÍÆ¼ö¡£ÔÚÊÓÆµ²¥·ÅÍøÕ¾ÖÐ,ÓÐ75%µÄ¹Û¿´À´×ÔÍÆ¼ö¡£ÔÚ
½»ÓÑÍøÕ¾ÖÐ,ÍÆ¼öÏµÍ³³£¸ù¾ÝºÃÓÑµÄ°®ºÃ,ÏòÓÃ»§ÍÆ¼öËû¿ÉÄÜ¸ÐÐËÈ¤µÄÈË¡£ÔÚÒÆ¶¯App
ÖÐ,¾­³£¸ù¾ÝÓÃ»§Ëù´¦µÄµØÀíÎ»ÖÃÍÆ¼ö¸½½üµÄ¾°µã¡¢ÃÀÊ³ºÍ×¡ËÞµÈÐÅÏ¢¡£¿É¼û,ÍÆ¼öÔÚ»¥
ÁªÍøÁìÓòÎÞ´¦²»ÔÚ,ÕâÊÇÒòÎª»¥ÁªÍøÉÏÐÅÏ¢¹ýÔØ,ÓÃ»§³£±»äÎÃ»ÔÚÐÅÏ¢ÖÐ,¶ø¶Ô×Ô¼ºµÄÊµ
¼ÊÐèÇó²»Ã÷È·;Æä´Î,ÍÆ¼öºÜÇ¿µØÒÀÀµÓÚÓÃ»§ÐÐÎª,»¥ÁªÍøÉÏºÜÄÑ»ñÈ¡ÓÃ»§µÄÕæÊµÐÅÏ¢ºÍ
Ï²ºÃ,Ö»ÄÜÍ¨¹ý²¶»ñÓÃ»§µÄÐÐÎª»ñÈ¡,Èç¼ÇÂ¼ÓÃ»§µÄä¯ÀÀÀúÊ·,µã»÷¡¢ÊÕ²Ø¡¢ËÑË÷µÈÐÐÎª,¸ù
¾ÝÕâÐ©ÐÐÎªºâÁ¿ÓÃ»§µÄÐËÈ¤¡£

ÍÆ¼öÏµÍ³ÊÇÍ¨¹ýÓÃ»§Óë²úÆ·Ö®¼äµÄ¶þÔª¹ØÏµ,ÀûÓÃÒÑÓÐµÄÑ¡Ôñ¹ý³Ì»òÏàËÆÐÔ¹ØÏµÍÚ
¾òÃ¿¸öÓÃ»§Ç±ÔÚµÄ¸ÐÐËÈ¤¶ÔÏó,½ø¶ø½øÐÐ¸öÐÔ»¯ÍÆ¼ö,Æä±¾ÖÊÊÇÐÅÏ¢¹ýÂË¡£Ò»¸öÍêÕûµÄÍÆ
¼öÏµÍ³ÓÉ3¸öÄ£¿é×é³É:ÊÕ¼¯ÓÃ»§ÐÅÏ¢µÄÐÐÎª¼ÇÂ¼Ä£¿é¡¢·ÖÎöÓÃ»§Ï²ºÃµÄÄ£ÐÍ·ÖÎöÄ£¿é
ºÍÍÆ¼öËã·¨Ä£¿é¡£ÆäÖÐ,Ð­Í¬¹ýÂËÍÆ¼öËã·¨ÊÇÍÆ¼öÏµÍ³×î³£ÓÃµÄËã·¨,ËüÄÜ·ÖÎöÓÃ»§µÄÏ²
ºÃ,²¢¸ù¾ÝÍÆ¼öËã·¨½øÐÐÍÆ¼ö¡£

2.Ð­Í¬¹ýÂËÍÆ¼öËã·¨
3.1 

Ð­Í¬¹ýÂË(colaborativefiltering,CF)ÍÆ¼öËã·¨ÊÇÍÆ¼öÏµÍ³ÖÐÖ÷Á÷µÄÍÆ¼öËã·¨¡£Ëü°ü
À¨Ð­Í¬ºÍ¹ýÂËÁ½¸ö²Ù×÷¡£ËùÎ½Ð­Í¬,¾ÍÊÇÀûÓÃÈºÌåµÄÐÐÎª×ö¾ö²ß(ÍÆ¼ö),¶ø¹ýÂËÊÇ´Ó¿ÉÐÐ
µÄ¾ö²ß(ÍÆ¼ö)·½°¸(±êµÄÎï)ÖÐ½«ÓÃ»§Ï²»¶µÄ·½°¸ÕÒ(¹ýÂË)³öÀ´¡£

1.Á½ÖÖÐ­Í¬¹ýÂËÍÆ¼öËã·¨
Ð­Í¬¹ýÂËÍÆ¼ö·ÖÎª»ùÓÚÓÃ»§µÄÐ­Í¬¹ýÂË·½·¨(user-basedCF)ºÍ»ùÓÚÎïÆ·µÄÐ­Í¬¹ý
ÂË·½·¨(dCF )¡£

item-base

»ùÓÚÓÃ»§µÄÐ­Í¬¹ýÂË»ù±¾¼ÙÉèÎª:ÎªÁË¸øÓÃ»§ÍÆ¼ö¸ÐÐËÈ¤µÄÄÚÈÝ,¿ÉÍ¨¹ýÕÒµ½Óë¸Ã
ÓÃ»§Æ«ºÃÏàËÆµÄÆäËûÓÃ»§,²¢½«ËûÃÇ¸ÐÐËÈ¤µÄÄÚÈÝÍÆ¼ö¸ø¸ÃÓÃ»§¡£¾ÙÀýÀ´Ëµ,Èç¹ûA¡¢
B 
Á½¸öÓÃ»§¶¼¹ºÂòÁËx¡¢y¡¢zÈý±¾Í¼Êé,²¢ÇÒ¸ø³öÁË5ÐÇºÃÆÀ¡£ÄÇÃ´,
A 
ºÍ
B 
¾ÍÊôÓÚÏàËÆµÄ
ÓÃ»§¡£¿ÉÒÔ½«
A 
¿´¹ýµÄÍ¼ÊéwÍÆ¼ö¸øÓÃ»§B¡£

»ùÓÚÎïÆ·µÄÐ­Í¬¹ýÂË»ù±¾¼ÙÉèÎª:Èç¹ûÒ»¸öÓÃ»§¶ÔÄ³¸öÎïÆ·¸ÐÐËÈ¤,Ôò½«Óë¸ÃÎïÆ·
ÏàËÆµÄÆäËûÎïÆ·ÍÆ¼ö¸ø¸ÃÓÃ»§¡£ÎïÆ·ÓëÎïÆ·Ö®¼äµÄÏàËÆÐÔ¸ù¾ÝÎïÆ·ÊÇ·ñ±»Ðí¶àÓÃ»§Í¬Ê±
¹ºÂòÀ´ÆÀÅÐ,¶ø²»»á¿¼ÂÇÎïÆ·±¾ÉíµÄÊôÐÔ¡£ÀýÈç,ÓÐºÜ¶à¹ºÂòiPhoneÊÖ»úµÄÓÃ»§Ò²Í¬Ê±
¹ºÂòÁËiPad,ÔòËµÃ÷iPhoneºÍiPadÕâÁ½ÖÖÎïÆ·¾ßÓÐÏàËÆÐÔ,¿ÉÏò¹ºÂòÁËiPhoneµÄÓÃ»§
ÍÆ¼öiPad¡£

2.»ùÓÚÎïÆ·µÄÐ­Í¬¹ýÂËÍÆ¼ö
¸ÃËã·¨Í¨¹ýÓÃ»§¶Ô²»Í¬ÎïÆ·µÄÆÀ·ÖÆÀ²âÎïÆ·Ö®¼äµÄÏàËÆÐÔ,»ùÓÚÎïÆ·Ö®¼äµÄÏàËÆÐÔ
×ö³öÍÆ¼ö¡£ÕâÀï²»ÊÇÀûÓÃÎïÆ·×ÔÉíÊôÐÔ¼ÆËãÎïÆ·Ö®¼äµÄÏàËÆ¶È,¶øÊÇÍ¨¹ý·ÖÎöÓÃ»§µÄÐÐ
Îª¼ÇÂ¼¼ÆËãÎïÆ·Ö®¼äµÄÏàËÆ¶È¡£¾ßÌå¶øÑÔ,Í¨¹ý¼ÆËã²»Í¬ÓÃ»§¶Ô²»Í¬ÎïÆ·µÄÆÀ·Ö»ñµÃÎï
Æ·¼äµÄ¹ØÏµ,»ùÓÚÎïÆ·¼äµÄ¹ØÏµ¶ÔÓÃ»§½øÐÐÏàËÆÎïÆ·µÄÍÆ¼ö,ÕâÀïµÄÆÀ·Ö´ú±íÓÃ»§¶ÔÉÌÆ·
µÄÌ¬¶ÈºÍÆ«ºÃ¡£¼òµ¥À´Ëµ,ÈçÍ¼3-10ËùÊ¾,ÓÃ»§User1ºÍUser2¶¼¹ºÂòÁËProduct1ºÍ

79 

Product3,²¢¸ø³öÁË5ÐÇºÃÆÀ,ËµÃ÷ÉÌÆ·Product1 ºÍProduct3 ±È½ÏÏàËÆ,ÄÇÃ´,µ±ÓÃ
»§
User3 Ò²¹ºÂòÁËÉÌÆ·Product3 Ê±,¿ÉÒÔÍÆ¶ÏËûÒ²ÓÐ¹ºÂòProduct1 µÄÇ±ÔÚÐèÇó,Òò´Ë
¿É


ÏòËûÍÆ¼öProduct1 ¡£


Í¼3-10 »ùÓÚÎïÆ·µÄÐ­Í¬¹ýÂËÍÆ¼öËã·¨Ê¾ÒâÍ¼

»ùÓÚÎïÆ·µÄÐ­Í¬¹ýÂËËã·¨µÄÊµÏÖ²½ÖèÈçÏÂ¡£

(1)¼ÆÊýÎïÆ·Ö®¼äµÄÏàËÆ¶È¡£ÔÚÐ­Í¬¹ýÂËËã·¨ÖÐ,ÏàËÆ¶ÈÊÇ²ÉÓÃÓàÏÒÏàËÆ¶ÈºâÁ¿µÄ, 
ÓàÏÒÏàËÆ¶È±íÕ÷ÁËÁ½¸öÏòÁ¿Ö®¼ä¼Ð½ÇµÄÏàËÆ¶È,¼´Èç¹ûÁ½¸öÏòÁ¿µÄ·½ÏòÏàËÆ,ËüÃÇµÄÓàÏÒ
ÏàËÆ¶ÈÖµ¾Í½Ï´ó(½Ó½üÓÚ1)¡£
²ÉÓÃÓàÏÒÏàËÆ¶È,ÊÇÒòÎªÁ½¸öÓÃ»§¹ºÂò»òÆÀ¼ÛµÄÉÌÆ·ÖÖÀà¿ÉÄÜ¸÷²»ÏàÍ¬,Èç¹û²ÉÓÃ¾à
ÀëµÄ·½·¨¶ÈÁ¿,Ôò¾àÀëµÄÄ³Ð©Î¬¶È½«Ã»ÓÐÖµ,¾àÀë¼ÆËã½«ÎÞ·¨½øÐÐ¡£Æä´Î,Ã¿¸öÓÃ»§µÄÆÀ
·Ö¿íÑÏ³Ì¶È²»Í¬,ÓÐÐ©ÓÃ»§µÄÆÀ·Ö¿ÉÄÜ×ÜÌåÆ«µÍ,´ËÊ±Èç¹û¼ÆËã¾àÀë½«²î¾à½Ï´ó,¶ø¼ÆËã
ÏòÁ¿µÄ·½Ïò(ÓàÏÒÏàËÆ¶È)Ôò²î¾àºÜÐ¡¡£

ÓàÏÒÏàËÆ¶ÈµÄ¼ÆËã·½·¨ÈçÏÂ¡£
i 
xxixj1,xj

¼ÙÉèÁ½¸ö¶ÔÏóvºÍvj 
¶ÔÓ¦µÄÏòÁ¿·Ö±ðÎªX=(i2,¡­,)ºÍY=(xj2,¡­,), 

i1,x

n n 
ÔòÓàÏÒÏàËÆ¶Èsim(vi,vj)µÄ¼ÆËã¹«Ê½Îª
n 

¦²xik 
¡Áxjk 

k=1

X

¡¤

Y

sim(vj)

vi,
= 

(3-3)

Y
X


= 

nn 

x2 x2

¦²ik ¡Á 
¦²jk 

k=1 k=1 


wij= 
|
N 
(i)|¡¤|
N ( 
(3-4) 

Éèxik 
ºÍxjk 
µÄÈ¡ÖµÖ»ÄÜÊÇ0»ò1, 
ÔòÊ½(3-3)¿É×ª»»³ÉÈçÏÂÐÎÊ½
:
|
N 
(j)
|


i)¡É
N 
(

ÀýÈç,¶ÔÓÚÎïÆ·a¡¢b¡¢¡¢
d 
ºÍÓÃ»§A¡¢B¡¢C¡¢ÉèNj(
)
| 
±íÊ¾¶ÔÎïÆ·
a 
¸ÐÐËÈ¤
b)
cA,D} 
D, a)={A,B} 
C 
ºÍD, 

a)¡É
N 
(|{A,B}¡É{A,C,wab==
= 
|
N 
(¡¤|
N 
(2¡Á36 

µÄÓÃ»§ÓÐ
A 
ºÍB,
N 
(={C,±íÊ¾¶ÔÎïÆ·
b 
¸ÐÐËÈ¤µÄÓÃ»§ÓÐA¡¢¸÷ÓÃ»§¶Ô
¸÷ÎïÆ·µÄ¸ÐÐËÈ¤³Ì¶È¾ùÎª1,ÔòÎïÆ·a¡¢
b 
Ö®¼äµÄÏàËÆ¶ÈÎª
|
N 
(b)|D}
| 
1 

a)|b)
| 

ÌáÊ¾:Ö»ÓÐµ±¸ÐÐËÈ¤³Ì¶ÈÖ»ÄÜÎª1»ò0Ê±,²ÅÄÜÊ¹ÓÃ¼ò»¯Ê½(3-4)¼ÆËãÓàÏÒÏàËÆ¶È, 
·ñÔò±ØÐëÊ¹ÓÃÍêÕûÊ½(3-3)¼ÆËã¡£

80 


È»ºó¸ù¾Ýwi¡£(j) µÄ´óÐ¡Ñ¡³öÓëÎïÆ·
i 
×îÏàËÆµÄ
K 
¸öÎïÆ·(
K 
µÄ´óÐ¡ÊÓÇé¿ö¶ø¶¨), ÇóÕâ
K 
¸öÎïÆ·µÄ¼¯ºÏ

(2)¸ù¾ÝÎïÆ·µÄÏàËÆ¶ÈºÍÓÃ»§µÄÀúÊ·ÐÐÎª¸øÓÃ»§Éú³ÉÍÆ¼öÁÐ±í¡£¼ÆËãÓÃ»§
u 
¶ÔÎïÆ·
j 
µÄ¸ÐÐËÈ¤³Ì¶Èpuj 
µÄ¹«Ê½ÈçÏÂ: 
wir(3-5)
puj = 
¦² juj 

u) 
i¡ÊSjK 
¡ÉN(u) 
±íÊ¾ÓëÎïÆ·
j 
×îÏàËÆµÄ
K 
¸öÎï

ÆäÖÐ,
N 
(±íÊ¾ÓÃ»§
u 
Ôø¾­ÓÐ¹ýÕý·´À¡µÄÎïÆ·¼¯ºÏ;SjK 
Æ·µÄ¼¯ºÏ;uÓÃÕýÕûÊý±íÊ¾)¡£Í¨¹ýÉè¶¨ãÐÖµ¾ö¶¨ÊÇ

r±íÊ¾ÓÃ»§
u 
¶ÔÎïÆ·
j 
µÄ¸ÐÐËÈ¤³Ì¶È
(
·ñÍÆ¼öÎïÆ·,´Ó(j) ¶øÉú³ÉÍÆ¼öÁÐ±í
¡£
Àý3-¶ÔÓÚÎïÆ·ace 
ºÍÓÃ»§A¡¢D, a)A,b)A,


¡¾4¡¿¡¢b¡¢¡¢d¡¢B¡¢C¡¢ÉèN(={B},N(={C}, 
N 
(c)={B},
N 
(={D},
N 
(={D}¡£¸÷ÓÃ»§¶Ô¸÷ÎïÆ·µÄ¸ÐÐËÈ¤³Ì¶È¾ùÎª
D,d)A,e)C,
1,ÍÆ¼öãÐÖµÎª0.

9¡£ÊÔÊ¹ÓÃ»ùÓÚÎïÆ·µÄÐ­Í¬¹ýÂËËã·¨¸øÓÃ»§
A 
ÍÆ¼öÎïÆ·¡£
½â:¸ù¾ÝÊ½(3-4)¼ÆËãÎïÆ·Ö®¼äµÄÏàËÆ¶È,ÓÐ
wab 
=1/2,wac 
=1/2,wa=1/2,wae 
=0/2=0 
È¡
K 
=3,¶øÓÃ»§
A 
¶ÔÎïÆ·a¡¢b¡¢
d 
¸ÐÐËÈ¤(K(d) =3), Ê£Óà¿ÉÍÆ¼öÎïÆ·Ö»ÓÐ
c 
ºÍe¡£ÏÈ¿´

c 
ºÍa¡¢b¡¢
d 
µÄÏàËÆ¶È,wac=wcd 
=1/2,wbc 
=0,ÔòpAc=1/2¡Á1+0¡Á1+1/2¡Á1=1¡£
ÓÖÒòÎªwbe 
=wde=1/2,wae=0,ËùÒÔpAe 
=1/2¡Á1+0¡Á1+1/2¡Á1=1¡£
ÓÉÓÚãÐÖµÎª0.Òò´ËÎïÆ·
c 
ºÍ
e 
¾ù¿ÉÍÆ¼ö¸øÓÃ»§A¡£

9, 

3. 
»ùÓÚÓÃ»§µÄÐ­Í¬¹ýÂËÍÆ¼ö
¸ÃËã·¨Í¨¹ý²»Í¬ÓÃ»§¶ÔÎïÆ·µÄÆÀ·ÖÆÀ²âÓÃ»§Ö®¼äµÄÏàËÆÐÔ,È»ºó»ùÓÚÓÃ»§Ö®¼äµÄÏà
ËÆÐÔ×ö³öÍÆ¼ö¡£¾ßÌå¶øÑÔ,»ùÓÚÓÃ»§µÄÐ­Í¬¹ýÂËËã·¨ÊÇÍ¨¹ýÓÃ»§µÄÀúÊ·ÐÐÎªÊý¾Ý,·¢ÏÖÓÃ
»§¶ÔÎïÆ·µÄÏ²ºÃ(ÈçÉÌÆ·¹ºÂò¡¢ÊÕ²Ø¡¢ÄÚÈÝÆÀÂÛ»ò·ÖÏí), ²¢¶ÔÕâÐ©Ï²ºÃ½øÐÐ¶ÈÁ¿ºÍ´ò·Ö¡£
¸ù¾Ý²»Í¬ÓÃ»§¶ÔÏàÍ¬ÉÌÆ·»òÄÚÈÝµÄÌ¬¶ÈºÍÆ«ºÃ³Ì¶È¼ÆËãÓÃ»§Ö®¼äµÄ¹ØÏµ,ÔÚÓÐÏàÍ¬Ï²ºÃ
µÄÓÃ»§¼ä½øÐÐÉÌÆ·ÍÆ¼ö¡£¼òµ¥µØËµ,ÈçÍ¼3-11 ËùÊ¾,ÓÃ»§User1 ºÍUser3 ¶¼¹ºÂòÁË
Product2 ºÍProduct3,²¢¸ø³öÁË5ÐÇºÃÆÀ,ÄÇÃ´,User1 ºÍUser3 ¾ÍÊôÓÚÍ¬Ò»ÀàÓÃ»§, 
¿ÉÒÔ½«User1 Âò¹ýµÄÎïÆ·Product1 ºÍProduct4 ÍÆ¼ö¸øUser3 ¡£


Í¼3-11 »ùÓÚÓÃ»§µÄÐ­Í¬¹ýÂËÍÆ¼öËã·¨Ê¾ÒâÍ¼
¡¾Àý3-5¡¿¶ÔÓÚÓÃ»§A¡¢B¡¢C¡¢
D 
ºÍÎïÆ·a¡¢b¡¢c¡¢d¡¢e,Éè
N 
(A)a,d},
N 
(B)=

={b,

81 


{c},e},}¡£¸÷ÓÃ»§¶Ô¸÷ÎïÆ·µÄ¸ÐÐËÈ¤³Ì¶È¾ùÎª1,ÍÆ¼öãÐ
a,
N 
(={
N 
(D)={d,
ÖµÎª0.
C)b,c,
e 

7¡£ÊÔÊ¹ÓÃ»ùÓÚÓÃ»§µÄÐ­Í¬¹ýÂËÍÆ¼öËã·¨¸øÓÃ»§
A 
ÍÆ¼öÎïÆ·
¡£
½â:¸ù¾ÝÊ½(3-4)¼ÆËãÓÃ»§Ö®¼äµÄÏàËÆ¶È,
ÓÐ


111 

wAB = 
6,wAC = 
6,wAD = 
3 

ºÍe¡£
È¡
K 
=3,ÒòÎªÓÃ»§
A 
¶ÔÎïÆ·a¡¢b¡¢
d 
¸ÐÐËÈ¤(
K 
=3), ËùÒÔÊ£Óà¿ÉÍÆ¼öÎïÆ·Ö»ÓÐ
c 

ÒòÎªÓÃ»§
B 
ºÍÓÃ»§
D 
¶ÔÉÌÆ·
c 
¸ÐÐËÈ¤,¶øÓÃ»§
A 
ºÍÓÃ»§B¡¢ÓÃ»§
D 
Ö®¼äÓÐÏàËÆÐÔ, 
¹ÊÓÃ»§
A 
¶ÔÎïÆ·
c 
µÄ¸ÐÐËÈ¤³Ì¶ÈÎª

¡Á 
3¡Á1¡Ö0.
ÒòÎªÓÃ»§
C 
ºÍÓÃ»§
D 
¶ÔÉÌÆ·
c 
¸ÐÐËÈ¤,¶øÓÃ»§
6A 
ºÍÓÃ»§C¡¢ÓÃ»§
D 
Ö®¼äÓÐÏàËÆÐÔ, 
¹ÊÓÃ»§
A 
¶ÔÎïÆ·
e 
µÄ¸ÐÐËÈ¤³Ì¶ÈÎª

pAc=wAB 
¡¤rAc 
+wAD 
¡¤rAc= 
1 1 742 

6
ÓÉÓÚãÐÖµÎª0.Òò´ËÎïÆ·
c 
ºÍ
e 
¾ù¿ÉÍÆ¼ö¸øÓÃ»§A
¡£


1 1 742 

¡Á 
3¡Á1¡Ö0.
pAe 
=wAC 
¡¤rAe 
+wAD 
¡¤rAe = 

7, 

3.2 
Ð­Í¬¹ýÂËÍÆ¼öËã·¨Ó¦ÓÃÊµÀý
2.
ÔÚÀý3-3ºÍÀý3-4ÖÐ,¶¼ÊÇ¼ÙÉèÓÃ»§¶ÔÉÌÆ·µÄ¸ÐÐËÈ¤³Ì¶ÈÊÇ1»ò0,¶øÊµ¼ÊÉÏ,¸ÐÐËÈ¤
³Ì¶ÈÊÇÍ¨¹ýÓÃ»§µÄÐÐÎªÆÀ¹ÀµÄ¡£Í¨³£¶ÔÓÃ»§µÄ¸÷ÖÖÐÐÎª¸³Óè²»Í¬µÄÈ¨ÖØÖµ,È»ºó¸ù¾ÝÈ¨
ÖØÖµÅÐ¶ÏÓÃ»§µÄ¸ÐÐËÈ¤³Ì¶È¡£

1. 
»ùÓÚÎïÆ·µÄÐ­Í¬¹ýÂËÍÆ¼öËã·¨ÊµÀý
¡¾Àý3-6¡¿¼ÙÉèÔÚµç×ÓÉÌÎñÍøÕ¾ÖÐ,ÓÃ»§µÄÐÐÎªÓÐÒÔÏÂ4ÖÖ¡£

(1)µã»÷,ÓÃ»§µã»÷ÁËÄ³¸öÉÌÆ·Ò³Ãæ,ÉèÈ¨ÖØÖµÎª1·Ö¡£
(2)ËÑË÷,ÓÃ»§ÔÚËÑË÷À¸ËÑË÷Ä³ÖÖÉÌÆ·,ÉèÈ¨ÖØÖµÎª3·Ö¡£
(3)ÊÕ²Ø,ÓÃ»§ÊÕ²ØÁËÄ³¸öÉÌÆ·,ÉèÈ¨ÖØÖµÎª5·Ö¡£
(4)¸¶¿î,ÉèÈ¨ÖØÖµÎª10 ·Ö
¡£
ÏÖÓÐÈçÏÂÓÃ»§¡¢ÉÌÆ·ºÍÐÐÎª
:
ÓÃ»§:A¡¢B¡¢C;
ÉÌÆ·:1¡¢2¡¢3¡¢4¡¢5¡¢6;
ÐÐÎª:µã»÷(1·Ö)¡¢ËÑË÷(3·Ö)¡¢ÊÕ²Ø(5·Ö)¡¢¸¶¿î(10 ·Ö)
¡£
ÍøÕ¾¼ÇÂ¼µÄÓÃ»§ÐÐÎªÁÐ±íÈçÍ¼3-12(a)ËùÊ¾
¡£
»ùÓÚÎïÆ·µÄÐ­Í¬¹ýÂËÍÆ¼öËã·¨µÄÖ´ÐÐ²½ÖèÈçÏÂ
¡£
(1)¸ù¾ÝÓÃ»§ÐÐÎªÁÐ±í¼ÆËãÓÃ»§¡¢ÎïÆ·µÄÆÀ·Ö¾ØÕó,ÈçÍ¼3-12(b)ËùÊ¾¡£
(2)½«ÓÃ»§¡¢ÎïÆ·µÄÆÀ·Ö¾ØÕóÖÐµÄÓÃ»§ÐÐÎª×ª»»³ÉÈ¨ÖØÖµ,ÈçÍ¼3-13(a)ËùÊ¾¡£ÏÔÈ», 
ÆÀ·Ö¾ØÕóÖÐµÄÃ¿¸öÈ¨ÖØÖµ,¾Í´ú±íÁËÓÃ»§¶ÔÎïÆ·µÄÏ²ºÃ³Ì¶È¡£
82 


Í¼3-12 ÓÃ»§ÐÐÎªÁÐ±íÓëÓÃ»§¡¢ÎïÆ·µÄÆÀ·Ö¾ØÕó

(3)¸ù¾ÝÓÃ»§¡¢ÎïÆ·µÄÆÀ·Ö¾ØÕó¼ÆËãÎïÆ·ÓëÎïÆ·µÄÏàËÆ¶È¾ØÕó¡£ÀýÈç,Ê¹ÓÃÓàÏÒÏàËÆ
¶È¹«Ê½¼ÆËãÎïÆ·1ºÍÎïÆ·2Ö®¼äµÄÏàËÆ¶È,ÈçÍ¼3-13(b)ËùÊ¾¡£
Í¼3-13 ¸ù¾ÝÓÃ»§¡¢ÎïÆ·µÄÆÀ·Ö¾ØÕó¼ÆËãÎïÆ·ÓëÎïÆ·µÄÏàËÆ¶È

°´ÕÕ¸Ã·½·¨,¶ÔËùÓÐÎïÆ·¼ÆËãÁ½Á½Ö®¼äµÄÏàËÆ¶ÈÖµ,µÃµ½ÈçÍ¼3-14 ËùÊ¾µÄÎïÆ·ÓëÎï
Æ·Ö®¼äµÄÏàËÆ¶È¾ØÕó¡£ÏÔÈ»,ÏàËÆ¶È¾ØÕóÖÐµÄÏàËÆ¶ÈÖµ,¾Í´ú±íÁËÎïÆ·ÓëÎïÆ·Ö®¼äµÄÏà
ËÆ¶È¡£


Í¼3-14 ÎïÆ·ÓëÎïÆ·Ö®¼äµÄÏàËÆ¶È¾ØÕó

(4)ÏàËÆ¶È¾ØÕó(ÏàËÆ³Ì¶È)¡ÁÆÀ·Ö¾ØÕó(Ï²ºÃ³Ì¶È)=ÍÆ¼öÁÐ±í,ÈçÍ¼3-15 ËùÊ¾¡£
µÃµ½µÄÍÆ¼öÁÐ±íÈçÍ¼3-16 ËùÊ¾¡£
83 


Í¼3-15 ÏàËÆ¶È¾ØÕó¡ÁÆÀ·Ö¾ØÕó

(5)¸ù¾ÝÍÆ¼öÁÐ±í,½«ÍÆ¼öÖµ×î¸ßµÄÈô¸ÉÖÖÎïÆ·ÍÆ¼ö¸øÓÃ»§,ÈçÍ¼3-17 ËùÊ¾¡£µ±È», 
Ò²¿ÉÏÈ½«ÓÃ»§ÒÑ¾­¹ºÂò¹ýµÄÎïÆ·ÍÆ¼öÖµÖÃÎª0¡£
Í¼3-16 µÃµ½µÄÍÆ¼öÁÐ±íÍ¼3-17 ÍÆ¼öÈ¨ÖØÖµ×î¸ßµÄÎïÆ·

ÀýÈç,¶ÔÓÚÓÃ»§
A 
À´Ëµ,ÍÆ¼öÖµ×î¸ßµÄÊÇÎïÆ·6,Òò´Ë¿É½«ÎïÆ·6ÍÆ¼ö¸øA¡£
×Ü½á:»ùÓÚÎïÆ·µÄÐ­Í¬¹ýÂËÍÆ¼öËã·¨²½ÖèÈçÏÂ¡£

(1)¸ù¾ÝÓÃ»§ÐÐÎªÁÐ±í¼ÆËãÓÃ»§¡¢ÎïÆ·µÄÆÀ·Ö¾ØÕó¡£
(2)¸ù¾ÝÓÃ»§¡¢ÎïÆ·µÄÆÀ·Ö¾ØÕó¼ÆËãÎïÆ·¡¢ÎïÆ·µÄÏàËÆ¶È¾ØÕó¡£
(3)ÎïÆ·¡¢ÎïÆ·ÏàËÆ¶È¾ØÕó¡ÁÓÃ»§¡¢ÎïÆ·ÆÀ·Ö¾ØÕó=ÍÆ¼öÁÐ±í¡£
(4)½«ÍÆ¼öÁÐ±íÖÐÓÃ»§Ö®Ç°ÒÑ¾­ÓÐ¹ý¹ºÂòÐÐÎªµÄÔªËØÍÆ¼öÖµÖÃÎª0¡£
»ùÓÚÎïÆ·µÄÐ­Í¬¹ýÂËÍÆ¼öËã·¨µÄÓÅÈ±µãÈçÏÂ¡£
ÓÅµã:Á½¸öÎïÆ·Ö®¼äµÄ¾àÀë¿ÉÄÜÊÇ¸ù¾Ý³É°ÙÉÏÇ§ÍòÓÃ»§µÄÆÀ·Ö¼ÆËãµÃ³öµÄ,Òò´ËÕâ
¸öÆÀ·ÖÍùÍùÄÜÔÚÒ»¶ÎÊ±¼äÄÚ±£³ÖÎÈ¶¨¡£Òò´Ë,ÕâÖÖËã·¨¿ÉÒÔÔ¤ÏÈ¼ÆËã¾àÀë,ÆäÔÚÏß²¿·ÖÄÜ
¸ü¿ìµØÉú³ÉÍÆ¼öÁÐ±í¡£
È±µã:²»Í¬ÁìÓòµÄ×îÈÈÃÅÎïÆ·Ö®¼ä¾­³£¾ßÓÐ½Ï¸ßµÄÏàËÆ¶È¡£ÕâÑù,¿ÉÄÜ»á¸øÏ²»¶¡¶Ëã
·¨µ¼ÂÛ¡·µÄ¶ÁÕßÍÆ¼ö¡¶¹þÀû²¨ÌØ¡·¡£Îª´Ë,ÔÚÔËÐÐÕâÖÖËã·¨Ê±¿ÉÒÔ²»ÄÉÈë×î³©ÏúÉÌÆ·¡£

2. 
»ùÓÚÓÃ»§µÄÐ­Í¬¹ýÂËÍÆ¼öËã·¨ÊµÀý
»ùÓÚÓÃ»§µÄÐ­Í¬¹ýÂËÍÆ¼öËã·¨µÄ»ù±¾¼ÙÉèÎª:ºÍÎÒÐËÈ¤ÏàËÆµÄÈËÏ²»¶µÄÉÌÆ·,ÎÒÒ²
»áÏ²»¶¡£¶ÔÓÚÀý3-6,ÕâÖÖÍÆ¼öËã·¨µÄÖ÷Òª²½ÖèÈçÏÂ¡£

(1)¸ù¾ÝÓÃ»§¶Ô¸÷ÖÖÎïÆ·µÄÆ«ºÃÖµµÄÏàËÆ³Ì¶È,ÔÚÃ¿Á½¸öÓÃ»§Ö®¼ä½øÐÐÏàËÆ¶È¼ÆËã, 
84 


ÎªÃ¿¸öÓÃ»§ÕÒµ½ÓëÖ®ÏàËÆ¶È×î¸ßµÄ¼¸¸öÁÚ¾ÓÓÃ»§,ÕâÒ»²½ÊÇ¶ÔÓÃ»§½øÐÐ·ÖÀà¡£

(2)½«Ä¿±êÓÃ»§µÄÁÚ¾Ó¶ÔÃ¿¸öÎïÆ·µÄÆ«ºÃÖµµÄ¼ÓÈ¨Æ½¾ù×÷ÎªÄ¿±êÓÃ»§Æ«ºÃÖµµÄÔ¤²â
Öµ¡£°ÑÔ¤²âÖµ×î¸ßµÄÈô¸ÉÉÌÆ·×÷ÎªÄ¿±êÓÃ»§µÄÍÆ¼öÁÐ±í¡£
ÆäÖÐ,Ã¿¸öÁÚ¾ÓÓÃ»§µÄÈ¨ÖØÈ¡¾öÓÚ¸ÃÁÚ¾ÓÓÃ»§ÓëÄ¿±êÓÃ»§Ö®¼äµÄÏàËÆ¶È¡£
Ëã·¨¾ßÌå²½ÖèÈçÏÂ¡£

(1)¸ù¾ÝÓÃ»§ÐÐÎªÁÐ±í¼ÆËãÎïÆ·¡¢ÓÃ»§µÄÆÀ·Ö¾ØÕó¡£
(2)¸ù¾ÝÓÃ»§¡¢ÎïÆ·µÄÆÀ·Ö¾ØÕó¼ÆËãÓÃ»§¡¢ÓÃ»§µÄÏàËÆ¶È¾ØÕó¡£
(3)ÓÃ»§ÓëÓÃ»§ÏàËÆ¶È¾ØÕó¡ÁÆÀ·Ö¾ØÕó=ÍÆ¼öÁÐ±í¡£
(4)½«ÍÆ¼öÁÐ±íÖÐÓÃ»§Ö®Ç°ÒÑ¾­ÓÐ¹ý¹ºÂòÐÐÎªµÄÔªËØÍÆ¼öÖµÖÃÎª0¡£
»ùÓÚÓÃ»§µÄÐ­Í¬¹ýÂËÍÆ¼öËã·¨µÄÈ±µãÊÇ:¢ÙÐÎ³ÉÓÐÒâÒåµÄÁÚ¾Ó¼¯ºÏºÜÄÑ,ºÜ¶àÓÃ»§
Á½Á½Ö®¼äÖ»ÓÐºÜÉÙ¼¸¸ö¹²Í¬ÆÀ·Ö,¶ø½öÓÐµÄ¹²Í¬´òÁË·ÖµÄÎïÆ·,ÍùÍùÊÇ×îÈÈÃÅµÄÉÌÆ·¡£

¢ÚÓÃ»§Ö®¼äµÄ¾àÀë¿ÉÄÜ±ä»¯µÃºÜ¿ì,ÕâÈÃÀëÏßËã·¨ÄÑÒÔË²¼ä¸üÐÂÍÆ¼ö½á¹û¡£
3. 
ÔÚÐ­Í¬¹ýÂËËã·¨ÖÐ¿¼ÂÇÊ±¼äºÍµØÓòµÄÒòËØ
ÔÚÐ­Í¬¹ýÂËÍÆ¼öËã·¨ÖÐ,»¹Ó¦¿¼ÂÇÊ±¼äºÍµØÓòµÄÒòËØ¡£ÕâÊÇÒòÎªÓÃ»§¶ÔÉÌÆ·µÄÏ²ºÃ
¾ßÓÐÊ±Ð§ÐÔ¡£Îª´Ë,ÔÚ»ùÓÚÎïÆ·µÄÐ­Í¬¹ýÂËÖÐ:¢ÙÎïÆ·Ö®¼äµÄÏàËÆ¶È¿ÉÒÔ¸ÄÎª,Í¬Ò»ÓÃ»§
ÔÚ¼ä¸ôºÜ¶ÌµÄÊ±¼äÄÚÏ²»¶µÄÁ½¼þÉÌÆ·Ö®¼ä,¿ÉÒÔ¸øÓè¸ü¸ßµÄÏàËÆ¶È¡£¢Ú¸ù¾Ýµ±Ç°ÓÃ»§µÄ
Æ«ºÃ,ÍÆ¼öÏàËÆµÄÎïÆ·¸øËû,¿ÉÒÔ¸ÄÎª,ÔÚÃèÊöÄ¿±êÓÃ»§Æ«ºÃÊ±,¸øÆä×î½üÏ²»¶µÄÎïÆ·¸³Óè
½Ï¸ßÈ¨ÖØ¡£ÔÚ»ùÓÚÓÃ»§µÄÐ­Í¬¹ýÂËÖÐ,¼ÆËãÏàËÆ¶ÈºÍÃèÊöÓÃ»§ÐÐÎªÊ±,¶¼¸ø×îÐÂµÄÆ«ºÃ¸³
Óè½Ï¸ßÈ¨ÖØ¡£

ÔÚÐ­Í¬¹ýÂËÖÐÒª¿¼ÂÇµ½µØÓòÒòËØ,ÒòÎª²»Í¬µØÓòµÄÓÃ»§¶ÔÉÌÆ·µÄÆ«ºÃÍùÍùÊÇÓÐÇø±ð
µÄ¡£Îª´Ë,ÔÚ»ùÓÚÎïÆ·µÄÐ­Í¬¹ýÂËÖÐ,ÎïÆ·Ö®¼äµÄÏàËÆ¶È¿ÉÒÔ¸ÄÎª,Í¬Ò»ÓÃ»§ÔÚÍ¬Ò»µØÓò
ÄÚÏ²»¶µÄÁ½¼þÉÌÆ·Ö®¼ä,¿ÉÒÔ¸øÓè¸ü¸ßµÄÏàËÆ¶È¡£ÔÚ»ùÓÚÓÃ»§µÄÐ­Í¬¹ýÂËÖÐ,°ÑÀàËÆµØÓò
ÓÃ»§µÄÐÐÎª×÷ÎªÍÆ¼öµÄÖ÷ÒªÒÀ¾Ý¡£

4. 
Ð­Í¬¹ýÂËÍÆ¼öËã·¨µÄÌØµã
Ð­Í¬¹ýÂËÍÆ¼öËã·¨ÓÐÏÂÁÐÓÅµã¡£

(1)²»ÐèÒª¸ù¾ÝÄÚÈÝ¼ÆËãÎïÆ·Ö®¼äµÄÏàËÆÐÔ,Ê¹µÃÄ³Ð©ÎïÆ·(ÈçÒÕÊõÆ·¡¢ÒôÀÖ¡¢ÊÓÆµ) 
¼´Ê¹»úÆ÷ÎÞ·¨¶ÔÆäÄÚÈÝ½øÐÐ·ÖÎö,Ò²ÄÜÊ¹ÓÃÐ­Í¬¹ýÂËÍÆ¼öËã·¨¡£
(2)ÄÜ¹»»ùÓÚÒ»Ð©¸´ÔÓµÄ¡¢ÄÑÒÔ±í´ïµÄ¸ÅÄî(ÐÅÏ¢ÖÊÁ¿¡¢Æ·Î»)½øÐÐ¹ýÂË¡£
(3)ÍÆ¼ö½á¹û¾ßÓÐÐÂÓ±ÐÔ
¡£
Ð­Í¬¹ýÂËÍÆ¼öËã·¨ÓÐÏÂÁÐÈ±µã
¡£
(1)ÏµÍ³¸ÕÊ¹ÓÃÊ±,ÓÃ»§¶ÔÉÌÆ·µÄÆÀ¼Û·Ç³£ÉÙ,ÕâÑù,»ùÓÚÓÃ»§µÄÆÀ¼ÛËùµÃµ½µÄÓÃ»§
¼ä(»òÎïÆ·¼ä)µÄÏàËÆÐÔ¿ÉÄÜ²»×¼È·(¼´ÀäÆô¶¯ÎÊÌâ)¡£
(2)Ëæ×ÅÓÃ»§ºÍÉÌÆ·µÄÔö¶à,ÏµÍ³µÄÐÔÄÜ»áÔ½À´Ô½µÍ¡£
(3)Èç¹û´ÓÀ´Ã»ÓÐÓÃ»§¶ÔÄ³Ò»ÉÌÆ·¼ÓÒÔÆÀ¼Û,ÔòÕâ¸öÉÌÆ·¾Í²»¿ÉÄÜ±»ÍÆ¼ö(¼´×î³õÆÀ
¼ÛÎÊÌâ)¡£
85 

86 
3.3 µçÓ°½ÚÄ¿ÍÆ¼öÊµÀý
Ä¿Ç°,µçÓ°½ÚÄ¿ÔÚÖÇÄÜµçÊÓºÍÊÓÆµÍøÕ¾ÖÐÈÕÒæ·á¸»,Ê¹¹ÛÖÚÑ¸ËÙ´Ó½ÚÄ¿ØÑ·¦Ê±´ú½øÈë
ÄÚÈÝ¹ýÊ£Ê±´ú¡£ÓÃ»§ÔÚÃæ¶Ô·±¶àµÄ½ÚÄ¿Ê±,ÍùÍùÄÑÒÔÕÒµ½¸ÐÐËÈ¤µÄµçÓ°½ÚÄ¿,Õâ²»½öÓ°Ïì
ÁËÊÕÊÓÓÃ»§µÄÊÕ¿´¸ÐÊÜ,Ò²ÔÚÄ³ÖÖ³Ì¶ÈÉÏÓ°Ïìµ½µçÓ°½ÚÄ¿µÄÊÕÊÓÂÊ¡£ÎªÁË¸øÓÃ»§ÍÆ¼ö¸ö
ÐÔ»¯µÄµçÓ°½ÚÄ¿,±¾ÊµÀý²ÉÓÃMovieLensÊý¾Ý¼¯×÷ÎªÑù±¾Êý¾Ý,Ê¹ÓÃÁ½ÖÖÐ­Í¬¹ýÂËÍÆ¼ö
Ëã·¨ÏòÓÃ»§ÍÆ¼öÏàËÆµçÓ°,²¢±È½ÏÁ½ÖÖËã·¨µÄÍÆ¼ö½á¹û¡£
MovieLensÊý¾Ý¼¯°üº¬Ðí¶àÓÃ»§¶ÔºÜ¶à²¿µçÓ°µÄÆÀ·ÖÊý¾Ý,Ò²°üÀ¨µçÓ°ÔªÊý¾ÝÐÅÏ¢
ºÍÓÃ»§ÊôÐÔÐÅÏ¢¡£Õâ¸öÊý¾Ý¼¯¾­³£ÓÃÀ´×öÍÆ¼öÏµÍ³¡¢»úÆ÷Ñ§Ï°Ëã·¨µÄ²âÊÔÊý¾Ý¼¯¡£¸ù¾Ý
ÕâÐ©µçÓ°ÆÀ·ÖÊý¾Ý,¾Í¿É¼ÆËã³öµçÓ°µÄÏàËÆ¶È»òÓÃ»§µÄÏàËÆ¶È,È»ºó¸ù¾ÝÏàËÆ¶ÈÍÆ¼öÏàËÆ
µçÓ°¸øÓÃ»§¡£¸ÃÊý¾Ý¼¯µÄÏÂÔØµØÖ·Îªhttp://files.grouplens.org/datasets/movielens/, 
ËüÓÐ¶àÖÖ°æ±¾,¶ÔÓ¦²»Í¬Êý¾ÝÁ¿,±¾ÀýËùÓÃµÄÊý¾ÝÎª1MBµÄÊý¾Ý¼¯(u.data)¡£¸ÃÊý¾Ý¼¯
°üº¬À´×Ô943¸öÓÃ»§ÒÔ¼°1682²¿µçÓ°µÄ×Ü¼Æ10ÍòÌõµçÓ°ÆÀ·Ö¼ÇÂ¼¡£
ÎÄ¼þÀïµÄÄÚÈÝ°üº¬ÁËÃ¿¸öÓÃ»§¶ÔÃ¿²¿µçÓ°µÄÆÀ·Ö¡£Êý¾Ý¸ñÊ½ÈçÏÂ¡£ 
userId(ÓÃ»§id), movieId(µçÓ°µÄid), rating(ÓÃ»§ÆÀ·Ö,ÊÇ5 ÐÇÖÆ,°´°ë¿ÅÐÇµÄ¹æÄ£µÝ
Ôö), timestamp(Ê±¼ä´Á) 
ÀýÈç:{196 242 3 881250949}¾ÍÊÇÒ»ÌõÆÀ·Ö¼ÇÂ¼¡£
¡¾³ÌÐò3-2¡¿ Ê¹ÓÃÁ½ÖÖÐ­Í¬¹ýÂËÍÆ¼öËã·¨ÏòÓÃ»§ÍÆ¼öÏàËÆµçÓ°,²¢ÆÀ¹ÀÁ½ÖÖËã·¨µÄ
ÍÆ¼ö½á¹û¡£ 
import numpy as np 
import pandas as pd #ÓÃpandas ¿â¶ÁÈ¡u.data ÎÄ¼þ
#Êý¾ÝÎÄ¼þ¸ñÊ½: ÓÃ»§id¡¢ÉÌÆ·id¡¢ÓÃ»§ÆÀ·Ö¡¢Ê±¼ä´Á
header=['user_id', 'item_id', 'rating', 'timestamp'] 
df=pd.read_csv('u.data', sep='\t', names=header) #¶ÁÈ¡u.data ÎÄ¼þ
#¼ÆËãÎ¨Ò»ÓÃ»§ºÍµçÓ°µÄÊýÁ¿
n_users=df.user_id.unique().shape[0] 
n_items=df.item_id.unique().shape[0] 
print('Number of users='+str(n_users)+' | Number of movies='+str(n_items)) 
from sklearn.model_selection import train_test_split 
train_data, test_data=train_test_split(df, test_size=0.2, random_state=21) 
#Ð­Í¬¹ýÂËÍÆ¼öËã·¨
#µÚÒ»²½ÊÇ´´½¨user-item ¾ØÕó,ÕâÐè´´½¨ÑµÁ·ºÍ²âÊÔÁ½¸öuser-item ¾ØÕó
train_data_matrix=np.zeros((n_users, n_items)) 
for line in train_data.itertuples(): 
train_data_matrix[line[1]-1, line[2]-1]=line[3] 
test_data_matrix=np.zeros((n_users, n_items)) 
for line in test_data.itertuples():