µÚ3ÕÂÂÏÉúÍøÂç

µÚ2ÕÂ½²½âÁËÉî¶ÈÑ§Ï°µÄ»ù±¾¸ÅÄî,ÒÔ¼°Éî¶ÈÉñ¾­ÍøÂç¡¢Ñ­»·Éñ¾­ÍøÂç¡¢Éú
³É¶Ô¿¹ÍøÂç¡¢Transformer¼°À©É¢Ä£ÐÍ¡£±¾ÕÂ½«ÏÈ½éÉÜÒ»ÖÖÌØÊâµÄÉñ¾­Íø
Âç¡ª¡ª¡ªÂÏÉúÍøÂç,ËüÊÇ×î¼òµ¥¡¢×î³£ÓÃµÄµ¥Ñù±¾Ñ§Ï°Ëã·¨Ö®Ò»¡£½éÉÜËüÊÇÈçºÎÔÚ
Ñù±¾½ÏÉÙµÄÇé¿öÏÂ¿ªÕ¹Ñ§Ï°µÄ,²¢ÓÃÓÚ½â¾öµÍÊý¾ÝÎÊÌâ(em )¡£½Ó

lowdataprobl
×Å¸ø³öÂÏÉúÍøÂçµÄ»ù±¾¼Ü¹¹,½éÉÜÂÏÉúÍøÂçµÄÓ¦ÓÃ³¡¾°¡£×îºóÍ¨¹ýÒ»¸öÍ¼ÏñÊ¶
±ðµÄ°¸Àý±àÐ´Ò»¸ö¼òµ¥µÄÂÏÉúÍøÂçÄ£ÐÍ³ÌÐò,ÔÚÊµ¼ùÖÐÑ§Ï°ÂÏÉúÍøÂç¡£

±¾ÕÂÄÚÈÝ: 

¡ñ ÂÏÉúÍøÂç¼ò½é¡£
¡ñ ÂÏÉúÍøÂçµÄ¼Ü¹¹¡£
¡ñ ÂÏÉúÍøÂçµÄÑÜÉú¡£
¡ñ ÂÏÉúÍøÂçµÄ·¢Õ¹¼°Ó¦ÓÃ¡£
¡ñ °¸Àý:ÀûÓÃÂÏÉúÍøÂç½øÐÐÍ¼ÏñÊ¶±ð¡£
3.ÂÏÉúÍøÂç¼ò½é
1 

ÂÏÉúÍøÂç(siamesenetwork)¡£siamese±íÊ¾åßÂÞË«°ûÌ¥,ÒâÎªÁ¬ÌåÈË¡£¹ËÃû
Ë¼Òå,¸ÃÍøÂç¿ÉÒÔÀí½âÎªÁ½¸ö»ò¶à¸öÉñ¾­ÍøÂçÔÚÒ»¶¨³Ì¶ÈÉÏÊÇ¡°Á¬Ìå¡±µÄ¡£ËùÒÔ
ÂÏÉúÍøÂçÓÖ³ÆÎªÁ¬ÌåÍøÂç,ÍøÂçÖÐµÄÁ¬ÌåÊÇÍ¨¹ý¹²ÏíÈ¨ÖØÊµÏÖµÄ¡£ÂÏÉúÍøÂçÊÇ
Ò»ÖÖ¼à¶½Ñ§Ï°,Ò²ÊÇÒ»ÖÖ¶ÈÁ¿Ñ§Ï°µÄ·½·¨,ÊÇ×î¼òµ¥³£ÓÃµÄµ¥Ñù±¾Ñ§Ï°Ëã·¨Ö®
Ò»,Ö÷ÒªÓÃÓÚ¸÷Àà±ðÊý¾Ýµã½ÏÉÙµÄÓ¦ÓÃÖÐ¡£Ò»°ãÍ¼Ïñ·ÖÀàÓÐ2ÖÖÇé¿ö:µÚ1ÖÖ


Çé¿öÊÇÍ¼Æ¬Àà±ð½ÏÉÙ,µ«ÊÇÃ¿Ò»ÀàµÄÊý¾ÝÁ¿¶à¡£µÚ2ÖÖÇé¿öÊÇÍ¼Æ¬Àà±ð½Ï¶à,µ«
ÊÇÃ¿ÖÖÀà±ðµÄÊýÁ¿½ÏÉÙ¡£¶ÔÓÚµÚ1ÖÖÇé¿ö,Ê¹ÓÃÉî¶ÈÑ§Ï°ÍøÂçÈçCNN,»òSVM 
µÈ»úÆ÷Ñ§Ï°¾Í¿ÉÒÔÇáÒ×µØ½â¾ö¡£¶ÔÓÚµÚ2ÖÖÇé¿ö,Ê¹ÓÃCNN µÈÉî¶ÈÑ§Ï°Ëã·¨¾Í
²»ÄÜ´ïµ½ºÜºÃµÄÐ§¹û¡£ÏÖÔÚµÄ¹«Ë¾Ñ§Ð£¶¼ÔÚÓÃÈËÁ³Ê¶±ð¼¼Êõ×öÃÅ½ûÏµÍ³,ÒªÊ¶
±ð³öÒ»¸öÈË,¾ÍÐèÒªÕâ¸öÈËµÄºÜ¶àÍ¼ÏñÀ´ÑµÁ·ÍøÂç,²¢ÇÒÍøÂç»¹ÒªÓÐÁ¼ºÃµÄ¾«
¶È¡£ÏÔÈ»ÈËÁ³Ê¶±ð¾ÍÊôÓÚµÚ2ÖÖÇé¿ö,¼´ÖÖÀà¶à¶øÃ¿Ò»ÀàµÄÊý¾ÝÁ¿ÉÙ¡£Òò´Ë,Õâ
ÖÖÇé¿öÏÂÊ¹ÓÃÂÏÉúÍøÂç¾Í¿ÉÒÔºÜºÃµØ½â¾öÕâÀàÍ¼Ïñ·ÖÀàÎÊÌâ¡£

ÄÇÃ´ÂÏÉúÍøÂç¾¿¾¹ÊÇÔõÑùÊµÏÖµÄÄØ? ËüÓÖÊÇÈçºÎÅÐ¶ÏÍ¼ÏñÊÇÊôÓÚÄÄÒ»ÀàµÄ

ÄØ? Ê×ÏÈ,ÂÏÉúÍøÂçÊÇÓÃÓÚÅÐ¶ÏÁ½¸öÊäÈëÖµÊÇ·ñÏàËÆµÄ,ÊäÈëÁ½ÕÅÍ¼Æ¬,Í¨¹ý¶Ô

±ÈÕâÁ½ÕÅÍ¼Æ¬µÄÏàËÆ¶ÈÀ´ÅÐ¶ÏËüÃÇÊÇ·ñÊôÓÚÍ¬Ò»Àà¡£ÂÏÉúÍøÂçÖÐÓÐÁ½¸ö¶Ô³ÆµÄ

Éñ¾­ÍøÂç,ËüÃÇ¾ßÓÐÏàÍ¬µÄÈ¨ÖØºÍ¼Ü¹¹,²¢ÓÉËðÊ§º¯ÊýÁ¬½Ó¡£ÂÏÉúÍøÂçÓÐÁ½¸öÊä

Èë,ÕâÁ½¸öÊäÈë·Ö±ð½øÈëÁ½¸öÍêÈ«ÏàÍ¬µÄÉñ¾­ÍøÂç,×îºóÍ¨¹ýÄÜÁ¿º¯ÊýÆÀ¼ÛÁ½¸ö

ÊäÈëµÄÏàËÆ¶È¡£

ÏÂÃæ¾ÙÀýËµÃ÷ÂÏÉúÍøÂçµÄ¹¤×÷Á÷³Ì,ÈçÍ¼3-1ËùÊ¾¡£¼ÙÈçÒªÅÐ¶ÏÍ¼Æ¬P1 ºÍ
Í¼Æ¬P2 ÊÇ·ñÏàËÆ,Ê×ÏÈ½«Í¼Æ¬P1 ×÷ÎªÍøÂçAµÄÊäÈë,½«Í¼Æ¬P2 ×÷ÎªÍøÂçBµÄ
ÊäÈë¡£½Ó×ÅÁ½¸öÊäÈëÍ¼Ïñ·Ö±ð¾­¹ýÕâÁ½¸öÍøÂçºóÌáÈ¡³ö¸÷×ÔµÄfeature(ÌØÕ÷Ïò
Á¿,ÓÖ½Ðembedding), ÓÉÓÚÂÏÉúÍøÂçÊÇÈ¨ÖØ¹²ÏíµÄ
Í¼3-1ÅÐ¶ÏÁ½ÕÅÍ¼Æ¬µÄÏàËÆ¶È
,ËùÒÔÍøÂçAºÍÍøÂçBµÄ½á¹¹

46


µÚ
3 
ÕÂÂÏÉúÍøÂç


ÏàÍ¬,²¢ÇÒÐèÒªÓÐÏàÍ¬µÄÈ¨ÖØ¡£Ö®ºóÍøÂçAºÍÍøÂçB·Ö±ð½«ÊäÈëÍ¼ÏñP1 ºÍP2 
¸÷×ÔµÄfeature×÷ÎªÄÜÁ¿º¯ÊýµÄÊäÈë¡£×îºóÓÉÄÜÁ¿º¯ÊýÅÐ¶ÏÁ½¸öÌØÕ÷ÏòÁ¿µÄ¾à
Àë,´Ó¶øÀ´´ïµ½ÅÐ¶ÏÁ½¸öÊäÈëÍ¼ÏñÊÇ·ñÏàËÆµÄÄ¿µÄ¡£ÕâÀïµÄ¾àÀë¿ÉÒÔÓÐºÜ¶à,±È
ÈçÅ·ÊÏ¾àÀë¡¢ÓàÏÒ¾àÀë¡¢Ö¸Êý¾àÀëµÈ¡£×îÖÕÊä³öÁ½ÕÅÍ¼Æ¬µÄÏàËÆ¶È¡£

3.ÂÏÉúÍøÂçµÄ¼Ü¹¹
2 

Í¨¹ýÇ°ÃæµÄÑ§Ï°,ÎÒÃÇ¶ÔÂÏÉúÍøÂçÓÐÁË³õ²½ÁË½â,ÏÂÃæÏêÏ¸½éÉÜÂÏÉúÍøÂç¡£

ÂÏÉúÍøÂçµÄ¼Ü¹¹ÈçÍ¼3-2ËùÊ¾¡£ËüÓÉÁ½¸öÍêÈ«ÏàÍ¬µÄÍøÂçºÍÒ»¸öÄÜÁ¿º¯Êý
×é³É,ÕâÁ½¸öÍøÂç¾ßÓÐÏàÍ¬µÄÈ¨ÖØºÍ¼Ü¹¹¡£½«X1 ºÍX2 ·Ö±ðÊäÈëÍøÂçAºÍÍø
ÂçB,Ò²¾ÍÊÇÁ½¸öFw 
(X)¡£ÕâÁ½¸öÍøÂçÓÐ×ÅÏàÍ¬µÄÈ¨ÖØw,ËüÃÇ»á·Ö±ðÊä³öX1 
ºÍX2 µÄÌØÕ÷ÏòÁ¿,Ò²¾ÍÊÇFw 
(X1)ºÍFw 
(X2), ²¢×÷ÎªÄÜÁ¿º¯ÊýEw 
µÄÊäÈë¡£
ÄÜÁ¿º¯ÊýEw 
¼ÆËãÁ½¸öÊäÈëµÄ¾àÀë,´Ó¶øµÃ³öÁ½¸öÊäÈëµÄÏàËÆ¶È¡£ÄÜÁ¿º¯ÊýEw 
µÄ±í´ïÊ½ÈçÏÂ: 

Ew 
(X1,X2)
= 

Fw 
(X1)-Fw 
(X2) (3-1)
ÕâÀïÊ¹ÓÃL2 ¾àÀë(Å·ÊÏ¾àÀë)×÷ÎªÄÜÁ¿º¯Êý,µ±Ew 
Öµ½ÏÐ¡Ê±,ËµÃ÷X1 ºÍ
X2 ÏàËÆ,·´Ö®ËµÃ÷x1 ºÍx2 ²»ÏàËÆ¡£


Í¼3-
2 
ÂÏÉúÍøÂçµÄ¼Ü¹¹

ÉÏÃæ½éÉÜ,ÂÏÉúÍøÂçÓÐÁ½¸öÊäÈë,ËüÃÇÊÇ³É¶Ô³öÏÖµÄ,ËüÃÇµÄ¶þÔª±êÇ©
(binarylabel)0,1}, ´ú±íÊäÈë¶ÔÊÇÕýÑù±¾¶Ô(ÏàËÆ)»¹ÊÇ¸ºÑù±¾¶Ô(²»ÏàËÆ)¡£

Y¡Ê{

47


ÀýÈç±í3-1ËùÊ¾µÄÍ¼Æ¬Ñù±¾¶Ô,µÚÒ»ÐÐÊÇÕýÑù±¾¶Ô(±êÇ©Îª1),µÚ¶þÐÐÊÇ¸ºÑù±¾
¶Ô(±êÇ©Îª0)¡£

±í3-
1 
ÊäÈëÍ¼Æ¬Ñù±¾¶Ô

Í¼Æ¬Ñù±¾¶Ô±êÇ©
1 
0 

ÂÏÉúÍøÂçµÄËðÊ§º¯Êý²ÉÓÃµÄÊÇ¶Ô±ÈËðÊ§º¯Êý(contrastivelos),Ä¿µÄÊÇÅÐ¶Ï
Á½¸öÊäÈëÖ®¼äµÄÏàËÆÐÔ¡£ÕâÖÖËðÊ§º¯ÊýµÄÔ­ÀíÊÇ:Ô­±¾ÏàËÆµÄÑù±¾,¾­¹ýÌØÕ÷
ÌáÈ¡ºó,ÔÚÌØÕ÷¿Õ¼äÄÚÁ½¸öÑù±¾ÒÀ¾ÉÏàËÆ;Ô­±¾²»ÏàËÆµÄÑù±¾,¾­¹ýÌØÕ÷ÌáÈ¡ºó, 
ÔÚÌØÕ÷¿Õ¼äµÄÁ½¸öÑù±¾ÒÀ¾É²»ÏàËÆ¡£¶Ô±ÈËðÊ§º¯ÊýµÄ±í´ïÊ½ÈçÏÂ: 

1 
N 
[))(

Los= 
2N 
¦²Y 
(Ew 
2+ 
(1-Y)max(0,
m 
-Ew 
2] 3-2)

n=1

ÆäÖÐ,
N 
±íÊ¾Ñù±¾ÊýÁ¿,µ±Á½¸öÊäÈëÖµÏàËÆÊ±Îª1;

Y 
±íÊ¾ÊäÈë±êÇ©, ²»ÏàËÆ
Ê±Îª0¡£Ew 
±íÊ¾ÄÜÁ¿º¯Êý,¿ÉÒÔÊÇÈÎºÎ¾àÀë¶ÈÁ¿¡£
m 
±íÊ¾ÊäÈëÑù±¾¶Ô²»ÏàËÆÊ±
µÄ¾àÀëãÐÖµ,¼´ÕâÁ½¸öÊäÈëÖµ²»ÏàËÆÊ±,ËüÃÇµÄ¾àÀë·¶Î§Îª[0,m],µ±¾àÀë³¬¹ý
m 
Ê±,ÕâÁ½¸öÊäÈëÖµµÄ²»ÏàËÆÐÔ¿É¿´×÷0,¾Í²»»áµ¼ÖÂËðÊ§¡£

3.ÂÏÉúÍøÂçµÄÑÜÉú
3 

ÂÏÉúÍøÂçÒÑ¾­ÔÚÍ¼Ïñ´¦ÀíÁìÓò´ó·Å¹â²Ê¡£Ëæ×Å¿ÆÑ§¼¼ÊõµÄ·¢Õ¹,²»ÉÙ×¨¼Ò
Ñ§ÕßÔÚÔ­ÓÐµÄÍøÂç½á¹¹»ù´¡ÉÏ¶ÔÆä½øÐÐ¸Ä½ø,ÕâÀï¼òµ¥½éÉÜ¼¸ÖÖ¡£

48


µÚ
3 
ÕÂÂÏÉúÍøÂç


3.1 
Î±ÂÏÉúÍøÂç
3.
ÂÏÉúÍøÂçÊÇÓÉÈ¨ÖØºÍ¼Ü¹¹ÍêÈ«ÏàÍ¬µÄÉñ¾­ÍøÂç×é³ÉµÄ,Èç¹ûÁ½¸öÍøÂç²»¹²
ÏíÈ¨ÖØ,»òÕßÁ½¸öÍøÂçÊÇ²»Í¬µÄÉñ¾­ÍøÂç,ÕâÖÖÍøÂç¾Í½Ð×÷Î±ÂÏÉúÍøÂç(pseudo 
siamesenetwork)¡£Î±ÂÏÉúÍøÂçµÄÁ½¸öÉñ¾­ÍøÂç¿ÉÒÔÊÇ½á¹¹ÏàÍ¬µ«È¨ÖØ²»Í¬,Ò²
¿ÉÒÔÊÇÍêÈ«²»Í¬½á¹¹µÄÁ½¸öÍøÂç¡£ÈçÍ¼3-3ËùÊ¾,¸ÃÎ±ÂÏÉúÍøÂç¾Í°üº¬Ò»¸ö
LSTMÍøÂç¡¢Ò»¸öCNNÍøÂç¡£ÕâÖÖÎ±ÂÏÉúÍøÂç¿ÉÒÔÓÃÀ´±È¶Ô²»Í¬Êý¾ÝÀàÐÍµÄ
ÐÅÏ¢(ÐÎÊ½ÉÏ¶àÄ£Ì¬µÄÐÅÏ¢)Ëù±í´ïµÄÄÚÈÝµÄÏàËÆÐÔ,ÈçÒ»¶ÎÎÄ×ÖºÍÒ»ÕÅÍ¼Ïñ,ÅÐ
¶ÏÎÄ×ÖÄÚÈÝÊÇ·ñ·ûºÏÍ¼Æ¬¡£


Í¼3-
3 
Î±ÂÏÉúÍøÂç

Î±ÂÏÉúÍøÂçÓÐºÜ¶àÓÃ´¦¡£ÈçLloydH.HughesµÈÈËÀûÓÃÎ±ÂÏÉúÍøÂç½â¾öÔÚ
·Ç³£¸ß·Ö±æÂÊµÄ¹âÑ§ºÍºÏ³É¿×¾¶À×´ïÒ£¸ÐÍ¼ÏñÖÐÊ¶±ðÏàÓ¦°ß¿éµÄÈÎÎñ[1],Ìá³ö
ÁËÒ»ÖÖ¾ßÓÐÁ½¸ö¶ÀÁ¢µ«ÏàÍ¬µÄ¾í»ýÁ÷µÄÎ±ÂÏÉúÍøÂç¼Ü¹¹,ÓÃÓÚ´¦ÀíÒ£¸ÐÍ¼Ïñ²¹
¶¡ºÍ¹âÑ§²¹¶¡¡£ËðÊ§º¯ÊýÉÏÊ¹ÓÃµÄÊÇ¶þÔª½»²æìØËðÊ§¡£µ±È»,Î±ÂÏÉúÍøÂçµÄÓ¦
ÓÃ»¹ÓÐºÜ¶à,¶ÁÕß¿ÉÒÔ²é¿´Ïà¹Ø×ÊÁÏ¡£

3.Èý°ûÌ¥Á¬ÌåÍøÂç
3.2 

ÂÏÉúÍøÂçÒÔ¼°Î±ÂÏÉúÍøÂç¶¼ÊÇÓÉÁ½¸öÍøÂç×é³ÉµÄ,Èç¹û»»³ÉÈý¸öÍøÂç¿ÉÐÐ
Âð
[?
2](
´ð°¸µ±È»ÊÇ¿ÉÐÐµÄ¡£EladHoferºÍNirAilonÔÚÂÛÎÄÖÐ¾ÍÌá³öÁËÈý°ûÌ¥Íø
Âçtripletnetwork),Æä½á¹¹ÈçÍ¼3-4ËùÊ¾¡£

´ÓÍ¼ÖÐ¿ÉÒÔ¿´³ö,Èý°ûÌ¥ÍøÂçÓÐ3¸öÊäÈë,·Ö±ð¶ÔÓ¦3¸öÍøÂç,Õâ3¸öÊäÈë
¿ÉÒÔÊÇÒ»¸öÕýÑù±¾¶ÔÁ½¸ö¸ºÑù±¾¶Ô,»òÒ»¸ö¸ºÑù±¾¶ÔÁ½¸öÕýÑù±¾¶Ô¡£Èý°ûÌ¥Íø

49


Í¼3-
4 
Èý°ûÌ¥ÍøÂç½á¹¹

ÂçÖÐµÄÕâ3¸öÍøÂçºÍÂÏÉúÍøÂçµÄÐÎÊ½±È½ÏÀàËÆ,ÊÇÓÉ3¸ö½á¹¹ÍêÈ«ÏàÍ¬¡¢È¨Öµ¹²
ÏíµÄÍøÂç×é³ÉµÄ¡£ÍøÂçÑµÁ·µÄÄ¿±êÊÇÊ¹Í¬Àà±ð¼äµÄ¾àÀë¾¡¿ÉÄÜµØÐ¡,²»Í¬Àà±ð
¼äµÄ¾àÀë¾¡¿ÉÄÜµØ´ó¡£¸ù¾Ý×÷ÕßµÄ¾­Ñé,¸ÃÍøÂçÔÚMNISTÊý¾Ý¼¯ÉÏÓÐ×Å½ÏÓÅ
µÄ±íÏÖ,Ò²¿ÉÒÔ×÷ÎªÎÞ¼à¶½Ñ§Ï°¿ò¼Ü,¾ßÌåÄÚÈÝ¶ÁÕß¿ÉÒÔÔÄ¶ÁÏà¹ØÂÛÎÄ¡£

Í¬Ñù,Èý°ûÌ¥ÍøÂçÒ²ÓÐÐí¶àÓÃ´¦¡£±ÈÈçYishuLiuºÍChaoHuang¾ÍÀûÓÃÈý
°ûÌ¥ÂÏÉúÍøÂç½øÐÐ³¡¾°·ÖÀàÈÎÎñ[3]¡£¸ÃÍøÂçÓÉÈý¸öÏàÍ¬¼Ü¹¹ºÍÏàÍ¬È¨ÖµµÄ¾í»ý
Éñ¾­ÍøÂç×é³É,Ã¿¸öÊäÈë¶ÔÓ¦Ò»¸öÍøÂç¡£ÆäÖÐÁ½¸öÊäÈëÊÇÕýÑù±¾,µÚÈý¸öÊÇ¸ºÑù
±¾¡£ËüÃÇ¹¹ÔìÁË4¸öÐÂµÄËðÊ§º¯ÊýÀ´Ìá¸ß·ÖÀà¾«¶È¡£¸ÐÐËÈ¤µÄ¶ÁÕß¿ÉÒÔÔÄ¶ÁÏà
¹ØÂÛÎÄ¡£

3.Èý°ûÌ¥Î±ÂÏÉúÍøÂç
3.3 
ÂÏÉúÍøÂç¾ÍÊÇÕâÃ´ÉñÆæ,²»Í¬µÄÈ¨Öµ¡¢¸ü¶àµÄ×ÓÍøÂç¶¼»áÊ¹ÂÏÉúÍøÂç±äµÃ¸ü
¼ÓÇ¿´ó,Èç¹û°ÑÕâÐ©¸Ä±ä¶¼¼ÓÈëÆäÖÐ,»á±ä³ÉÊ²Ã´ÑùÄØ? Àî¹âÕýµÈÈËÔÚÂÛÎÄ[4]ÖÐ
Ê¹ÓÃÁËÈý°ûÌ¥Î±ÂÏÉúÍøÂçÀ´¼ì²â²»Í¬µÄº¸½ÓÈ±ÏÝ»ò¶¯×÷,ÈçÍ¼3-5ËùÊ¾¡£Õâ¸ö
ÍøÂçÓÉÈý¸ö²»Í¬µÄÍøÂç×é³É¡£¸ÃÍøÂçÓÐ3¸öÊäÈë,·Ö±ðÊäÈëÍ¼Ïñ¡¢ÉùÒôÒÔ¼°µçÁ÷
µçÑ¹3ÖÖ²»Í¬µÄÊý¾Ý¡£3ÖÖ×ÓÍøÂçÊ¹ÓÃµÄÊÇ3ÖÖ¸Ä½øµÄ¾í»ýÉñ¾­ÍøÂç,Ê¹ÓÃÁË¿ç
Ä£Ì¬×¢Òâ»úÖÆ(cros-modalatention,CMA)À´Íê³ÉÍ¼Ïñ¡¢ÉùÒôºÍµçÁ÷µçÑ¹Ö®¼ä
µÄ½»»¥¡£¸ÃÍøÂçÏêÏ¸¹¹Ôì·Ç³£¸´ÔÓ,¶ÁÕß¿ÉÒÔÔÄ¶ÁÂÛÎÄÑ§Ï°,ÕâÀï²»ÔÙ½éÉÜ¡£

50


µÚ
3 
ÕÂÂÏÉúÍøÂç


Í¼3-
5 
Èý°ûÌ¥Î±ÂÏÉúÍøÂç½á¹¹Ê¾ÒâÍ¼

3.ÂÏÉúÍøÂçµÄ·¢Õ¹¼°Ó¦ÓÃ
4 

ÒÔÉÏ½éÉÜ±íÃ÷,ÂÏÉúÍøÂçÍ¨¹ýÑ°ÕÒÁ½¸öÊäÈëÖµÖ®¼äµÄÏàËÆÐÔÀ´Ñ§Ï°¡£Òò´Ë
¸ÃÍøÂçÖ÷ÒªÓ¦ÓÃÓÚÐèÒª¶Ô±ÈÁ½¸öÊäÈëÖ®¼äÏàËÆÐÔµÄÈÎÎñÖÐÈ¥¡£ÕâÑùµÄÓ¦ÓÃºÜ
¶à,²¢ÇÒÐí¶àÁìÓò¶¼ÓÐÉæ¼°¡£

ÔçÔÚ1993 Äê,yµÈÈËÔÚÂÛÎÄ[5]ÖÐÌá³öÁËÂÏÉúÍøÂç,ÓÃÓÚÑéÖ¤Ö§

JaneBromle
Æ±ÉÏµÄÇ©ÃûÓëÒøÐÐÔ¤ÁôÇ©ÃûÊÇ·ñÒ»ÖÂ¡£×÷ÕßÊÕ¼¯ÁË5990 ¸öÇ©ÃûÊý¾ÝÓÃÓÚÊ¶±ð
Ç©ÃûµÄÕæÊµÐÔ,Êý¾Ý·ÖÎªÕýÑù±¾Ç©ÃûºÍ¸ºÑù±¾Ç©Ãû,ÓÃÓÚÑµÁ·ÂÏÉúÍøÂç¡£Ê¹ÓÃÊ±
¼äÑÓ³ÙÍøÂç(timedelayneuralnetwork,TDNN)×÷ÎªÂÏÉúÍøÂçµÄÁ½¸ö×ÓÍøÂç¡£
ÔÚÑµÁ·¹ý³ÌÖÐ,Á½¸ö×ÓÍøÂç´ÓÁ½¸öÇ©ÃûÖÐÌáÈ¡ÌØÕ÷,È»ºó¼ÆËãÁ½¸öÌØÕ÷ÏòÁ¿¼Ð½Ç
µÄÓàÏÒÖµ×÷Îª¾àÀëÖµ¡£ÒªÊ¶±ðÒ»¸öÐÂÇ©ÃûÊ±,ÌáÈ¡Õâ¸öÇ©ÃûµÄÌØÕ÷ÏòÁ¿Óë´æ´¢
µÄÇ©ÃûÕßÌØÕ÷ÏòÁ¿±È½Ï,Èç¹û¾àÀëÐ¡ÓÚÉè¶¨ãÐÖµ,ÔòËµÃ÷Õâ¸öÇ©ÃûÊÇÕæÊµµÄ¡£

Ö®ºóÓÉÓÚµ±Ê±¼¼ÊõÌõ¼þµÄÏÞÖÆ,ÂÏÉúÍøÂçµÄ·¢Õ¹¼¸ºõÍ£ÖÍ²»Ç°¡£Ö±µ½2010 
Äê,HintonÔÚICML ÉÏ·¢±íÁËRectified 
Linear 
UnitsImprove 
Restricted 
BoltzmannMachines[6]¡£ËûÊ¹ÓÃÂÏÉúÍøÂç×öÈËÁ³Ê¶±ð,ÅÐ¶ÏÁ½ÕÅÈËÁ³Í¼ÏñÊÇ·ñ

51


ÏàËÆ¡£²ÉÓÃÁ½¸öNoisyRectifiedLinearUnit(NReLU)×÷ÎªÁ½¸ö×ÓÍøÂç,ÄÜÁ¿º¯
ÊýÑ¡ÓÃµÄÊÇÓàÏÒ¾àÀë¡£2015Äê,SergeyZagoruykoÔÚLearningtoCompare 
ImagePatchesviaConvolutionalNeuralNetworks[7]Ò»ÎÄÖÐ½éÉÜÁË¼¸ÖÖ¸Ä½øµÄ
ÂÏÉúÍøÂç,²¢×öÁË¶Ô±È¡£ËûÔÚÒÔCNNÎª×ÓÍøÂçµÄÂÏÉúÍøÂçµÄ»ù´¡ÉÏ½è¼øÁËË«Í¨
2-channel) SPP) two-stream)

µÀ(ÍøÂç¡¢¿Õ¼ä½ð×ÖËþ³Ø»¯(ÍøÂçÒÔ¼°Ë«Á÷ÍøÂç(µÄ½á
¹¹,¶ÔÂÏÉúÍøÂç½øÐÐ¸Ä½ø,ÓÃÓÚÍ¼Æ¬ÏàËÆ¶È¶Ô±È,²¢×öÁË¶Ô±ÈÊÔÑé¡£ÔÚÍ¼ÏñÆ¥Åä
ÉÏ,vµÈÈËÊ¹ÓÃÂÏÉúÍøÂç¶ÔÊÀ½ç¸÷µØµÄµØ±êÍ¼Æ¬½øÐÐÍ¼ÏñÆ¥

IaroslavMelekho

Åä[8]¡£ËûÃÇÊ¹ÓÃÁ½¸ö¾í»ýÉñ¾­ÍøÂç×÷ÎªÂÏÉúÍøÂçµÄ×ÓÍøÂç,Ê¹ÓÃÅ·ÊÏ¾àÀë×÷Îª

ÄÜÁ¿º¯Êý,ËðÊ§º¯Êý²ÉÓÃµÄÊÇ»ùÓÚ±ß¼ÊµÄ¶Ô±ÈËðÊ§º¯Êý,ÓÃÓÚ¼ÆËãÍ¼Æ¬Ö®¼äµÄÏà

ËÆ¶È¡£

Ëæ×ÅÂÏÉúÍøÂç·¢Õ¹µÄÈÕÒæ³ÉÊì,ÂÏÉúÍøÂçÒ²¿ªÊ¼ÂýÂýÓ¦ÓÃÔÚ¼ÆËã»úÊÓ¾õ¡¢Ä¿
±ê¸ú×ÙÁìÓòºÍ×ÔÈ»ÓïÑÔ´¦ÀíµÈÁìÓò¡£LucaBertinetoµÈÈËÌá³öÁËÒ»ÖÖÐÂµÄÈ«¾í
»ýÂÏÉúÍøÂç,ÓÃÓÚÊÓÆµÖÐµÄÄ¿±ê¼ì²â[9]¡£XingpingDongºÍJianbingShen½«Ò»
ÖÖÐÂµÄÈýÖØËðÊ§¼ÓÈëÂÏÉúÍøÂç¿ò¼ÜÖÐ,ÓÃÓÚÄ¿±ê¸ú×Ù[10]¡£JonasMuelerºÍ
AdityaThyagarajanµÈÈËÌá³öÍ¨¹ýÁ½¸öLSTMÍøÂç×÷ÎªÂÏÉúÍøÂçÖÐµÄÁ½¸ö×ÓÍø
ÂçÀ´´¦Àí¾ä×Ó¶Ô[11]¡£Ê¹ÓÃÂü¹þ¶Ù¾àÀëÀ´¶ÈÁ¿Á½¸ö¾ä×ÓµÄ¿Õ¼äÏàËÆ¶È,´Ó¶ø¼ÆËã
Á½¸ö¾ä×ÓÖ®¼äµÄÏàËÆ¶È¡£

ÂÏÉúÍøÂçµÄÓ¦ÓÃÏàµ±¹ã·º¡£´ËÍâ,ÂÏÉúÍøÂç³ýÁË¿ÉÒÔµ¥¶ÀÊ¹ÓÃÍâ,»¹¿ÉÒÔ×é

×°ÔÚ¸÷ÖÖÍøÂç¼Ü¹¹ÖÐ,ÓÃÓÚ×é³ÉÊÊºÏ²»Í¬ÈÎÎñµÄÄ£ÐÍ¡£

3.°¸Àý:ÀûÓÃÂÏÉúÍøÂç½øÐÐÍ¼ÏñÊ¶±ð
5 

ÒÔÉÏ½éÉÜÁËÂÏÉúÍøÂçµÄ½á¹¹¼°Ó¦ÓÃ¡£½ÓÏÂÀ´´ÓÊµÕ½³ö·¢,Í¨¹ýÒ»¸öÍ¼ÏñÊ¶

±ðµÄ°¸Àý¶¯ÊÖÑµÁ·Ò»¸ö¼òµ¥µÄÂÏÉúÍøÂç,ÀûÓÃ¸ÃÍøÂçÅÐ¶ÏÁ½ÕÅÍ¼Æ¬ÊÇ·ñÏàËÆ,½ø

¶øÊ¶±ð³ö¸ÃÍ¼ÏñµÄÀà±ð¡£

°¸ÀýÖÐÊ¹ÓÃµÄÊý¾Ý¼¯ÎªFashion-MNISTÊý¾Ý¼¯,ËüÓÉµÂ¹ú¹«Ë¾ZalandoÆì

ÏÂµÄÑÐ¾¿²¿ÃÅÌá¹©¡£¸ÃÊý¾Ýº­¸ÇÁË10ÖÖÀà±ðµÄ¹²70000¸ö²»Í¬ÉÌÆ·µÄÕýÃæÍ¼

52


µÚ
3 
ÕÂÂÏÉúÍøÂç


Æ¬,ÆäÖÐÑµÁ·¼¯°üº¬60000 ¸öÑù±¾,²âÊÔ¼¯°üº¬10000 ¸öÑù±¾¡£Ñù±¾À´×ÔÈÕ³£´©
×ÅµÄÒÂ¿ãÐ¬°ü,Ã¿Ò»¸ö¶¼ÊÇ28¡Á28 µÄ»Ò¶ÈÍ¼Ïñ,ÈçÍ¼3-6ËùÊ¾¡£


Í¼3-
6 
Fashion-MNIST 
Êý¾Ý¼¯ÖÐÇ°24 
ÕÅÍ¼Æ¬

½ÓÏÂÀ´ÐèÒª´´½¨ÑµÁ·Êý¾Ý¡£ÓÉÓÚÂÏÉúÍøÂçÓÐÁ½¸öÊäÈë,Òò´ËÑµÁ·Êý¾Ý±ØÐë
³É¶Ô²¢´øÓÐ±êÇ©¡£´ÓÏàÍ¬Àà±ðÖÐËæ»úÑ¡È¡Á½ÕÅÍ¼Æ¬×÷ÎªÕýÑù±¾¶Ô,´ÓÒ»¸öÀà±ð
ÖÐÑ¡³öÒ»ÕÅÍ¼Æ¬ÓëÆäËûÀà±ðÖÐµÄÒ»ÕÅÍ¼Æ¬×é³É¸ºÑù±¾¶Ô¡£Èç±í3-2ËùÊ¾,ÕýÑù
±¾¶ÔµÄÁ½ÕÅÍ¼Æ¬ÊÇÍ¬Ò»Àà±ð,¸ºÑù±¾¶ÔµÄÁ½ÕÅÍ¼Æ¬ÊÇ²»Í¬Àà±ð¡£

Ö®ºó¾Í¿ªÊ¼¹¹½¨ÂÏÉúÍøÂç¡£´´½¨Á½¸ö¾í»ýÍøÂç,ÓÃÓÚÌáÈ¡ÌØÕ÷ÏòÁ¿,Á½¸öÍø
ÂçµÄ¼¤»îº¯ÊýÊ¹ÓÃÏßÐÔÕûÁ÷º¯Êý(ReLU )¡£½«Í¼Ïñ¶ÔÖÐµÄÁ½¸öÍ¼Æ¬·Ö±ðÊäÈëÁ½
¸ö¾í»ýÍøÂçÖÐ,Êä³öÌáÈ¡µÄÌØÕ÷ÏòÁ¿¡£Ö®ºó°ÑÕâÁ½¸öÌØÕ÷ÏòÁ¿×÷ÎªÄÜÁ¿º¯ÊýµÄ
ÊäÈë,Êä³öÁ½ÕÅÍ¼Æ¬µÄÏàËÆ¶È¡£

ÏÂÃæ¸ù¾Ý°¸ÀýÒ»²½Ò»²½µØÑµÁ·Ò»¸öÂÏÉúÍøÂç¡£¸Ã°¸Àý¿ÉÒÔÔÚÌá¹©µÄÔ´´úÂë
ÖÐ²é¿´¾ßÌå´úÂë¡£

53


±í3-2 ÊäÈëÑù±¾¶Ô
Êä Èë ¶Ô±ê Ç©
Õý
¸º
Õý
¸º 
(1)µ¼ÈëÐèÒªµÄ¿â¡£ 
import random 
import tensorflow as tf 
from tensorflow import keras 
from keras.layers import Input, Flatten, Dense, Dropout, Lambda, MaxPooling2D 
from keras.models import Model 
from keras.optimizers import RMSprop 
from keras import backend as K 
from keras.layers.convolutional import Conv2D 
from keras.layers import LeakyReLU 
from keras.regularizers import l2 
from keras.models import Model, Sequential 
from tensorflow.keras import regularizers 
import numpy as np 
import matplotlib.pyplot as plt 
54

µÚ3 ÕÂ ÂÏÉúÍøÂç
(2)¼ÓÔØÊý¾Ý¡£
Ê¹ÓÃFashion-MNISTÊý¾Ý¼¯,¸ÃÊý¾ÝÒÑÔÚkerasÊý¾Ý¼¯ÖÐÓÐËù°üº¬,¿ÉÒÔÖ±
½ÓÊ¹ÓÃÒÔÏÂ´úÂë¼ÓÔØÊý¾Ý¶ø²»ÓÃÌáÇ°ÏÂÔØ¡£ 
(x_train, y_train), (x_test, y_test) = keras.datasets.fashion_mnist.load_data() 
x_train = x_train.astype('float32') 
x_test = x_test.astype('float32') 
x_train = x_train / 255.0 
x_test = x_test / 255.0 
ÏÔÊ¾Êý¾Ý¼¯µÄµÚÒ»ÕÅÍ¼Æ¬,ÈçÍ¼3-7ËùÊ¾¡£ 
plt.figure(figsize=(5,5)) 
plt.imshow(x_train[0], cmap=plt.cm.binary) 
plt.xticks([]) 
plt.yticks([]) 
plt.grid(False) 
Í¼3-7 Fashion-MNISTÊý¾Ý¼¯ÖÐµÄÒ»ÕÅÍ¼Æ¬
°´ÕÕÊý¾Ý±êÇ©¶ÔÊý¾Ý½øÐÐ·ÖÀà¡£Ñ¡È¡¡°ÉÏÒÂ¡±¡°¿ã×Ó¡±¡°Ì×Í·ÉÀ¡±¡°ÍâÌ×¡±¡°Á¹Ð¬¡± 
¡°Ñ¥×Ó¡±6¸öÀà±ð¡£»®·ÖÑµÁ·¼¯ºÍ²âÊÔ¼¯,±ÈÀýÎª8¡Ã2¡£ 
digit_indices = [np.where(y_train == i)[0]for i in {0,1,2,4,5,9}] 
digit_indices = np.array(digit_indices) 
n = min([len(digit_indices[d]) for d in range(6)]) 
train_set_shape = n * 0.8 
test_set_shape = n * 0.2 
y_train_new = digit_indices[:, :int(train_set_shape)] 
y_test_new = digit_indices[:, int(train_set_shape):] 
print(y_train_new.shape) 
print(y_test_new.shape)test_set_shape = n * 0.2 
55

(3)ÖÆ×÷ÑµÁ·Êý¾Ý¡£
¶¨Òåcreate_pairsº¯ÊýÀ´Éú³ÉÊý¾Ý¡£Ç°Ãæ½²µ½,SiameseÍøÂçµÄÊäÈëÊý¾ÝÓ¦
¸ÃÊÇ³É¶Ô´æÔÚµÄ(ÕýÑù±¾ºÍ¸ºÑù±¾)¡£°´ÕÕÉÏÃæÒÑ¾­·ÖºÃµÄÀà±ð,´ÓÍ¬Ò»¸öÀà±ð
ÖÐÑ¡È¡Í¼Ïñ(z1,z2),²¢´æ´¢µ½pairsÊý×éÖÐ¡£Í¬Ê±´Ó²»Í¬Àà±ðÖÐÑ¡È¡Í¼Ïñ(z1, 
z2),Í¬Ñù´æ´¢µ½pairsÊý×éÖÐ¡£´ËÊ±¸ÃÌõÑù±¾ÖÐ°üº¬Ò»Õý¡¢Ò»¸º,½«labels¸³Öµ
Îª[1,0]¡£×îÖÕÉú³ÉÁËÑµÁ·Êý¾Ý,°üº¬ÑµÁ·¼¯ºÍ²âÊÔ¼¯¡£ 
def create_pairs(x, digit_indices): 
pairs = [] 
#±êÇ©Îª1 »ò0,ÓÃÓÚ±êÊ¶Ñù±¾¶ÔÊÇÕýµÄ»¹ÊÇ¸ºµÄ 
labels = [] 
class_num = digit_indices.shape[0] 
for d in range(class_num): 
for i in range(int(digit_indices.shape[1])-1): 
#Ê¹ÓÃÀ´×ÔÍ¬Ò»ÀàµÄÍ¼ÏñÀ´´´½¨ÕýÑù±¾¶Ô 
z1, z2 = digit_indices[d][i], digit_indices[d][i + 1] 
pairs += [[x[z1], x[z2]]] 
#Ê¹ÓÃËæ»úÊý´ÓÁíÒ»¸öÀàÖÐÕÒµ½Í¼ÏñÀ´´´½¨¸ºÑù±¾¶Ô 
inc = random.randrange(1, class_num) 
dn = (d + inc) % class_num 
z1, z2 = digit_indices[d][i], digit_indices[dn][i] 
pairs += [[x[z1], x[z2]]] 
#add two labels which the first one is positive class and the second is 
#negative 
labels += [1, 0] 
return np.array(pairs), np.array(labels) 
#ÑµÁ·¼¯
tr_pairs, tr_y = create_pairs(x_train, y_train_new) 
tr_pairs = tr_pairs.reshape(tr_pairs.shape[0], 2, 28, 28, 1) 
#²âÊÔ¼¯
te_pairs_1, te_y_1 = create_pairs(x_train, y_test_new) 
te_pairs_1 = te_pairs_1.reshape(te_pairs_1.shape[0], 2, 28, 28, 1) 
(4)¹¹½¨ÂÏÉúÍøÂç²¢ÑµÁ·Ä£ÐÍ¡£
ÏÈ½¨Á¢»ù±¾ÍøÂç,ËüÊÇÒ»¸öÓÃÓÚÌØÕ÷ÏòÁ¿ÌáÈ¡µÄ¾í»ýÍøÂç¡£ÓÃReLU Îª¼¤
»îº¯Êý¹¹½¨Á½¸ö¾í»ý²ãºÍÒ»¸öÆ½Ãæ²ã¡£ 
def create_base_network(input_shape): 
input = Input(shape=input_shape) 
56

µÚ3 ÕÂ ÂÏÉúÍøÂç 
x = Conv2D(32, (7, 7), activation='relu', input_shape=input_shape, 
kernel_regularizer=regularizers.l2(0.01), 
bias_regularizer=regularizers.l1(0.01))(input) 
x = MaxPooling2D()(x) 
x = Conv2D(64, (3, 3), activation= 'relu', kernel_regularizer= regularizers. 
l2(0.01), bias_regularizer=regularizers.l1(0.01))(x) 
x = Flatten()(x) 
x = Dense(128, activation='relu', kernel_regularizer=regularizers.l2(0.01), 
bias_regularizer=regularizers.l1(0.01))(x) 
return Model(input, x) 
½ÓÏÂÀ´,½«Í¼Ïñ¶ÔÊäÈëµ½»ù´¡ÍøÂçÖÐ,Ëü½«·µ»ØEmbeddings,¼´ÌØÕ÷ÏòÁ¿¡£ 
input_shape = (28,28,1) 
base_network = create_base_network(input_shape) 
input_a = Input(shape=input_shape) 
input_b = Input(shape=input_shape) 
processed_a = base_network(input_a) 
processed_b = base_network(input_b) 
processed_aºÍprocessed_bÊÇÍ¼Ïñ¶ÔµÄÌØÕ÷ÏòÁ¿¡£½«ÕâÐ©ÌØÕ÷ÏòÁ¿Ìá¹©¸ø
ÄÜÁ¿º¯ÊýÀ´¼ÆËãËüÃÇÖ®¼äµÄ¾àÀë,ÕâÀïÊ¹ÓÃÅ·ÊÏ¾àÀë×÷ÎªÄÜÁ¿º¯Êý¡£Í¬Ê±¸ø³ö
ÁËËðÊ§º¯Êýcontrastive_loss,²¢¶¨Òå¾«È·¶È¡£ 
#¾àÀëº¯Êý
def euclidean_distance(vects): 
x, y = vects 
sum_square = K.sum(K.square(x - y), axis=1, keepdims=True) 
return K.sqrt(K.maximum(sum_square, K.epsilon())) 
#Êä³öÀàÐÍº¯Êý
def eucl_dist_output_shape(shapes): 
shape1, shape2 = shapes 
return (shape1[0], 1) 
#ËðÊ§º¯Êý
def contrastive_loss(y_true, y_pred): 
margin = 1 
square_pred = K.square(y_pred) 
margin_square = K.square(K.maximum(margin - y_pred, 0)) 
return K.mean(y_true * square_pred + (1 - y_true) * margin_square) 
#¾«È·¶Èº¯Êý
def accuracy(y_true, y_pred): 
57

#Compute classification accuracy with a fixed threshold on distances. 
return K.mean(K.equal(y_true, K.cast(y_pred < 0.5, y_true.dtype))) 
distance = Lambda(euclidean_distance, output_shape= eucl_dist_output_shape) 
([processed_a, processed_b]) 
½ÓÏÂÀ´ÉèÖÃÂÖÊý(epoch)Îª13,²¢Ê¹ÓÃRMsprop½øÐÐÓÅ»¯¡£Ö®ºó¶¨ÒåÄ£ÐÍ
model¡£ 
epochs = 13 
rms = RMSprop() 
model = Model([input_a, input_b], distance) 
model.compile(loss=contrastive_loss, optimizer=rms, metrics=[accuracy]) 
ËùÓÐ¶¼×¼±¸ºÃºó,¾Í¿ÉÒÔ¿ªÊ¼ÑµÁ·Ä£ÐÍ¡£ 
tr_y = np.array(tr_y, dtype='float32') 
results = model.fit([tr_pairs[:, 0], tr_pairs[:, 1]], tr_y, batch_size = 128, 
epochs=epochs, verbose=2, validation_split=.25) 
¿ÉÒÔ»æÖÆ³öÍ¼ÏñÀ´²é¿´Ä£ÐÍËðÊ§µÄ±ä»¯,ÈçÍ¼3-8ËùÊ¾¡£ 
plt.plot(results.history['loss']) 
plt.title('Model loss') 
plt.ylabel('Loss') 
plt.xlabel('Epoch') 
plt.show() 
Í¼3-8 Ä£ÐÍËðÊ§±ä»¯
58

µÚ3 ÕÂ ÂÏÉúÍøÂç
¿ÉÒÔ¿´µ½,Ëæ×ÅÑµÁ·ÂÖÊýµÄÔö¼Ó,ËðÊ§ÔÚ²»¶Ï¼õÉÙ¡£
(5)Ô¤²â¼°ÆÀ¹À¡£
ÑµÁ·ºÃÄ£ÐÍºó,¾Í¿ÉÒÔÓÃ²âÊÔ¼¯À´Ô¤²â¡£ 
y_pred = model.predict([te_pairs_1[:, 0], te_pairs_1[:, 1]]) 
¶¨Òå¾«È·¶È¼ÆËãº¯Êý,²é¿´Ä£ÐÍµÄ×¼È·ÐÔ¡£ 
#¶¨Òå¾«È·¶Èº¯Êý
def compute_accuracy(y_true, y_pred): 
pred = y_pred.ravel() < 0.5 
return np.mean(pred == y_true) 
¼ÆËãÄ£ÐÍµÄ×¼È·ÐÔ,²¢Êä³ö¡£ 
te_acc = compute_accuracy(te_y_1, y_pred) 
print('Accuracy on test set: %0.2f%%' % (100 * te_acc)) 
Êä³ö:Accuracyontestset:92.19%¡£
3.6 Ð¡ ½á
±¾ÕÂ½²½âÁËÂÏÉúÍøÂçÊÇÓÃÓÚÅÐ¶ÏÁ½¸öÊäÈëÏàËÆÐÔµÄÒ»ÖÖÍøÂç,ÒÔ¼°ÂÏÉúÍø
ÂçÊÇÈçºÎÅÐ¶ÏÁ½¸öÊäÈëµÄÏàËÆÐÔµÄ¡£ËüÊÇÓÉ½á¹¹ÏàÍ¬¡¢È¨Öµ¹²ÏíµÄÁ½¸öÉñ¾­Íø
Âç×é³ÉµÄ,Í¨¹ýÕâÁ½¸öÍøÂçÌáÈ¡³öÌØÕ÷ÏòÁ¿,²¢ÊäÈëµ½ÄÜÁ¿º¯ÊýÖÐ¼ÆËãÏàËÆÐÔ¡£
×îºó½²½âÁËÂÏÉúÍøÂçµÄÒ»Ð©³£ÓÃÓ¦ÓÃ,²¢Í¨¹ýÒ»¸ö°¸Àý¶¯ÊÖÊµÏÖÁËÒ»¸ö¼òµ¥µÄ
ÂÏÉúÍøÂçÄ£ÐÍ¡£
3.7 Ë¼ ¿¼ Ìâ
1.ÏêÏ¸½âÊÍÒ»ÏÂÂÏÉúÍøÂçµÄ»ù±¾¸ÅÄî¼°ÆäÔÚ¸÷ÖÖ³¡¾°ÖÐµÄÓ¦ÓÃ¡£
2.ÏêÊöÂÏÉúÍøÂçÈçºÎÀûÓÃÆäÌØ¶¨µÄÉè¼ÆÀ´ÅÐ¶ÏÁ½¸öÊäÈëÑù±¾µÄÏàËÆÐÔ¡£
3.ÏêÏ¸ÃèÊöÂÏÉúÍøÂçµÄµäÐÍ½á¹¹,ÒÔ¼°ÕâÖÖ½á¹¹¶ÔÍøÂçÐÔÄÜµÄÓ°Ïì¡£
59

4.ÔÚÂÏÉúÍøÂçÖÐ,Á½¸ö×ÓÍøÂçµÄÈ¨ÖµÊÇ·ñÊ¼ÖÕ±£³ÖÏàÍ¬? ÕâÖÖÉè¼Æ±³ºóµÄ
Âß¼­ÊÇÊ²Ã´? 
5.ÁÐ¾ÙÒ»Ð©ÔÚÂÏÉúÍøÂç»ù´¡ÉÏ·¢Õ¹³öÀ´µÄÍøÂç½á¹¹,²¢¼òÊöÆäÌØµã¡£
²Î¿¼ÎÄÏ×

[1]HughesLH,SchmitM,MouL,etal.IdentifyingcorespondingpatchesinSARandopticalimages 
withapseudo-siameseCNN[J].IEEEgeoscienceandremotesensiglters,2018,15(5):784-788. 
[2]HoferE,AilonN.Depmetriclearningusingtripletnetwor]//Similarity-basedpatern 
recognition:thirdinternationalworkshop,SIMBAD2015,Copenhagen,Denmark,October12-14,2015. 
procedings3.springerinternationalpublishing,2015:84-92. k(n) [C(e) 
[3]LiuY,HuangC.Sceneclasificationviatripltntrks[J].IEEEJournalofselectedtopicsinapplied 
rthobservationsandremotesensing,2017):220-237.,11(1(wo) (e) (e) [4]LiZ,C(a) (e) henH,MaX,etal.Triplepseudo-siamesenetworkwithhybridatentionmechanismfor 
wedneetdtcin[.tras&Dsg2022(
ligdfceetoJ]Maeilein,217):110645. 

[5]BromleyJ,GuyonI,LeCunY,etal.Signatureverificationusinga¡°siamese¡±timedelayneuralnetwork 
[J].Advancesinneuralinformationprocesingsystems,1993(6):669-688. 
[6] NairV,HintonGE.RectifiedlinearunitsimprovtrictedBoltzmannmachines[C]//Procedingsof 
the27thinternationalconferenceonmachinelearninICML-10).2010:807-814.g((s) (e) (er) 

[7]ZagoruykoS,KomodakisN.Learningtocompareimagepatchesviaconvolutionalneuralnetworks 
[C]//ProcedingsoftheIEEEconferenceoncomputervisionandpaternrecognition,2015: 
4353-4361. 
[8]MelekhovI,KannalaJ,RahtuE.Siamesenetworkfeaturesforimagematching[C]//201623rd 
inentoaofrneoareogiin(.2016:378383.
trainlcneecnptenrcntoICPR)IEEE,

[9]BertinetoL,ValmadreJ,HenriquesJF,etal.Fuly-convolutionalsiamesenetworksforobjecttracking[C]//Compueiin¨Cersos:amsedtentelns,Ocoe-n
trvsocv2016wokhptram,hehradtbr810ad1516, 
2016,procedings,partI14.springerinternationalpublishing,2016:850-865. 

[10] DongX,ShenJ.Tripletlosinsietworkforobjecttracking[C]//ProcedingsoftheEuropean 
nferenceoncomputervision.2018:459-474.(ECCV)(en) (s) (ame) [11]Mu(o) (c) elerJ,ThyagarajanA.Siameserecurentarchitecturesforlearningsentencesimilarity[C]//
ProcedingsoftheAAAIconferenceonartificialinteligence,2016:30(1):2786-2792. 
60