µÚ5ÕÂÊÓ¾õÊý¾Ý·ÖÎö

5.ÊÓ¾õÊý¾Ý·ÖÎö¸ÅÊö
1 

ie) vdo), 
½ø¶øÌá¹©½¨Òé»ò²ÉÈ¡ÐÐ¶¯,¿ÉÎªÏÖÊµÉú»îºÍÉú²úÖÐµÄÐí¶àÓ¦ÓÃÌá¹©¼¼ÊõÖ§³Ö¡£ÀýÈç,ÔÚ¹¤Òµ
¼ì²âÖÐ,²É¼¯²úÆ·Í¼Ïñ²¢Ê¹ÓÃ¼ÆËã»úÊÓ¾õ¼¼Êõ,ÀûÓÃÄ¿±ê¼ì²â¼¼Êõ¿É¼ì²â³ö²úÆ·ÔÚÉú²ú¹ý³Ì
ÖÐ³öÏÖµÄÁÑÎÆ¡¢ÐÎ±ä¡¢²¿¼þ¶ªÊ§µÈÍâ¹ÛÈ±ÏÝ,´ïµ½ÌáÉý²úÆ·ÖÊÁ¿ÎÈ¶¨ÐÔºÍÉú²úÐ§ÂÊµÄÄ¿µÄ;ÔÚ
ÎïÁ÷ÔËÊäÖÐ,²É¼¯°ü¹üÔËÊä¹ý³ÌµÄÊÓÆµ,ÀûÓÃÄ¿±ê¸ú×Ù¼¼Êõ¿É»ñÈ¡°ü¹üµÄÔË¶¯¹ì¼£,Í¨¹ýÔË
¶¯¹ì¼£µÄ·ÖÎöÔ¤¾¯°ü¹üµøÂä¡¢°ü¹üËð»ÙµÈ×´¿ö,´ïµ½½ÚÔ¼ÈËÁ¦³É±¾ºÍÌá¸ß¹ÜÀíÐ§ÂÊµÄÄ¿µÄ¡£

ÊÓ¾õÊý¾Ý·ÖÎöÒÔÍ¼Ïñ»òÊÓÆµ×÷ÎªÊäÈë,Í¨¹ý¼ÆËã»úÊÓ¾õ¼¼Êõ¹¹½¨Ä£ÐÍ,Ö¼ÔÚ³ä·ÖÌáÈ¡Í¼
ÏñºÍÊÓÆµÊý¾ÝµÄÌØÕ÷,½ø¶ø¸ù¾ÝÌØ¶¨ÈÎÎñÀûÓÃÌáÈ¡µÄÌØÕ÷Íê³ÉÏàÓ¦µÄ¹¦ÄÜ¡£Í¨³£,Ê¹ÓÃµ½µÄ
imageclasificatioobjectdetectio

ÊÓ¾õÊý¾ÝÖ÷Òª°üÀ¨Í¼Ïñ(magºÍÊÓÆµ(ieÍ¨¹ý¼ÆËã»ú¼¼Êõ»ñÈ¡ÆäÖÐµÄÓÐÓÃÐÅÏ¢, 

¼ÆËã»úÊÓ¾õ¼¼ÊõÓÐÍ¼Ïñ·ÖÀà(n)¡¢Ä¿±ê¼ì²â(n)¡¢Í¼Ïñ·Ö¸î
(imagesegmentation)ºÍÊÓÆµÄ¿±ê¸ú×Ù(videoobjecttracking)µÈ¡£ÆäÖÐ,Í¼Ïñ·ÖÀà¼¼Êõ½«Õû
·ùÍ¼Ïñ»®·Öµ½Ä³¸öÀà±ð,ÀýÈç¸ø¶¨¹·»òÃ¨µÄÍ¼Ïñ,Ê¹ÓÃÍ¼Ïñ·ÖÀà¼¼Êõ¿É½«Í¼Ïñ±ê¼ÇÎª¹·»ò
Ã¨;Ä¿±ê¼ì²â¼¼ÊõÔÚÍ¼Ïñ·ÖÀàµÄ»ù´¡ÉÏ,¼ÈÒªÊ¹Í¼ÏñÖÐµÄÄ¿±ê·ÖÀàÕýÈ·,Ò²Òª¼ì²âÄ¿±êµÄÊµ
¼ÊÎ»ÖÃ,ÀýÈç¸ø¶¨°üº¬¹·ºÍÃ¨µÄÍ¼Ïñ,Ê¹ÓÃÄ¿±ê¼ì²â²»½öÒª·Ö±ð¼ì²â³ö¹·ºÍÃ¨ÕâÁ½¸öÀà±ð, 
»¹Òª·Ö±ð¼ì²â³ö¹·ºÍÃ¨µÄÎ»ÖÃ;Í¼Ïñ·Ö¸î¼¼Êõ°ÑÍ¼Ïñ·Ö³ÉÈô¸É¸ö¸÷¾ßÌØÐÔµÄÇøÓò,²¢ÌáÈ¡³ö
¸ÐÐËÈ¤ÇøÓò,¶ÔÓÚ°üº¬¹·ºÍÃ¨µÄÍ¼Ïñ,Í¼Ïñ·Ö¸îµÄÊä³öÖÁÉÙ°üº¬¸ÐÐËÈ¤µÄ¹·µÄÇøÓò¡¢Ã¨µÄÇø
ÓòºÍÆäËû²»¸ÐÐËÈ¤µÄÇøÓò;ÊÓÆµÄ¿±ê¸ú×Ù¼¼ÊõÔòÐè°ÑÊÓÆµÊý¾Ý²ð½âÎªÒ»ÏµÁÐÁ¬ÐøµÄÊÓÆµÖ¡, 
µ±Ä³Ò»Ö¡³öÏÖ¸ÐÐËÈ¤µÄÄ¿±êÊ±,ÔÚºóÐøÖ¡ÖÐ¶Ô¸ÃÄ¿±ê½øÐÐ¸ú×Ù,¶ÔÓÚÒ»¶Î°üº¬¹·µÄÊÓÆµ,µ±
ÊÓÆµÄ¿±ê¸ú×ÙÔÚµÚÒ»Ö¡¼ì²âµ½¹·Ê±,ÐèÒª¶ÔºóÐøÖ¡ÖðÒ»¼ì²âÊÇ·ñ´æÔÚÍ¬ÑùµÄÕâÖ»¹·¡£

¸÷ÀàÊÓ¾õÊý¾Ý·ÖÎöÈÎÎñ¶¼Ðè¶ÔÍ¼ÏñºÍÊÓÆµÊý¾Ý½øÐÐÌØÕ÷ÌáÈ¡,ËùÌáÈ¡ÌØÕ÷µÄÖÊÁ¿¾ö¶¨
ÁË¸÷ÖÖÈÎÎñÊÇ·ñÄÜ³É¹¦Íê³É¡£´«Í³µÄÌØÕ÷ÌáÈ¡·½·¨Ðè×Ü½á´óÁ¿µÄÏÈÑéÖªÊ¶,ÒÀ¿¿ÈË¹¤·½Ê½
Éè¼ÆÌØ¶¨µÄ¹æÔò,ÔÚÒ»¶¨µÄÊ±¼ä·¶Î§ÄÚÄÜÂú×ãÊµ¼ÊÐèÇó¡£Ëæ×ÅÓ¦ÓÃ³¡¾°µÄ²»¶Ï·á¸»¡¢Êý¾Ý¹æ
Ä£µÄ¿ìËÙÔö´óºÍÐÔÄÜÒªÇóµÄ²»¶ÏÌá¸ß,ÒÀ¿¿ÏÈÑéÖªÊ¶Éè¼ÆµÄ¹æÔòÔÚÌØÕ÷ÌáÈ¡ÉÏÓöµ½ÁËÆ¿¾±¡£
Ëæ×ÅÈË¹¤ÖÇÄÜ¼¼ÊõµÄ¿ìËÙ·¢Õ¹,ÓÉÓÚÉî¶ÈÉñ¾­ÍøÂçÄÜ´Ó´óÁ¿Êý¾ÝÖÐÑ§Ï°µ½·á¸»µÄÌØÕ÷,ÇÒ½ö
ÓÐ¼«ÉÙ²¿·ÖÐèÈËÎª¸ÉÔ¤,Éî¶ÈÉñ¾­ÍøÂçÊÜµ½ÁËÑ§½çºÍÒµ½çµÄ¹ã·º¹Ø×¢,²¢È¡µÃÁË¾Þ´óµÄ³É
¹¦,ÄÜ½øÒ»²½Âú×ãÈËÃÇÔ½À´Ô½¶àµÄÊÓ¾õÊý¾Ý·ÖÎöÐèÇó¡£

¾í»ýÉñ¾­ÍøÂç(convolutionalneuralnetwork,CNN)ÊÇÓÃÓÚÊÓ¾õÊý¾ÝÌØÕ÷ÌáÈ¡µÄÖ÷Á÷Ä£
ÐÍ,»ùÓÚCNNµÄÊÓ¾õÊý¾Ý·ÖÎö,Ò²ÊÇÉî¶ÈÑ§Ï°¼¼ÊõÔÚÊµ¼ÊÖÐÓ¦ÓÃ×î¹ã·ºµÄÁìÓò¡£CNNÆðÔ´


µÚ
5 
ÕÂÊÓ¾õÊý¾Ý·ÖÎö


ÓÚ20 ÊÀ¼Í70 Äê´úÈËÃÇ¶Ô¶¯Îï´óÄÔÊÓ¾õÏµÍ³µÄÑÐ¾¿¡£½üÄêÀ´,Ëæ×Å¼ÆËãÐÔÄÜµÄÌáÉýºÍÔ½À´
Ô½¶àµÄÑÐ¾¿ÈËÔ±Í¶Èë,CNN ¶ÔÊÓ¾õÊý¾Ý´¦ÀíµÄÓÅÊÆ±»³ä·ÖÍÚ¾ò,Æä²»½öÄÜ½«´óÊý¾ÝÁ¿µÄÍ¼
ÏñºÍÊÓÆµ½øÐÐ½µÎ¬´¦Àí,ÇÒÄÜ´ÓÓÐÏÞµÄÊý¾ÝÖÐÌáÈ¡µ½ÓÐÐ§µÄÌØÕ÷¡£Òò´Ë,»ùÓÚCNN ¿ª·¢µÄ
Í¼Ïñ·ÖÀà¡¢Ä¿±ê¼ì²â¡¢Í¼Ïñ·Ö¸îºÍÊÓÆµÄ¿±ê¸ú×ÙµÈ´óÁ¿Ëã·¨ÒÑ¹ã·ºÓ¦ÓÃÓÚ¹¤Òµ¼ì²â¡¢Å©ÒµÉú
²ú¡¢Ò½ÁÆ±£½¡¡¢¹ÊÕÏÕï¶ÏºÍ×Ô¶¯¼ÝÊ»µÈÁìÓò¡£

±¾ÕÂ½éÉÜÊÓ¾õÊý¾Ý·ÖÎöµÄ¹Ø¼üÁ÷³Ì,Í¨¹ý¶ÔÄ¿±ê¼ì²â¡¢Í¼Ïñ·Ö¸îºÍÊÓÆµÄ¿±ê¸ú×ÙµÈÒÔ
CNN ÎªÖ÷¸ÉÍøÂç½øÐÐÌØÕ÷ÌáÈ¡µÄµäÐÍÈÎÎñµÄÌÖÂÛ,Ê¹¶ÁÕß¸üÉîÈëÀí½âÊÓ¾õÊý¾Ý·ÖÎö¼¼Êõ¡£

5.Ä¿±ê¼ì²â
2 

2.Ä¿±ê¼ì²â¸ÅÊö
5.1 

Ä¿±ê¼ì²âÊÇ¶ÔÍ¼ÏñÖÐµÄÄ¿±ê½øÐÐ·ÖÀàºÍ¶¨Î»,×îÖÕµÃµ½Í¼ÏñÖÐÄ¿±êµÄÀà±ð¼°¸ÃÄ¿±êÔÚ
Í¼ÏñÖÐµÄÎ»ÖÃ¡£ÀýÈç,ÔÚÍ¼5.Îª±£Ö¤Ê©¹¤ÈËÔ±°²È«,

1ËùÊ¾µÄ5G »ùÕ¾½¨ÉèÖÐ, ±ØÐëÈ·±£Ê©¹¤
ÈËÔ±ÕýÈ·Åå´÷°²È«Ã±¡¢°²È«ÉþºÍ·´¹âÒÂµÈ¸÷Àà°²È«»¤¾ß¡£´ËÊ±,Ê¹ÓÃÄ¿±ê¼ì²âËã·¨¶ÔÉãÏñÍ·
²É¼¯µ½µÄÍ¼ÏñÖÐµÄ°²È«Ã±ºÍÈËÔ±µÈÄ¿±ê½øÐÐ¼ì²â,¿É¿ìËÙÅÐ¶ÏÄ¿±êÈËÔ±ÊÇ·ñÕýÈ·Åå´÷°²È«
Ã±,ÄÜÓÐÐ§µØ¼Ó¿ì¼ì²âÐ§ÂÊ,¼õÉÙÈË¹¤¼ì²â³É±¾¡£


Í¼5.°²È«Ã±Åå´÷¼ì²â

1 

Ä¿±ê¼ì²â¼¼ÊõµÄÑÐ¾¿ºÍÓ¦ÓÃÓÉÀ´ÒÑ¾Ã,ÔÚÉî¶ÈÉñ¾­ÍøÂçáÈÆðÖ®Ç°,´«Í³Ä¿±ê¼ì²â¼¼ÊõÉæ
¼°ÇøÓòÑ¡Ôñ¡¢ÊÖ¶¯ÌØÕ÷ÌáÈ¡¡¢·ÖÀàÆ÷·ÖÀàµÈ²½Öè¡£ÆäÖÐ,ÊÖ¶¯ÌáÈ¡ÌØÕ÷µÄ·½·¨ÍùÍùºÜÄÑÂú×ã
Ä¿±êµÄ¶àÑù»¯ÌØÕ÷,Òò´ËÕâÖÖ½â¾ö·½°¸Ò»Ö±Î´ÄÜÓÐÐ§½â¾öÄ¿±ê¼ì²âÎÊÌâ¡£×ÔÉî¶ÈÉñ¾­ÍøÂç
µÃµ½¹Ø×¢²¢±»¹ã·ºÓ¦ÓÃÒÔÀ´,ÌØ±ðÊÇCNN ¶ÔÍ¼ÏñÇ¿´óµÄÌØÕ÷ÌáÈ¡ÄÜÁ¦¿ìËÙÍÆ¶¯ÁËÄ¿±ê¼ì²â
¼¼ÊõµÄ·¢Õ¹¡£»ùÓÚCNN µÄÄ¿±ê¼ì²â°üÀ¨Ä¿±ê·ÖÀàºÍÄ¿±ê¶¨Î»Á½¸öÈÎÎñ,Ä¿±ê·ÖÀàÈÎÎñÅÐ¶Ï
ÊäÈëÍ¼ÏñÖÐÊÇ·ñ°üº¬ÐèÒª¼ì²âµÄÄ¿±êÀà±ð,Ä¿±ê¶¨Î»ÈÎÎñÈ·¶¨ÊäÈëÍ¼ÏñÖÐÄ¿±êÀà±ðµÄ¾ßÌå
Î»ÖÃ,²¢Êä³öÄ¿±êµÄ±ß½ç¿òÀ´±íÊ¾¾ßÌåµÄÎ»ÖÃÐÅÏ¢¡£Î§ÈÆÕâÁ½¸öÈÎÎñ,¿É½«Ä¿±ê¼ì²âËã·¨·Ö

twostagonestagÎªÁ½½×¶Î(e)Ëã·¨ºÍÒ»½×¶Î(e)Ëã·¨¡£Á½½×¶ÎËã·¨½«Ä¿±ê¼ì²âÈÎÎñ·ÖÎªÁ½¸ö
½×¶Î,Ê×ÏÈÉú³ÉÄ¿±êÎïÌåµÄ±ß½ç¿ò,ÔÙ¶ÔÆäÀà±ð½øÐÐÔ¤²â;Ò»½×¶ÎËã·¨½«±ß½ç¿ò¶¨Î»ÎÊÌâ×ª

107


»¯Îª»Ø¹é(ÎÊÌâ½øÐÐ´¦Àí,Ö±½Ó¼ÆËãÄ¿±êµÄÀà±ðºÍ±ß½ç¿ò×ø±ê¡£Òò´Ë,Á½½×¶ÎËã·¨Í¨

regresion)
³£±ÈÒ»½×¶ÎËã·¨¾ßÓÐ¸ü¸ßµÄ×¼È·ÂÊ,¶øÒ»½×¶ÎËã·¨±ÈÁ½½×¶ÎËã·¨¾ßÓÐ¸ü¸ßµÄÐ§ÂÊ¡£ÏÂÃæÒÔ
CNNÄ£ÐÍºÍYOLOÕâÒ»¾­µäµÄÒ»½×¶ÎÄ¿±ê¼ì²âËã·¨Îª´ú±í,ÏêÏ¸½éÉÜÄ¿±ê¼ì²â¼¼Êõ¡£

5.2 
¾í»ýÉñ¾­ÍøÂç
2.
CNNÊÇÒ»ÖÖÉî¶ÈÑ§Ï°Ä£ÐÍ,×Ô2012Äêºó±»¹ã·ºÓ¦ÓÃÓÚÊÓ¾õÊý¾Ý·ÖÎö,ÇÒ¶ÔÍ¼ÏñÊý¾ÝµÄ´¦
ÀíÓÈÎªÓÐÐ§¡£Ëü²»½öÄÜ×ÔÖ÷µØÌáÈ¡Í¼ÏñÊý¾ÝÌØÕ÷,ÇÒ»ùÓÚCNNµÄÄ£ÐÍ¾ßÓÐÁ¼ºÃµÄ·º»¯ÄÜÁ¦¡£

1.CNN 
½á¹¹
2ËùÊ¾, inputlayer)¡¢convolutional 
layeoolinglayer) fulyconnectedlaye

CNNµÄ²ã¼¶½á¹¹ÈçÍ¼5.Ö÷Òª°üº¬ÊäÈë²ã(¾í»ý²ã(

r)¡¢³Ø»¯²ã(pºÍÈ«Á¬½Ó²ã(r),Í¨¹ý²»Í¬²ã¼¶µÄ×éºÏ¿É¹¹
½¨²»Í¬µÄCNN,¶ÔÍ¼ÏñÊµÏÖ²»Í¬µÄ´¦ÀíÈÎÎñ¡£


Í¼5.

2 
CNN 
²ã¼¶½á¹¹Í¼

2.CNN 
²ã¼¶¼ò½é
1)ÊäÈë²ã
(
ÊäÈë²ã¼´ÊäÈëµÄÍ¼ÏñÊý¾Ý,Ò»ÕÅÍ¼ÏñÔÚ¼ÆËã»úÖÐÍ¨³£²ÉÓÃ¾ØÕóÐÎÊ½À´´æ´¢,²¢ÓÉºìÂÌÀ¶
RGB)Èý¸öÍ¨µÀµþ¼Ó¶ø³É¡£Òò´Ë,Ò»ÕÅÍ¼ÏñÍ¨³£´æ´¢Îª(³¤¡Á¿í¡ÁÍ¨µÀÊý)µÄ¶àÎ¬¾ØÕó(Ò²³Æ
ÎªÌØÕ÷Í¼),ÆäÖÐµÄÊýÖµ±íÊ¾RGBÍ¨µÀµÄ256¼¶ÁÁ¶ÈÖµ,3ËùÊ¾¡£

ÈçÍ¼5.


Í¼5.ÊäÈëÍ¼Ïñ¼°Æä¶ÔÓ¦µÄÌØÕ÷Í¼ÐÎÊ½

3 

108


µÚ
5 
ÕÂÊÓ¾õÊý¾Ý·ÖÎö


2)¾í»ý²ã

¾í»ý²ãÊÇCNNµÄºËÐÄ²ã¼¶,Æä×÷ÓÃÊÇ¶ÔÊäÈëÌØÕ÷Í¼½øÐÐÌØÕ÷ÌáÈ¡¡£Ã¿¸ö¾í»ý²ãÖÐÓëÊä
ÈëÌØÕ÷Í¼½øÐÐ¾í»ýÔËËãµÄ½á¹¹³ÆÎª¾í»ýºË,ÊäÈëÌØÕ÷Í¼Í¨¹ýÓë¾í»ýºË½øÐÐ¾í»ý¼ÆËã,µÃ³öÊä
³öÌØÕ÷Í¼¡£

¶ÔÓÚÍ¼ÏñÊý¾Ý,¾í»ý¼ÆËãÊÇÔÚÍ¼Ïñ¿Õ¼äÉÏ·­×ª¡¢»¬¶¯¾í»ýºË,´Ó¶øÌáÈ¡Í¼ÏñµÄÌØÕ÷¡£Îª
ÁË¼õÉÙ²»±ØÒªµÄ·­×ª¿ªÏú,ÔÚCNNµÄ¾ßÌåÊµÏÖÖÐ,Í¨³£ÒÔ»¥Ïà¹Ø(cros-corelation)¼ÆËã´ú
Ìæ¾í»ý¼ÆËã,¾ßÌåÎª¾í»ýºËÖÐËùÓÐ×÷ÓÃµãÒÀ´ÎÓëÊäÈëÌØÕ÷Í¼ÖÐµÄÏñËØµãÏà³Ë²¢Ïà¼Ó,ÈçÍ¼5.
ËùÊ¾¡£Ô­ÌØÕ÷Í¼ºÍ¾í»ýºËÖÐµÄÄ³¸ö×÷ÓÃµã,»¥Ïà¹Ø¼ÆËãÎª(7¡Á5)+(3¡Á3)+(6¡Á3)+(1¡Á 
4 
9)+(2¡Á1)+(7¡Á4)+(5¡Á2)+(3¡Á1)+(9¡Á9)=195,È»ºóÎªÃ¿¸öÊä³öÌØÕ÷Í¼µÄÏñËØµã¼Ó
Ò»¸öÆ«ÖÃÖµ,ÈôÆ«ÖÃÖµÎª3,Ôò×îÖÕÊä³ö½á¹ûÎª195+3=198 ¡£Ò»¸ö¾í»ý²ãÖÐÍ¨³£°üÀ¨¶à¸ö
¾í»ýºË,Æä²ÎÊý¿ÉÍ¨¹ýÑ§Ï°µÃµ½,ÓëÆäËûÉñ¾­ÍøÂçÄ£ÐÍµÄ¼ÆËãÏà±È,¾í»ý²ãÖÐµÄ»¥Ïà¹Ø¼ÆËã
ÄÜ¸ßÐ§µØÌáÈ¡Í¼ÏñÖÐµÄÌØÕ÷,²¢¼õÉÙ¼ÆËãÁ¿¡£


Í¼5.»¥Ïà¹Ø¼ÆËã

4 

ÏÂÃæ½éÉÜ¾í»ý¼ÆËãÉæ¼°µÄ¸ÅÄî¡£Éî¶ÈÊÇÖ¸ÌØÕ÷Í¼µÄÍ¨µÀÊýÁ¿,Ã¿¸ö¾í»ý²ãÊä³öÌØÕ÷Í¼
µÄÉî¶ÈÓë¾í»ýºËÊýÁ¿Ò»ÖÂ;²½³¤ÓÃÀ´ÃèÊö¾í»ýºËÒÆ¶¯µÄ¼ä¸ô;Ìî³äÊÇÖ¸¶ÔÌØÕ÷Í¼±ßÔµÌí¼ÓÊÊ
µ±ÊýÄ¿µÄÐÐºÍÁÐ,Ö¼ÔÚÊ¹¾í»ýºËÄÜÍêÕûµØ¸²¸ÇÌØÕ÷Í¼¡£

3)³Ø»¯²ã

³Ø»¯ÊÇÒ»ÖÖ½«ÌØÕ÷Í¼½øÐÐÑ¹Ëõ³éÏóµÄ²½Öè,³£¼ûµÄ³Ø»¯²Ù×÷°üÀ¨×î´ó³Ø»¯ºÍÆ½¾ù³Ø»¯¡£
×î´ó³Ø»¯ÔÚ¶ÔÓ¦ÇøÓòÄÚÈ¡×î´óÖµ×÷ÎªÊä³ö,Æ½¾ù³Ø»¯È¡¶ÔÓ¦ÇøÓòÄÚµÄÆ½¾ùÖµ×÷ÎªÊä³ö¡£³Ø
»¯²ã¿É½µµÍÍøÂçÄ£ÐÍµÄ¼ÆËãÁ¿,±ÜÃâ¹ýÄâºÏ¡£²½³¤Îª2µÄ2¡Á2×î´ó³Ø»¯²Ù×÷ÈçÍ¼5.

5ËùÊ¾, 
¼´È¡³öÔ­ÌØÕ÷Í¼ÖÐÃ¿2¡Á2¸öÎ»ÖÃµÄ×î´óÖµ¡£


Í¼5.×î´ó³Ø»¯

5 

109


4)È«Á¬½Ó²ã

È«Á¬½Ó²ãÍ¨³£×÷ÎªCNN µÄÊä³ö²ã¼¶,Ö¼ÔÚ½«¸ßÎ¬µÄÌØÕ÷Í¼Í¨¹ýÈ«Á¬½Ó²Ù×÷Ó³Éä³ÉµÍÎ¬
Êý¾Ý,½ø¶øÊµÏÖÍ¼ÏñÊý¾Ý´¦ÀíµÄÈÎÎñ¡£CNN ÖÐµÄÈ«Á¬½Ó²Ù×÷Í¨¹ý»¥Ïà¹Ø¼ÆËãÊµÏÖ,ÀýÈç,¶Ô
ÓÚÊäÈëµÄ³¤¿íÎªa¡¢a¡Áa¡Áb), 
c¡Á1) 

Éî¶ÈÎª
b 
µÄÌØÕ÷Í¼(È«Á¬½Ó²Ù×÷¿É×ª»¯Îª¸ÃÌØÕ÷Í¼Óë
c 
¸öÍ¬
Ñù³¤¿íÎªa¡¢Éî¶ÈÎª
b 
µÄ¾í»ýºË½øÐÐµÄ¾í»ý¼ÆËã,Éú³É(Î¬µÄÊä³öÏòÁ¿¡£

5.3 
YOLO 
Ëã·¨
2.
YOLO Ëã·¨ÊÇ»ùÓÚµ¥¸öCNN Ä£ÐÍµÄÒ»½×¶ÎÄ¿±ê¼ì²âËã·¨,½«Ä¿±ê·ÖÀàºÍÄ¿±ê¶¨Î»Á½
¸öÈÎÎñºÏ¶þÎªÒ»,×÷ÎªÒ»¸ö»Ø¹éÈÎÎñ,¿ÉÖ±½Ó´ÓÍêÕûµÄÍ¼ÏñÖÐÔ¤²âÄ¿±êÀà±ðºÍ±ß½ç¿ò×ø±ê, 
¾ßÓÐÊµÊ±¼ì²âµÄÐÔÄÜºÍ·Ç³£¹ã·ºµÄÓ¦ÓÃ¡£

1.YOLO 
¿ò¼Ü
YOLO Ëã·¨ÒÔ¹Ì¶¨´óÐ¡µÄÍ¼ÏñÊý¾Ý×÷ÎªÊäÈë,¾­CNN ÌáÈ¡µ½ÌØÕ÷Í¼ºó,ÓÉÁ½¸öÈ«Á¬½Ó
²ã¶ÔÌØÕ÷Í¼½øÐÐ½µÎ¬,µÃµ½¹Ì¶¨´óÐ¡µÄÊä³öÌØÕ÷Í¼,Êä³öÌØÕ÷Í¼ÖÐ°üº¬±¾ÕÅÍ¼ÏñÖÐ¼ì²âµ½µÄ
Ä¿±êÀà±ð¼°Æä±ß½ç¿òµÄ»Ø¹éÖµ,Æä¿ò¼ÜÈçÍ¼5.Êä³ö

6ËùÊ¾¡£ÊäÈëÍ¼Ïñ´óÐ¡Îª448¡Á448¡Á3, 
ÌØÕ÷Í¼µÄ´óÐ¡Îª7¡Á7¡Á(B¡Á5+Cls), ÆäÖÐ,7¡Á7 ±íÊ¾¿É½«Êä³öÌØÕ÷Í¼¿´×÷49(7¡Á7)¸öÏñ
ËØµã,Ã¿¸öÏñËØµã¾ùÎª(B¡Á5+Cls)µÄÏòÁ¿;
B 
±íÊ¾Ã¿¸öÏñËØµã´æÔÚ
B 
¸ö±ß½ç¿ò¸ºÔð¼ì²âÄ¿
±ê,Ã¿¸ö±ß½ç¿òÐèÒªÖÐÐÄµã(y)¡¢)¡¢h)¡¢Cn¼°Àà±ðÊý(s)

x,¿í(¸ß(ÖÃÐÅ¶È(of) ClÕâ5¸öÖµ±í
Ê¾,Conf±íÊ¾¸Ã±ß½ç¿òº¬ÓÐÄ¿±êµÄ¸ÅÂÊ(w) ,Cls±íÊ¾Àà±ðÊý,Ã¿¸öÄ¿±êÀà±ð¶ÔÓ¦µÄ¸ÅÂÊÎª
i)}Cls ½«
B 
ºÍCl

{p(i=1¡£ÀýÈç,s·Ö±ðÉèÖÃÎª2ºÍ2,Ò²¾ÍÊÇ½«Í¼Ïñ»®·ÖÎª7¡Á7 ¸öÏñËØµã,Ã¿¸ö
ÏñËØµãÓÐÁ½¸ö±ß½ç¿ò¸ºÔð¼ì²âÄ¿±ê,ÇÒÐè¼ì²âµÄÁ½¸öÄ¿±êÀà±ð¶ÔÓ¦µÄ¸ÅÂÊ¡£


Í¼5.

6 
YOLO 
¿ò¼Ü½á¹¹

2.YOLO 
»ù±¾²½Öè
ÓÉÌØ¶¨Êý¾Ý¼¯ÑµÁ·Íê³ÉµÄCNN Ëã·¨¿É½«ÆäÄ£ÐÍ²ÎÊýÓ¦ÓÃÓÚÌØ¶¨µÄÊÓ¾õÊý¾Ý·ÖÎöÈÎÎñ¡£
ÀýÈç,ÓÉ°²È«Ã±Åå´÷Êý¾Ý¼¯ËùÑµÁ·Íê³ÉµÄYOLO Ëã·¨,¿É¼ÓÔØÆäÄ£ÐÍ²Î¼Ó¶ÔÐÂµÄÍ¼ÏñÊý¾Ý
½øÐÐÊÇ·ñÕýÈ·Åå´÷°²È«Ã±µÄ×Ô¶¯¼ì²â¡£ÔÚÊÓ¾õÊý¾Ý·ÖÎöÖÐ,ÕâÒ»¹ý³Ì³ÆÎªÍÆÀí(e)¡£

inferenc

110


µÚ
5 
ÕÂÊÓ¾õÊý¾Ý·ÖÎö


1)Í¼ÏñÔ¤´¦Àí

»ùÓÚYOLOÍøÂç½á¹¹,Îª»ñÈ¡¹Ì¶¨´óÐ¡µÄÊä³öÌØÕ÷Í¼,Ðè½«ÊäÈëÍ¼Ïñ
X 
µÄ³¤¿í¾ùËõ·Å
Îª¹Ì¶¨Öµ448 ¡£¾ßÌåËõ·Å·½·¨Îª³¤¿íµÈ±ÈÀýËõ·Å,¼´Í¼ÏñÖÐ×î³¤µÄ±ßËõ·Åµ½448ÏñËØ,¶Ô¶Ì
±ß²»Âú448ÏñËØµÄÎ»ÖÃÊ¹ÓÃ»ÒÉ«Ìî³ä¡£Ëõ·ÅÍê³Éºó,ÊäÈëÍ¼Ïñ¿É±íÊ¾ÎªX448¡Á448¡Á3 ¡£

2)ÉèÖÃ±ß½ç¿ò

°ÑËõ·ÅºóµÄÍ¼Ïñ»®·ÖÎª7¡Á7µÄÍø¸ñ,Ã¿¸öÍø¸ñÖÐÉèÖÃ
B 
¸ö±ß½ç¿ò,¸ºÔð¼ì²âÄ¿±ê¡£Àý
Èç,½«
B 
ÉèÖÃÎª2,Ò²¾ÍÊÇ½«ÊäÈëÍ¼Ïñ»®·ÖÎª49(7¡Á7)¸öÍø¸ñ,Ã¿¸öÍø¸ñÓÐÁ½¸ö±ß½ç¿ò¸ºÔð
¼ì²âÄ¿±ê¡£

3)Êä³öÌØÕ÷Í¼

Ê×ÏÈ,YOLOÖÐÊ¹ÓÃ»ùÓÚCNNÊµÏÖµÄGoogLeNet,¶Ô
X 
ÌáÈ¡ÌØÕ÷¡£GoogLeNetÎª
2014ÄêÌá³öµÄCNN¿ò¼Ü,ÄÜ¸ßÐ§µØÀûÓÃ¼ÆËã×ÊÔ´,ÔÚÏàÍ¬µÄ¼ÆËãÁ¿ÏÂÌáÈ¡µ½¸ü·á¸»µÄÌØ
Õ÷,Æä¶Ô
X 
ÌáÈ¡ÌØÕ÷µÄÍøÂç½á¹¹Èç±í51ËùÊ¾,ÌáÈ¡µ½µÄÌØÕ÷Í¼ÎªF7¡Á7¡Á1024¡£ÆäÖÐ,_4 

.11 Convi=1 
±íÊ¾µÚ
i 
¸ö¾í»ý²ã,Pooli4=1±íÊ¾µÚ
i 
¸ö³Ø»¯²ã,ConvBlock_1±íÊ¾4¸ö¾í»ý²ã×é³ÉµÄÄ£¾í(i) »ýÄ£¿é,ConvBlock2±í(_) Ê¾(i) 10¸ö¾í»ý²ã×é³ÉµÄ¾í»ýÄ£¿é,C(_) onvBlock3±íÊ¾6¸ö¾í»ý²ã×é³ÉµÄÄ£¾í»ýÄ£¿é(_) ¡£È»ºó,(_) Ê¹ÓÃÈ«Á¬½Ó²ã1¶ÔF11½µÎ¬µÃF4096¡Á1,ÔÙ(_) Ê¹ÓÃÈ«(_) Á¬½Ó²ã2¶ÔF12½µ
Î¬µÃF[7¡Á7¡Á(B¡Á5+Cls)]¡Á1 ¡£×îºó,¶ÔF13×÷±ä»»µÃµ½Êä³öÌØÕ÷Í¼(12) F7¡Á7¡Á(B¡Á5+Cls)¡£ÆäÖÐ,¿í¸ß

t Fot 

Î¬¶ÈÎª7(13) ¡Á7,¿É±íÊ¾49¸öÏñËØµã¡£¼ÙÉèB=2Ê±,FoÊä³öÎ¬¶ÈÎª(o) 7¡Á7¡Á(2(u) ¡Á5+Cls)(u) µÄÌØ
Õ÷Í¼,Ã¿¸ö(s) ×ø±ê((t) y,h)¡¢Cn

{p(i=1¡£
2¡Á5+ClÏòÁ¿±íÊ¾Ô¤²âµÃµ½µÄ±ß½ç¿òx(u) ,w,of¼°Ä¿±êÀà±ð¸ÅÂÊ

Cls

i)}

±í5.
ogLNt½á¹¹±í

1Gee

GogLeNet 
X(ÊäÈë) Êä³ö
Conv_1 (448¡Á448¡Á3) F1(224¡Á224¡Á64) 
Pool_1 F1 F2(112¡Á112¡Á256) 
Conv_2 F2 F3(112¡Á112¡Á192) 
Pool_2 F3 F4(56¡Á56¡Á192) 
Conv_Block_1 F4 F5(56¡Á56¡Á512) 
Pool_3 F5 F6(28¡Á28¡Á512) 
Conv_Block_2 F6 F7(28¡Á28¡Á1024) 
Pool_4 F7 F8(14¡Á14¡Á1024) 
Conv_Block_3 F8 F9(7¡Á7¡Á1024) 
Conv_3 F9 F10(7¡Á7¡Á1024) 
Conv_4 F10 F11(7¡Á7¡Á1024) 

4)·Ç¼«´óÖµÒÖÖÆ
y,Conp(i=1, non-maximum

¸ù¾ÝÔ¤²âµÃµ½µÄ(x,w,h)¡¢f¼°{i)}Cls ÀûÓÃ·Ç¼«´óÖµÒÖÖÆ(
suppresion,NMS)·½·¨½øÐÐÉ¸Ñ¡,µÃµ½×îÓÐ¿ÉÄÜ°üº¬Ä¿±êµÄ±ß½ç¿ò¡£Á½¸ö±ß½ç¿òµÄ½»¼¯Ãæ
»ýÓë²¢¼¯Ãæ»ýµÄ±ÈÖµ³ÆÎª½»²¢±È(ÓÃÓÚ¶ÈÁ¿Á½¸ö±ß½ç¿òµÄ½»

intersectionoverunion,IoU), 

111


µþ³Ì¶È,Æä¼ÆËãÈçÍ¼5.onf×î´óµÄ±ß½ç¿ò

7ËùÊ¾¡£·Ç¼«´óÖµÒÖÖÆÊ×ÏÈ´Ó±ß½ç¿ò¼¯ºÏÖÐÈ¡³öC
×÷ÎªÊä³ö;È»ºóÖðÒ»¼ÆËãÆäÓà±ß½ç¿òÓëÊä³ö±ß½ç¿òµÄIoU,½«IoU ´óÓÚ¸ø¶¨ãÐÖµ(TS)µÄ±ß
½ç¿ò´Ó±ß½ç¿ò¼¯ºÏÖÐÒÆ³ý;×îºó,ÖØ¸´ÉÏÊö²½Öè,Ö±ÖÁ±ß½ç¿ò¼¯ºÏÎª¿Õ,Êä³öµÄ±ß½ç¿ò¼´Îª×î
ÓÐ¿ÉÄÜ°üº¬Ä¿±êµÄ±ß½ç¿ò¡£


Í¼5.
U 
¼ÆËã

7 
Io

1¡£

ÉÏÊöË¼Ïë¼ûËã·¨5.

Ëã·¨5.

1 
YOLO 
Ëã·¨

ÊäÈë: 

X:´ý¼ì²âÍ¼Ïñ,TS:IoU ãÐ
Öµ
Êä³ö
:
l 

_={i}1:°üº¬Ä¿±êµÄ±ß½ç¿ò¼¯ºÏ

PredbboxBboxi=

²½Öè: 

1.¶Ô
X 
½øÐÐÔ¤´¦Àí,½«ÊäÈëÍ¼Ïñ
X 
µÄÎ¬¶È´¦ÀíÎª448¡Á448¡Á3 
2.½«
X 
»®·ÖÎª7¡Á7 µÄÍø¸ñ
3.F11¡ûGogLNet(X) /
/ 
ÌáÈ¡
X 
µÄÌØÕ÷,F11 Î¬¶ÈÎª7¡Á7¡Á1024 
4.F12¡ûFC_11) /
/ 
Ê¹ÓÃÈ«Á¬½Ó²ãFC_1¶ÔF11 ½µÎ¬,F12 Î¬¶ÈÎª4096¡Á1 1(F(e) (o) 
5.F13¡ûFC_2(F12)
/
/ 
Ê¹ÓÃÈ«Á¬½Ó²ãFC_2¶ÔF12 ½µÎ¬,²¢µÃµ½¹Ì¶¨´óÐ¡µÄÎ¬¶È,F13 Î¬¶ÈÎª[7¡Á7¡Á(B¡Á5+Cls)]¡Á1 

6.Fout¡ûRshape(F13) /
/ 
½«¶þÎ¬¾ØÕóF13 ×ª»»ÎªÈýÎ¬¾ØÕóFout,FouÎ¬¶ÈÎª(7¡Á7¡Á(B¡Á5+Cls)) 
¶¯»­5-
1 
7¡Á7¡ÁB

Áî{i}(e) ÎªËùµÃ±ß½ç¿ò¼¯ºÏ,Ã¿¸ö±ß½ç¿òBbi 
={xi 
,wi 
,
i 
,
i 
,7¡Á7¡ÁB 

7. 
Bbox=1 oxyi 
,honfClsi}C(t) 
8.Confi 
=maonfi}=1 ), ÁîA=Bboxi 
,Pred_bbox={A}x({C(i) //´Ó±ß½ç¿ò¼¯ºÏÖÐÈ¡³öC(i) onf×î´óµÄ±ß½ç¿ò
A
9.Fori=1To7¡Á7¡ÁB 
Do


10. 
Score¡ûIoU(A,Bboxi)
11. 
IfScore>TSTh
12. 
Delete(Bbox/
/ 
´Ó±ß½ç¿ò¼¯ºÏÖÐÒÆ³ý¸Ã±ß½ç¿òi(e) )(n) 
13. 
ElePe_bbx.ppnd(oi) /
/ 
½«¸Ã±ß½ç¿òÌí¼ÓÖÁPe_bbox¼¯ºÏ
srdoaeBbxrd

14. EndIf
15.EndFor
16.ReturnPred_bbox /
/ 
·µ»ØÉ¸Ñ¡Ê£ÓàµÄ±ß½ç¿ò
112


µÚ
5 
ÕÂÊÓ¾õÊý¾Ý·ÖÎö


Àý5.ÓÃYOLO Ëã·¨¼ì²âÍ¼ÏñÖÐµÄÄ¿±ê( ÎªÀý,8ËùÊ¾¡£½«ÊäÈëÍ¼ÏñËõ·ÅÎª

1 
Äñ) ÈçÍ¼5.448¡Á448¡Á3,ÉèS=7,¼´»®·ÖÎª7¡Á7 µÄÍø¸ñ(ÈçÍ¼ÖÐImage1ËùÊ¾); ½«´¦ÀíºóµÄÍ¼ÏñÊäÈë
YOLO Ä£ÐÍÖÐ½øÐÐÌØÕ÷ÌáÈ¡,Ã¿¸öÍø¸ñ²ÉÓÃ2¸ö±ß½ç¿ò¼ì²âÄ¿±ê(B=2), ÓÉÓÚÄ¿±ê½öÓÐÄñ, 
Òò´ËCls=1,×îÖÕÊä³öÌØÕ÷Í¼µÄÎ¬¶ÈÎª7¡Á7¡Á(2¡Á5+1)( ÈçÍ¼ÖÐImage2ËùÊ¾); ¶ÔÓÚ7¡Á7 

i,

´óÐ¡µÄÊä³öÌØÕ÷Í¼,µÚiÐÐµÚ
j 
ÁÐµÄÏñËØµã¶ÔÓ¦Î¬¶ÈÎª(2¡Á5+1)µÄÌØÕ÷ÏòÁ¿,±íÊ¾Îªv(j)= 

i,j)(j) i,(j) j) j) i,(j) i,i,(

i,(j) i,i,i,(j) i,(j) j) i,
Con1 x1 1 1 1on2 x22 22


{f(,,y,w,h(,Cf(,,y,w,h(,pj)}, ÆäÖÐ

i,(j) i,i,i,(j)

f(h(f(

(i,j),(j),i,,(j),j))±íÊ¾¸ÃÏñËØµãÖÐµÚÒ»¸ö±ß½ç¿òµÄÐÅÏ¢,(j),i,, 

i,(j)h(j) i,y2 w22 p

Con1 x1 y1 w1 1 Con2 x2 

(j),i,,i,)±íÊ¾¸ÃÏñËØµãÖÐµÚ¶þ¸ö±ß½ç¿òµÄÐÅÏ¢,(j)±íÊ¾¸ÃÏñËØµãÖÐµÄ¶ÔÏóÎªÄñ
ÀàµÄ¸ÅÂÊ¡£Êä³öÌØÕ÷Í¼¹²ÄÜ¼ì²â³ö98(7¡Á7¡Á2)¸ö±ß½ç¿ò,½«98 ¸ö±ß½ç¿òÍ¨¹ýNMS ·½·¨
½øÐÐÉ¸Ñ¡,×îÖÕµÃµ½ÏñËØµã(4,5)Ëù¶ÔÓ¦µÄ±ß½ç¿ò(ÈçÍ¼ÖÐI3ËùÊ¾)Îª×î¿ÉÄÜÊô
i=j=
98 ¡£
mage

ÓÚÄñµÄ±ß½ç¿ò¼°ÆäÊôÓÚÄñµÄ¸ÅÂÊÎª0.


Í¼5.»ùÓÚYOLO 
Ëã·¨µÄ¼ì²â

8 

5.Í¼Ïñ·Ö¸î
3 

5.1 
Í¼Ïñ·Ö¸î¸ÅÊö
3.
Í¼Ïñ·Ö¸îÊÇÖ¸¸ù¾Ý»Ò¶È¡¢²ÊÉ«¡¢¿Õ¼äÎÆÀí¡¢¼¸ºÎÐÎ×´µÈÌØÕ÷°ÑÍ¼Ïñ»®·Ö³ÉÈô¸É¸ö»¥²»Ïà
½»µÄÇøÓò,Ê¹µÃÕâÐ©ÌØÕ÷ÔÚÍ¬Ò»ÇøÓòÄÚ±íÏÖ³öÒ»ÖÂÐÔ»òÏàËÆÐÔ,¶øÔÚ²»Í¬ÇøÓò¼ä±íÏÖ³öÃ÷ÏÔ

113


µÄ²»Í¬¡£Òò´Ë,Í¼Ïñ·Ö¸îÓÐÖúÓÚÇø·ÖÍ¼ÏñµÄ×é³É²¿·Ö,ÎªÍ¼ÏñµÄºóÐø´¦ÀíºÍÓ¦ÓÃµì¶¨»ù´¡¡£
ÀýÈç,ÔÚÒ½Ñ§Ó°ÏñÁìÓò,¾ø´ó¶àÊýÈËÌåµÄÓ°ÏñÊý¾Ý¶¼¿É·Ö¸î³É²»Í¬µÄÆ÷¹Ù¡¢×éÖ¯ÀàÐÍ»ò¼²²¡
Ö¢×´,·Ö¸îºÃµÄÇøÓò¿ÉºÜºÃµØ¸¨ÖúÒ½Éú¼õÉÙÕï¶ÏËùÐèµÄÊ±¼ä¡£

ÓëÄ¿±ê¼ì²âÀàËÆ,Í¼Ïñ·Ö¸îµÄÑÐ¾¿ºÍÓ¦ÓÃÈÔÓÉÀ´ÒÑ¾Ã,ÔÚÉî¶ÈÉñ¾­ÍøÂçáÈÆðÖ®Ç°,Ö÷Òª

µÄÍ¼Ïñ·Ö¸î¼¼Êõ°üÀ¨ãÐÖµ·Ö¸î¡¢ÇøÓò·Ö¸î¡¢±ßÔµ·Ö¸î¡¢ÎÆÀíÌØÕ÷ºÍ¾ÛÀàµÈ,¶øÕâÐ©´«Í³µÄ·½·¨

ÍùÍùÐèÏà»¥½áºÏÆðÀ´Ê¹ÓÃ²ÅÄÜÈ¡µÃ½ÏºÃµÄ·Ö¸î½á¹û;×ÔÉî¶ÈÉñ¾­ÍøÂçµÃµ½¹Ø×¢²¢±»¹ã·ºÓ¦

ÓÃÒÔÀ´,ÌØ±ðÊÇCNN¶ÔÍ¼ÏñµÄ´¦Àí,ÎªÍ¼Ïñ·Ö¸îÁìÓò×¢ÈëÁËÇ¿´óµÄ¼¼Êõ»îÁ¦,²¢³ÉÎªÍ¼Ïñ·Ö

¸î×îºËÐÄµÄÖ§³Å¼¼Êõ¡£»ùÓÚCNNµÄÍ¼Ïñ·Ö¸î¾Û½¹µ½¾ßÌåµÄÃ¿Ò»¸öÏñËØ,¶ÔÃ¿Ò»¸öÏñËØ¸³Óè

Ò»¸öÓïÒå±êÇ©,Òò´ËÕâÀàÍ¼Ïñ·Ö¸î¿É·ÖÎªÓïÒå·Ö¸îºÍÊµÀý·Ö¸îÁ½Àà¡£ÓïÒå·Ö¸îÊÇ¶ÔËùÓÐµÄ

Í¼ÏñÏñËØÖ´ÐÐÏñËØ¼¶±ê¼Ç,¼´ÎªÃ¿¸öÏñËØ·ÖÅäÒ»¸öÀà±ð,µ«²»Çø·ÖÍ¬Ò»Àà±ðÖÐµÄ¶ÔÏó¡£ÊµÀý

·Ö¸î½«Ä¿±ê¼ì²âºÍÓïÒå·Ö¸îÏà½áºÏ,Í¨¹ý¼ì²âºÍÃè»æÍ¼ÏñÖÐÃ¿¸ö¸ÐÐËÈ¤µÄ¶ÔÏó½øÒ»²½À©Õ¹

ÓïÒå·Ö¸î·¶Î§,¼´ÐèÇø·ÖÍ¬Ò»Àà±ðÖÐµÄ²»Í¬¶ÔÏó¡£Ïà±ÈÓïÒå·Ö¸î,ÊµÀý·Ö¸î·¢Õ¹½ÏÍí,Òò´Ë

ÊµÀý·Ö¸îËã·¨´ó¶à»ùÓÚCNNÊµÏÖ,ÇÒ·Ö¸î¾«¶ÈºÍÐ§ÂÊÖð½¥µÃµ½ÌáÉý¡£ÏÂÃæÒÔMaskR-CNN 

ÕâÒ»¾­µäµÄÊµÀý·Ö¸îËã·¨Îª´ú±í,ÏêÏ¸½éÉÜÍ¼Ïñ·Ö¸î¼¼Êõ¼°ÆäÊµÏÖ¹ý³Ì¡£

5.3.2 
MaskR-CNN 
Ëã·¨
MaskR-CNNÊµÀý·Ö¸îËã·¨ÔÚÄ¿±ê¼ì²âµÄ»ù´¡ÉÏÔÙ½øÐÐÍ¼Ïñ·Ö¸î,¸ÅÄî¼òµ¥¡¢Áé»î,²»
½ö¿É¸ßÐ§µØ¼ì²â³öÍ¼ÏñµÄÄ¿±ê,ÇÒ¶ÔÃ¿¸öÄ¿±êÉú³ÉÒ»¸ö¸ßÖÊÁ¿µÄ·Ö¸îÑÚÄ¤,ÊÇÍ¨ÓÃµÄÍ¼Ïñ·Ö
¸î¿ò¼Ü¡£

1.MaskR-CNN 
¿ò¼Ü
Mas-atrRCNNµÄ¿ò¼Ü, ful 

kRCNN»ùÓÚFse-ÔÚÌØÕ÷ÌáÈ¡ÍøÂçÖ®ºó¼ÓÈëÁËÈ«¾í»ýÍøÂç(
convolutionalnetwork,FCN),ÓÉÔ­À´µÄÁ½¸öÈÎÎñ(·ÖÀà+»Ø¹é)±äÎªÁËÈý¸öÈÎÎñ(·ÖÀà+»Ø
¹é+·Ö¸î)¡£MaskR-CNN²ÉÓÃºÍFasterR-Æä¿ò¼Ü½á¹¹ÈçÍ¼5.

CNNÏàÍ¬µÄÁ½¸ö½×¶Î,9Ëù
Ê¾¡£µÚÒ»½×¶Î,´ý·Ö¸îµÄÍ¼ÏñÓÉCNNÌáÈ¡ÌØÕ÷,¸ÃÌØÕ÷µÄÃ¿¸öÎ»ÖÃ¶¼ÊÂÏÈÉè¶¨ºÃ²¿·ÖÃª¿ò, 
Ê¹ÓÃÇøÓòÌá°¸ÍøÂç(¶ÔÕâÐ©Ãª¿ò½øÐÐ³õ²½É¸Ñ¡,²¢ÁôÏÂ¸ÐÐË

regionproposalnetwork,RPN)
È¤µÄÇøÓò(regionofinterest,RoI),¼´¿ÉÄÜµÄÄ¿±êÇøÓò,È»ºó½«ÕâÐ©RoIÖðÒ»ÊäÈëRoI¶ÔÆë
(RoIalign)Ä£¿é,Ê¹Ã¿¸öRoI¶ÔÆëÌØÕ÷Í¼,²¢µÃµ½Í³Ò»Î¬¶ÈµÄÊä³ö¡£µÚ¶þ½×¶Î,Í³Ò»Î¬¶ÈµÄ
RoI³ýÁËÓÃÓÚ·ÖÀàºÍ±ß½ç¿ò»Ø¹é,»¹Ìí¼ÓÁËÒ»¸öFCNµÄ·ÖÖ§,¶ÔÃ¿¸öRoIÔ¤²âÁË¶ÔÓ¦µÄ·Ö
¸îÑÚÄ¤(mask)Í¼,ÒÔËµÃ÷¸ø¶¨ÏñËØÊÇ·ñÊÇÄ¿±êµÄÒ»²¿·Ö¡£µ±ÏñËØÊôÓÚÄ¿±êÊ±,ËùÓÐÎ»ÖÃÑÚ
Ä¤±êÊ¶Îª1,ÆäËûÎ»ÖÃÑÚÄ¤±êÊ¶Îª0¡£

2.MaskR-CNN 
¹Ø¼üÄ£¿é
1)RPN½á¹¹

RPNÊÇÒ»¸öÇáÁ¿µÄÉñ¾­ÍøÂç,Í¨¹ý»¬¶¯´°¿ÚÀ´É¨ÃèÌØÕ÷Í¼,²¢Ñ°ÕÒ´æÔÚÄ¿±êµÄÇøÓò,Õâ
ÑùµÄË¼ÏëÊ¹µÃRPN¿ÉÓÐÐ§¸´ÓÃËùÌáÈ¡µÄÌØÕ÷,ÇÒ±ÜÃâÁËÖØ¸´¼ÆËã¡£RPNÎªÌØÕ÷Í¼ÉÏ¸÷¸ö
Î»ÖÃµÄÃ¿¸öÃª¿òÉú³ÉÁ½¸öÊä³ö,Ò»ÊÇÃª¿òµÄÇ°¾°¸ÅÂÊºÍ±³¾°¸ÅÂÊ(9µÄSoftma

Í¼5.x·ÖÖ§), 
Ç°¾°¸ÅÂÊ¸ß,ÔòÃª¿ò¿òÑ¡µÄ²¿·ÖÎªÄ¿±ê,±³¾°¸ÅÂÊ¸ß,ÔòÃª¿ò¿òÑ¡µÄ²¿·ÖÊÇ±³¾°;¶þÊÇÃª¿ò¾«
µ÷²ÎÊý(Í¼5.ox_reg·ÖÖ§), Òò´Ë

9µÄBbÊÂÏÈÉè¶¨µÄÃª¿ò¿ÉÄÜ²¢Î´ÍêÃÀµØÎ»ÓÚÄ¿±êÖÐÐÄ, 
RPNÆÀ¹ÀÁËÃª¿òÖÐÐÄµã×ø±ê¡¢¿íºÍ¸ßµÄ±ä»¯,ÒÔ¾«µ÷Ãª¿òÀ´¸üºÃµØÄâºÏÄ¿±ê¡£Í¨¹ýRPNµÄ

114


µÚ
5 
ÕÂÊÓ¾õÊý¾Ý·ÖÎö


Í¼5.MakR-CNN 
¿ò¼Ü½á¹¹

9s

´¦Àí,MaskR-CNN ¿É×îºÃµØÑ¡³ö°üº¬Ä¿±êÇøÓòµÄÃª¿ò,²¢¶ÔÆäÎ»ÖÃºÍ³ß´ç½øÐÐ¾«µ÷,¶ø±³

¾°Ãª¿ò¾­É¸Ñ¡ºóÊýÁ¿»áÃ÷ÏÔ¼õÉÙ,±»É¸Ñ¡ºóÊ£ÓàµÄÃª¿ò±»³ÆÎªRoI¡£
2)RoI¶ÔÆë
ÓÉÓÚÊ£ÓàµÄÃ¿¸öRoI¿í¸ßµÈÎ¬¶È´óÐ¡²»Ò»,±ØÐë½«ÕâÐ©RoIÓëÔ­ÌØÕ÷Í¼¶ÔÆë,²¢Í³Ò»Î¬

¶È´óÐ¡,ÒÔ±ãºóÐø¶ÔËùÓÐRoI½øÐÐÏàÍ¬µÄ·ÖÀà¡¢±ß¿ò»Ø¹éºÍ·Ö¸îÑÚÄ¤´¦ÀíÈÎÎñ¡£Ö®Ç°ÊµÏÖ¸Ã
²Ù×÷µÄÄ£¿é³ÆÎªRoI³Ø»¯(RoIpoolinÈçÍ¼5.

g), 10 ÉÏ°ë²¿·ÖËùÊ¾¡£Èôµ±Ç°µÃµ½Ò»¸öÌØÕ÷Í¼
³ß´çÎª5¡Á7 µÄRoÒªÇó´ËÇøÓòÍ³Ò»ËõÐ¡Îª2¡Á2 ¡£´ËÊ±, 5,

I, ÒòÎª5Óë2µÄ±ÈÖµÊÇ·ÇÕûÊý2.
ËùÒÔRoI³Ø»¯½«¶ÔÆä½øÐÐÈ¡ÕûµÄ·Ö¸î,¼´½«¡°5¡±·Ö¸î³É¡°3+2¡±,½«¡°7¡±·Ö¸î³É¡°3+4¡±,È»ºóÈ¡
Ã¿¸öÇøÓòµÄ×î´óÖµ×÷Îª±¾ÇøÓòµÄÖµ¡£

´Ó¸Ã¹ý³Ì¿É¿´³ö,Ê¹ÓÃRoI³Ø»¯ºÜ´Ö²ÚµØÁ¿»¯Ò»¸öÇøÓòµÄÖµ,ÇÒÃ¿¸öÇøÓòµÄ³ß´ç»¹ÓÐ½Ï
´ó²î¾à,»áµ¼ÖÂRoIÍ¨¹ýFCN ½øÐÐÏñËØ·Ö¸îµÄ¹ý³ÌÖÐÄ¿±ê¶ÔÆëÊ±³öÏÖ½Ï´óµÄÆ«ÒÆ¡£¶Ô´Ë, 
Mas-oI³Ø»¯, ÆäÊµÏÖ·½Ê½ÈçÍ¼5.

kRCNN Ê¹ÓÃRI¶ÔÆë´úÌæRo¸ßÐ§µØ½â¾öÁËÕâ¸öÎÊÌâ, 10 
ÏÂ°ë²¿·ÖËùÊ¾¡£Ê×ÏÈ½«5¡Á7 ÌØÕ÷Í¼¹Ì¶¨ÎªÏàÍ¬´óÐ¡µÄ2¡Á2 ÇøÓò,¼´µÃµ½Í¼ÖÐµÄ¢Ù¡¢¢Ú¡¢¢Û
ºÍ¢ÜÕâ4¸öÇøÓò,¸Ã¹ý³ÌÖÐ²»×öÈÎºÎÁ¿»¯´¦Àí;È»ºó¶ÔÕâ4¸öÇøÓòÄÚ²¿½øÐÐÍ¬ÑùµÄ´¦Àí,ÔÙ
Ï¸·Ö³É4¸ö¹æÄ£ÏàÍ¬µÄÇøÓò(Ê¹ÓÃÐéÏß±íÊ¾), Ö®ºó¶ÔÓÚÃ¿Ò»¸ö×îÐ¡ÇøÓò(°üº¬²»Ö¹Ò»¸öÏñËØ
µã), È·¶¨ÆäÖÐÐÄµã(Ê¹ÓÃ¡°+¡±ºÅ±íÊ¾), ²¢Ê¹ÓÃË«ÏßÐÔ²åÖµ·¨µÃµ½¸Ã¡°+¡±ºÅËùÔÚÎ»ÖÃµÄÖµ,×÷
Îª×îÐ¡¸ñ×ÓÇøÓòµÄÖµ¡£¶ÔÓÚ¢Ù¡¢¢Ú¡¢¢ÛºÍ¢ÜÕâ4¸öÇøÓò,Ã¿¸öÇøÓò¶¼»áÓÐ4¸öÕâÑùµÄÖµ,È¡Õâ
4¸öÖµÖÐµÄ×î´óÖµ×÷ÎªÃ¿¸öÇøÓòµÄÖµ¡£×îÖÕ¿ÉµÃµ½2¡Á2 ÇøÓòÖÐÃ¿¸öÎ»ÖÃµÄÖµ,×÷ÎªÍ³Ò»Î¬
¶ÈµÄÌØÕ÷Í¼Êä³ö½á¹û¡£ÉÏÊöRoI¶ÔÆëµÄ´¦Àí·½Ê½¿É±ÜÃâ¼ÆËã¹ý³ÌÖÐ¶ªÊ§Ô­ÌØÕ÷Í¼µÄÐÅÏ¢, 
ÇÒÖÐ¼ä¹ý³ÌÈ«³Ì²»Á¿»¯,±£Ö¤ÁË×î¼ÑµÄÐÅÏ¢ÍêÕûÐÔ¡£

3)FCN ½á¹¹
FCN ÊÇÒ»¸ö¾­µäµÄÓïÒå·Ö¸î½á¹¹,¿É¶ÔÒ»ÕÅÍ¼ÏñÉÏµÄËùÓÐÏñËØµã½øÐÐ·ÖÀà,¼´ÊµÏÖ¶Ô
Í¼ÏñÖÐÄ¿±êµÄ×¼È··Ö¸î¡£FCN ÊÇÒ»¸ö¶Ëµ½¶ËµÄÍøÂç,½á¹¹ÈçÍ¼5.Ö÷ÒªÖ´ÐÐ¹ý³Ì°ü

11 ËùÊ¾, 
À¨¾í»ýºÍ×ªÖÃ¾í»ý(»ò·´¾í»ý), ¼´ÏÈ¶ÔÍ¼Ïñ½øÐÐ¾í»ýºÍ³Ø»¯,Ê¹ÆäÌØÕ÷Î¬¶ÈµÄ´óÐ¡Öð½¥¼õ

115