µÚ5ÕÂ¡þPythonÊý¾Ý·ÖÎö»ù´¡¿â
±¾ÕÂÑ§Ï°Ä¿±ê£º  

¤r Ñ§Ï°NumPy¿âµÄÓÃ·¨¡¢Êý¾Ý½á¹¹ºÍ»ù±¾²Ù×÷

¤r Ñ§Ï°Pandas¿âµÄÓÃ·¨¡¢Êý¾Ý½á¹¹ºÍ»ù±¾²Ù×÷

¤r Ñ§Ï°Matplotlib¿âµÄÓÃ·¨¡¢Êý¾Ý½á¹¹ºÍ»ù±¾²Ù×÷

¤r ÕÆÎÕSciPy¿âµÄ²Ù×÷¡¢×÷ÓÃ

¤r ÕÆÎÕScikitª²learn¿âµÄ²Ù×÷¡¢×÷ÓÃ

±¾ÕÂ½éÉÜPython½øÐÐÊý¾Ý·ÖÎöÊ±³£ÓÃµÄNumPy¡¢Pandas¡¢Matplotlib¡¢SciPyºÍScikitª²learn»ù´¡¿â¡£NumPyÊÇPythonµÄÒ»ÖÖ¿ªÔ´ÊýÖµ¼ÆËãÀ©Õ¹¿â£¬ÕâÖÖ¹¤¾ß¿ÉÓÃÀ´´æ´¢ºÍ´¦Àí´óÐÍ¾ØÕó£¬±ÈPython×ÔÉíµÄÇ¶Ì×ÁÐ±í(nested list structure)½á¹¹Òª¸ßÐ§Ðí¶à£» PandasÊÇ»ùÓÚNumPyµÄÒ»ÖÖ¹¤¾ß£¬¸Ã¹¤¾ßÊÇÎªÁË½â¾öÊý¾Ý·ÖÎöÈÎÎñ¶ø´´½¨µÄ£¬PandasÌá¹©ÁË´óÁ¿µÄ¿âºÍ±ê×¼Êý¾ÝÄ£ÐÍ¼°¸ßÐ§¡¢±ã½ÝµØ´¦Àí´óÐÍÊý¾Ý¼¯ËùÐèµÄº¯ÊýºÍ·½·¨£» MatplotlibÊÇÒ»¸öPythonµÄ2D»æÍ¼¿â£¬Ëü»ùÓÚ¸÷ÖÖÓ²¿½±´¸ñÊ½ºÍ¿çÆ½Ì¨µÄ½»»¥Ê½»·¾³Éú³É³ö°æÖÊÁ¿¼¶±ðµÄÍ¼ÐÎ£» SciPyÊÇÒ»¿î·½±ãµÄ×¨Îª¿ÆÑ§ºÍ¹¤³ÌÉè¼ÆµÄPython¹¤¾ß°ü£¬°üÀ¨Í³¼Æ¡¢ÓÅ»¯¡¢ÕûºÏ¡¢ÏßÐÔ´úÊýÄ£¿é¡¢¸µÀïÒ¶±ä»»¡¢ÐÅºÅºÍÍ¼Ïñ´¦Àí¼°³£Î¢·Ö·½³ÌÇó½âÆ÷µÈ£» Scikitª²learn(¼ò³ÆSklearn)ÊÇSciPyµÄÀ©Õ¹£¬½¨Á¢ÔÚNumPyºÍMatplotlib¿âµÄ»ù´¡Ö®ÉÏ£¬Ö§³Ö·ÖÀà¡¢»Ø¹é¡¢½µÎ¬ºÍ¾ÛÀàµÈ»úÆ÷Ñ§Ï°Ëã·¨¡£

5.1NumPy

NumPy(Numerical Python)ÊÇÒ»¸ö¿ªÔ´µÄPython¿ÆÑ§¼ÆËã¿â£¬°üº¬ºÜ¶àÊµÓÃµÄÊýÑ§º¯Êý£¬º­¸ÇÏßÐÔ´úÊýÔËËã¡¢¸µÀïÒ¶±ä»»ºÍËæ»úÊýÉú³ÉµÈ¹¦ÄÜ¡£NumPyÔÊÐíÓÃ»§½øÐÐ¿ìËÙ½»»¥Ê½Ô­ÐÍÉè¼Æ£¬¿ÉÒÔºÜ×ÔÈ»µØÊ¹ÓÃÊý×éºÍ¾ØÕó¡£ËüµÄ²¿·Ö¹¦ÄÜÈçÏÂ¡£

£¨1) ndarray£º Ò»¸ö¾ßÓÐÊ¸Á¿ËãÊõÔËËã¹¦ÄÜÇÒ½ÚÊ¡¿Õ¼äµÄ¶àÎ¬Êý×é¡£

£¨2) ÓÃÓÚ¶ÔÕû×éÊý¾Ý½øÐÐ¿ìËÙÔËËãµÄ±ê×¼ÊýÑ§º¯Êý(ÎÞÐë±àÐ´Ñ­»·)¡£

£¨3) ÓÃÓÚ¶Á/Ð´´ÅÅÌÊý¾ÝµÄ¹¤¾ß¼°²Ù×÷ÄÚ´æÓ³ÉäÎÄ¼þµÄ¹¤¾ß¡£

£¨4) ÏßÐÔ´úÊý¡¢Ëæ»úÊýÉú³É¼°¸µÀïÒ¶±ä»»¹¦ÄÜ¡£

£¨5) ÓÃÓÚ¼¯³ÉC¡¢C++¡¢FORTRANµÈÓïÑÔµÄ´úÂë±àÐ´¹¤¾ß¡£

NumPyµÄµ×²ãËã·¨ÔÚÉè¼ÆÊ±¾ÍÓÐ×ÅÓÅÒìµÄÐÔÄÜ£¬¶ÔÓÚÍ¬ÑùµÄÊýÖµ¼ÆËãÈÎÎñÀ´Ëµ£¬Ê¹ÓÃNumPyÒª±ÈÖ±½Ó±àÐ´Python´úÂë±ã½ÝµÃ¶à¡£¶ÔÓÚ´óÐÍÊý×éµÄÔËËãÀ´Ëµ£¬Ê¹ÓÃNumPyÖÐÊý×éµÄ´æ´¢Ð§ÂÊºÍÊäÈë/Êä³öÐÔÄÜ¾ùÓÅÓÚPythonÖÐµÈ¼ÛµÄ»ù±¾Êý¾Ý½á¹¹(ÀýÈç£¬Ç¶Ì×µÄlistÈÝÆ÷)¡£¶ÔÓÚTB¼¶µÄ´óÎÄ¼þÀ´Ëµ£¬NumPyÊ¹ÓÃÄÚ´æÓ³ÉäÎÄ¼þÀ´´¦Àí£¬ÒÔ´ïµ½×îÓÅµÄÊý¾Ý¶Á/Ð´ÐÔÄÜ¡£ÕâÊÇÒòÎªNumPyÄÜ¹»Ö±½Ó¶ÔÊý×éºÍ¾ØÕó½øÐÐ²Ù×÷£¬¿ÉÒÔÊ¡ÂÔºÜ¶àÑ­»·Óï¾ä£¬ÆäÖÚ¶àµÄÊýÑ§º¯ÊýÒ²»áÈÃ¿ª·¢ÈËÔ±±àÐ´´úÂëµÄ¹¤×÷ÇáËÉÐí¶à¡£²»¹ýNumPyÊý×éµÄÍ¨ÓÃÐÔ²»¼°PythonÌá¹©µÄlistÈÝÆ÷£¬ÕâÊÇÆä²»×ãÖ®´¦¡£Òò´Ë£¬ÔÚ¿ÆÑ§¼ÆËãÖ®ÍâµÄÁìÓò£¬NumPyµÄÓÅÊÆÒ²¾Í²»ÄÇÃ´Ã÷ÏÔÁË¡£NumPy±¾ÉíÃ»ÓÐÌá¹©ÄÇÃ´¶à¸ß¼¶µÄÊý¾Ý·ÖÎö¹¦ÄÜ£¬Àí½âNumPyÊý×é¼°ÃæÏòÊý×éµÄ¼ÆËã½«ÓÐÖúÓÚ¸ü¼Ó¸ßÐ§µØÊ¹ÓÃÖîÈçPandasÖ®ÀàµÄ¹¤¾ß¡£ÏÂÃæ¶ÔNumPyµÄÊý¾Ý½á¹¹ºÍ²Ù×÷½øÐÐ½éÉÜ¡£

NumPyµÄ¶àÎ¬Êý×é¶ÔÏóndarrayÊÇÒ»¸ö¿ìËÙ¡¢Áé»îµÄ´óÊý¾Ý¼¯ÈÝÆ÷¡£ÓÃ»§¿ÉÒÔÀûÓÃÕâÖÖÊý×é¶ÔÏó¶ÔÕû¿éÊý¾Ý½øÐÐÊýÑ§ÔËËã£¬ÆäÔËËã¸ú±êÁ¿ÔªËØÖ®¼äµÄÔËËãÒ»Ñù¡£´´½¨ndarrayÊý×é×î¼òµ¥µÄ°ì·¨¾ÍÊÇÊ¹ÓÃarray()º¯Êý£¬Ëü½ÓÊÜÒ»ÇÐÐòÁÐÐÍµÄ¶ÔÏó(°üÀ¨ÆäËûÊý×é)£¬È»ºó²úÉúÒ»¸öÐÂµÄ¡¢º¬ÓÐ´«ÈëÊý¾ÝµÄNumPyÊý×é¡£ÕâÀïÒÔÒ»¸öÁÐ±íµÄ×ª»»ÎªÀý¡£



In £Û1£Ý: import numpy as np

data=£Û6, 7.5, 8, 0, 1£Ý

arr1=np.array(data)

arr1

Out£Û1£Ý: array(£Û 6. ,7.5,8. ,0. ,1. £Ý)





ndarrayÊÇÒ»¸öÍ¨ÓÃµÄÍ¬¹¹Êý¾Ý¶àÎ¬ÈÝÆ÷£¬ÆäÖÐËùÓÐµÄÔªËØ±ØÐëÊÇÏàÍ¬ÀàÐÍµÄ¡£Ã¿Ò»¸öÊý×é¶¼ÓÐÒ»¸öshape(±íÊ¾Î¬¶È´óÐ¡µÄÊý×é)ºÍÒ»¸ödtype(ÓÃÓÚËµÃ÷Êý×éÊý¾ÝÀàÐÍµÄ¶ÔÏó)¡£



In £Û2£Ý: arr1.shape

Out£Û2£Ý: (5,)

In £Û3£Ý: arr1.dtype

Out£Û3£Ý: dtype('float64')





Ç¶Ì×ÐòÁÐ(ÀýÈç£¬ÓÉÒ»×éµÈ³¤ÁÐ±í×é³ÉµÄÁÐ±í)½«»á±»×ª»»³ÉÒ»¸ö¶àÎ¬Êý×é¡£



In £Û4£Ý: data2=£Û£Û1, 2, 3, 4£Ý, £Û5, 6, 7, 8£Ý£Ý

arr2=np.array(data2)

arr2






Out£Û4£Ý: 

array(£Û£Û1, 2, 3, 4£Ý,

£Û5, 6, 7, 8£Ý£Ý)

In £Û5£Ý: arr2.ndim

Out£Û5£Ý: 2

In £Û6£Ý: arr2.shape

Out£Û6£Ý: (2, 4)





³ý·ÇÏÔÊ½ËµÃ÷£¬·ñÔònp.array()»á³¢ÊÔÎªÐÂ½¨µÄÊý×éÍÆ¶Ï³öÒ»¸ö½ÏÎªºÏÊÊµÄÊý¾ÝÀàÐÍ¡£Êý¾ÝÀàÐÍ±£´æÔÚÒ»¸öÌØÊâµÄdtype¶ÔÏóÖÐ£¬ÀýÈç£¬ÉÏÃæµÄÁ½¸öÀý×Ó¡£



In £Û7£Ý: arr1.dtype

Out£Û7£Ý: dtype('float64')

In £Û8£Ý: arr2.dtype

Out£Û8£Ý: dtype('int32')





³ýÁËnp.array()Íâ£¬»¹ÓÐÒ»Ð©º¯Êý¿ÉÒÔÐÂ½¨Êý×é£¬ÀýÈç£¬np.zeros()ºÍnp.ones()¿ÉÒÔ·Ö±ð´´½¨Ö¸¶¨³¤¶È»òÐÎ×´È«Îª0»òÈ«Îª1µÄÊý×é¡£Empty¿ÉÒÔ´´½¨Ò»¸öÃ»ÓÐÈÎºÎ¾ßÌåÊýÖµµÄÊý×é¡£Èç¹ûÒªÓÃÕâÐ©·½·¨´´½¨Êý×é£¬Ö»Ðè´«ÈëÒ»¸ö±íÊ¾ÐÎ×´µÄÔª×é¼´¿É¡£



In £Û9£Ý: np.zeros(8)

Out£Û9£Ý: array(£Û 0.,0.,0.,0.,0.,0.,0.,0.£Ý)

In £Û10£Ý: np.zeros((2, 4))

Out£Û10£Ý: 

array(£Û£Û 0.,0.,0.,0.£Ý,

£Û 0.,0.,0.,0.£Ý£Ý)

In £Û11£Ý: np.empty((2, 3, 2))

Out£Û11£Ý: 

array(£Û£Û£Û9.78249979e-322, 0.00000000e+000£Ý,

£Û0.00000000e+000, 0.00000000e+000£Ý,

£Û0.00000000e+000, 0.00000000e+000£Ý£Ý,



£Û£Û0.00000000e+000, 0.00000000e+000£Ý,

£Û0.00000000e+000, 0.00000000e+000£Ý,

£Û0.00000000e+000, 0.00000000e+000£Ý£Ý£Ý)





ÔÚNumPyÖÐ£¬np.empty()»áÈÏÎª·µ»ØÈ«Îª0µÄÊý×éÊÇ²»°²È«µÄ£¬ËùÒÔËü»á·µ»ØÒ»Ð©Î´³õÊ¼»¯µÄºÜ½Ó½ü0µÄËæ»úÖµ¡£

ndarrayµÄÒ»Ð©³£ÓÃµÄ»ù±¾Êý¾Ý²Ù×÷º¯ÊýÈç±í5.1ËùÊ¾¡£


±í5.1ndarray»ù±¾Êý¾Ý²Ù×÷º¯Êý




º¯ÊýËµÃ÷

array()½«ÊäÈëÊý¾Ý(ÁÐ±í¡¢Ôª×é¡¢Êý×é»òÆäËûÐòÁÐÀàÐÍ)×ª»»Îªndarray¡£ÍÆ¶Ï³ödtype»òÌØ±ðÖ¸¶¨dtype£¬Ä¬ÈÏÖ±½Ó¸³ÖµÊäÈëÊý¾Ý
asarray()½«ÊäÈë×ª»»Îªndarray¡£Èç¹ûÊäÈë±¾ÉíÊÇÒ»¸öndarray£¬¾Í²»ÔÙ¸´ÖÆÐø±í


º¯ÊýËµÃ÷

arange()ÀàËÆÓÚÄÚÖÃµÄrange£¬µ«·µ»ØµÄÊÇÒ»¸öndarray¶ø·Çlist
ones()£¬ones_like()¸ù¾ÝÖ¸¶¨µÄÐÎ×´ºÍdtype´´½¨Ò»¸öÈ«1Êý×é¡£ones_likeÒÔÁíÒ»¸öÊý×éÎª²ÎÊý£¬²¢¸ù¾ÝÆäÐÎ×´ºÍdtype´´½¨Ò»¸öÈ«1Êý×é
zeros(),zeros_like()ÀàËÆÓÚones()ºÍones_like()£¬Ö»²»¹ý²úÉúµÄÊÇÈ«0Êý×é
empty()£¬empty_like()´´½¨ÐÂÊý×é£¬Ö»·ÖÅäÄÚ´æ¿Õ¼ä£¬²»Ìî³äÈÎºÎÖµ
full()£¬full_like()ÓÃfull valueÖÐµÄËùÓÐÖµ£¬¸ù¾ÝÖ¸¶¨µÄÐÎ×´ºÍdtype´´½¨Ò»¸öÊý×é¡£full_like()Ê¹ÓÃÁíÒ»¸öÊý×é£¬ÓÃÏàÍ¬µÄÐÎ×´ºÍdtype´´½¨
eye(),identity()´´½¨Ò»¸öÕý·½µÄN¡ÁN¾ØÕó(¶Ô½ÇÏßÎª1£¬ÆäÓàÎª0)



ÊÓÆµ½²½â


5.1.1ndarrayµÄÊý¾ÝÀàÐÍ

dtype(Êý¾ÝÀàÐÍ)ÊÇÒ»¸öÌØÊâµÄ¶ÔÏó£¬Ëüº¬ÓÐndarray½«Ò»¿éÄÚ´æ½âÊÍÎªÌØ¶¨Êý¾ÝÀàÐÍËùÐèµÄÐÅÏ¢¡£



In £Û12£Ý: arr3=np.array(£Û1, 2, 3£Ý, dtype=np.float64)

arr3

Out£Û12£Ý: array(£Û 1.,2.,3.£Ý)

In £Û13£Ý: arr4=np.array(£Û1, 2, 3£Ý, dtype=np.int32)

arr4

Out£Û13£Ý: array(£Û1, 2, 3£Ý)





dtypeÊÇNumPyÈç´ËÇ¿´óºÍÁé»îµÄÔ­ÒòÖ®Ò»¡£ÔÚ¶àÊýÇé¿öÏÂ£¬ËüÖ±½ÓÓ³Éäµ½ÏàÓ¦µÄ»úÆ÷±íÊ¾£¬ÕâÊ¹µÃ¡°¶Á/Ð´´ÅÅÌÉÏµÄ¶þ½øÖÆÊý¾ÝÁ÷¡±¼°¡°¼¯³ÉµÍ¼¶ÓïÑÔ´úÂë¡±µÈ¹¤×÷±äµÃ¸ü¼Ó¼òµ¥¡£ÊýÖµÐÍdtypeµÄÃüÃûÐÎÊ½ÏàÍ¬£º Ò»¸öÀàÐÍÃû(ÀýÈç£¬float»òint)£¬ºóÃæ¸úÒ»¸öÓÃÓÚ±íÊ¾¸÷ÔªËØÎ»³¤µÄÊý×Ö¡£±ê×¼µÄË«¾«¶È¸¡µãÖµ(¼´PythonÖÐµÄfloat¶ÔÏó)ÐèÒªÕ¼ÓÃ8B(¼´64b)¡£Òò´Ë£¬¸ÃÀàÐÍÔÚNumPyÖÐ¼Ç×÷float64¡£

¿ÉÒÔÓÃastype·½·¨ÏÔÊ½¸ü¸ÄÊý×éµÄdtype¡£



In £Û14£Ý: arr5=np.array(£Û1, 2, 3£Ý) 

arr5.dtype

Out£Û14£Ý: dtype('int32')

In £Û15£Ý: arr6=arr5.astype(np.float64)

arr6

Out£Û15£Ý: array(£Û 1.,2.,3.£Ý)







ÊÓÆµ½²½â


5.1.2Êý×éºÍ±êÁ¿Ö®¼äµÄÔËËã

ÓÃÊý×é±í´ïÊ½´úÌæÑ­»·µÄ·½·¨£¬Í¨³£±»³Æ×÷Ê¸Á¿»¯(vectorization)¡£´óÐ¡ÏàµÈµÄÊý×éÖ®¼äµÄÈÎºÎËãÊõÔËËã¶¼»áÓ¦ÓÃµ½ÔªËØ¼¯¡£



In £Û16£Ý: arr=np.array(£Û£Û1. ,2. , 3.£Ý, £Û4. ,5. ,6£Ý£Ý)

arr *arr






Out£Û16£Ý: 

array(£Û£Û1., 4., 9.£Ý,

£Û 16.,25.,36.£Ý£Ý)

In £Û17£Ý: arr - arr

Out£Û17£Ý: 

array(£Û£Û 0.,0.,0.£Ý,

£Û 0.,0.,0.£Ý£Ý)





Í¬Ñù£¬Êý×éºÍ±êÁ¿µÄÔËËãÒ²»á½«ÄÇ¸ö±êÁ¿´«²¥µ½¸÷¸öÔªËØ¡£



In £Û18£Ý: 1 / arr

Out£Û18£Ý: 

array(£Û£Û 1.,0.5 ,0.33333333£Ý,

£Û 0.25,0.2 ,0.16666667£Ý£Ý)

In £Û19£Ý: arr ** 0.5

Out£Û19£Ý: 

array(£Û£Û 1.,1.41421356,1.73205081£Ý,

£Û 2.,2.23606798,2.44948974£Ý£Ý)







ÊÓÆµ½²½â


5.1.3Ë÷ÒýºÍÇÐÆ¬

NumPyË÷ÒýºÍÇÐÆ¬ÊÇÒ»¸öÄÚÈÝ·á¸»µÄÖ÷Ìâ£¬ÒòÎªÑ¡È¡Êý¾Ý×Ó¼¯»òµ¥¸öÔªËØµÄ·½Ê½ÓÐºÜ¶à¡£Ê×ÏÈ£¬Ò»Î¬Êý×éµÄÇÐÆ¬Ë÷Òý»ù±¾ºÍPythonÁÐ±íµÄÇÐÆ¬Ë÷Òý¹¦ÄÜÒ»ÖÂ¡£



In £Û20£Ý: arr=np.arange(10)

arr

Out£Û20£Ý: array(£Û0, 1, 2, 3, 4, 5, 6, 7, 8, 9£Ý)

In £Û21£Ý: arr£Û4£Ý

Out£Û21£Ý: 4

In £Û22£Ý: arr£Û3:7£Ý

Out£Û22£Ý: array(£Û3, 4, 5, 6£Ý)

In £Û23£Ý: arr£Û3:5£Ý=12

arr

Out£Û23£Ý: array(£Û 0,1,2, 12, 12,5,6,7,8,9£Ý)





ÈçÉÏËùÊ¾£¬µ±½«Ò»¸ö±êÁ¿¸³Öµ¸øÒ»¸öÇÐÆ¬Ê±(ÀýÈç£¬arr£Û3:5£Ý=12)£¬¸ÃÖµ»á×Ô¶¯´«²¥µ½Õû¸öÑ¡Çø¡£ÒòÎªÊý×éÇÐÆ¬ÊÇÔ­Ê¼Êý×éÊÓÍ¼£¬Õâ¾ÍÒâÎ¶×ÅÈç¹û×öÈÎºÎÐÞ¸Ä£¬Ô­Ê¼Êý×é¶¼»á¸ú×Å¸ü¸Ä¡£



In £Û24£Ý: arr_slice=arr£Û3:5£Ý

arr_slice£Û1£Ý=100

arr

Out£Û24£Ý: array(£Û0, 1, 2,12, 100, 5, 6, 7, 8, 9£Ý)

In £Û25£Ý: arr_slice£Û:£Ý=250

arr

Out£Û25£Ý: array(£Û0, 1, 2, 250, 250, 5, 6, 7, 8, 9£Ý)





¶ÔÓÚ¸ßÎ¬Êý×éÀ´Ëµ£¬ÄÜ×öµÄÊÂÇé¸ü¶à¡£ÔÚÒ»¸ö¶þÎ¬Êý×éÖÐ£¬¸÷Ë÷ÒýÎ»ÖÃÉÏµÄÔªËØ²»ÔÙÊÇ±êÁ¿¶øÊÇÒ»Î¬Êý×é¡£



In £Û26£Ý: arr=np.array(£Û£Û1, 2, 3£Ý, £Û4, 5, 6£Ý, £Û7, 8, 9£Ý£Ý)

arr£Û2£Ý

Out£Û26£Ý: array(£Û7, 8, 9£Ý)





Òò´Ë£¬¿ÉÒÔ¶Ô¸÷¸öÔªËØ½øÐÐµÝ¹é·ÃÎÊ£¬µ«ÕâÑùÐèÒª×öµÄÊÂÇéÓÐµã¶à¡£ÓÃ»§¿ÉÒÔ´«ÈëÒ»¸öÒÔ¶ººÅ¸ô¿ªµÄË÷ÒýÁÐ±íÀ´Ñ¡È¡µ¥¸öÔªËØ¡£Ò²¾ÍÊÇËµ£¬ÏÂÃæÕâÁ½ÖÖ·½Ê½ÊÇµÈ¼ÛµÄ¡£



In £Û27£Ý: arr£Û1£Ý£Û2£Ý

Out£Û27£Ý: 6

In £Û28£Ý: arr£Û1, 2£Ý

Out£Û28£Ý: 6





»¨Ê½Ë÷ÒýÊÇÀûÓÃÕûÊýÊý×é½øÐÐË÷Òý£¬¼ÙÉèÓÐÒ»¸ö8¡Á4µÄÊý×é¡£



In £Û29£Ý: arr=np.empty((8,4))

for i in range(8):

arr£Ûi£Ý=i

arr

Out£Û29£Ý: 

array(£Û£Û 0.,0.,0.,0.£Ý,

£Û 1.,1.,1.,1.£Ý,

£Û 2.,2.,2.,2.£Ý,

..., 

£Û 5.,5.,5.,5.£Ý,

£Û 6.,6.,6.,6.£Ý,

£Û 7.,7.,7.,7.£Ý£Ý)





ÎªÁËÒÔÌØ¶¨µÄË³ÐòÑ¡È¡ÐÐ×Ó¼¯£¬Ö»Ðè´«ÈëÒ»¸öÓÃÓÚÖ¸¶¨Ë³ÐòµÄÕûÊýÁÐ±í»òndarray¼´¿É¡£



In £Û30£Ý: arr£Û£Û4, 3, 0, 6£Ý£Ý

Out£Û30£Ý: 

array(£Û£Û 4.,4.,4.,4.£Ý,

£Û 3.,3.,3.,3.£Ý,

£Û 0.,0.,0.,0.£Ý,

£Û 6.,6.,6.,6.£Ý£Ý)





Ê¹ÓÃ¸ºÊýË÷Òý½«»á´ÓÄ©Î²¿ªÊ¼Ñ¡È¡ÐÐ¡£



In £Û31£Ý: arr£Û£Û-3, -5, -7£Ý£Ý

Out£Û31£Ý: 

array(£Û£Û 5.,5.,5.,5.£Ý,

£Û 3.,3.,3.,3.£Ý,

£Û 1.,1.,1.,1.£Ý£Ý)





µ±Ò»´Î´«Èë¶à¸öÊý×éÊ±£¬Ëü·µ»ØµÄÊÇÒ»¸öÒ»Î¬Êý×é£¬ÆäÖÐµÄÔªËØ¶ÔÓ¦¸÷¸öË÷ÒýÔª×é¡£



In £Û32£Ý: arr=np.arange(32).reshape((8,4))

arr

Out£Û32£Ý: 

array(£Û£Û 0,1,2,3£Ý,

£Û 4,5,6,7£Ý,

£Û 8,9, 10, 11£Ý,

..., 

£Û20, 21, 22, 23£Ý,

£Û24, 25, 26, 27£Ý,

£Û28, 29, 30, 31£Ý£Ý)

In £Û33£Ý: arr£Û£Û1,5,7,2£Ý, £Û0,3,1,2£Ý£Ý

Out£Û33£Ý: array(£Û 4, 23, 29, 10£Ý)





ËüÑ¡³öµÄÔªËØÆäÊµÊÇ(1,0)¡¢(5,3)¡¢(7,1)ºÍ(2,2)ÕâÐ©Î»ÖÃµÄÔªËØ¡£Õâ¸ö»¨Ê½Ë÷ÒýµÄ½á¹û¿ÉÄÜºÍÄ³Ð©ÓÃ»§Ô¤²âµÄ²»Ì«Ò»Ñù£¬Ñ¡È¡¾ØÕóµÄÐÐÁÐ×Ó¼¯Ó¦¸ÃÊÇ¾ØÐÎÇøÓòµÄÐÎÊ½²Å¶Ô¡£ÏÂÃæÊÇµÃµ½¸Ã½á¹ûµÄÒ»¸ö°ì·¨¡£



In £Û34£Ý: arr£Û£Û1,5,7,2£Ý£Ý£Û:,£Û0,3,1,2£Ý£Ý

Out£Û34£Ý: 

array(£Û£Û 4,7,5,6£Ý,

£Û20, 23, 21, 22£Ý,

£Û28, 31, 29, 30£Ý,

£Û 8, 11,9, 10£Ý£Ý)





ÁíÍâÒ»¸ö°ì·¨¾ÍÊÇÊ¹ÓÃnp.ix_()º¯Êý£¬Ëü¿ÉÒÔ½«Á½¸öÒ»Î¬Êý×é×ª»»³ÉÒ»¸öÓÃÓÚÑ¡È¡·½ÐÎÇøÓòµÄË÷ÒýÆ÷¡£



In £Û35£Ý: arr£Ûnp.ix_(£Û1,5,7,2£Ý, £Û0,3,1,2£Ý)£Ý

Out£Û35£Ý: 

array(£Û£Û 4,7,5,6£Ý,

£Û20, 23, 21, 22£Ý,

£Û28, 31, 29, 30£Ý,

£Û 8, 11,9, 10£Ý£Ý)





×¢Òâ£º  »¨Ê½Ë÷ÒýºÍÇÐÆ¬²»Ò»Ñù£¬ËüÊÇ½«Êý¾Ý¸´ÖÆµ½ÐÂµÄÊý×éÖÐ¡£



ÊÓÆµ½²½â


5.1.4Êý×é×ªÖÃºÍÖá¶Ô»»

×ªÖÃ(transpose)ÊÇÖØËÜµÄÒ»ÖÖÌØÊâÐÎÊ½£¬Ëü·µ»ØµÄÊÇÔ´Êý¾ÝµÄÊÓÍ¼(²»»á½øÐÐÈÎºÎ¸´ÖÆ²Ù×÷)¡£Êý×é²»½öÓÐtranspose()·½·¨£¬»¹ÓÐÒ»¸öÌØÊâµÄTÊôÐÔ¡£



In £Û36£Ý: arr=np.arange(15).reshape(5,3)

Arr






Out£Û36£Ý: 

array(£Û£Û 0,1,2£Ý,

£Û 3,4,5£Ý,

£Û 6,7,8£Ý,

£Û 9, 10, 11£Ý,

£Û12, 13, 14£Ý£Ý)



In £Û37£Ý: arr.T

Out£Û37£Ý: 

array(£Û£Û 0,3,6,9, 12£Ý,

£Û 1,4,7, 10, 13£Ý,

£Û 2,5,8, 11, 14£Ý£Ý)





ÔÚ½øÐÐ¾ØÕó¼ÆËãÊ±£¬¾­³£ÐèÒªÓÃµ½¸Ã²Ù×÷£¬ÀýÈç£¬ÀûÓÃnp.dot()¼ÆËã¾ØÕóÄÚ»ý¡£



In £Û38£Ý: arr=np.random.randn(6,3)

 np.dot(arr.T, arr)

Out£Û38£Ý: 

array(£Û£Û9.03630405, 0.49388948,-1.54587135£Ý,

£Û0.49388948, 2.25164741, 1.93791071£Ý,

£Û -1.54587135, 1.93791071,10.55460651£Ý£Ý)





¶ÔÓÚ¸ßÎ¬Êý×éÀ´Ëµ£¬transpose()ÐèÒªµÃµ½Ò»¸öÓÉÖá±àºÅ×é³ÉµÄÔª×é²ÅÄÜ¶ÔÕâÐ©Öá½øÐÐ×ªÖÃ¡£



In £Û39£Ý: arr=np.arange(16).reshape((2, 2, 4))

 Arr

Out£Û39£Ý: 

array(£Û£Û£Û 0,1,2,3£Ý,

£Û 4,5,6,7£Ý£Ý,



£Û£Û 8,9, 10, 11£Ý,

£Û12, 13, 14, 15£Ý£Ý£Ý)

In £Û40£Ý: arr.transpose((1, 0, 2))

Out£Û40£Ý: 

array(£Û£Û£Û 0,1,2,3£Ý,

£Û 8,9, 10, 11£Ý£Ý,



£Û£Û 4,5,6,7£Ý,

£Û12, 13, 14, 15£Ý£Ý£Ý)







ÊÓÆµ½²½â


5.1.5ÀûÓÃÊý×é½øÐÐÊý¾Ý´¦Àí

NumPyÊý×é¿ÉÒÔ½«ºÜ¶àÊý¾Ý´¦ÀíÈÎÎñ±íÊöÎª¼ò½àµÄÊý×é±í´ïÊ½(·ñÔòÐèÒª±àÐ´Ñ­»·)¡£Ê¸Á¿»¯Êý×éÔËËãÒª±ÈPython·½Ê½¿ìÉÏÒ»Á½¸öÊýÁ¿¼¶£¬ÓÈÆäÊÇ¶ÔÓÚ¸÷ÖÖÊýÖµÔËËãÀ´Ëµ¡£ÀýÈç£¬np.meshgrid()º¯Êý½ÓÊÕÁ½¸öÒ»Î¬Êý×é£¬²¢²úÉúÁ½¸ö¶þÎ¬¾ØÕó(¶ÔÓ¦Á½¸öÊý×éÖÐËùÓÐµÄ(x£¬y)¶Ô)¡£



In £Û41£Ý: points=np.arange(-5, 5, 0.01)  #1000¸ö¼ä¸ôÏàµÈµÄµã

xs, ys=np.meshgrid(points, points)

ys

Out£Û41£Ý: 

array(£Û£Û-5., -5., -5., ..., -5., -5., -5.£Ý,

£Û-4.99, -4.99, -4.99, ..., -4.99, -4.99, -4.99£Ý,

£Û-4.98, -4.98, -4.98, ..., -4.98, -4.98, -4.98£Ý,

..., 

£Û 4.97,4.97,4.97, ...,4.97,4.97,4.97£Ý,

£Û 4.98,4.98,4.98, ...,4.98,4.98,4.98£Ý,

£Û 4.99,4.99,4.99, ...,4.99,4.99,4.99£Ý£Ý)





¼ÙÉèÔÚÒ»×éÖµÉÏ¼ÆËãº¯Êýsqrt(x^2 + y^2)£¬ÕâÊ±¶Ôº¯ÊýµÄÇóÖµÔËËã¾ÍºÃ°ìÁË£¬°ÑÕâÁ½¸öÊý×éµ±×÷Á½¸ö¸¡µãÊý±àÐ´±í´ïÊ½¼´¿É¡£



In £Û42£Ý: import matplotlib.pyplot as plt

z=np.sqrt(xs ** 2 + ys ** 2)

z

Out£Û42£Ý: 

array(£Û£Û 7.07106781,7.06400028,7.05693985, ...,7.04988652,

7.05693985,7.06400028£Ý,

£Û 7.06400028,7.05692568,7.04985815, ...,7.04279774,

7.04985815,7.05692568£Ý,

£Û 7.05693985,7.04985815,7.04278354, ...,7.03571603,

7.04278354,7.04985815£Ý,

..., 

£Û 7.04988652,7.04279774,7.03571603, ...,7.0286414 ,

7.03571603,7.04279774£Ý,

£Û 7.05693985,7.04985815,7.04278354, ...,7.03571603,

7.04278354,7.04985815£Ý,

£Û 7.06400028,7.05692568,7.04985815, ...,7.04279774,

7.04985815,7.05692568£Ý£Ý)

In £Û43£Ý: plt.imshow(z, cmap=plt.cm.gray)

plt.colorbar()

plt.title('Image plot of $£Üsqrt{x^2 + y^2}$ for a grid of values')

Out£Û43£Ý: <matplotlib.text.Text at 0x1086aa90>





º¯ÊýÖµµÄÍ¼ÐÎ»¯½á¹ûÈçÍ¼5.1ËùÊ¾¡£



Í¼5.1¸ù¾ÝÍø¸ñ¶Ôº¯ÊýÇóÖµµÄ½á¹û

5.1.6ÊýÑ§ºÍÍ³¼Æ·½·¨

ÓÃ»§¿ÉÒÔÍ¨¹ýÊý×éÉÏµÄÒ»×éÊýÑ§º¯Êý¶ÔÕû¸öÊý×é»òÄ³¸öÖáÏòµÄÊý¾Ý½øÐÐÍ³¼Æ¼ÆËã¡£



In £Û44£Ý: arr=np.random.randn(5, 4)#²úÉúÕýÌ¬·Ö²¼Êý¾Ý

arr.mean()

Out£Û44£Ý: -0.24070480645161735

In £Û45£Ý: np.mean(arr)

Out£Û45£Ý: -0.24070480645161735

In £Û46£Ý: arr.sum()

Out£Û46£Ý: -4.8140961290323467





mean()ºÍsum()ÕâÀàº¯Êý¿ÉÒÔ½ÓÊÕÒ»¸öaxis²ÎÊý(ÓÃÓÚ¼ÆËã¸ÃÖáÏòÉÏµÄÍ³¼ÆÖµ)£¬×îÖÕ½á¹ûÊÇÒ»¸öÉÙÒ»Î¬µÄÊý×é¡£



In £Û47£Ý: arr.mean(axis=1)

Out£Û47£Ý: array(£Û-0.26271711, -0.50185429,0.38508322, -0.25435201, -0.56968384£Ý)

In £Û48£Ý: arr.sum(0)

Out£Û48£Ý: array(£Û 0.81837351, -2.17245972, -4.01616748,0.55615755£Ý)





Ïñcumsum()ºÍcumprod()Ö®ÀàµÄ·½·¨Ôò²»¾ÛºÏ£¬¶øÊÇ²úÉúÒ»¸öÓÉÖÐ¼ä½á¹û×é³ÉµÄÊý×é¡£



In £Û49£Ý: arr=np.array(£Û£Û0,1,2£Ý, £Û3,4,5£Ý, £Û6,7,8£Ý£Ý)

arr.cumsum(0)

Out£Û49£Ý: 

array(£Û£Û 0,1,2£Ý,

£Û 3,5,7£Ý,

£Û 9, 12, 15£Ý£Ý, dtype=int32)

In £Û50£Ý: arr.cumprod(1)

Out£Û50£Ý: 

array(£Û£Û0, 0, 0£Ý,

£Û3,12,60£Ý,

£Û6,42, 336£Ý£Ý, dtype=int32)






5.2Pandas

PandasµÄÃû³ÆÀ´×ÔÓÚÃæ°åÊý¾Ý(panel data)ºÍPythonÊý¾Ý·ÖÎö(data analysis)¡£PandasÊÇÒ»ÖÖ»ùÓÚNumPyµÄÊý¾Ý·ÖÎö°ü£¬×î³õÓÉAQR Capital ManagementÓÚ2008Äê4ÔÂ×÷Îª½ðÈÚÊý¾Ý·ÖÎö¹¤¾ß¿ª·¢³öÀ´£¬²¢ÓÚ2009Äêµ×¿ªÔ´£¬Ä¿Ç°ÓÉ×¨×¢ÓÚPythonÊý¾Ý°ü¿ª·¢µÄPyData¿ª·¢Ð¡×é¼ÌÐøÎ¬»¤¡£PandasÌá¹©ÁË´óÁ¿µÄ¸ßÐ§²Ù×÷´óÐÍÊý¾Ý¼¯ËùÐèµÄº¯ÊýºÍ·½·¨£¬ËüÊÇÊ¹Python³ÉÎªÇ¿´ó¶ø¸ßÐ§µÄÊý¾Ý·ÖÎö¹¤¾ßµÄÖØÒªÒòËØÖ®Ò»¡£

5.2.1PandasÊý¾Ý½á¹¹
1. Series

SeriesÊÇÒ»ÖÖÀàËÆÓÚÒ»Î¬Êý×éµÄ¶ÔÏó£¬ËüÓÉÒ»×éÊý¾Ý¼°ÓëÖ®Ïà¹ØµÄÒ»×éÊý¾Ý±êÇ©(¼´Ë÷Òý)×é³É¡£Ö»ÓÐÒ»×éÊý¾Ý¿É²úÉú×î¼òµ¥µÄSeries¡£



In £Û1£Ý: import pandas as pd

from pandas import Series, DataFrame

obj=Series(£Û4, 7, -5, 3£Ý)

obj

Out£Û1£Ý: 

04

17

2-5

33

dtype: int64





SeriesµÄ×Ö·û´®±íÏÖÐÎÊ½ÎªË÷ÒýÔÚ×ó±ß£¬ÖµÔÚÓÒ±ß¡£ÓÉÓÚÃ»ÓÐÎªÊý¾ÝÖ¸¶¨Ë÷Òý£¬»á×Ô¶¯´´½¨Ò»¸ö0~£¨N-1£©(NÎªÊý¾Ý³¤¶È)µÄÕûÊýÐÍË÷Òý¡£ÓÃ»§¿ÉÒÔÍ¨¹ýSeriesµÄvaluesºÍindexÊôÐÔ»ñÈ¡ÆäÊý×é±íÊ¾ÐÎÊ½ºÍË÷Òý¶ÔÏó¡£



In £Û2£Ý: obj.values

Out£Û2£Ý: array(£Û 4,7, -5,3£Ý, dtype=int64)

In £Û3£Ý: obj.index

Out£Û3£Ý: RangeIndex(start=0, stop=4, step=1)





Í¨³££¬ÐèÒª´´½¨µÄSeries´øÓÐÒ»¸ö¿ÉÒÔ¶Ô¸÷¸öÊý¾Ýµã½øÐÐ±ê¼ÇµÄË÷Òý¡£



In £Û4£Ý: obj2=Series(£Û4,3,-5,7£Ý, index=£Û'd','b','a','c'£Ý)

obj2

Out£Û4£Ý: 

d4

b3






a-5

c7

dtype: int64





ÓëÆÕÍ¨µÄNumPyÊý×éÏà±È£¬¿ÉÒÔÍ¨¹ýË÷ÒýµÄ·½Ê½Ñ¡È¡SeriesÖÐµÄµ¥¸ö»òÒ»×éÖµ¡£



In £Û5£Ý: obj2£Û'a'£Ý

Out£Û5£Ý: -5

In £Û6£Ý: obj2£Û£Û'c', 'a', 'd'£Ý£Ý

Out£Û6£Ý: 

c7

a-5

d4

dtype: int64





2. DataFrame

DataFrameÊÇÒ»¸ö±í¸ñÐÍµÄÊý¾Ý½á¹¹£¬Ëüº¬ÓÐÒ»×éÓÐÐòµÄÁÐ£¬Ã¿ÁÐ¿ÉÒÔÊÇ²»Í¬µÄÀàÐÍ(ÊýÖµÐÍ¡¢×Ö·û´®¡¢²¼¶ûÐÍµÈ)¡£DataFrame¼ÈÓÐÐÐË÷Òý£¬ÓÖÓÐÁÐË÷Òý£¬¿ÉÒÔ¿´×÷ÊÇÓÉSeries×é³ÉµÄ×Öµä(¹²ÓÃÍ¬Ò»¸öË÷Òý)¡£¸úÆäËûÀàËÆµÄÊý¾Ý½á¹¹Ïà±È£¬DataFrameÖÐÃæÏòÐÐºÍÃæÏòÁÐµÄ²Ù×÷»ù±¾ÊÇÆ½ºâµÄ¡£¹¹½¨DataFrameµÄ·½·¨ºÜ¶à£¬×î³£¼ûµÄ¾ÍÊÇÖ±½Ó´«ÈëÒ»¸öÓÉµÈ³¤ÁÐ±í»òNumPyÊý×é×é³ÉµÄ×Öµä¡£



In £Û7£Ý: data={'state': £Û'Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'£Ý,

'year':£Û2000, 2001, 2002, 2001, 2002£Ý,

'pop':£Û1.5, 1.7, 3.6, 2.4, 2.9£Ý}

frame=DataFrame(data)

frame

Out£Û7£Ý: 

pop state year

01.5Ohio2000

11.7Ohio2001

23.6Ohio2002

32.4Nevada2001

42.9Nevada2002





Èç¹ûÖ¸¶¨ÁËÁÐÐòÁÐ£¬DataFrameµÄÁÐ¾Í»á°´ÕÕÖ¸¶¨µÄË³Ðò½øÐÐÅÅÁÐ¡£



In £Û8£Ý: DataFrame(data, columns=£Û'year', 'state', 'pop'£Ý)

Out£Û8£Ý: 

year state pop

02000Ohio1.5

12001Ohio1.7

22002Ohio3.6

32001Nevada2.4

42002Nevada2.9





5.2.2PandasÎÄ¼þ²Ù×÷
1. Pandas¶ÁÈ¡ÎÄ¼þ

PandasÌá¹©ÁËÒ»Ð©ÓÃÓÚ½«±í¸ñÐÍÊý¾Ý¶ÁÈ¡ÎªDataFrame¶ÔÏóµÄº¯Êý¡£±í5.2¶ÔËüÃÇ½øÐÐÁË×Ü½á£¬ÆäÖÐread_csv()ºÍread_table()¿ÉÄÜ»áÊÇ½ñºóÓÃµÃ×î¶àµÄ¡£


±í5.2Pandas¶ÁÈ¡ÎÄ¼þµÄº¯Êý




º¯ÊýËµÃ÷

read_csv()´ÓÎÄ¼þ¡¢URL¡¢ÎÄ¼þÐÍ¶ÔÏóÖÐ¼ÓÔØ´ø·Ö¸ô·ûµÄÊý¾Ý¡£Ä¬ÈÏ·Ö¸ô·ûÎª¶ººÅ
read_table()´ÓÎÄ¼þ¡¢URL¡¢ÎÄ¼þÐÍ¶ÔÏóÖÐ¼ÓÔØ´ø·Ö¸ô·ûµÄÊý¾Ý¡£Ä¬ÈÏ·Ö¸ô·ûÎªÖÆ±í·û("£Üt")
read_fwf()¶ÁÈ¡¶¨¿íÁÐ¸ñÊ½Êý¾Ý(Ò²¾ÍÊÇËµÃ»ÓÐ·Ö¸ô·û)
read_clipboard()¶ÁÈ¡¼ôÌù°åÖÐµÄÊý¾Ý£¬¿ÉÒÔ¿´×÷ÊÇread_table()µÄ¼ôÌù°å¡£ËüÔÚ½«ÍøÒ³×ª»»Îª±í¸ñÊ±·Ç³£ÓÐÓÃ



2. Pandasµ¼³öÎÄ¼þ

Pandasµ¼³öÎÄ¼þµÄº¯ÊýÈç±í5.3ËùÊ¾¡£


±í5.3Pandasµ¼³öÎÄ¼þµÄº¯Êý



º¯ÊýËµÃ÷

to_csv(file_path,sep=' ',index=True,header=True)
file_path±íÊ¾ÎÄ¼þÂ·¾¶

sep±íÊ¾·Ö¸ô·û

index´ú±íÊÇ·ñµ¼³öÐÐÐòºÅ

header´ú±íÊÇ·ñµ¼³öÁÐÐòºÅ

to_excel(file_path,sep=' ',index=True,header=True)
file_path±íÊ¾ÎÄ¼þÂ·¾¶

sep±íÊ¾·Ö¸ô·û

index´ú±íÊÇ·ñµ¼³öÐÐÐòºÅ

header´ú±íÊÇ·ñµ¼³öÁÐÐòºÅ



5.2.3Êý¾Ý´¦Àí

ÔÚÊý¾Ý·ÖÎöÖÐ£¬Êý¾ÝÇåÏ´ÊÇÔÚÊý¾Ý¼ÛÖµÁ´ÖÐ×î¹Ø¼üµÄ²½Öè¡£Êý¾ÝÇåÏ´¾ÍÊÇ´¦ÀíÈ±Ê§Êý¾Ý¼°Çå³ýÎÞÒâÒåµÄÐÅÏ¢¡£¶ÔÓÚÀ¬»øÊý¾ÝÀ´Ëµ£¬¼´Ê¹ÊÇÍ¨¹ý×îºÃµÄ·ÖÎö£¬Ò²½«²úÉú´íÎóµÄ½á¹û£¬²¢Îóµ¼ÒµÎñ±¾Éí¡£

¶ÔÈ±Ê§ÖµµÄ´¦ÀíÓÐÊý¾Ý²¹Æë¡¢É¾³ý¶ÔÓ¦ÐÐ¡¢²»´¦ÀíµÈ¼¸ÖÖ·½·¨¡£



In £Û9£Ý£º 

import pandas as pd

import numpy as np

from pandas import DataFrame






data={'Tom':£Û170, 26, 30£Ý,'Mike':£Û175, 25, 28£Ý,'Jane':£Û170, 26,np.nan£Ý,'Tim':£Û175, 25, 28£Ý}

data1=DataFrame(data).T

data1.drop_duplicates()

data1





¸Ã¶Î´úÂëµÄÊä³ö½á¹ûÈçÏÂ¡£



Out £Û9£Ý£º 

0 1 2

Jane170.026.0 NaN

Mike175.025.028.0

Tim 175.025.028.0

Tom 170.026.030.0





·½·¨Ò»£º É¾³ýÓÐÈ±Ê§ÖµµÄÐÐ¡£



In £Û10£Ý£º 

data2=data1.dropna()

data2





É¾³ýºóµÄ½á¹ûÈçÏÂ¡£



Out £Û10£Ý£º 

0 1 2

Mike175.025.028.0

Tim 175.025.028.0

Tom 170.026.030.0





Í¨¹ýÊ¹ÓÃdropna()·½·¨ºó£¬¿ÉÒÔ¿´µ½µÚ1ÐÐ´æÔÚÈ±Ê§Öµ£¬¹Ê±»É¾µôÁË¡£

·½·¨¶þ£º ¶ÔÈ±Ê§Öµ½øÐÐÌî³äÓÐºÜ¶à·½·¨£¬±È½Ï³£ÓÃµÄÓÐ¾ùÖµÌî³ä¡¢ÖÐÎ»ÊýÌî³ä¡¢ÖÚÊýÌî³äµÈ¡£ÒÔÏÂ²ÉÓÃ¾ùÖµÌî³ä¡£




In £Û11£Ý£º 

data3=data1.fillna(data1.mean())

data3





½á¹ûÈçÏÂ¡£



Out £Û11£Ý£º 

0 12

Jane170.026.028.666667

Mike175.025.028.000000

Tim 175.025.028.000000

Tom 170.026.030.000000





5.2.4²ã´Î»¯Ë÷Òý

²ã´Î»¯Ë÷ÒýÊÇPandasµÄÒ»¸öÖØÒª¹¦ÄÜ£¬ËüÄÜÊ¹Ò»¸öÖáÉÏÓÐ¶à¸ö(Á½¸öÒÔÉÏ)Ë÷Òý¼¶±ð£¬¼´ËüÄÜÒÔµÍÎ¬¶ÈÐÎÊ½´¦Àí¸ßÎ¬¶ÈÊý¾Ý¡£



In £Û12£Ý£º 

import pandas as pd

import numpy as np

from pandas import Series,DataFrame

data=Series(np.random.randn(10),

index=£Û£Û'a','a','a','b','b','b','c','c','d','d'£Ý,

£Û1,2,3,1,2,3,1,2,2,3£Ý£Ý)

data

Out£Û12£Ý: 

a1-0.088594

20.316611

31.383978

b10.215510

2-0.111913

3-0.580355

c1-0.048050

2-0.054285

d2-0.136860

3-1.578472

dtype: float64





Õâ¾ÍÊÇ´øÓÐ¶àÖØË÷ÒýµÄSeries¸ñÊ½»¯Êä³ö¡£ÏÂÃæ¿´Ò»ÏÂËüµÄË÷Òý¡£



In £Û13£Ý£º 

data.index

Out£Û13£Ý: 

MultiIndex(levels=£Û£Û'a', 'b', 'c', 'd'£Ý, £Û1, 2, 3£Ý£Ý,

labels=£Û£Û0, 0, 0, 1, 1, 1, 2, 2, 3, 3£Ý, £Û0, 1, 2, 0, 1, 2, 0, 1, 1, 2£Ý£Ý)





¶ÔÓÚÒ»¸ö²ã´Î»¯Ë÷ÒýµÄ¶ÔÏóÀ´Ëµ£¬Ñ¡È¡Ò»¸öÊý¾Ý¼¯ºÜ¼òµ¥¡£



In £Û14£Ý£º 

data£Û'b'£Ý

Out£Û14£Ý: 

10.215510

2-0.111913

3-0.580355

In £Û15£Ý£º 

data£Û'b':'c'£Ý

Out£Û15£Ý: 






b10.215510

2-0.111913

3-0.580355

c1-0.048050

2-0.054285

dtype: float64

In £Û16£Ý£º 

data£Û£Û'b','d'£Ý£Ý

Out£Û16£Ý: 

b10.215510

2-0.111913

3-0.580355

d2-0.136860

3-1.578472

dtype: float6





ÉõÖÁ»¹¿ÉÒÔÔÚ¡°ÄÚ²ã¡±ÖÐ½øÐÐÑ¡È¡¡£



In £Û17£Ý£º 

data£Û:,2£Ý

Out£Û17£Ý: 

a0.316611

b-0.111913

c-0.054285

d-0.136860

dtype: float64





²ã´Î»¯Ë÷ÒýÔÚÊý¾ÝÖØËÜºÍ»ùÓÚ·Ö×éµÄ²Ù×÷ÖÐ°çÑÝ×ÅÖØÒªµÄ½ÇÉ«¡£ÀýÈç£¬Ò»¸öÊý¾Ý¿ÉÒÔÍ¨¹ýËüµÄunstack()·½·¨±»ÖØÐÂ°²ÅÅµ½Ò»¸öDataFrameÖÐ¡£



In £Û18£Ý£º 

data.unstack()

Out£Û18£Ý: 

1 2 3

a-0.0885940.3166111.383978

b0.215510-0.111913-0.580355

c-0.048050-0.054285 NaN

d NaN  -0.136860-1.578472





¶ÔÓÚÒ»¸öDataFrame¶ÔÏóÀ´Ëµ£¬Ã¿ÌõÖá¶¼¿ÉÒÔÓÐ·Ö²ãË÷Òý¡£



In £Û19£Ý£º 

df=DataFrame(np.arange(12).reshape((4,3)),

index=£Û£Û'a','a','b','b'£Ý,£Û1,2,1,2£Ý£Ý,

columns=£Û£Û'Ohio','Ohio','Colorado'£Ý,

 £Û'green','red','green'£Ý£Ý)






Df

Out£Û19£Ý: 

Ohio Colorado

green redgreen

a 1 0 12

2 3 45

b 1 6 78

2 910 11





¸÷²ã¶¼¿ÉÒÔÓÐÃû×Ö(×Ö·û´®»òÆäËûPython¶ÔÏó)¡£Èç¹ûÖ¸¶¨Ãû³Æ£¬Ëü¾Í»áÏÔÊ¾ÔÚ¿ØÖÆÌ¨Êä³öÖÐ¡£



In £Û20£Ý£º 

df.index.names=£Û'key1','key2'£Ý

df.columns.names=£Û'state','color'£Ý

df

Out£Û20£Ý: 

stateOhio Colorado

color green redgreen

key1 key2 

a10 12

23 45

b16 78

2910 11





ÓÉÓÚÓÐÁË·Ö²¿µÄË÷Òý£¬ËùÒÔ¿ÉÒÔºÜÇáËÉµØÑ¡È¡ÁÐ·Ö×é¡£



In £Û21£Ý£º 

df£Û'Ohio'£Ý

Out£Û21£Ý: 

colorgreenred

key1 key2

a1 01

2 34

b1 67

2 9 10





5.2.5·Ö¼¶Ë³Ðò
1. ÖØÐÂ·Ö¼¶ÅÅÐò

ÓÐÊ±ÐèÒªÖØÐÂµ÷ÕûÄ³ÌõÖáÉÏ¸÷¼¶±ðµÄË³Ðò£¬»òÕß¸ù¾ÝÖ¸¶¨¼¶±ðµÄÖµ¶ÔÊý¾Ý½øÐÐÖØÐÂÅÅÐò¡£Swaplevel()½ÓÊÕÁ½¸ö¼¶±ðµÄ±àºÅ»òÃû³Æ£¬²¢·µ»ØÒ»¸ö»¥»»¼¶±ðµÄÐÂ¶ÔÏó(µ«Êý¾Ý²»»á·¢Éú±ä»¯)¡£



In £Û22£Ý£º 

df.swaplevel('key1','key2')

Out£Û22£Ý: 

stateOhio Colorado

color green redgreen

key2 key1 

1a0 12

2a3 45

1b6 78

2b910 11





ÔÚ½»»»¼¶±ðÊ±¾­³£»áÓÃµ½sortlevel()£¬Ëü¸ù¾Ýµ¥¸ö¼¶±ðÖÐµÄÖµ¶ÔÊý¾Ý½øÐÐÅÅÐò£¬ÕâÑù×îÖÕ½á¹û¾ÍÊÇÓÐÐòµÄÁË¡£



In £Û23£Ý£º 

df.sortlevel(1)

Out£Û23£Ý: 

stateOhio Colorado

color green redgreen

key1 key2 

a10 12

b16 78

a23 45

b2910 11





2. ¸ù¾Ý¼¶±ð»ã×ÜÍ³¼Æ

Ðí¶à¶ÔDataFrameºÍSeriesµÄÃèÊöºÍ»ã×ÜÍ³¼Æ¶¼ÓÐÒ»¸ölevelÑ¡Ïî£¬ËüÓÃÓÚÖ¸¶¨ÔÚÄ³ÌõÖáÉÏÇóºÍµÄ¼¶±ð¡£



In £Û24£Ý£º 

df.sum(level='key2')

Out£Û24£Ý: 

stateOhio Colorado

color green redgreen

key2

1 6 8 10

21214 16





5.2.6Ê¹ÓÃDataFrameµÄÁÐ

ÓÐÊ±Ï£Íû½«DataFrameµÄÒ»¸ö»ò¶à¸öÁÐË÷Òýµ±³ÉÐÐÓÃ£¬»òÕß½«DataFrameµÄÐÐË÷Òý±ä³ÉÁÐ¡£



In £Û25£Ý£º 

Df=DataFrame({'a':range(7),'b':range(7,0,-1),

'c':£Û'one','one','one','two','two','two','two'£Ý,






'd':£Û0,1,2,0,1,2,3£Ý})

Df

Out£Û25£Ý: 

abcd

007one0

116one1

225one2

334two0

443two1

552two2

661two3





DataFrameµÄset_index()·½·¨»á½«Ò»¸ö»ò¶à¸öÁÐ×ª»»ÎªÐÐË÷Òý£¬²¢´´½¨Ò»¸öÐÂµÄDataFrame¡£



In £Û26£Ý£º 

df1=df.set_index(£Û'c','d'£Ý)

df1

Out£Û26£Ý: 

ab

c d

one 007

116

225

two 034

143

252

361





DataFrameµÄreset_index()·½·¨»á½«²ã´Î»¯Ë÷ÒýµÄ¼¶±ð×ªÒÆµ½ÁÐÀïÃæÈ¥¡£



In £Û27£Ý£º 

df1.reset_index()

Out£Û27£Ý: 

cdab

0one007

1one116

2one225

3two034

4two143

5two252

6two361





5.3Matplotlib

Matplotlib¿ÉÒÔÍ¨¹ý»æÍ¼°ïÖúÓÃ»§ÕÒ³öÒì³£Öµ£¬½øÐÐ±ØÒªµÄÊý¾Ý×ª»»£¬µÃ³öÓÐ¹ØÄ£ÐÍµÄideaµÈ£¬ÆäÊÇPythonÊý¾Ý·ÖÎöÖØÒªµÄ¿ÉÊÓ»¯¹¤¾ß¡£

5.3.1figureºÍsubplot

MatplotlibµÄÍ¼Ïñ¶¼Î»ÓÚfigureÖÐ£¬¿ÉÒÔÓÃplt.figure()´´½¨Ò»¸öÐÂµÄfigure¡£



In £Û28£Ý£º 

import matplotlib.pyplot as plt

fig=plt.figure() #´´½¨Ò»¸öÐÂµÄfigure,»áµ¯³öÒ»¸ö¿Õ´°¿Ú





plt.figure()µÄÒ»Ð©Ñ¡Ïî£¬ÌØ±ðÊÇfiguresize£¬¿ÉÒÔÈ·±£Í¼Æ¬±£´æµ½´ÅÅÌÉÏÊ±¾ßÓÐÒ»¶¨µÄ´óÐ¡ºÍ×Ýºá±È¡£plt.gcf()¿ÉµÃµ½µ±Ç°figureµÄÒýÓÃ£¬±ØÐëÓÃadd_subplot()´´½¨Ò»¸ö»ò¶à¸ösubplot²Å¿ÉÒÔ»æÍ¼¡£



In £Û29£Ý£º 

ax1=fig.add_subplot(2,2,1)





ÒÔÉÏ´úÂëµÄÒâË¼ÊÇ¸ÃÍ¼ÏñÊÇ2¡Á2µÄ(¼´ÓÐ4¸ösubplot)£¬ÇÒµ±Ç°Ñ¡ÖÐµÄÊÇ4¸ösubplotÖÐµÄµÚÒ»¸ö(±àºÅ´Ó1¿ªÊ¼)¡£Èç¹ûÒª°ÑºóÃæµÄÒ²´´½¨²¢ÏÔÊ¾³öÀ´£¬ÄÇÃ´¿ÉÒÔÓÃÈçÏÂ´úÂë¡£



In £Û30£Ý£º 

ax2=fig.add_subplot(2,2,2)

ax3=fig.add_subplot(2,2,3)

ax4=fig.add_subplot(2,2,4)





Õâ¼¸ÐÐ´úÂëÔËÐÐµÄ½á¹ûÈçÍ¼5.2ËùÊ¾¡£



Out£Û30£Ý: 







Í¼5.2ÓÐ4¸ösubplotµÄfigure


ÕâÊ±Èç¹ûÖ´ÐÐÒ»Ìõ»æÍ¼ÃüÁîplt.plot(£Û £Ý)£¬Matplotlib¾Í»áÔÚ×îºóÒ»¸öÓÃ¹ýµÄsubplot(Ã»ÓÐÔò´´½¨Ò»¸ö)ÉÏ½øÐÐ»æÖÆ¡£Òò´Ë£¬Ö´ÐÐÏÂÁÐ´úÂë¿ÉÒÔµÃµ½ÈçÍ¼5.3ËùÊ¾µÄ½á¹û¡£



In £Û31£Ý£º 

from numpy.random import randn

plt.plot(randn(50).cumsum(), 'k--')

Out£Û31£Ý:







Í¼5.3½øÐÐ»æÖÆ²Ù×÷ºóµÄÍ¼


'kª²ª²'ÊÇÒ»¸öÏßÐÍÑ¡Ïî£¬ÓÃÓÚ¸æËßMatplotlib»æÖÆºÚÉ«ÐéÏßÍ¼¡£Ç°ÃæÄÇÐ©ÓÉfig.add_subplot()·µ»ØµÄÊÇAxesSubplot¶ÔÏó£¬Ö±½Óµ÷ÓÃÆäÊµÀý·½·¨¾Í¿ÉÒÔÔÚÆäËû¿Õ×ÅµÄ¸ñ×ÓÀïÃæ»æÍ¼¡£



In £Û32£Ý£º 

import numpy as np

ax1.hist(randn(100),bins=20,color='k', alpha=0.3)

ax2.scatter(np.arange(30),np.arange(30) + 3 * randn(30))





½á¹ûÈçÍ¼5.4ËùÊ¾¡£



Out£Û32£Ý:







Í¼5.4Á¬Ðø»æÖÆºóµÄÍ¼


¿ÉÒÔÔÚMatplotlibÖÐÕÒµ½¸÷ÖÖÍ¼±êÀàÐÍ¡£¸ù¾ÝÌØ¶¨²¼¾Ö´´½¨figureºÍsubplotÊÇÒ»¼þ·Ç³£³£¼ûµÄÈÎÎñ£¬ÓÚÊÇ±ã³öÏÖÁËÒ»¸ö¸üÎª·½±ãµÄ·½·¨¡ª¡ªplt.subplots()¡£Ëü¿ÉÒÔ´´½¨Ò»¸öÐÂµÄfigure£¬²¢·µ»ØÒ»¸öº¬ÓÐÒÑ´´½¨µÄsubplot¶ÔÏóµÄNumPyÊý×é¡£



In £Û33£Ý£º 

fig, axes=plt.subplots(2,3)

axes





Êä³ö½á¹ûÈçÏÂ¡£



Out£Û33£Ý: 

array(£Û£Û<matplotlib.axes._subplots.AxesSubplot object at 0x0000000012486278>,

 <matplotlib.axes._subplots.AxesSubplot object at 0x0000000013EFF780>,

 <matplotlib.axes._subplots.AxesSubplot object at 0x00000000161A67B8>£Ý,

 £Û<matplotlib.axes._subplots.AxesSubplot object at 0x00000000161FF588>,

 <matplotlib.axes._subplots.AxesSubplot object at 0x0000000016265AC8>,

 <matplotlib.axes._subplots.AxesSubplot object at 0x00000000162BE400>£Ý£Ý, 

 dtype=object)





ÕâÊÇ·Ç³£ÊµÓÃµÄ£¬ÒòÎª¿ÉÒÔÇáËÉµØ¶ÔaxesÊý×é½øÐÐË÷Òý£¬¾ÍºÃÏñÒ»¸ö¶þÎ¬Êý×éÒ»Ñù£¬ÀýÈç£¬axes£Û0,1£Ý¡£ÓÃ»§»¹¿ÉÒÔÍ¨¹ýsharexºÍshareyÖ¸¶¨subplotÓ¦¸Ã¾ßÓÐÏàÍ¬µÄXÖá»òYÖá¡£ÔÚ±È½ÏÏàÍ¬·¶Î§ÄÚµÄÊý¾ÝÊ±£¬ÕâÒ²ÊÇ·Ç³£ÊµÓÃµÄ£¬·ñÔòMatplotlib»á×Ô¶¯Ëõ·Å¸÷Í¼±íµÄ½çÏÞ¡£¹ØÓÚsubplotsµÄ¸ü¶àÐÅÏ¢Èç±í5.4ËùÊ¾¡£


±í5.4pyplot.subplots()µÄ²ÎÊý



²ÎÊýËµÃ÷

nrowssubplotµÄÐÐÊý
ncolssubplotµÄÁÐÊý
sharexËùÓÐsubplotÓ¦¸ÃÊ¹ÓÃÏàÍ¬µÄXÖá¿Ì¶È(µ÷½Úxlim»áÓ°ÏìËùÓÐµÄsubplot)
shareyËùÓÐsubplotÓ¦¸ÃÊ¹ÓÃÏàÍ¬µÄYÖá¿Ì¶È(µ÷½Úylim»áÓ°ÏìËùÓÐµÄsubplot)
subplot_kwÓÃÓÚ´´½¨¸÷subplotµÄ¹Ø¼ü×Ö×Öµä
**fig_kw´´½¨figureÊ±µÄÆäËû¹Ø¼ü×Ö


5.3.2µ÷ÕûsubplotÖÜÎ§µÄ¼ä¾à

ÔÚÄ¬ÈÏÇé¿öÏÂ£¬Matplotlib»áÔÚsubplotÍâÎ§ÁôÏÂÒ»¶¨µÄ±ß¾à£¬²¢ÔÚsubplotÖ®¼äÁôÏÂÒ»¶¨µÄ¼ä¾à¡£¼ä¾à¸úÍ¼ÏñµÄ¸ß¶ÈºÍ¿í¶ÈÓÐ¹Ø£¬Òò´Ë£¬Èç¹ûµ÷ÕûÁËÍ¼Ïñ´óÐ¡£¬¼ä¾àÒ²»á×Ô¶¯µ÷Õû¡£ÀûÓÃfigureµÄsubplots_adjust()·½·¨¿ÉÒÔÇá¶øÒ×¾ÙµØÐÞ¸Ä¼ä¾à£¬´úÂëÈçÏÂ¡£



In £Û34£Ý£º 

fig, axes=plt.subplots(2,2,sharex=True, sharey=True)






for i in range(2):

for j in range(2):

axes£Ûi,j£Ý.hist(randn(500),bins=50, color='k', alpha=0.5)

plt.subplots_adjust(wspace=0, hspace=0)





wspaceºÍhspaceÓÃÓÚ¿ØÖÆ¿í¶ÈºÍ¸ß¶ÈµÄ°Ù·Ö±È£¬¿ÉÒÔÓÃ×÷subplotÖ®¼äµÄ¼ä¾à£¬ÔÚÕâ¸öÀý×ÓÖÐ½«¼ä¾àÊÕËõµ½0£¬ÈçÍ¼5.5ËùÊ¾¡£



Out£Û34£Ý: 







Í¼5.5¸÷subplotÖ®¼äÃ»ÓÐ¼ä¾à


ÓÉÍ¼5.5²»ÄÑ¿´³öÆäÖÐµÄÖá±êÇ©ÖØµþÁË¡£Matplotlib²»»á¼ì²éÖá±êÇ©ÊÇ·ñÖØµþ£¬ËùÒÔ¶ÔÓÚÕâÖÖÇé¿öÀ´Ëµ£¬ÓÃ»§Ö»ÄÜ×Ô¼ºÉè¶¨¿Ì¶ÈÎ»ÖÃºÍ¿Ì¶È±êÇ©¡£


5.3.3ÑÕÉ«¡¢×¢ÊÍºÍÏßÐÍ

MatplotlibµÄplot()º¯Êý¿ÉÒÔ½ÓÊÕÒ»×é£¨x£¬y£©×ø±ê¼°±íÊ¾ÑÕÉ«ºÍÏßÐÍµÄ×Ö·û´®ËõÐ´¡£³£ÓÃµÄÑÕÉ«¶¼ÓÐÒ»¸öËõÐ´´Ê£¬Èç¹ûÒªÊ¹ÓÃÆäËûÑÕÉ«£¬ÄÇÃ´¿ÉÒÔÊ¹ÓÃÖ¸¶¨ÆäRGBÖµµÄ·½Ê½¡£ÀýÈç£¬Òª¸ù¾ÝxºÍy»æÖÆºìÉ«ÐéÏß£¬¿ÉÒÔÖ´ÐÐÈçÏÂ´úÂë¡£



In £Û35£Ý£º 

plt.plot(x,y,'r--')





ÕâÖÖÔÚÒ»¸ö×Ö·û´®ÖÐÖ¸¶¨ÑÕÉ«ºÍÏßÐÍµÄ·½Ê½·Ç³£·½±ã£¬Ò²¿ÉÒÔÍ¨¹ýÏÂÃæÕâÖÖ¸üÎªÃ÷È·µÄ·½Ê½µÃµ½Í¬ÑùµÄÐ§¹û¡£



In £Û36£Ý£º 

plt.plot(x,y,linestyle='--', color='r')





ÔÚMatplotlib»æÖÆµÄÍ¼ÐÎÖÐ¿ÉÒÔÌí¼ÓÁ½Àà×¢ÊÍ£º Ö¸ÏòÐÔ×¢ÊÍºÍÎÞÖ¸ÏòÐÔ×¢ÊÍ¡£ÓÃÒ»¸ö¼ýÍ·Ö¸ÏòÒª×¢ÊÍµÄµØ·½£¬ÔÙÐ´ÉÏÒ»¶Î»°µÄÐÐÎª£¬³ÆÎªÖ¸ÏòÐÔ×¢ÊÍ¡£MatplotlibÊ¹ÓÃº¯Êýplt.annotate()À´ÊµÏÖÕâ¸ö¹¦ÄÜ£¬¶øÎÞÖ¸ÏòÐÔ×¢ÊÍÊ¹ÓÃtext()º¯ÊýÊµÏÖ¡£annotate£¨£©º¯ÊýµÄÓï·¨½á¹¹ÈçÏÂ¡£



plt.annotation(s, xy, xytext=None, xycoords='data', textcoords=None, arrowprops=None, annotation_clip=None, **kwargs)





Ö÷Òª²ÎÊý½âÊÍÈçÏÂ¡£

s£º ×Ö·û´®£¬×¢ÊÍÐÅÏ¢ÄÚÈÝ¡£ 

xy£º (float£¬float)£¬¼ýÍ·µãËùÔÚµÄ×ø±êÎ»ÖÃ¡£ 

xytext£º (float£¬float)£¬×¢ÊÍÄÚÈÝµÄ×ø±êÎ»ÖÃ¡£ 

xycoords£º ±»×¢ÊÍµãµÄ×ø±êÏµÊôÐÔ(xycoordsµÄÖµÎªdata£¬ÒÔ±»×¢ÊÍµÄ×ø±êµãxyÎª²Î¿¼)¡£ 

textcoords£º ÉèÖÃ×¢ÊÍÎÄ±¾µÄ×ø±êÏµÊôÐÔ(textcoordsÑ¡ÔñÎªÏà¶ÔÓÚ±»×¢ÊÍµãxyµÄÆ«ÒÆÁ¿)¡£

arrowprops£º dict£¬ÉèÖÃÖ¸Ïò¼ýÍ·µÄ²ÎÊý (arrowstyle£º ÉèÖÃ¼ýÍ·µÄÑùÊ½, color£º ÉèÖÃ¼ýÍ·µÄÑÕÉ«, connectionstyle£º ÉèÖÃ¼ýÍ·µÄÐÎ×´ÎªÖ±Ïß»òÇúÏß)¡£ 

ÎÞÖ¸ÏòÐÔµÄ×¢ÊÍÎÄ±¾Ê¹ÓÃmatplotlib.pyplot.text()º¯Êý½øÐÐÌí¼Ó£¬¸Ãº¯Êý»áÔÚÍ¼ÖÐÖ¸¶¨µÄÎ»ÖÃÌí¼Ó×¢ÊÍÄÚÈÝ¶øÎÞÖ¸Ïò¼ýÍ·¡£º¯ÊýµÄÓï·¨½á¹¹ÈçÏÂ¡£



plt.text(x,y,s,family,fontsize,style,color,**kwargs)




Ö÷Òª²ÎÊý½âÊÍÈçÏÂ¡£

x£¬y£º ´ú±í×¢ÊÍÄÚÈÝÎ»ÖÃ¡£ 

s£º ´ú±í×¢ÊÍÎÄ±¾ÄÚÈÝ¡£ 

family£º ÉèÖÃ×ÖÌå£¬×Ô´øµÄ¿ÉÑ¡ÏîÓÐ{'serif', 'sansª²serif', 'cursive', 'fantasy', 'monospace'}¡£

fontsize£º ×ÖÌå´óÐ¡¡£ 

style£º ÉèÖÃ×ÖÌåÑùÊ½£¬¿ÉÑ¡ÏîÓÐ{'normal', 'italic'(Ð±Ìå), 'oblique'(Ð±Ìå)}¡£

ÏÂÃæÊµÀýÊ¹ÓÃÖù×´Í¼Õ¹Ê¾ÎÒ¹úTop5³ÇÊÐ¸»Ô£¼ÒÍ¥ÊýÁ¿·Ö²¼²¢ÓÃtext()º¯Êý±ê×¢¼ÒÍ¥ÊýÁ¿¡£



import matplotlib.pyplot as plt

import numpy as np

# ¹¹½¨Êý¾Ý

Y2020 = £Û15600,12700,11300,4270,3620£Ý

Y2021 = £Û17400,14800,12000,5200,4020£Ý

cities = £Û'±±¾©','ÉÏº£','Ïã¸Û','ÉîÛÚ','¹ãÖÝ'£Ý

bar_width = 0.4

half_bar_width = 0.2

# ÖÐÎÄÂÒÂëµÄ´¦Àí






plt.rcParams£Û'font.sans-serif'£Ý =£Û'Microsoft YaHei'£Ý

plt.rcParams£Û'axes.unicode_minus'£Ý = False

# »æÍ¼

plt.bar(np.arange(5)-half_bar_width, Y2020, label = '2020', color = 'royalblue', alpha = 0.8, width = bar_width)

plt.bar(np.arange(5)+half_bar_width, Y2021, label = '2021', color = 'goldenrod', alpha = 0.8, width = bar_width)

plt.xlabel('Top5³ÇÊÐ')

plt.ylabel('¼ÒÍ¥ÊýÁ¿')

plt.title('²Æ¸»¼ÒÍ¥ÊýTop5³ÇÊÐ·Ö²¼')

plt.xticks(np.arange(5),cities)

# ÎªÃ¿¸öÌõÐÎÍ¼Ìí¼ÓÊýÖµ±êÇ©

for x2020,y2020 in enumerate(Y2020):

plt.text(x2020-bar_width, y2020+100, '%s' %y2020)

for x2021,y2021 in enumerate(Y2021):

plt.text(x2021, y2021+100, '%s' %y2021)

plt.legend()

plt.show()





ÉÏÊö´úÂëµÄÖ´ÐÐ½á¹ûÈçÍ¼5.6ËùÊ¾¡£ 



Í¼5.6ÎÒ¹úTop5³ÇÊÐ¸»Ô£¼ÒÍ¥Êý·Ö²¼Öù×´Í¼


5.3.4¿Ì¶È±êÇ©ºÍÍ¼Àý

¶ÔÓÚ´ó¶àÊýµÄÍ¼±ê×°ÊÎÏî¶øÑÔ£¬ÆäÊµÏÖ·½Ê½Ö÷ÒªÓÐÁ½ÖÖ£¬¼´Ê¹ÓÃ¹ý³ÌÐÍµÄpyplot½Ó¿ÚºÍ¸üÎªÃæÏò¶ÔÏóµÄÔ­ÉúMatplotlib API¡£Éè¼Æpyplot½Ó¿ÚµÄÄ¿µÄ¾ÍÊÇÊµÏÖ½»»¥Ê½×÷ÓÃ£¬Ëüº¬ÓÐÖîÈçxlim()¡¢xticks()ºÍxticklabels()Ö®ÀàµÄ·½·¨£¬·Ö±ð¿ØÖÆÍ¼±íµÄ·¶Î§¡¢¿Ì¶ÈÎ»ÖÃºÍ¿Ì¶È±êÇ©µÈ¡£ÆäÊ¹ÓÃ·½Ê½ÓÐÒÔÏÂÁ½ÖÖ¡£

(1) µ÷ÓÃÊ±²»´ø²ÎÊý£¬Ôò·µ»Øµ±Ç°µÄ²ÎÊýÖµ¡£ÀýÈç£¬plt.xlim()·µ»Øµ±Ç°XÖáµÄ»æÍ¼·¶Î§¡£

(2) µ÷ÓÃÊ±´ø²ÎÊý£¬ÔòÉèÖÃ²ÎÊý¡£ÀýÈç£¬plt.xlim(£Û0,100£Ý)»á½«XÖáµÄ·¶Î§ÉèÖÃÎª0~100¡£

ÕâÐ©·½·¨¶¼ÊÇ¶Ôµ±Ç°»ò×î½ü´´½¨µÄAxesSubplotÆð×÷ÓÃ£¬ËüÃÇ¸÷×Ô¶ÔÓ¦subplot¶ÔÏóÉÏµÄÁ½¸ö·½·¨¡£ÒÔxlim()ÎªÀý£¬¾ÍÊÇax.get_xlim()ºÍax.set_xlim()¡£ÎªÁËËµÃ÷ÖáµÄ×Ô¶¨Òå£¬´´½¨Ò»¸ö¼òµ¥µÄÍ¼Ïñ²¢»æÖÆÒ»¶ÎËæ»úÂþ²½Í¼£¬ÈçÍ¼5.7ËùÊ¾¡£



In £Û37£Ý£º 

fig=plt.figure()

ax=fig.add_subplot(1,1,1)

ax.plot(randn(1000).cumsum())

Out£Û37£Ý: 







Í¼5.7Ëæ»úÂþ²½Í¼Àý


Èç¹ûÒªÐÞ¸ÄXÖá¿Ì¶È£¬×î¼òµ¥µÄ°ì·¨¾ÍÊÇÊ¹ÓÃset_xticks()ºÍset_xticklabels()¡£Ç°Õß¸æËßMatplotlibÒª½«¿Ì¶È·ÅÔÚÊý¾Ý·¶Î§ÖÐµÄÄÄÐ©Î»ÖÃ£¬ÔÚÄ¬ÈÏÇé¿öÏÂÕâÐ©Î»ÖÃÒ²¾ÍÊÇ¿Ì¶È±êÇ©¡£

5.3.5Ìí¼ÓÍ¼Àý

Í¼Àý(legend)ÊÇÁíÍâÒ»ÖÖÓÃÓÚ±íÊ¾Í¼±êÔªËØµÄÖØÒª¹¤¾ß¡£Ìí¼ÓÍ¼ÀýµÄ×î¼òµ¥µÄ·½Ê½£¬¾ÍÊÇÔÚÌí¼ÓsubplotÊ±´«Èëlabel²ÎÊý¡£



In £Û38£Ý£º 

fig=plt.figure()

ax=fig.add_subplot(1,1,1)

ax.plot(randn(1000).cumsum(),'k',label='one')





µ±ÐèÒª¶ÔÍ¼ÖÐµÄÏß½øÐÐ×¢½âÊ±£¬¿ÉÓÃÏÂÃæÕâÑùµÄ´úÂëÌí¼ÓÍ¼Àý¡£



In £Û39£Ý£º 

fig=plt.figure()

ax=fig.add_subplot(1,1,1)

ax.plot(randn(1000).cumsum(),'k',label='one')

ax.plot(randn(1000).cumsum(),'k--',label='two')

ax.plot(randn(1000).cumsum(),'k.',label='three')

ax.legend(loc='best')





Õâ¼¸ÐÐ´úÂëµÃµ½µÄÐ§¹ûÈçÍ¼5.8ËùÊ¾¡£ÓÃ»§¿ÉÒÔÍ¨¹ýloc²ÎÊýÀ´Ö¸¶¨Í¼ÀýËùÔÚµÄÎ»ÖÃ£¬'best'±íÊ¾Ëü»á×Ô¶¯ÕÒÒ»¸ö×î¼ÑÎ»ÖÃ¡£



Out£Û39£Ý: 







Í¼5.8ÔÚ×î¼ÑÎ»ÖÃÌí¼ÓÍ¼Àý


5.3.6½«Í¼±í±£´æµ½ÎÄ¼þ

ÀûÓÃplt.savefig()·½·¨¿ÉÒÔ½«µ±Ç°Í¼±í±£´æµ½ÎÄ¼þ¡£¸Ã·½·¨Ïàµ±ÓÚfigure¶ÔÏóµÄsavefig()ÊµÀý·½·¨¡£ÀýÈç£¬Òª½«Í¼±í±£´æÎªSVG¸ñÊ½ÎÄ¼þ£¬ÐèÒªÓÃÈçÏÂ´úÂë¡£



In £Û40£Ý£º 

plt.savefig('figpath.svg')





ÎÄ¼þÀàÐÍÊÇÍ¨¹ýÎÄ¼þÀ©Õ¹ÃûÍÆ¶Ï³öÀ´µÄ¡£Òò´Ë£¬Èç¹ûÓÃ»§Ê¹ÓÃµÄÊÇ.jpg£¬¾Í»áµÃµ½Ò»¸öJPG¸ñÊ½µÄÎÄ¼þ¡£ÔÚ·¢²¼Í¼Æ¬Ê±×î³£ÓÃµ½µÄÁ½¸öÑ¡ÏîÊÇdpi(¿ØÖÆ¡°Ã¿Ó¢´çµãÊý¡±)ºÍbbox_inches(¼ô³ýµ±Ç°Í¼±íÖÜÎ§µÄ¿Õ°×²¿·Ö)¡£Èç¹ûÓÃ»§ÏëµÃµ½Ò»¸öÖ¸¶¨·Ö±æÂÊµÄÎÄ¼þ£¬ÄÇÃ´¿ÉÒÔÓÃÏÂÃæµÄÓï¾ä¡£



In £Û41£Ý£º 

plt.savefig('figpath.svg', dpi=xxx, bbox_inches='tight')





dpi±íÊ¾ÏëÒªµÃµ½µÄ·Ö±æÂÊ£¬bbox_inches='tight'±íÊ¾µÃµ½µÄÍ¼Æ¬´øÓÐ×îÐ¡µÄ°×±ß¡£figure.savefig()·½·¨µÄ²ÎÊýËµÃ÷Èç±í5.5ËùÊ¾¡£


±í5.5figure.savefig()·½·¨µÄ²ÎÊýËµÃ÷




²ÎÊýËµÃ÷

fnameº¬ÓÐÎÄ¼þÂ·¾¶µÄ×Ö·û´®£¬»òÕßPythonµÄÎÄ¼þÐÍ¶ÔÏó£¬Í¼Ïñ¸ñÊ½ÓÉÎÄ¼þÀ©Õ¹ÃûÍÆ¶Ï¶ø³ö
dpiÍ¼ÏñµÄ·Ö±æÂÊ(Ã¿Ó¢´çµãÊý)£¬Ä¬ÈÏµÈÓÚ100
facecolorÍ¼ÏñµÄ±³¾°ÑÕÉ«£¬Ä¬ÈÏÎª°×É«
edgecolorÍ¼ÏñËÄÖÜµÄÑÕÉ«£¬Ä¬ÈÏÎª°×É«
formatÉèÖÃÎÄ¼þ¸ñÊ½£¬ÀýÈç£¬png¡¢pdf¡¢svg¡¢jpg¡­
bbox_inchesÍ¼ÏñÐèÒª±£´æµÄ²¿·Ö¡£Èç¹ûÉèÖÃÎª'tight'£¬Ôò»á³¢ÊÔ¼ôµôÍ¼ÏñÖÜÎ§µÄ¿Õ°×²¿·Ö


5.4SciPy

SciPy½¨Á¢ÔÚNumPy»ù´¡Ö®ÉÏ£¬¼¯³ÉÁËÖÚ¶àµÄÊýÑ§¡¢¿ÆÑ§¼°¹¤³Ì¼ÆËãÖÐ³£ÓÃ¿âº¯ÊýµÄPythonÄ£¿é£¬ÀýÈç£¬ÏßÐÔ´úÊý¡¢³£Î¢·Ö·½³ÌÊýÖµÇó½â¡¢ÐÅºÅ´¦Àí¡¢Í¼Ïñ´¦Àí¡¢Ï¡Êè¾ØÕóµÈ¡£Í¨¹ý¸øÓÃ»§Ìá¹©Ò»Ð©¸ß²ãµÄÃüÁîºÍÀà£¬SciPyÔÚPython½»»¥Ê½»á»°ÖÐ´ó´óÔö¼ÓÁË²Ù×÷ºÍ¿ÉÊÓ»¯Êý¾ÝµÄÄÜÁ¦¡£Í¨¹ýSciPy£¬PythonµÄ½»»¥Ê½»á»°±ä³ÉÁËÒ»¸öÊý¾Ý´¦ÀíºÍsystemª²prototypingµÄ»·¾³£¬×ãÒÔºÍMATLAB¡¢IDL¡¢Octave¡¢Rª²Lab¼°SciLab¿¹ºâ¡£

SciPyµÄ×ÓÄ£¿éº­¸ÇÁË²»Í¬¿ÆÑ§¼ÆËãÁìÓòµÄÄÚÈÝ£¬±í5.6¶ÔËüÃÇ½øÐÐÁË×Ü½á¡£


±í5.6SciPy×ÓÄ£¿éµÄÃèÊö




×ÓÄ£¿éÃèÊö

constansÎïÀíºÍÊýÑ§³£Êý
cluster¾ÛÀàËã·¨
fftpack¿ìËÙ¸µÀïÒ¶±ä»»³ÌÐò
integrate¼¯³ÉºÍ³£Î¢·Ö·½³ÌÇó½âÆ÷
interpolateÄâºÏºÍÆ½»¬ÇúÏß
ioÊäÈëºÍÊä³ö
linalgÏßÐÔ´úÊýÐø±í


×ÓÄ£¿éÃèÊö

maxentropy×î´óìØ·¨
ndimageNÎ¬Í¼Ïñ´¦Àí
odrÕý½»¾àÀë»Ø¹é
optimize×îÓÅÂ·¾¶Ñ¡Ôñ
signalÐÅºÅ´¦Àí
sparseÏ¡Êè¾ØÕó¼°Ïà¹Ø³ÌÐò
spatial¿Õ¼äÊý¾Ý½á¹¹ºÍËã·¨
specialÌØÊâº¯Êý
statesÍ³¼ÆÉÏµÄº¯ÊýºÍ·Ö²¼
weaveC/C++ÕûºÏ


ÀýÈç£¬ÓÃoptimizeÊµÏÖ×îÓÅ»¯¡£



In £Û42£Ý£º 

from scipy import *

import matplotlib.pyplot as plt

import numpy as np

from scipy import optimize

#×îÓÅ»¯ÎÊÌâ(Ñ°ÕÒº¯ÊýµÄ×î´óÖµ»ò×îÐ¡Öµ)ÊÇÊýÑ§ÖÐµÄÒ»´óÁìÓò£¬¸´ÔÓº¯ÊýµÄ×îÓÅ»¯ÎÊÌâ

#»ò¶à±äÁ¿µÄ×îÓÅ»¯ÎÊÌâ£¬¿ÉÄÜ»á·Ç³£¸´ÔÓ

x=linspace(-5, 3, 100)

def f(x):

return 4*x**3 + (x-2)**2 + x**4

#¾Ö²¿×îÐ¡Öµ

x_min_local=optimize.fmin_bfgs(f, 2)

print(x_min_local)

#È«¾Ö×îÐ¡Öµ

x_max_global=optimize.fminbound(f, -10, 10)

print(x_max_global)





5.5Scikitª²learn

Scikitª²learn(Sklearn)ÊÇPython»ùÓÚNumPy¡¢SciPy¡¢MatplotlibÊµÏÖ»úÆ÷Ñ§Ï°µÄËã·¨¿â£¬ Scikitª²learn¿âÊ¼ÓÚ2007ÄêµÄGoogle Summer of CodeÏîÄ¿£¬×î³õÓÉDavid Cournapeau¿ª·¢¡£ËüÊÇÒ»¸ö¼ò½à¡¢¸ßÐ§µÄËã·¨¿â£¬¿ÉÒÔÊµÏÖÊý¾ÝÔ¤´¦Àí¡¢·ÖÀà¡¢»Ø¹é¡¢½µÎ¬¡¢Ä£ÐÍÑ¡ÔñµÈ³£ÓÃµÄ»úÆ÷Ñ§Ï°Ëã·¨£¬ÒÔÓÃÓÚÊý¾ÝÍÚ¾òºÍÊý¾Ý·ÖÎö£¬¾ßÌåÄÚÈÝ¼ûµÚ10ÕÂ¡£Scikitª²learn¿â³£ÓÃÄ£¿é¿ò¼ÜÍ¼ÈçÍ¼5.9ËùÊ¾¡£



Í¼5.9Scikitª²learn¿â³£ÓÃÄ£¿é¿ò¼ÜÍ¼

±¾ÕÂÐ¡½á

±¾ÕÂ½éÉÜPythonÊý¾Ý·ÖÎöµÄ³£ÓÃ¿â£º  NumPyÊýÖµ¼ÆËã¿âÊÇÊý¾Ý·ÖÎöµÄ»ù´¡£¬Ëü½«Êý¾Ý×ª»»ÎªÊý×é½øÐÐ¼ÆËã£» PandasÊÇPythonÊý¾Ý·ÖÎöµÄ±ê×¼¿â£¬ÀïÃæ°üº¬ÁËºÜ¶àÊý¾Ý·ÖÎöµÄ¹¤¾ß£» MatplotlibÊÇ½«Êý¾Ý¿ÉÊÓ»¯µÄ¿â£¬¿ÉÒÔÈÃÓÃ»§¶ÔÊý¾ÝÓÐÒ»¸ö¸ü¼ÓÖ±¹Û¡¢ÇåÎúµÄÈÏÊ¶£» SciPyÊÇÒ»¸ö»ùÓÚNumPyµÄ¼¯³ÉÊýÑ§¼ÆËã¿â£» Scikitª²learnÊÇÒ»¸ö¼¯³ÉÁËºÜ¶à»úÆ÷Ñ§Ï°Ëã·¨µÄ¿â¡£

±¾ÕÂÏ°Ìâ

1. ´´½¨Ò»¸ö³¤¶ÈÎª10µÄÒ»Î¬µÄÈ«Îª0µÄndarray¶ÔÏó£¬È»ºóÈÃµÚ3¸öÔªËØµÈÓÚ5¡£

2.  ÀûÓÃMatplotlib»­³öÒ»¸ö1000²½µÄËæ»úÂþ²½£¨random walk£©µÄÍ¼Àý£¬Í¨¹ýset_xticks()ºÍset_xticklabels()½«Æä·ÅÔÚ×î¼ÑÎ»ÖÃ¡£

3. ¸ù¾ÝÈçÏÂÔ­Ê¼Êý¾Ý¼¯raw_dataÉú³ÉÒ»¸öDataFrame£¬²¢½«Æä¸³Öµ¸ø±äÁ¿army¡£

raw_data={'regiment': £Û'Nighthawks', 'Nighthawks', 'Nighthawks', 'Nighthawks', 'Dragoons', 'Dragoons', 'Dragoons', 'Dragoons', 'Scouts', 'Scouts', 'Scouts', 'Scouts'£Ý,'company': £Û'1st', '1st', '2nd', '2nd', '1st', '1st', '2nd', '2nd','1st', '1st', '2nd', '2nd'£Ý,'deaths': £Û523, 52, 25, 616, 43, 234, 523, 62, 62, 73, 37, 35£Ý,'battles': £Û5, 42, 2, 2, 4, 7, 8, 3, 4, 7, 8, 9£Ý,'size': £Û1045, 957, 1099, 1400, 1592, 1006, 987, 849, 973, 1005, 1099, 1523£Ý,'veterans': £Û1, 5, 62, 26, 73, 37, 949, 48, 48, 435, 63, 345£Ý,'readiness': £Û1, 2, 3, 3, 2, 1, 2, 3, 2, 1, 2, 3£Ý,'armored': £Û1, 0, 1, 1, 0, 1, 0, 1, 0, 0, 1, 1£Ý,'deserters': £Û4, 24, 31, 2, 3, 4, 24, 31, 2, 3, 2, 3£Ý,'origin': £Û'Arizona', 'California', 'Texas', 'Florida', 'Maine', 'Iowa', 'Alaska', 'Washington', 'Oregon', 'Wyoming', 'Louisana', 'Georgia'£Ý}