µÚ5 ÕÂ
Pandas Êý¾Ý»ñÈ¡ÓëÇåÏ´ 
¶ÔÓÚÊý¾Ý·ÖÎö¶øÑÔ,Êý¾Ý´ó²¿·ÖÀ´Ô´ÓÚÍâ²¿Êý¾Ý,Èç³£ÓÃµÄCSV ÎÄ¼þ¡¢ExcelÎÄ¼þºÍÊý
¾Ý¿âÎÄ¼þµÈ¡£Pandas¿â½«Íâ²¿Êý¾Ý×ª»»ÎªDataFrameÊý¾Ý¸ñÊ½,´¦ÀíÍê³ÉºóÔÙ´æ´¢µ½ÏàÓ¦
µÄÍâ²¿ÎÄ¼þÖÐ¡£
Ç°ÆÚ²É¼¯µ½µÄÊý¾Ý,»ò¶à»òÉÙ¶¼´æÔÚÒ»Ð©è¦´ÃºÍ²»×ã,ÈçÊý¾ÝÈ±Ê§¡¢¼«¶ËÖµ¡¢Êý¾Ý¸ñÊ½²»
Í³Ò»µÈÎÊÌâ¡£Êý¾ÝÔ¤´¦Àí²»½ö¿ÉÒÔÌá¸ß³õÊ¼Êý¾ÝµÄÖÊÁ¿,±£ÁôÓë·ÖÎöÄ¿±êÁªÏµ½ôÃÜµÄÊý¾Ý, 
¶øÇÒ¿ÉÒÔÓÅ»¯Êý¾ÝµÄ±íÏÖÐÎÊ½,ÓÐÖúÓÚÌá¸ßÊý¾Ý·ÖÎö»òÊý¾ÝÍÚ¾ò¹¤×÷µÄÐ§ÂÊºÍ×¼È·ÂÊ¡£
Êý¾ÝÇåÏ´Ö÷ÒªÊÇ½«¡°Ôà¡±Êý¾Ý±ä³É¡°¸É¾»¡±Êý¾ÝµÄ¹ý³Ì,¸Ã¹ý³ÌÖÐ»áÍ¨¹ýÒ»ÏµÁÐµÄ·½·¨¶Ô
¡°Ôà¡±Êý¾Ý½øÐÐ´¦Àí,ÒÔ´ïµ½Çå³ýÈßÓàÊý¾Ý¡¢¹æ·¶Êý¾Ý¡¢¾ÀÕý´íÎóÊý¾ÝµÄÄ¿µÄ¡£
½ÓÏÂÀ´,±¾½Ú½«Õë¶ÔPandasÖÐÊý¾Ý»ñÈ¡¡¢ÇåÏ´Óë¸ñÊ½»¯´¦ÀíµÄÄÚÈÝ½øÐÐÏêÏ¸½²½â¡£
5.1 Êý¾Ý»ñÈ¡²Ù×÷
ÔÚ¶ÔÊý¾Ý½øÐÐ·ÖÎöÊ±,Í¨³£²»»á½«ÐèÒª·ÖÎöµÄÊý¾ÝÖ±½ÓÐ´Èë³ÌÐòÖÐ,ÕâÑù²»½öÔì³É³ÌÐò
´úÂëÓ·Ö×,¶øÇÒ¿ÉÓÃÂÊºÜµÍ¡£³£ÓÃµÄ·½·¨ÊÇ½«ÐèÒª·ÖÎöµÄÊý¾Ý´æ´¢µ½±¾µØ,Ö®ºóÔÙ¶Ô´æ´¢ÎÄ
¼þ½øÐÐ¶ÁÈ¡¡£
³õÊ¼Êý¾Ý»ñÈ¡ÊÇÔ¤´¦ÀíµÄµÚÒ»²½,¸Ã²½ÖèÖ÷Òª¸ºÔð´ÓÎÄ¼þ¡¢Êý¾Ý¿â¡¢ÍøÒ³µÈÖÚ¶àÇþµÀÖÐ
»ñÈ¡Êý¾Ý,ÒÔµÃµ½Ô¤´¦ÀíµÄ³õÊ¼Êý¾Ý,ÎªºóÐøµÄ´¦Àí¹¤×÷×öºÃÊý¾Ý×¼±¸¡£
Õë¶Ô²»Í¬µÄ´æ´¢ÎÄ¼þ,Pandas¶ÁÈ¡Êý¾ÝµÄ·½Ê½ÊÇ²»Í¬µÄ¡£Pandas½«Êý¾Ý¼ÓÔØµ½
DataFrameºó,¾Í¿ÉÒÔÊ¹ÓÃDataFrame¶ÔÏóµÄÊôÐÔºÍ·½·¨½øÐÐ²Ù×÷¡£ÕâÐ©²Ù×÷ÓÐµÄÊÇÍê³É
Êý¾Ý·ÖÎöÖÐµÄ³£¹æÍ³¼Æ¹¤×÷,ÓÐµÄÊÇ¶ÔÊý¾ÝµÄ¼Ó¹¤´¦Àí¡£
½ÓÏÂÀ´,±¾½Ú½«Õë¶Ô³£ÓÃ´æ´¢¸ñÊ½ÎÄ¼þµÄ¶ÁÐ´½øÐÐ½éÉÜ¡£
5.1.1 ¶ÁÈ¡ÎÄ±¾(CSV ºÍTXT)ÎÄ¼þ
ÎÄ±¾ÎÄ¼þÊÇÒ»ÖÖÓÉÈô¸ÉÐÐ×Ö·û¹¹³ÉµÄ¼ÆËã»úÎÄ¼þ,ËüÊÇÒ»ÖÖµäÐÍµÄË³ÐòÎÄ¼þ¡£CSV 
(Comma-SeparatedValues)ÊÇÒ»ÖÖ¶ººÅ·Ö¸ôµÄÎÄ¼þ¸ñÊ½,ÒòÎªÆä·Ö¸ô·û²»Ò»¶¨ÊÇ¶ººÅ,ÓÖ±»
³ÆÎª×Ö·û·Ö¸ôÎÄ¼þ,ÎÄ¼þÒÔ´¿ÎÄ±¾ÐÎÊ½´æ´¢±í¸ñÊý¾Ý(Êý×ÖºÍÎÄ±¾)¡£CSV ²»½ö¿ÉÒÔÊÇÒ»¸ö
ÊµÌåÎÄ¼þ,»¹¿ÉÒÔÊÇ×Ö·ûÐÎÊ½(ÈçURL+data.csv),ÒÔ±ãÓÚÔÚÍøÂçÉÏ´«Êä¡£
CSV ÎÄ¼þÊÇÒ»ÖÖ´¿ÎÄ±¾ÎÄ¼þ,¿ÉÒÔÊ¹ÓÃÈÎºÎÎÄ±¾±à¼­Æ÷½øÐÐ±à¼­,ËüÖ§³Ö×·¼ÓÄ£Ê½,½Ú
Ê¡ÄÚ´æ¿ªÏú¡£ÒòÎªCSV ÎÄ¼þ¾ßÓÐÖî¶àµÄÓÅµã,ËùÒÔÔÚºÜ¶àÊ±ºò»á½«Êý¾Ý±£´æµ½CSV ÎÄ
¼þÖÐ¡£
CSV ²»´øÊý¾ÝÑùÊ½,±ê×¼»¯½ÏÇ¿,ÊÇ×îÎª³£¼ûµÄÊý¾Ý¸ñÊ½¡£

1 24 Python ´óÊý¾Ý·ÖÎöÓë¿ÉÊÓ»¯
PandasÖÐÌá¹©ÁËread_csv()º¯ÊýÓÃÓÚ¶ÁÈ¡CSV ÎÄ¼þ,¹ØÓÚËüÃÇµÄ¾ßÌå½éÉÜÈçÏÂ¡£
1.Í¨¹ýread_csv()º¯Êý¶ÁÈ¡CSV ÎÄ¼þµÄÊý¾Ý
read_csv()º¯ÊýµÄ×÷ÓÃÊÇ½«CSV ÎÄ¼þµÄÊý¾Ý¶ÁÈ¡³öÀ´,²¢×ª»»³ÉDataFrame¶ÔÏó¡£
read_csv()º¯ÊýµÄÓï·¨¸ñÊ½ÈçÏÂ¡£ 
read_csv(filepath_or_buffer,sep= ',', delimiter= None, header= 'infer', names= 
None, index_col=None, usecols=None, prefix=None,nrows=None, ¡­) 
²ÎÊýËµÃ÷ÈçÏÂ¡£
.filepath_or_buffer:±íÊ¾ÎÄ¼þÂ·¾¶,¿ÉÒÔÎªURL×Ö·û´®¡£Ã»ÓÐÄ¬ÈÏÖµ,Ò²²»ÄÜÎª¿Õ, 
¸ù¾ÝPythonµÄÓï·¨,µÚÒ»¸ö²ÎÊý´«²ÎÊ±¿ÉÒÔ²»Ð´²ÎÊýÃû¡£
.sep:½ÓÊÕstring,´ú±íÃ¿ÐÐÊý¾ÝÄÚÈÝµÄ·Ö¸ô·û¡£read_csvÄ¬ÈÏÎª¡°,¡±,read_tableÄ¬
ÈÏÎªÖÆ±í·û¡°[Tab]¡±,Èç¹û·Ö¸ô·ûÖ¸¶¨´íÎó,ÔÚ¶ÁÈ¡Êý¾ÝµÄÊ±ºò,Ã¿Ò»ÐÐÊý¾Ý½«Á¬³É
Ò»Æ¬¡£read_csv()º¯Êý»¹Ìá¹©ÁËÒ»¸ö²ÎÊýÃûÎªdelimiterµÄ¶¨½ç·û,ÕâÊÇÒ»¸ö±¸Ñ¡·Ö
¸ô·û,ÊÇsepµÄ±ðÃû,Ð§¹ûºÍsepÒ»Ñù¡£Èç¹ûÖ¸¶¨¸Ã²ÎÊý,Ôòsep²ÎÊýÊ§Ð§¡£³£¼û²Î
ÊýµÄÓÐÒÔÏÂÐÎÊ½¡£ 
pd.read_csv(r'./data.csv',sep='\t') #Ö¸¶¨ÖÆ±í·û·Ö¸ôTab 
pd.read_csv(r'./data.csv',sep='(? <!a)\|(? !1)',engine='python') 
#Ê¹ÓÃÕýÔò±í´ïÊ½
. header:Ö¸¶¨ÐÐÊý×÷ÎªÁÐÃû,Ö¸¶¨µÚ¼¸ÐÐÊÇ±íÍ·,Ä¬ÈÏ»á×Ô¶¯ÍÆ¶Ï°ÑµÚÒ»ÐÐ×÷Îª±í
Í·¡£³£¼û²ÎÊýÓÐÒÔÏÂÐÎÊ½¡£ 
pd.read_csv(r'./data.csv',header=0) #µÚÒ»ÐÐ
pd.read_csv(r'./data.csv',header=None) #Ã»ÓÐ±íÍ·
pd.read_csv(r'./data.csv',header=[0,1,3]) #¶à²ãË÷ÒýMulitIndex 
. names:Ö¸¶¨ÁÐµÄÃû³Æ,ÊÇÒ»¸öÀàËÆÁÐ±íµÄÐòÁÐ,ÓëÊý¾ÝÒ»Ò»¶ÔÓ¦¡£Èç¹ûÎÄ¼þ²»°üº¬
ÁÐÃû,Ó¦¸ÃÉèÖÃheader=None¡£ÁÐÃûÁÐ±íÖÐ²»ÔÊÐíÓÐÖØ¸´Öµ¡£³£¼û²ÎÊýÓÐÒÔÏÂ
ÐÎÊ½¡£ 
pd.read_csv(r'./data.csv',names=['ÁÐÃû_1','ÁÐÃû_']) #Ö¸¶¨ÁÐÃû
.index_col:Ö¸¶¨Ë÷ÒýÁÐ,¿ÉÒÔÊÇÐÐË÷ÒýµÄÁÐ±àºÅ»òÕßÁÐÃû,½ÓÊÕint¡¢sequence»ò
False,±íÊ¾Ë÷ÒýÁÐµÄÎ»ÖÃ¡£ÈôÈ¡ÖµÎªsequenceÔò´ú±í¶àÖØË÷Òý,Ä¬ÈÏÎªNone¡£Èç
¹û¸ø¶¨Ò»¸öÐòÁÐ,ÔòÓÐ¶à¸öÐÐË÷Òý¡£Pandas²»»á×Ô¶¯½«µÚÒ»ÁÐ×÷ÎªË÷Òý,²»Ö¸¶¨Ê±
»á×Ô¶¯Ê¹ÓÃÒÔ0¿ªÊ¼µÄ×ÔÈ»Ë÷Òý¡£³£¼û²ÎÊýÓÐÒÔÏÂÐÎÊ½¡£ 
pd.read_csv(r'./data.csv',index_col=False) #²»ÔÙÊ¹ÓÃÊ×ÁÐ×÷ÎªË÷Òý
pd.read_csv(r'./data.csv',index_col=0) #µÚ¼¸ÁÐ×÷ÎªË÷Òý
pd.read_csv(r'./data.csv',index_col='ÁÐÃû') #Ö¸¶¨ÁÐÃû×÷ÎªË÷Òý
pd.read_csv(r'./data.csv',index_col=['ÁÐÃû1','ÁÐÃû2']) #¶à¸öË÷Òý
pd.read_csv(r'./data.csv',index_col=[0,3]) #°´ÁÐË÷ÒýÖ¸¶¨¶à¸öË÷Òý
. Èç¹ûÖ»Ê¹ÓÃÊý¾ÝµÄ²¿·ÖÁÐ,¿ÉÒÔÓÃusecolsÀ´Ö¸¶¨,ÕâÑù¿ÉÒÔ¼Ó¿ì¼ÓÔØËÙ¶È²¢½µµÍÄÚ
´æÏûºÄ¡£³£¼û²ÎÊýÓÐÒÔÏÂÐÎÊ½¡£ 
pd.read_csv(r'./data.csv',usecols=[1,5,2]) #°´ÕÕË÷ÒýÖ»¶ÁÈ¡Ö¸¶¨ÁÐ,ÓëË³ÐòÎÞ¹Ø
pd.read_csv(r'./data.csv',usecols=['ÁÐÃû1','ÁÐÃû3','ÁÐÃû2']) 
#°´ÁÐÃû,ÁÐÃû±ØÐë´æÔÚ
. nrows:Ö¸¶¨ÐèÒª¶ÁÈ¡µÄÐÐÊý,´ÓÎÄ¼þµÚÒ»ÐÐËãÆð,¾­³£ÓÃÓÚ½Ï´óµÄÊý¾Ý,ÏÈÈ¡²¿·Ö

µÚ5 ÕÂ¡¡Pandas Êý¾Ý»ñÈ¡ÓëÇåÏ´1 25 
Êý¾Ý½øÐÐ´úÂë±àÐ´¡£
ÐèÒª×¢ÒâµÄÊÇ,ÔÚ¶ÁÈ¡ÎÄ¼þÊ±,Èç¹û´«ÈëµÄÊÇÎÄ¼þµÄÂ·¾¶,¶ø²»ÊÇÎÄ¼þÃû,Ôò»á³öÏÖ±¨
´í,¾ßÌåµÄ½â¾ö·½·¨ÊÇÏÈÇÐ»»µ½¸ÃÎÄ¼þµÄÄ¿Â¼ÏÂ,Ê¹ÓÃOSÄ£¿é»ñÈ¡¸ÃÎÄ¼þµÄÎÄ¼þÃû¡£
Ò»°ãÇé¿öÏÂ,»á½«¶ÁÈ¡µ½µÄÊý¾Ý·µ»ØÒ»¸öDataFrame¡£
¡¾Àý5-1¡¿ ¶ÁÈ¡¡°¼ÇÕËÆ¾Ö¤Çåµ¥.csv¡±ÎÄ¼þ¡£ 
import pandas as pd 
pd.set_option('display.unicode.east_asian_width',True) 
#¶ÁÈ¡Ö¸¶¨Ä¿Â¼ÏÂµÄcsv ¸ñÊ½µÄÎÄ¼þ
df=pd.read_csv(r'./¼ÇÕËÆ¾Ö¤Çåµ¥.csv',encoding='gbk') 
print(df.head()) #Êä³öÇ°5 Ìõ
ÔËÐÐ½á¹û: 
Æ¾Ö¤ºÅÄêÔÂÈÕ... ¿ÆÄ¿Ãû³ÆÃ÷Ï¸¿ÆÄ¿Ãû³Æ½ð¶î·½Ïò½ð¶î
0 1 2013 1 5 ... ÒøÐÐ´æ¿îNaN ½è·½½ð¶î5,151,450.00 
1 1 2013 1 5 ... ÊµÊÕ×Ê±¾NaN ´û·½½ð¶î5,151,450.00 
2 2 2013 1 7 ... ÏúÊÛ·ÑÓÃ²îÂÃ·Ñ½è·½½ð¶î4,200.00 
3 2 2013 1 7 ... ¿â´æÏÖ½ðNaN ´û·½½ð¶î1,200.00 
4 2 2013 1 7 ... ÆäËûÓ¦ÊÕ¿îNaN ´û·½½ð¶î3,000.00 
[5 rows x 10 columns] 
ÔÚÉÏÊö´úÂëÖÐÖ¸¶¨ÁË±àÂë¸ñÊ½,¼´encoding='gbk'¡£Python³£ÓÃµÄ±àÂë¸ñÊ½ÊÇUTF-8 
ºÍGBK¸ñÊ½,Ä¬ÈÏ±àÂë¸ñÊ½ÎªUTF-8¡£¶ÁÈ¡.csvÎÄ¼þÊ±,ÐèÒªÍ¨¹ýencoding²ÎÊýÖ¸¶¨±àÂë
¸ñÊ½¡£
2.¶ÁÈ¡.txtÎÄ¼þ¸ñÊ½
Text¸ñÊ½µÄÎÄ¼þÒ²ÊÇ±È½Ï³£¼ûµÄ´æ´¢Êý¾ÝµÄ·½Ê½,À©Õ¹ÃûÎª¡°.txt¡±,ËüÓëÉÏÃæÌáµ½µÄ
CSV ÎÄ¼þ¶¼ÊôÓÚÎÄ±¾ÎÄ¼þ¡£Èç¹ûÏ£Íû¶ÁÈ¡TextÎÄ¼þ,¼È¿ÉÒÔÊ¹ÓÃÇ°ÃæÌáµ½µÄread_csv() 
º¯Êý,Ò²¿ÉÒÔÊ¹ÓÃread_table()º¯Êý¡£¶ÁÈ¡Ê±ÐèÒªÖ¸¶¨sep²ÎÊý(ÈçÖÆ±í·û\t)¡£
read_table()º¯ÊýµÄÓï·¨¸ñÊ½ÈçÏÂ¡£ 
read_table(filepath_or_buffer,sep= '\t', delimiter= None, header= 'infer', names 
=None, index_col=None, usecols=None, prefix=None, ¡­) 
²ÎÊýËµÃ÷Í¬read_csv()º¯ÊýµÄ²ÎÊý¡£
¡¾Àý5-2¡¿ ¶ÁÈ¡¡°¼ÇÕËÆ¾Ö¤Çåµ¥.txt¡±ÎÄ¼þ¡£ 
import pandas as pd 
pd.set_option('display.unicode.east_asian_width',True) 
#¶ÁÈ¡Ö¸¶¨Ä¿Â¼ÏÂµÄcsv ¸ñÊ½µÄÎÄ¼þ
df=pd.read_csv(r'./¼ÇÕËÆ¾Ö¤Çåµ¥.txt',sep='\t',encoding='gbk') 
print(df.head()) #Êä³öÇ°5 Ìõ
ÔËÐÐ½á¹û: 
Æ¾Ö¤ºÅÄêÔÂÈÕ... ¿ÆÄ¿Ãû³ÆÃ÷Ï¸¿ÆÄ¿Ãû³Æ½ð¶î·½Ïò½ð¶î
0 1 2013 1 5 ... ÒøÐÐ´æ¿îNaN ½è·½½ð¶î5,151,450.00 
1 1 2013 1 5 ... ÊµÊÕ×Ê±¾NaN ´û·½½ð¶î5,151,450.00 
2 2 2013 1 7 ... ÏúÊÛ·ÑÓÃ²îÂÃ·Ñ½è·½½ð¶î4,200.00 
3 2 2013 1 7 ... ¿â´æÏÖ½ðNaN ´û·½½ð¶î1,200.00 
4 2 2013 1 7 ... ÆäËûÓ¦ÊÕ¿îNaN ´û·½½ð¶î3,000.00 
[5 rows x 10 columns]

1 26 Python ´óÊý¾Ý·ÖÎöÓë¿ÉÊÓ»¯
×¢Òâ:read_csv()º¯ÊýÓëread_table()º¯ÊýµÄÇø±ðÔÚÓÚÊ¹ÓÃµÄ·Ö¸ô·û²»Í¬,Ç°ÕßÊ¹ÓÃ
¡°,¡±×÷Îª·Ö¸ô·û,¶øºóÕßÊ¹ÓÃ¡°\t¡±×÷Îª·Ö¸ô·û¡£
5.1.2 ¶ÁÈ¡Excel ÎÄ¼þ
ExcelÎÄ¼þÒ²ÊÇ±È½Ï³£¼ûµÄÓÃÓÚ´æ´¢Êý¾ÝµÄ·½Ê½,ËüÀïÃæµÄÊý¾Ý¾ùÊÇÒÔ¶þÎ¬±í¸ñµÄÐÎ
Ê½ÏÔÊ¾µÄ¡£´ÓÄÚÈÝ½Ç¶ÈÀ´Ëµ,Excel¿ÉÒÔ·ÖÎªÒÔÎÄ×ÖÎªÖ÷µÄÎÄ×Ö»òÕßÐÅÏ¢½á¹¹»¯ºÍÒÔÊý×Ö
ÎªºËÐÄµÄÍ³¼Æ±¨±í,Òò´Ë¿ÉÒÔ¶ÔÊý¾Ý½øÐÐÍ³¼Æ¡¢·ÖÎöµÈ²Ù×÷¡£
ExcelµÄÎÄ¼þÀ©Õ¹ÃûÓÐ.xlsºÍ.xlsxÁ½ÖÖ¡£PandasÖÐÌá¹©ÁË¶ÔExcelÎÄ¼þ½øÐÐ¶ÁÈ¡²Ù×÷
µÄ·½·¨Îªread_excel()º¯Êý,¹ØÓÚËüÃÇµÄ²Ù×÷¾ßÌåÈçÏÂ¡£
1.Ê¹ÓÃread_excel()º¯Êý¶ÁÈ¡ExcelÎÄ¼þ
read_excel()º¯ÊýµÄ×÷ÓÃÊÇ½«ExcelÎÄ¼þÖÐµÄÊý¾Ý¶ÁÈ¡³öÀ´,²¢×ª»»³ÉDataFrame¶Ô
Ïó,ÆäÓï·¨¸ñÊ½ÈçÏÂ¡£ 
pandas.read_excel(io,sheet_name=0,header=0,names=None,index_col=None,**kwds) 
²ÎÊýËµÃ÷ÈçÏÂ¡£
.io:½ÓÊÕ×Ö·û´®,±íÊ¾.xls»ò.xlsxÎÄ¼þÂ·¾¶»òÀàÎÄ¼þ¶ÔÏó¡£
.sheet_name:Ö¸¶¨Òª¶ÁÈ¡µÄ¹¤×÷±í,¿É½ÓÊÕNone¡¢×Ö·û´®¡¢ÕûÊý¡¢×Ö·û´®ÁÐ±í»òÕûÊý
ÁÐ±í,Ä¬ÈÏÎª0(±íÊ¾µÚÒ»¸öSheetÒ³ÖÐµÄÊý¾Ý×÷ÎªDataFrame¶ÔÏó),ÆäËû²ÎÊýÖµÇë
¼û±í5-1¡£×Ö·û´®Ö¸¹¤×÷±íÃû³Æ;ÕûÊýÀàÐÍÎªË÷Òý,±íÊ¾¹¤×÷±íÎ»ÖÃ;×Ö·û´®ÁÐ±í»ò
ÕûÊýÁÐ±íÓÃÓÚÇëÇó¶à¸ö¹¤×÷±í;ÎªNoneÊ±Ôò»ñÈ¡ËùÓÐµÄ¹¤×÷±í¡£
±í5-1 sheet_name²ÎÊýÖµ¼°ËµÃ÷
ÖµËµ Ã÷
sheet_name=0 µÚÒ»¸öSheetÒ³ÖÐµÄÊý¾Ý×÷ÎªDataFrame¶ÔÏó
sheet_name=1 µÚ¶þ¸öSheetÒ³ÖÐµÄÊý¾Ý×÷ÎªDataFrame¶ÔÏó
sheet_name="Sheet1" ÃûÎª¡°Sheet1¡±µÄSheetÒ³ÖÐµÄÊý¾Ý×÷ÎªDataFrame¶ÔÏó
sheet_name=[0,1,"Sheet3"] µÚÒ»¸ö¡¢µÚ¶þ¸öºÍÃûÎª¡°Sheet3¡±µÄSheetÒ³ÖÐµÄÊý¾Ý×÷ÎªDataFrame 
¶ÔÏó 
. header:Ö¸¶¨×÷ÎªÁÐÃûµÄÐÐ,Ä¬ÈÏÎª0,¼´È¡µÚÒ»ÐÐµÄÖµÎªÁÐÃû¡£Êý¾ÝÎª³ýÁÐÃûÒÔÍâ
µÄÊý¾Ý;ÈôÊý¾Ý²»°üÀ¨ÁÐÃû,ÔòÉèÖÃÎªheader=None¡£
. names:Ä¬ÈÏÎªNone,±íÊ¾ÒªÊ¹ÓÃµÄÁÐÃûÁÐ±í¡£Èç²»Ö¸¶¨,Ä¬ÈÏÎª±íÍ·µÄÃû³Æ¡£
.index_col:Ö¸¶¨ÁÐÎªË÷ÒýÁÐ,Ä¬ÈÏÎªNone,Ë÷Òý0ÊÇDataFrame¶ÔÏóµÄÐÐ±êÇ©¡£
ÌØ±ðÌáÐÑ,µ±Ê¹ÓÃread_excel()º¯Êý¶ÁÈ¡ExcelÎÄ¼þÊ±,Èô³öÏÖimportErrorÒì³£,ËµÃ÷
µ±Ç°Python»·¾³ÖÐÈ±ÉÙ¶ÁÈ¡ExcelÎÄ¼þµÄÒÀÀµ¿âxlrd,ÐèÒªÊÖ¶¯°²×°ÒÀÀµ¿âxlrd(pip 
installxlrd)½øÐÐ½â¾ö¡£
2.¶ÁÈ¡Ö¸¶¨SheetÒ³µÄÊý¾Ý
Ò»¸öExcelÎÄ¼þÓÐÊ±»á°üº¬¶à¸öSheetÒ³,Í¨¹ýÉèÖÃsheet_name²ÎÊý¾Í¿ÉÒÔ¶ÁÈ¡Ö¸¶¨
SheetÒ³µÄÊý¾Ý¡£
¡¾Àý5-3¡¿ Í¨¹ýread_excel()º¯Êý¶ÁÈ¡¡°¸ßÖÐ°àÑ§Éú³É¼¨.xlsx¡±ÎÄ¼þÖÐ¡°¸ßÒ»(1)°à³É¼¨¡±

µÚ5 ÕÂ¡¡Pandas Êý¾Ý»ñÈ¡ÓëÇåÏ´1 27 
SheetµÄÊý¾Ý¡£ 
import pandas as pd 
#½â¾öÊý¾ÝÊä³öÊ±ÁÐÃû²»¶ÔÆëµÄÎÊÌâ
pd.set_option('display.unicode.east_asian_width',True) 
df=pd.read_excel(r'./¸ßÖÐ°àÑ§Éú³É¼¨.xlsx',sheet_name='¸ßÒ»(1)°à³É¼¨') 
print(df.head()) #Êä³öÇ°5 Ìõ
ÔËÐÐ½á¹û: 
Ñ§ºÅÐÕÃûÓïÎÄÊýÑ§Ó¢ÓïÎïÀí»¯Ñ§µØÀíÀúÊ·
0 G210101 ÉêÖ¾·²99.0 98 101.0 95 91 95 78 
1 G210102 ·ëÄ¬·ç78.0 95 94.0 82 90 93 94 
2 G210103 Ê¯Ë«Ó¢84.0 100 97.0 87 78 89 93 
3 G210104 Ê·²®Íþ101.0 110 102.0 93 95 92 88 
4 G210105 Íõ¼Ò¿¥91.5 89 94.0 92 91 86 86 
³ýÁËÖ¸¶¨SheetÒ³µÄÃû×Ö,»¹¿ÉÒÔÖ¸¶¨SheetÒ³µÄË³Ðò,´Ó0¿ªÊ¼¡£ÀýÈç,¡°sheet_name 
=0¡±±íÊ¾¶ÁÈ¡µÚÒ»¸öSheetÒ³µÄÊý¾Ý;¡°sheet_name=1¡±±íÊ¾µ¼ÈëµÚ¶þ¸öSheetÒ³µÄÊý¾Ý, 
ÒÔ´ËÀàÍÆ¡£
Èç¹û²»Ö¸¶¨sheet_name²ÎÊý,ÔòÄ¬ÈÏµ¼ÈëµÚÒ»¸öSheetÒ³µÄÊý¾Ý¡£
ÌØ±ðÌáÐÑ,ÔÚ¶ÁÈ¡ÎÄ¼þÊ±,Òª×¢Òâ¾ø¶ÔÂ·¾¶ºÍÏà¶ÔÂ·¾¶µÄÎÊÌâ¡£ÔÚPythonÖÐÔòÐèÒªÔÚ
Â·¾¶Ç°Ãæ¼ÓÒ»¸ö¡°r¡±,ÒÔ±ÜÃâÂ·¾¶ÀïµÄ·´Ð±¸Ü¡°\¡±±»×ªÒå¡£
3.Í¨¹ýÐÐÁÐË÷Òý¶ÁÈ¡Ö¸¶¨ÐÐÁÐÊý¾Ý
DataFrameÊÇ¶þÎ¬Êý¾Ý½á¹¹,Òò´ËËü¼ÈÓÐÐÐË÷ÒýÓÖÓÐÁÐË÷Òý¡£µ±¶ÁÈ¡ExcelÎÄ¼þÊ±,ÐÐ
Ë÷Òý»á×Ô¶¯Éú³É,Èç0,1,2,¡­,¶øÁÐË÷ÒýÔòÄ¬ÈÏ½«µÚ0ÐÐ×÷ÎªÁÐË÷Òý¡£
Èç¹ûÍ¨¹ýÖ¸¶¨ÐÐË÷Òý¶ÁÈ¡ExcelÎÄ¼þ,ÔòÐèÒªÉèÖÃindex_col²ÎÊý¡£
Ò»¸öExcel±íÓÐ¶àÁÐÊý¾Ý,ÈôÖ»ÐèÆäÖÐ¼¸ÁÐÊý¾Ý,¿ÉÒÔÍ¨¹ýusecols²ÎÊýÖ¸¶¨ÐèÒªµÄÁÐ, 
Ò»°ã´Ó0¿ªÊ¼(±íÊ¾µÚ1ÁÐ,ÒÔ´ËÀàÍÆ)¡£Èç¹ûµ¼Èë¶àÁÐ,Ôò¿ÉÒÔÔÚÁÐ±íÖÐÖ¸¶¨¶à¸öÖµ,Ò²¿É
ÒÔÖ¸¶¨ÁÐÃû³Æ(ÒªÃ´¶¼ÎªÖµ,ÒªÃ´¶¼ÎªÁÐÃû³Æ)¡£
¡¾Àý5-4¡¿ ÒÔµÚ0ÁÐ×÷ÎªÐÐË÷Òý,Ñ¡È¡ÐÕÃû¡¢ÊýÑ§ºÍÎïÀíÁÐÊý¾Ý¡£ 
import pandas as pd 
#½â¾öÊý¾ÝÊä³öÊ±ÁÐÃû²»¶ÔÆëµÄÎÊÌâ
pd.set_option('display.unicode.east_asian_width',True) 
df=pd.read_excel(r'./¸ßÖÐ°àÑ§Éú³É¼¨.xlsx',sheet_name='¸ßÒ»(1)°à³É¼¨',index_col= 
0,usecols=[0,1,3,5]) #ÉèÖÃ"Ñ§ºÅ"ÎªÐÐË÷Òý
print(df.head()) #Êä³öÇ°5 Ìõ
ÔËÐÐ½á¹û: 
Ñ§ºÅÐÕÃûÊýÑ§ÎïÀí
G210101 ÉêÖ¾·²98 95 
G210102 ·ëÄ¬·ç95 82 
G210103 Ê¯Ë«Ó¢100 87 
G210104 Ê·²®Íþ110 93 
G210105 Íõ¼Ò¿¥89 92 
Èç¹ûÍ¨¹ýÖ¸¶¨ÁÐË÷Òýµ¼ÈëExcelÊý¾Ý,ÔòÐèÒªÉèÖÃheader²ÎÊý,¹Ø¼ü´úÂëÈçÏÂ¡£

1 28 Python ´óÊý¾Ý·ÖÎöÓë¿ÉÊÓ»¯ 
df=pd.read_excel(r'./¸ßÖÐ°àÑ§Éú³É¼¨.xlsx',sheet_name= '¸ßÒ»(1)°à³É¼¨',header= 1) 
#ÉèÖÃµÚ1 ÐÐÎªÁÐË÷Òý
Èç¹û½«Êý×Ö×÷ÎªÁÐË÷Òý,¿ÉÒÔÉèÖÃheader²ÎÊýÎªNone,¹Ø¼ü´úÂëÈçÏÂ¡£ 
df=pd.read_excel(r'./¸ßÖÐ°àÑ§Éú³É¼¨.xlsx',sheet_name= '¸ßÒ»(1)°à³É¼¨',header= 
None) #ÁÐË÷ÒýÎªÊý×Ö
ÄÇÃ´,ÎªÊ²Ã´ÒªÖ¸¶¨Ë÷ÒýÄØ? ÒòÎªÍ¨¹ýË÷Òý¿ÉÒÔ¿ìËÙµØ¼ìË÷Êý¾Ý,ÀýÈç,¸ù¾Ýdf[1],¾Í
¿ÉÒÔ¿ìËÙ¼ìË÷µ½¡°ÐÕÃû¡±ÕâÒ»ÁÐÊý¾Ý¡£
4.¶ÁÈ¡Ö¸¶¨ÁÐÊý¾Ý
Ò»¸öExcel±íÖÐÍùÍù°üº¬¶àÁÐÊý¾Ý,Èç¹ûÖ»ÐèÒªÆäÖÐµÄ¼¸ÁÐ,¿ÉÒÔÍ¨¹ýusecols²ÎÊýÖ¸
¶¨ÐèÒªµÄÁÐ,´Ó0¿ªÊ¼(±íÊ¾µÚ1ÁÐ,ÒÔ´ËÀàÍÆ)¡£
¡¾Àý5-5¡¿ ¶ÁÈ¡¡°¸ßÖÐ°àÑ§Éú³É¼¨.xlsx¡±µÚ1ÁÐÊý¾ÝµÄÇ°5Ìõ¡£ 
import pandas as pd 
#½â¾öÊý¾ÝÊä³öÊ±ÁÐÃû²»¶ÔÆëµÄÎÊÌâ
pd.set_option('display.unicode.east_asian_width',True) 
df=pd.read_excel(r'./¸ßÖÐ°àÑ§Éú³É¼¨.xlsx',sheet_name='¸ßÒ»(1)°à³É¼¨',usecols=[1]) 
#¶ÁÈ¡µÚ1 ÁÐ
print(df.head()) #Êä³öÇ°5 Ìõ
ÔËÐÐ½á¹û: 
ÐÕÃû
0 ÉêÖ¾·²
1 ·ëÄ¬·ç
2 Ê¯Ë«Ó¢
3 Ê·²®Íþ
4 Íõ¼Ò¿¥
Èç¹ûµ¼Èë¶àÁÐ,Ôò¿ÉÒÔÔÚÁÐ±íÖÐÖ¸¶¨¶à¸öÖµ¡£ÀýÈç,µ¼ÈëµÚ1ÁÐºÍµÚ4ÁÐ,¹Ø¼ü´úÂëÈçÏÂ¡£ 
df=pd.read_excel(r'./¸ßÖÐ°àÑ§Éú³É¼¨.xlsx',sheet_name= '¸ßÒ»(1)°à³É¼¨',usecols= 
[0,3]) 
Ò²¿ÉÒÔÖ¸¶¨ÁÐÃû³Æ,¹Ø¼ü´úÂëÈçÏÂ¡£ 
df=pd.read_excel(r'./¸ßÖÐ°àÑ§Éú³É¼¨.xlsx',sheet_name='¸ßÒ»(1)°à³É¼¨',usecols= 
['ÐÕÃû']) 
5.1.3 ¶ÁÈ¡JSON Êý¾ÝÎÄ¼þ
JSON(JavaScriptObjectNotation)ÊÇ»¥ÁªÍøÉÏ·Ç³£Í¨ÓÃµÄÇáÁ¿¼¶Êý¾Ý½»»»¸ñÊ½,ÊÇ
HTTPÇëÇóÖÐÊý¾ÝµÄ±ê×¼¸ñÊ½Ö®Ò»¡£PandasÌá¹©µÄJSON ¶ÁÈ¡·½·¨ÔÚ½âÎöÍøÂçÅÀ³æÊý¾Ý
Ê±,¿ÉÒÔ¼«´óµØÌá¸ßÐ§ÂÊ,¹ã·ºÓ¦ÓÃÓÚWebÊý¾Ý½»»¥¡£
JSON ²ÉÓÃ¶ÀÁ¢ÓÚ±à³ÌÓïÑÔµÄÎÄ±¾¸ñÊ½À´´æ´¢Êý¾Ý,ÆäÎÄ¼þµÄÀ©Õ¹ÃûÎª.json,¿ÉÍ¨¹ýÎÄ
±¾±à¼­¹¤¾ß²é¿´¡£
JSON ¸ñÊ½¼ò½à¡¢½á¹¹ÇåÎú,Ê¹ÓÃ¼üÖµ¶Ô(key:value)µÄ¸ñÊ½´æ´¢Êý¾Ý¶ÔÏó¡£
keyÊÇÊý¾Ý¶ÔÏóµÄÊôÐÔ,valueÊÇÊý¾Ý¶ÔÏóÊôÐÔµÄ¶ÔÓ¦Öµ¡£JSON Êý¾ÝÊ¹ÓÃ´óÀ¨ºÅÀ´Çø
·Ö±íÊ¾²¢´æ´¢¡£ÀýÈç,¡°ÐÔ±ð¡±:¡°ÄÐ¡±¾ÍÊÇÒ»¸ökey:value½á¹¹µÄÊý¾Ý¡£
ÀýÈç:

µÚ5 ÕÂ¡¡Pandas Êý¾Ý»ñÈ¡ÓëÇåÏ´1 29 
{"
fruit ":"apple" , 
"color": red , 
"productioninformation":"AnHui", 
"farmer ":{"name":"Muzi" , "age":40 , "sex":"male"} 
}
¶ÔÏóÔÚJSON ÖÐÊÇÊ¹ÓÃ´óÀ¨ºÅ{}À¨ÆðÀ´µÄÄÚÈÝ,Êý¾Ý½á¹¹Îª{key1:value1,key2: 
value2,¡­}µÄ¼üÖµ¶Ô½á¹¹¡£
Êý×é(Àí½âÎªPythonÖÐµÄÁÐ±í,ÐÎÊ½Ò»ÖÂ)ÔÚJSON ÖÐÊÇÊ¹ÓÃ·½À¨ºÅ[]À¨ÆðÀ´µÄÄÚÈÝ, 
¿ÉÒÔ´æ·Å¶à¸ö¶ÔÏó¡£
JSON ÎÄ¼þ¸ñÊ½¹ã·ºÓ¦ÓÃÓÚ»¥ÁªÍø·þÎñÆ÷APIÖÐ,Ò×ÓÚ»úÆ÷½âÎöºÍÉú³É,ÎÄ¼þÌå»ýÐ¡¡£
µ«ÊÇJSON ÎÄ¼þ¸ñÊ½´æ´¢µ¥Ò»,Ö»ÄÜ´æ´¢ÎÄ±¾,²»ÈçExcelÈÝÒ×ÔÄ¶Á¡£
JSON ÎÄ¼þ¸ñÊ½ÓëExcelÎÄ¼þÒ»Ñù,±àÂë¸ñÊ½ÎªANSI¡¢UnicodeºÍUTF-8¡£ÔÚÊý¾Ý¼Ó
ÔØÊ±,¿ÉÒÔ¸ù¾ÝÐèÒª½øÐÐÏàÓ¦µÄ´¦Àí,ÆäÖÐ,UTF-8¸ñÊ½µÄJSON ÎÄ¼þÓ¦ÓÃ×îÎª¹ã·º¡£
Pandas¶ÁÈ¡JSON Êý¾ÝµÄread_json()º¯ÊýÈçÏÂ: 
pandas.read_json(path_or_buf=None, orient=None, typ='frame', dtype=True, 
convert_axes=True, convert_dates=True, keep_default_dates=True, 
numpy=False, precise_float=False, date_unit=None, encoding=None, 
lines=False, chunksize=None, compression='infer') 
¡¾Ê¾Àý5-6¡¿ PandasÍ¨¹ýread_json()º¯Êý¶ÁÈ¡JSON Êý¾Ý¡£ 
import pandas as pd 
df = pd.read_json(r"./json_data.json",encoding="utf8") 
print(df) 
ÔËÐÐ½á¹û: 
sno sname ssex sage 
0 202101002 Marry F 18 
1 202102001 Strong M 19 
Pandas»¹Ìá¹©ÁËpd.jsonnormalize(data)·½·¨À´¶ÁÈ¡°ë½á¹¹»¯µÄJSON Êý¾Ý¡£
5.1.4 ¶ÁÈ¡HTML ±í¸ñÊý¾Ý
ÔÚä¯ÀÀÍøÒ³Ê±,ÓÐÐ©Êý¾Ý»áÔÚHTML(HyperTextMarkupLanguage,³¬ÎÄ±¾±ê¼ÇÓï
ÑÔ)ÍøÒ³ÖÐÒÔ±í¸ñµÄÐÎÊ½½øÐÐÕ¹Ê¾,¶ÔÓÚÕâ²¿·ÖÊý¾Ý,¿ÉÒÔÊ¹ÓÃPandasÖÐµÄread_html()º¯
Êý½ÓÊÕHTML×Ö·û´®¡¢HTMLÎÄ¼þ¡¢URL,²¢½«HTMLÖÐµÄ<table>±êÇ©±í¸ñÊý¾Ý½âÎö
ÎªDataFrame¡£Èç·µ»ØÓÐ¶à¸ödfµÄÁÐ±í,Ôò¿ÉÒÔÍ¨¹ýË÷ÒýÖ¸¶¨È¡µÚ¼¸¸ö¡£Èç¹ûÒ³ÃæÀïÖ»ÓÐ
Ò»¸ö±í¸ñ,ÄÇÃ´Õâ¸öÁÐ±í¾ÍÖ»ÓÐÒ»¸öDataFrame¡£
read_html()º¯ÊýµÄÓï·¨¸ñÊ½ÈçÏÂ¡£ 
pandas.read_html(io, match='.+', flavor=None, 
header=None, index_col=None,skiprows=None, encoding=None,attrs=None) 
²ÎÊýËµÃ÷ÈçÏÂ¡£
.io:×Ö·û´®,ÎÄ¼þÂ·¾¶,Ò²¿ÉÒÔÊÇURLÁ´½Ó¡£Èç¹ûÍøÖ·²»½ÓÊÜhttps,¿ÉÒÔ³¢ÊÔÈ¥µô
httpsÖÐµÄsºóÅÀÈ¡¡£

1 30 Python ´óÊý¾Ý·ÖÎöÓë¿ÉÊÓ»¯
. match:ÕýÔò±í´ïÊ½,·µ»ØÓëÕýÔò±í´ïÊ½Æ¥ÅäµÄ±í¸ñ¡£
.flavor:½âÎöÆ÷Ä¬ÈÏÎª¡°lxml¡±¡£
. header:Ö¸¶¨ÁÐ±êÌâËùÔÚµÄÐÐ,ÁÐ±ílistÎª¶àÖØË÷Òý¡£
.index_col:Ö¸¶¨ÐÐ±êÌâ¶ÔÓ¦µÄÁÐ,ÁÐ±ílistÎª¶àÖØË÷Òý¡£
.encoding:×Ö·û´®,Ä¬ÈÏÎªNone,ÎÄ¼þµÄ±àÂë¸ñÊ½¡£
.attrs:Ä¬ÈÏÎªNone,ÓÃÓÚ±íÊ¾±í¸ñµÄÊôÐÔÖµ¡£
ÔÚÊ¹ÓÃread_html()º¯ÊýÊ±,Ê×ÏÈÒªÈ·¶¨ÍøÒ³±í¸ñÊÇ·ñÎª<table>±êÇ©¡£¿ÉÒÔÍ¨¹ýÔÚ
ÍøÒ³ÖÐµ¥»÷ÓÒ¼ü,ÔÚµ¯³öµÄ²Ëµ¥ÖÐÑ¡Ôñ¡°²é¿´Ô´ÎÄ¼þ¡±,²é¿´´úÂëÊÇ·ñº¬ÓÐ±í¸ñ±êÇ©¡°<table> 
¡­</table>¡±µÄ×ÖÑù,È»ºó²ÅÊ¹ÓÃread_html()º¯Êý¡£
¡¾Àý5-7¡¿ ¶ÁÈ¡ÐÂÀËÍøÉÏµÄ´óÑ§²¿·Ö×¨ÒµÐÅÏ¢¡£ 
import pandas as pd 
import requests 
html_ data = requests. get ( ' http://kaoshi. edu. sina. com. cn/college/majorlist? 
page=1') 
html_table_data = pd.read_html(html_data.content,header=0,encoding='utf-8') 
columns = ['×¨ÒµÃû³Æ','×¨Òµ´úÂë','×¨Òµ´óÀà','×¨ÒµÐ¡Àà'] 
df = pd.DataFrame(data=html_table_data[1],columns=columns) 
print(df.head()) 
ÔËÐÐ½á¹û: 
×¨ÒµÃû³Æ×¨Òµ´úÂë×¨Òµ´óÀà×¨ÒµÐ¡Àà
0 ÕÜÑ§Àà101 ÕÜÑ§ÕÜÑ§Àà
1 ÕÜÑ§10101 ÕÜÑ§ÕÜÑ§Àà
2 Âß¼­Ñ§10102 ÕÜÑ§ÕÜÑ§Àà
3 ×Ú½ÌÑ§10103 ÕÜÑ§ÕÜÑ§Àà
4 Â×ÀíÑ§10104 ÕÜÑ§ÕÜÑ§Àà
ÖµµÃÒ»ÌáµÄÊÇ,ÔÚÊ¹ÓÃread_html()º¯Êý¶ÁÈ¡ÍøÒ³ÖÐµÄ±í¸ñÊý¾ÝÊ±,ÐèÒª×¢ÒâÍøÒ³µÄ±à
Âë¸ñÊ½¡£ÔËÐÐ³ÌÐò,Èç¹û³öÏÖ¡°ImportError:lxmlnotfound,pleaseinstallit¡±µÄ´íÎóÌáÊ¾ÐÅ
Ï¢,ÔòÐèÒª°²×°lxmlÄ£¿é¡£
5.1.5 ¶ÁÈ¡MySQL Êý¾Ý¿âÖÐÊý¾Ý
´ó¶àÊýÇé¿öÏÂ,º£Á¿µÄÊý¾ÝÊÇÊ¹ÓÃÊý¾Ý¿â½øÐÐ´æ´¢µÄ,ÕâÖ÷ÒªÊÇÒÀÀµÓÚÊý¾Ý¿âµÄÊý¾Ý½á
¹¹»¯¡¢Êý¾Ý¹²ÏíÐÔ¡¢¶ÀÁ¢ÐÔµÈÌØµã¡£Òò´Ë,ÔÚÊµ¼ÊÉú²ú»·¾³ÖÐ,¾ø´ó¶àÊýµÄÊý¾Ý¶¼ÊÇ´æ´¢ÔÚÊý
¾Ý¿âÖÐ¡£
PandasÖ§³ÖMySQL¡¢Oracle¡¢SQLiteµÈÖ÷Á÷Êý¾Ý¿âµÄ¶ÁÐ´²Ù×÷¡£
ÎªÁË¸ßÐ§µØ¶ÔÊý¾Ý¿âÖÐµÄÊý¾Ý½øÐÐ¶ÁÈ¡,ÕâÀïÐèÒªÒýÈëSQLAlchemy¡£SQLAlchemy 
ÊÇÊ¹ÓÃPython±àÐ´µÄÒ»¿î¿ªÔ´Èí¼þ,ËüÌá¹©µÄSQL¹¤¾ß°üºÍ¶ÔÏóÓ³Éä¹¤¾ßÄÜ¹»¸ßÐ§µØ·Ã
ÎÊÊý¾Ý¿â¡£ÔÚÊ¹ÓÃSQLAlchemyÊ±ÐèÒªÊ¹ÓÃÏàÓ¦µÄÁ¬½Ó¹¤¾ß°ü,ÈçMySQL ÐèÒª°²×°
mysqlconnector,OracleÔòÐèÒª°²×°cx_oracle¡£
PandasµÄio.sqlÄ£¿éÖÐÌá¹©ÁË³£ÓÃµÄ¶ÁÐ´Êý¾Ý¿âº¯Êý,read_sql_table()º¯ÊýÓëread_ 
sql_query()º¯Êý¶¼¿ÉÒÔ½«¶ÁÈ¡µÄÊý¾Ý×ª»»ÎªDataFrame¶ÔÏó,Ç°Õß±íÊ¾½«ÕûÕÅ±íµÄÊý¾Ý×ª
»»³ÉDataFrame,ºóÕßÔò±íÊ¾½«Ö´ÐÐSQLÓï¾äµÄ½á¹û×ª»»ÎªDataFrame¶ÔÏó¡£¶øread_sql()

µÚ5 ÕÂ¡¡Pandas Êý¾Ý»ñÈ¡ÓëÇåÏ´1 31 
º¯ÊýÍ¬Ê±Ö§³Öread_sql_table()º¯ÊýÓëread_sql_query()º¯ÊýÁ½ÕßµÄ¹¦ÄÜ¡£to_sql()·½·¨Ôò
ÊÇ°Ñ¼ÇÂ¼Êý¾ÝÐ´µ½Êý¾Ý¿âÀï¡£
ÔÚÁ¬½ÓMySQLÊý¾Ý¿âÊ±,ÕâÀïÊ¹ÓÃµÄÊÇmysqlconnectorÇý¶¯,Èç¹ûµ±Ç°µÄPython»·
¾³ÖÐÃ»ÓÐ¸ÃÄ£¿é,ÔòÐèÒªÊ¹ÓÃpipinstallmysql-connectorÃüÁî°²×°¸ÃÄ£¿é¡£ÏÂÃæÒÔread_ 
sql()º¯ÊýºÍto_sql()·½·¨ÎªÀý,·Ö±ð½éÉÜÈçºÎ¶ÁÐ´Êý¾Ý¿âÖÐµÄÊý¾Ý,¾ßÌåÄÚÈÝÈçÏÂ¡£
1.Ê¹ÓÃread_sql()º¯Êý¶ÁÈ¡Êý¾Ý
read_sql()º¯Êý¼È¿ÉÒÔ¶ÁÈ¡ÕûÕÅÊý¾Ý±í,ÓÖ¿ÉÒÔÖ´ÐÐSQLÓï¾ä,ÆäÓï·¨¸ñÊ½ÈçÏÂ¡£ 
pandas.read_sql(sql,con,index_col= None,coerce_float= True,params= None,parse_ 
dates=None, columns=None, chunksize=None) 
²ÎÊýËµÃ÷ÈçÏÂ¡£
.sql:±íÊ¾±»Ö´ÐÐµÄSQLÓï¾ä¡£
.con:½ÓÊÕÊý¾Ý¿âÁ¬½Ó,±íÊ¾Êý¾Ý¿âµÄÁ¬½ÓÐÅÏ¢¡£
.index_col:Ä¬ÈÏÎªNone,Èç¹û´«ÈëÒ»¸öÁÐ±í,Ôò±íÊ¾Îª²ã´Î»¯Ë÷Òý¡£
.coerce_float:½«·Ç×Ö·û´®¡¢·ÇÊý×Ö¶ÔÏóµÄÖµ×ª»»Îª¸¡µãÊýÀàÐÍ¡£
. params:´«µÝ¸øÖ´ÐÐ·½·¨µÄ²ÎÊýÁÐ±í,Èçparams={'name':'value'}¡£
.columns:½ÓÊÕlist±íÊ¾¶ÁÈ¡Êý¾ÝµÄÁÐÃû,Ä¬ÈÏÎªNone¡£
Èç¹û·¢ÏÖÊý¾ÝÖÐ´æÔÚ¿ÕÖµ,Ôò»áÊ¹ÓÃNaN ½øÐÐ²¹È«¡£
¡¾Àý5-8¡¿ Ê¹ÓÃread_sql()º¯Êý¶ÁÈ¡Êý¾Ý¿âÖÐµÄÊý¾Ý±íspecialty¡£ 
import pandas as pd 
from sqlalchemy import create_engine 
#mysql ÕËºÅÎªroot,ÃÜÂëÎª123456,Êý¾ÝÃûÎªjxgl 
#Êý¾Ý±íÃû³Æ:specialty 
engine = create_engine('mysql+pymysql://' 
'root:123456@127.0.0.1:3306/jxgl') 
#Í¨¹ýÊý¾Ý±íÃû¶ÁÈ¡Êý¾Ý¿âµÄÊý¾Ý
#category_data = pd.read_sql('specialty', engine) 
#Ò²¿ÉÒÔÍ¨¹ýSQL Óï¾ä¶ÁÈ¡Êý¾Ý¿âµÄÊý¾Ý
sql = 'SELECT * FROM specialty' 
df_data = pd.read_sql(sql, engine) 
print(df_data) 
ÔËÐÐ½á¹û: 
zno zname 
0 1102 Êý¾Ý¿ÆÑ§Óë´óÊý¾Ý¼¼Êõ
1 1103 ÈË¹¤ÖÇÄÜ
2 1201 ÍøÂçÓëÐÂÃ½Ìå
3 1214 Çø¿éÁ´¿ÆÑ§Óë¹¤³Ì
4 1407 ½¡¿µ·þÎñÓë¹ÜÀí
5 1409 ÖÇÄÜÒ½Ñ§¹¤³Ì
6 1601 ¹©Ó¦Á´¹ÜÀí
7 1805 ÖÇÄÜ¸ÐÖª¹¤³Ì
8 1807 ÖÇÄÜ×°±¸ÓëÏµÍ³
ÉÏÊöÊ¾ÀýÖÐ,Ê×ÏÈµ¼ÈëÁËsqlalchemyÄ£¿é,Í¨¹ýcreate_engine()º¯Êý´´½¨Á¬½ÓÊý¾Ý¿â
µÄÐÅÏ¢,È»ºóµ÷ÓÃread_sql()º¯Êý¶ÁÈ¡Êý¾Ý¿âÖÐµÄspecialtyÊý¾Ý±í,²¢×ª»»³ÉDataFrame 
¶ÔÏó¡£

1 32 Python ´óÊý¾Ý·ÖÎöÓë¿ÉÊÓ»¯
×¢Òâ:ÔÚÊ¹ÓÃcreate_engine()º¯Êý´´½¨Á¬½ÓÊ±,Æä¸ñÊ½ÈçÏÂ:'Êý¾Ý¿âÀàÐÍ+Êý¾Ý¿âÇý
¶¯Ãû³Æ://ÓÃ»§Ãû:ÃÜÂë@»úÆ÷µØÖ·:¶Ë¿ÚºÅ/Êý¾Ý¿âÃû'¡£
ÐèÒªÇ¿µ÷µÄÊÇ,ÕâÀïµÄSQLÓï¾ä²»½öÊÇÓÃÓÚÉ¸Ñ¡µÄSQLÓï¾ä,ÆäËûÓÃÓÚÔöÉ¾¸Ä²éµÄ
SQLÓï¾ä¶¼ÊÇ¿ÉÒÔÖ´ÐÐµÄ¡£
2.Ê¹ÓÃto_sql()·½·¨½«Êý¾ÝÐ´ÈëÊý¾Ý¿âÖÐ
to_sql()·½·¨µÄ¹¦ÄÜÊÇ½«Series»òDataFrame¶ÔÏóÒÔÊý¾Ý±íµÄÐÎÊ½Ð´ÈëÊý¾Ý¿âÖÐ,Æä
Óï·¨¸ñÊ½ÈçÏÂ¡£ 
to_sql(name, con, schema = None, if_exists = 'fail', index = True, index_label = 
None,chunksize = None,dtype = None) 
²ÎÊýËµÃ÷ÈçÏÂ¡£
. name:±íÊ¾Êý¾Ý¿â±íµÄÃû³Æ¡£
.con:±íÊ¾Êý¾Ý¿âµÄÁ¬½ÓÐÅÏ¢¡£
.if_exists:¿ÉÒÔÈ¡ÖµÎªfail¡¢replace»òappend,Ä¬ÈÏÎªfail¡£Ã¿¸öÈ¡Öµ´ú±íµÄº¬Òå
ÈçÏÂ¡£
fail:Èç¹û±í´æÔÚ,Ôò²»Ö´ÐÐÐ´Èë²Ù×÷¡£
replace:Èç¹û±í´æÔÚ,Ôò½«Ô´Êý¾Ý¿â±íÉ¾³ýÔÙÖØÐÂ´´½¨¡£
append:Èç¹û±í´æÔÚ,ÄÇÃ´ÔÚÔ­Êý¾Ý¿â±íµÄ»ù´¡ÉÏ×·¼ÓÊý¾Ý¡£
.index:±íÊ¾ÊÇ·ñ½«DataFrameÐÐË÷Òý×÷ÎªÊý¾Ý´«ÈëÊý¾Ý¿â,Ä¬ÈÏÎªTrue¡£
.index_label:±íÊ¾ÊÇ·ñÒýÓÃË÷ÒýÃû³Æ¡£Èç¹ûindexÉèÎªTrue,´Ë²ÎÊýÎªNone,ÔòÊ¹
ÓÃÄ¬ÈÏÃû³Æ;Èç¹ûindexÎª²ã´Î»¯Ë÷Òý,Ôò±ØÐëÊ¹ÓÃÐòÁÐÀàÐÍ¡£
½ÓÏÂÀ´,Í¨¹ýÒ»¸öÊ¾Àý³ÌÐòÀ´ÑÝÊ¾ÈçºÎÊ¹ÓÃPandasÏòÊý¾Ý¿âÖÐÐ´ÈëÊý¾Ý¡£
Ê×ÏÈ,´´½¨Ò»¸öÃû³ÆÎªstudents_infoµÄÊý¾Ý¿â,¾ßÌåµÄSQLÓï¾äÈçÏÂ¡£ 
CREATE DATABASE students_info CHARASET=utf8 
È»ºó,´´½¨Ò»¸öDataFrame¶ÔÏó,ËüÍ³¼ÆÁËÃ¿¸öÄê¼¶ÖÐÄÐÉúºÍÅ®ÉúµÄÈËÊý¡£
½Ó×Å,µ÷ÓÃto_sql()·½·¨½«DataFrame¶ÔÏóÐ´ÈëÃû³ÆÎªstudentsµÄÊý¾Ý±íÖÐ,¾ßÌå´úÂë
ÈçÏÂ¡£ 
from pandas import DataFrame,Series 
import pandas as pd 
from sqlalchemy import create_engine 
from sqlalchemy.types import * 
df = DataFrame({"°à¼¶":["Ò»Äê¼¶","¶þÄê¼¶","ÈýÄê¼¶","ËÄÄê¼¶"], 
"ÄÐÉúÈËÊý":[25,23,27,30], 
"Å®ÉúÈËÊý":[19,17,20,20]}) 
#´´½¨Êý¾Ý¿âÒýÇæ
#mysql+pymysql ±íÊ¾Ê¹ÓÃMySQL Êý¾Ý¿âµÄpymysql Çý¶¯
#ÕËºÅ:root,ÃÜÂë:123456,Êý¾Ý¿âÃû:studnets_info 
#Êý¾Ý±íµÄÃû³Æ: students 
engine=create_engine('mysql+ mysqlconnector://root:123456@127.0.0.1/students_ 
info') 
df.to_sql('students',engine) 
µ±³ÌÐòÖ´ÐÐ½áÊøºó,¿ÉÒÔÔÚÊý¾Ý¿âÖÐ²é¿´ÊÇ·ñ³É¹¦´´½¨ÁËÊý¾Ý±í,ÒÔ¼°Êý¾ÝÊÇ·ñ±£´æ³É
¹¦,ÕâÀïÊ¹ÓÃÃüÁîÐÐµÄ·½Ê½½øÐÐÑéÖ¤¡£