目 录 第1章 基本语法与数据类型 1 1.1 编辑器Anaconda 1 1.2 基本语法 3 1.3 数值运算符 6 1.3.1 算术运算符 6 1.3.2 比较运算符 7 1.3.3 赋值运算符 7 1.4 字符串 9 1.4.1 字符串的表示 9 1.4.2 索引与切片 11 1.5 列表、元组、字典、集合 13 1.5.1 列表 13 1.5.2 元组 20 1.5.3 字典 22 1.5.4 集合 25 1.6 格式化输出 26 1.6.1 %输出 26 1.6.2 format输出 27 1.6.3 f输出 28 1.7 其他常用的函数 28 1.7.1 strip()函数 28 1.7.2 split()函数 29 1.7.3 divmod()函数 30 1.7.4 join()函数 31 本章小结 31 练习 34 第2章 流程控制 35 2.1 选择结构 35 2.2 循环结构 36 2.2.1 for循环 36 2.2.2 while循环 37 2.2.3 continue语句和break语句 37 2.3 常见的错误类型 39 2.4 异常处理 44 2.4.1 try语句 44 2.4.2 assert语句 46 2.4.3 raise语句 46 本章小结 47 练习 47 第3章 函数与类 49 3.1 常用函数 49 3.1.1 zip()函数 49 3.1.2 enumerate()函数 49 3.1.3 eval()函数 50 3.1.4 判断方法与函数 51 3.1.5 其他内置函数 53 3.2 自定义函数 54 3.2.1 自定义函数语法 54 3.2.2 调用自定义函数 55 3.2.3 形参和实参 56 3.2.4 参数传递 56 3.2.5 变量的作用域 58 3.2.6 函数参数的类型 60 3.2.7 任意个数参数 61 3.2.8 函数调用 62 3.3 特殊函数 65 3.3.1 lambda()函数 65 3.3.2 filter()函数 66 3.3.3 map()函数 66 3.3.4 行函数 67 3.4 模块和包 68 3.4.1 模块 68 3.4.2 包 69 3.4.3 time 模块、datetime模块和calendar模块 70 3.4.4 urllib模块 73 3.5 类 74 本章小结 76 练习 76 第4章 数据处理 78 4.1 Numpy 78 4.1.1 数组的创建 78 4.1.2 数组的操作 84 4.1.3 数组统计基础 87 4.2 Pandas 88 4.2.1 Series 89 4.2.2 DataFrame 94 4.2.3 数据导入 97 4.2.4 数据导出 99 4.3 正则表达式 101 4.3.1 match()方法 105 4.3.2 search()方法 106 4.3.3 findall()方法 107 4.3.4 查找和替换re.sub() 107 4.4 数据操作 108 4.4.1 数据清洗 108 4.4.2 数据抽取 112 4.4.3 排名索引 120 4.4.4 数据合并 124 4.4.5 数据计算 127 4.4.6 数据分组 128 4.4.7 日期处理 130 本章小结 133 练习 134 第5章 数据分析 135 5.1 基本统计 135 5.2 分组分析 137 5.3 分布分析 139 5.4 交叉分析 141 5.5 结构分析 142 5.6 相关分析 143 本章小结 145 练习 145 第6章 数据可视化 146 6.1 matplotlib 146 6.1.1 符号及中文标注 147 6.1.2 饼图 149 6.1.3 散点图 150 6.1.4 折线图 152 6.1.5 柱形图 155 6.1.6 直方图 158 6.2 plotly 158 6.2.1 线形图 160 6.2.2 面积图 161 6.2.3 散点图 162 6.2.4 散点矩阵图 163 6.2.5 饼图 164 6.2.6 柱状图 165 本章小结 166 练习 167 第7章 综合应用案例 168 7.1 基础知识 168 7.1.1 图理论简介 168 7.1.2 networkx基本操作 169 7.2 数据处理 172 7.2.1 导入数据 172 7.2.2 时间格式处理 173 7.2.3 检查数据空缺值 175 7.3 数据分析 175 7.3.1 载入数据并构建图 175 7.3.2 找出最繁忙的机场 176 7.3.3 最短路径和最省时的路径 177 7.3.4 最合适的中转机场 178 7.4 完整代码 178 实践 180 参考文献 181