前言 随着互联网、云计算和大数据的蓬勃发展,信息技术得到了极大的普及与应用,在人文社科领域,定量研究越来越受到普遍重视。2014年,得克萨斯大学的艺术史学家Maximilian Schich在Science上发表了Quantitative social science. A network framework of cultural history,他带领团队收集了两千多年以来历史上15万西方文化名人的迁徙信息,通过数据分析与计算研究文化史的网络框架;美国杂志撰稿作家Ben Blatt出版了Nabokovs Favorite Word Is Mauve一书,他用统计学的方法,梳理了19世纪末到21世纪初1500部经典著作,拆解出优秀作品的写作规律;近年来,我国多家科研机构建设了面向人文社科研究的数据平台,为人文社科研究范式的创新与转型提供数据支撑。 2020年11月,教育部发布《新文科建设宣言》,重磅启动“新文科”建设。在人文社科领域,应用数据思维和数据科学方法进行科研探索,已成为必然趋势。新文科建设与人才培养要求针对人文社科领域的科研应用需求,结合文科专业学生特点,融入现代信息技术赋能文科教育。因此,面向新文科学生的素养养成,应该建设以数据思维为核心的教材体系,促进数据驱动的新文科研究范式发展,涵盖数据、大数据、数据管理、数据分析、数据可视化、数字化学习与创作等关键学科知识,培养学生应用数字化工具解决问题,全面提升学生的计算机素养、数字化胜任力和进行交叉学科科研创新的关键能力。 本教材致力于深化新文科大学计算机教学改革,培养具有形象思维、数据思维和编程思维的新文科人才,能够在数字化时代更好地开展人文社科领域的数字化学习与创新训练。 本教材以及与之对应的课程目标如下。 ●了解计算思维和数据思维,理解数据和大数据的基本概念,理解数据处理的过程和方法。 ●能够针对实际问题,利用Excel进行数据处理、数据分析与可视化。 ●了解常用的数据管理方式,理解数据库及关系数据库的基本概念。 ●能够根据实际需求,利用MySQL数据库管理系统对数据进行管理。 ●培养学生应用数据科学方法和数据思维进行交叉学科科研探索,形成较强的形象思维、逻辑思维、批判性思维和创造性思维。 本教材分为理论与实验两部分。理论部分涵盖基本概念、数据处理、数据分析与可视化、数据管理基础、数据库实践及综合应用;实验部分针对各个章节的理论学习,开展数据处理、数据分析与可视化、数据库及数据表的基本操作、数据查询等实验。理论部分的各章简要介绍如下。 第1章 数据及数据思维概述介绍计算思维、数据思维、认识数据以及大数据的基本概念,使读者了解数据科学基本概念。 第2章 Excel数据处理从数据表应用、数据处理应用以及数据管理与统计的方法三个方面,介绍Excel数据类型,工作表创建及格式化,利用公式与函数对数据进行处理与分析,以及排序、筛选、分类汇总表、数据透视表等常用的数据管理与统计工具。通过不同场景实例的学习,读者将掌握数据处理的基本方法和技巧。 第3章Excel数据分析与数据可视化围绕数据分析与数据可视化的方法,通过解决实际问题,介绍了模拟运算表、单变量求解、移动平均、指数平滑、回归分析等数据分析方法,多种图表的可视化方法以及可视化看板的制作。通过本章的学习,读者能够掌握数据分析的基础知识以及常用的数据分析方法,并实现数据可视化。 第4章数据管理基础介绍数据管理与数据库以及关系数据库的基本概念和原理,使读者了解常用的数据管理方式,掌握数据库的基本概念。 第5章数据库实践以MySQL数据库管理系统为例,详细介绍数据库的创建,数据表的设计、创建、更新与查询方法,以及数据库安全管理,通过大量实例的学习,读者能够掌握数据库管理数据的基本方法和操作。 第6章调查问卷的设计与数据处理通过实际生活中的问卷调查表案例,详细介绍了调查问卷的构成、调查问卷的设计、问卷数据的录入、数据的统计分析方法以及问卷调查报告的书写,使读者掌握从问卷数据收集到问卷数据统计,以及最后完成调查报告的整个流程和方法。 本教材编写团队全部来自华东师范大学数据科学与工程学院,他们多年来始终致力于大学计算机基础教育及相关研究,密切结合信息技术发展及人才培养的需求,着眼于将智能信息技术与教育研究实践进行深度融合,在大学计算机公共课、基础教育改革等方面做出了众多的探索与实践。 本教材的编写始于2021年年初,经过两年的创作与不断完善最终完成。在此,感谢清华大学出版社和全国高等学校计算机教育研究会的支持,感谢为大学计算机基础教学贡献力量的各位老师,特别感谢参与教材编写与审核的各位老师:王肃、俞琨、胡文心、刘艳、蔡建华。由于时间仓促,书中疏漏及不足之处在所难免,敬请读者海涵并不吝指正。 作者 2023年5月