前言 数字时代已经来临。移动互联网、云计算、大数据、人工智能、物联网等先进信息技术层出不穷,不断渗透至社会的各个领域,产生了许多新的应用场景,深刻地改变着人们的社交方式、生活方式和工作方式。 数字时代要求有新的教育,新工科、新医科、新农科、新文科的概念应运而生。教育部高教司司长吴岩指出,高等教育创新发展势在必行,要全面推进新工科、新医科、新农科、新文科建设。在推进新工科、新医科、新农科、新文科建设中,普及大数据基础教育非常有必要,但在各个专业的传统教学体系中缺乏此类课程和资源。为此,我们于2017年着手开发入门级的 “大数据工具应用”在线开放课程。该课程首期成果于2018年初在智慧树平台上线,2018年底面向全国开放共享。经过约两年的逐步建设和完善,该课程构建了教学视频、教学PPT、题库、实验报告、实验数据以及补充学习材料等丰富的教学资源。截至2020年4月,使用该课程的高校超过百所,累计学员超过1.6万人,课程获得各高校师生的一致好评。为了方便大家学习,达到更好的学习效果,课程教学团队集中力量编撰了本书,作为“大数据工具应用”课程的配套教材。本书的出版是 “大数据工具应用”课程建设的又一个重要成果。 “大数据工具应用”课程以讲授大数据基础知识和工具应用为使命,力图构建一门新的大数据入门学习课程。课程包括7章,涵盖数据获取、数据挖掘、数据呈现和数据思维等内容。课程立足应用入门,强调工具操作,突出案例教学。通过本课程的学习,学生们能够掌握一定的数据获取、分析与呈现技能,初步建立数据思维的概念。具体而言,本课程具有以下特色。 1. 属于新工科类课程 本课程讲授新兴的信息技术,围绕大数据的基础知识和工具应用进行课程建设和开发。学习本课程,学生将能拓展所学专业的知识边界,获得一定的大数据知识与技能,建立数据思维的概念。在大数据时代,向各个专业推出此类新工科课程极富意义。 2. 强调工具应用 本课程是一门工具慕课。在数据获取部分引入爬虫工具八爪鱼; 数据挖掘部分引入开源工具Weka; 数据呈现部分引入商业工具Tableau。这三个工具皆是易获取的主流软件。教学中力图将理论与实践相结合,讲解和演示如何基于所学理论使用工具去解决实际问题。工具应用是理论与实践之间的纽带,强调动手操作是课程学习的关键。此外,通过线上教学视频呈现老师们的演示操作,学生们能够无限次观看学习,弥补了线下教学演示难以多次重复的不足。 3. 低门槛学习要求 现有的大数据课程往往要求学生具有一定的编程和算法基础,门槛较高,很多学生难于入门。为此,本课程尽量降低学习门槛,学习先决条件仅为熟练使用Word和Excel,教学实施期间无编程要求。课程的低门槛使得各类学生能够容易踏入大数据之门,揭开大数据的神秘面纱,领略大数据的美妙。 本书由钟雪灵教授和郭艺辉博士担任主编,与侯昉博士(系统分析师)、刘晓庆副教授、黄承慧博士(系统分析师)和彭诗力博士(系统分析师)一道编撰。各章内容编写的具体分工如下: 侯昉 编写第1、2章和3.1节~3.3节; 刘晓庆编写3.4节~3.6节和第7章; 黄承慧 编写第4章; 钟雪灵编写第5章; 郭艺辉编写6.1节~6.3节; 彭诗力 编写6.4节~6.6节。全书由钟雪灵和郭艺辉定稿。 本课程得到了多方人士的大力支持和帮助。广东金融学院李建军书记积极推动具有我校特色的在线工具课程群开发,王醒男副 校长针对应用型人才能力培养提出工具课程作为抓手。两位领导作为我校应用型人才工具课程建设的布局者,为本课程成功上线与持续建设创造了良好的环境。学校实验教学中心王小燕主任作为工具课程建设的负责人,是我们课程团队的领路人。在此向各位领导表示衷心的感谢!除了本书的作者外,课程团队成员温聪源高级实验师、朱彪先生、何志锋博士和谢添德老师为课程的建设和运行积极奉献自己的智慧。智慧树网的方一蛟先生、邓利鹏小姐、秦月小姐、肖茹丹小姐、林鹏飞先生和申文斌先生为课程的建设和运行做了大量的工作。清华大学出版社 为本书的顺利出版也付出良多。在此向为“大数据工具应用”课程付出辛勤劳动的朋友们表示衷心的感谢! 钟雪灵 2020年4月12日于广州