大数据分析是大数据科学、计算机科学与技术等相关学科的高级专业课程。主要面向有一定的概率统计和数据库基础知识,并且具有一定软件开发能力的本科高年级或研究生学生。课程会介绍和大规模数据处理、分析和挖掘相关的常用算法理论, Hadoop 生态系统的架构与应用以及在实际应用中的大规模数据处理技术。课程需要学生阅读大量的相关文献来获得对技术的理解,还要求学生通过完成一系列编程来掌握大规模数据处理理论知识和工具。通过本课程的学习,希望学生能够在了解和掌握大规模数据处理、分析和挖掘理论的基础上,学会应用大规模数据处理技术解决现实数据处理、分析和挖掘问题。
课程目标对学生的能力要求如下:
课程目标1. 对大数据分析的价值、意义和基本原理建立清晰和较全面的认识;
课程目标2. 掌握有关数据挖掘、处理、建模和解释的基本原理和方法;
课程目标3. 熟悉大数据分析在科学研究、工程建设、商业分析和公共管理等领域的实际案例。