课程简介


大数据时代已经到来,数据是新的石油,正成为一种生产资料、稀有资产,是重要的战略资源,全面融入社会、生产、生活各个方面,深刻改变着世界的经济格局、利益格局、安全格局。为了挖掘大数据的价值,社会急需大量合格的数据科学家,使用各种技术对不同来源的数据进行分析,帮助企业做出更加明智的决策。

数据科学的核心任务是从数据中抽取信息、发现知识。它的研究对象是各种各样的数据及其特性。数据科学包含一组概念、原则、过程、技术/方法以及工具,为其核心任务服务。其中,概念和基本原则给予人们观察问题、解决问题的一套完整的思想框架,而大量的数据分析技术/方法和工具则帮助人们切实实现数据科学的目标。

本课程涵盖数据科学的多个核心领域,包括数据处理、统计分析、机器学习、数据可视化等,旨在帮助学生了解数据科学领域的基本概念、方法和技术,为学生提供了一个全面而系统的学习平台。通过学习本课程,学生将能够掌握数据科学的基础知识,并为进一步学习相关领域课程奠定基础。

课程信息


授课教师

张建章 博士
邮箱:jianzhang.zhang@foxmail.com
钉钉:张建章
办公室:仓前恕园2号楼1009

互动平台

课程钉钉群 ;课程讨论区

授课对象

本科生,大数据管理与应用,电子商务,国际商务

授课时间

待定 [2022-2023校历]

授课地点

待定

参考资料

【教材】《数据科学导论-基于Python语言》,朝乐门 著,2021年,人民邮电出版社

【图书】《数据挖掘:概念与技术(第三版)》,Jiawei Han等 著,范明、孟小峰 译,2012年,机械工业出版社

【图书】《数据挖掘与数据化运营实战 思路、方法、技巧与应用》,卢辉 著,2013年,机械工业出版社

相关课程

先修课程:程序设计基础

后续课程:文本分析与数据挖掘

常用工具
成绩评定

本课程成绩主要由四部分组成,如下:

  • 期末成绩-50%
  • 课程作业/测验-30%
  • 课堂表现-10%
  • 日常考勤-10%

课程计划


章节 日期 内容 思考题 资料
第一讲 -
  • 数据科学的基础理论 [ ]
  • Python实践 [ ]
  • - 【论文】数据科学概论
    【视频】大数据时代
    作业1 - 第一次作业题 [题目] 在线提交地址

    DDL: 202X-XX-XX 23:59

    第二讲 -
  • 统计学与模型 [ ]
  • Python实践 [ ]
  • - 【论文】大数据时代的统计教育
    【视频】大数据的统计学基础
    作业2 - 第二次作业题 [题目] 在线提交地址

    DDL: 202X-XX-XX 23:59

    第三讲 -
  • 机器学习与算法 [ ]
  • Python实践 [ ]
  • - 【论文】大数据下的机器学习算法综述
    【视频】大数据机器学习
    作业3 - 第三次作业题 [题目] 在线提交地址

    DDL: 202X-XX-XX 23:59

    第四讲 -
  • 数据可视化 [ ]
  • Python实践 [ ]
  • - 【论文】大数据可视化技术及应用
    【视频】大数据可视化概述
    作业4 - 第四次作业题 [题目] 在线提交地址

    DDL: 202X-XX-XX 23:59

    第五讲 -
  • 数据加工 [ ]
  • Python实践 [ ]
  • - 【论文】科学计量可视化软件的对比与数据预处理研究
    【视频】为什么要数据预处理
    作业5 - 第五次作业题 [题目] 在线提交地址

    DDL: 202X-XX-XX 23:59

    第六讲 -
  • 大数据技术 [ ]
  • Python实践 [ ]
  • - 【论文】大数据分析技术在新能源汽车行业的应用综述
    【视频】大数据开源平台Spark
    作业6 - 第六次作业题 [题目] 在线提交地址

    DDL: 202X-XX-XX 23:59

    第七讲 -
  • 数据产品开发 [ ]
  • 数据产品项目管理实践 [ ]
  • - 【论文】大数据驱动下顾客参与的产品开发方法研究
    【视频】数据产品设计流程
    作业7 - 第七次作业题 [题目] 在线提交地址

    DDL: 202X-XX-XX 23:59