课程简介 Course Introduction

《数据挖掘与大数据分析》是一门多领域交叉学科,涉及概率论、统计学、信息论、逼近论、凸分析、算法复杂度理论等多门学科。

机器学习是《数据挖掘与大数据分析》最为核心的内容,它专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是使计算机具有智能的根本途径。它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉智能机器人等领域

本课程以监督学习算法为主要教学内容,以生成方法、判别方法、神经网络为主线,介绍机器学习中非常基础但是却非常重要一些算法,算法包括:线性回归、局部加权线性回归、逻辑回归、GLMs模型、SortMax回归、岭回归、Lasso回归、决策树(ID3、C4.5)、KNN算法、单层感知机等。


教学大纲 Teaching Syllabus


周次

主要讲授内容



1

1、数据挖掘的基本概念

2、监督学习和无监督学习

3、分类和回归

4、线性回归的数学原理

5、使用Python实现线性回归算法

6、使用Scikit-learn实现线性回归算法

7、使用MADlib实现线性回归算法


2

1、局部加权线性回归的数学原理

2、使用Python实现线性回归算法

3、使用Scikit-learn实现线性回归算法

4、使用MADlib实现线性回归算法

5、综合案例:基于线性回归的汽车价格预测


3

1、逻辑回归的数学原理

2、使用Python实现逻辑回归算法

3、使用Scikit-learn实现逻辑回归算法

4、使用MADlib实现线性回归算法

5、综合案例:从疝气病症预测病马的死亡率


4

1、指数分布族

2、广义线性回归GLMs的数学原理

3、SoftMax回归算法的数学原理

4、使用Python实现SoftMax回归算法

5、使用Scikit-learn实现SoftMax回归算法

6、使用MADlib实现SoftMax回归算法


6

1、岭回归的数学原理

2、使用Python实现岭回归算法

3、使用Scikit-learn实现岭回归算法

4、使用MADlib实现岭回归算法

5、Lasso回归的数学原理

6、使用Python实现Lasso回归算法

7、使用Scikit-learn实现Lasso回归算法

8、使用MADlib实现Lasso回归算法

6、综合案例:预测乐高玩具套装的价格

7、综合案例:使用Lasso回归选取财政收入预测


7

1、判别模型和生成模型

2、GDA模型的数学原理

3、使用Python实现GDA回归算法

4、使用Scikit-learn实现GDA回归算法

5、使用MADlib实现GDA回归算法


11

1、朴素贝叶斯算法的数学原理

2、使用Python实现朴素贝叶斯算法

3、使用Scikit-learn实现朴素贝叶斯算法

4、使用MADlib实现朴素贝叶斯算法

5、综合案例:基于朴素贝叶斯的垃圾邮件过滤

6、综合案例:使用朴素贝叶斯分类器从个人广告中获取区域倾向


12

1、决策树算法的基本原理

2、使用Python实现C4.5算法

3、使用Scikit-learn实现C4.5算法

4、使用MADlib实现C4.5算法

5、综合案例:使用决策树预测隐性眼镜的类型


13

1、KNN算法的基本原理

2、使用Python实现KNN算法

3、使用Scikit-learn实现KNN算法

4、使用MADlib实现KNN算法

5、综合案例:使用KNN算法改进约会网站的配对效果

6、综合案例:手写识别系统

7、综合案例:基于KNN和决策树算法的多模型手机价格预测

8、综合案例:基于KNN和决策树算法的电信客户流失分析与预测


14

期末考试



留言板 Message Board
条留言  共

  • 参与互动
    Interaction

  • 扫码加入课程
    Scan QR Code
教学队伍Teaching Members
请输入以下信息:
  • 学号号:
  • 班级选择:

扫一扫二维码,快速加入本课程!

放大二维码 查看使用方法
课程
引导