课程简介 Course Introduction

ADVANCED DATA MINING (数据挖掘进阶)

  • For graduate (master) students in Computer Science major

  • South campus, GDUFS

  • Starting at September 2016

  • 36 study scores in total

  • Scheduled as 16 weeks in total

  • The book 《Mining of Massive Datasets》 version 2.1 in English, PDF file (513 pages, 3.69 MB)

  • 《大数据-互联网大规模数据挖掘与分布式处理》(第2版), 王斌译


Related resources:

  • The book 《Mining of Massive Datasets》 version 1 in English, PDF file (340 pages, 2 MB)

  • The book 《Mining of Massive Datasets》 version 2.1 in English, PDF file (513 pages, 3.69 MB)

  • 《Mining of Massive Datasets》, about the book, link

  • 《Mining of Massive Datasets》 by Jeff Ullman, Stanford University, course resource

  • 《Deep Learning for Natural Language Processing》, by Richard Socher, Stanford University, course resource

教学大纲 Teaching Syllabus
校历周次内容(章节、知识点)
第3周
(2 * 40mins)
课程介绍 (Course introduction)
第1章 基本概念 (Basic concept)
第4周
(2 * 40mins)
第2章 MapReduce及新软件栈 (Map-Reduce and the New Software Stack)
2.1 分布式文件系统
2.2 MapReduce
2.3 使用MapReduce的算法
- 主流大数据计算平台介绍
2.7 小结
第5周
(2 * 40mins)
第3章 相似性发现 (Finding Similar Items)
3.1 紧邻搜索的应用
3.2 文档的shingling
3.3 保持相似度的集合摘要表示
3.4 文档的局部敏感哈希算法
3.5 距离测度
3.6 局部敏感函数理论
3.10 小结
第6周
(2 * 40mins)
Project 介绍
第7周
(2 * 40mins)
第7章 聚类 (Clustering)
7.1 聚类技术介绍
7.2 层次聚类
7.3 k-均值算法
第8周
(2 * 40mins)
第7章 聚类 (Clustering)
7.4 CURE算法
7.5 非欧空间下的聚类
7.6 流聚类及并行化
7.7 小结
第9周
(3 * 40mins)
第9章 推荐系统
9.1 推荐系统的模型
9.2 基于内容的推荐
9.3 协同过滤
第10周
(3 * 40mins)
第9章 推荐系统
9.4 降维处理
9.5 NetFlix竞赛
9.6 小结
Project 进度检查
第11周
(3 * 40mins)
Introduction to Deep Learning
第12周
(3 * 40mins)
Deep Learning for NLP (1)
第13周
(2 * 40mins)
Deep Learning for NLP (2)
第14周
(2 * 40mins)
Simple Word Vector representations
word2vec, GloVe
第15周
(2 * 40mins)
Advanced word vector representations
language models, softmax, single layer networks
第16周
(2 * 40mins)
CNTK - Computational Network Toolkit for deep learning
第17周
(2 * 40mins)
Project检查
第18周
(2 * 40mins)
Project答辩

  • 参与互动
    Interaction

  • 扫码加入课程
    Scan QR Code
教学队伍Teaching Members
需要验证您的身份,请输入请求信息:
  • 学号号:
  • 班级选择:
  • 附注信息:

扫一扫二维码,快速加入本课程!

放大二维码 查看使用方法
课程
引导