自然语言处理是人工智能领域的一个重要的研究方向,是计算机科学与语言学的交叉学科。随着互联网的快速发展,网络文本尤其是用户生成的文本呈爆炸性增长,为自然语言处理带来了巨大的应用需求。
本课程是自然语言处理的核心课程,主要知识单元内容有:系统性介绍自然语言处理常用的理论知识,包括自然语言处理任务限制、技术范畴、语料库、中文自动分词、数据预处理、自然语言处理工具、数据可视化等及相关算法,目的是使学生学会自然语言处理相关的基础知识,以便为应用涉及的任务分析、技术选型奠定基础。同时介绍自然语言处理的命名实体识别、文本信息抽取、文本分类、问答与摘要、机器翻译、语义计算、知识图谱、情感技术等技术领域与重要应用,学习自然语言处理常见应用任务的内涵和解决这些任务的常用方法。
周次 | 章目名称 | 教学内容与教学目标 |
1 | 第一章
引论 | 1. 课程介绍 2. 自然语言处理的基本概念 3. 自然语言处理的研究内容 4. 语言学基础知识-词性、语法、短语结构、语义和语用 5. 自然语言处理的主要技术 6. 自然语言处理的应用场景 7. 自然语言处理的发展趋势 8. 面临的机遇和挑战 |
2 | 第二章 语料库与语言知识库 | 1. 语料库的基本概念 2. 语料库语言学的发展 3. 语料库的类型和典型语料库介绍 4. 语料库构建方法 5. 知识库的基本概念 6. 典型知识库 7. 知识库构建方法 |
3 | 第三章
语言模型 | 1. 语言模型性能评价方法 2. 语言模型自适应方法 3. n-gram语法 4. 贝叶斯网络 5. 马尔可夫模型 6. 最大熵模型 7. 条件随机场模型 |
4
| 第四章
自动分词、词性标注、命名实体识别
| 1. 汉语自动分词的基本问题 2. 汉语分词主要方法 3. 汉语分词方法的最新进展 4. 汉语分词常用工具和评测 5. 词性标注基本概念 6. 词性标注常用方法和模型 7. 词性标注最新进展 8. 词性标注常用工具和评测 9. 命名实体识别基本概念 10. 命名实体识别常用方法 11. 命名实体识别方法最新进展 12. 命名实体识别常用工具和评测 |
5 | 实验课-1 | 1. Project宣讲 2. Python配置 3. NLTK安装配置 4. 案例 |
6 | 第五章
句法分析 | 1. 句法分析的基本概念 2. 语法形式化 3. 句法分析的主要方法 4. 浅层句法分析 5. 依赖语法分析 6. 句法分析性能评价 7. 句法分析常用工具 |
7 | 第六章
语义分析 | 1. 词义消歧基本概念 2. 词义消歧主要方法 3. 有监督的词义消歧方法 4. 基于词典的词义消歧方法 5. 无监督的词义消歧方法 6. 语义角色标注基本概念 7. 语义角色标注基本方法 8. 语义角色标注的领域适用性问题 |
8 | 第七章
语篇分析 | 1. 语篇分析基本概念 2. 语篇分析的基础理论 3. 语篇衔接性研究 4. 语篇连贯性研究 5. 语篇语料标注 6. 汉语语篇分析 |
9 | 第八章
机器翻译 | 1. 机器翻译的基本概念、基本方法 2. 机器翻译的研究现状 3. 机器翻译的主要方法 4. 机器翻译的评估方法 |
10 | 实验课-2 | 1. 词性标注实践 2. 句法分析实践 3. 自动分词实践 4. Project分组及答疑 |
11 | 第九章
情感分析与文本分类 | 1. 文本分类的基本概念、基本方法 2. 文本特征选择 3. 分类器的选择和设计 4. 文本分类性能评测 5. 情感分类任务 |
12 | 第十章
信息抽取与自动文摘 | 1. 信息抽取的基本概念、基本方法 2. 信息抽取的领域应用 3. 自动文摘的基本概念、基本方法 4. 自动文摘的最新研究 |
13 | 第十一章
信息检索与问答系统 | 1. 信息检索的基本概念、基本方法 2. 信息检索的领域应用 3. 自动问答的基本概念 4. 自动问答的技术框架 5. 基于检索、知识库的问答系统 6. 自动问答的评测 7. 自动问答的发展和应用 |
14 | 第十二章
知识图谱 | 1. 知识图谱的基本概念、类型和发展 2. 知识图谱中的知识表示方法 3. 知识体系构建与知识融合 4. 知识图谱的主要技术任务 5. 知识的存储与检索 6. 知识推理 7. 知识图谱的应用 |
15 | 第十三章
基于深度学习的自然语言处理 | 1. 深度学习的基本概念 2. 深度学习的主要方法 3. 深度学习的主要平台 4. 词嵌入常用算法 5. 典型网络模型 6. 深度学习在自然语言处理中的主要应用 |
16 | 实验课-3 | 1. Project分组答辩 |