内容简介
《语料库语言学及Python实现》主要包括语料库语言学的基本理论和语料库建设与研究的Python实现两部分内容。作者将语料库语言学理论和Python方案相结合,介绍了语料库语言学、语料库的设计与研发、语料库的研究范式、Python的基本原理与编程原理、基于Python的语料获取等内容。
《语料库语言学及Python实现》在系统介绍语料库语言学基本理论的同时,侧重为读者提供一套可行、有效、易学的技术方案,而Python正符合这一要求。《语料库语言学及Python实现》介绍的示例程序一般只有10行左右,却都可以实现完整复杂的功能,所以即使不是很懂编程原理的人,也可以借助工具包实现一些复杂功能。后程序开发周期短,这使读者可以将主要精力放在语言研究上。
目录
第1章 概述
1.1 阅读本书的理由
1.2 选择Python的理由
1.3 本书内容安排
第2章 语料库的设计与开发原理
2.1 语料库及其属性
2.2 语料库的建设步骤
2.3 语料库的发展
第3章 基于语料库的语言研究与应用范式
3.1 语料库语言学
3.2 字词频统计调查
3.3 概率分布研究
3.4 搭配和语义韵
3.5 基于语料库的句型语法研究
3.6 语料库在第二语言教学与研究中的应用
3.7 语料库在词典学中的应用
第4章 Python基础编程
4.1 Python安装
4.2 初识Python编程
4.3 数据类型
4.4 流程控制
4.5 文件处理
4.6 函数与模块
4.7 面向对象的编程
第5章 Python的正则表达式与字符串处理
5.1 正则表达式及其功能
5.2 Python的正则表达式模块
5.3 正则表达式模式和实例
第6章 基于Python的网络爬虫
6.1 网络爬虫基础
6.2 urllib、requests加BeautifulSoup爬虫方案
6.3 Scrapy爬虫方案
第7章 语料标注原理与常用的NLP工具包
7.1 中文分词和词性标注基本原理
7.2 句法标注理论基础
7.3 Stanford CoreNLP
7.4 NLTK工具包
7.5 Jieba分词工具包
7.6 THULAC中文词法分析工具包
第8章 数据预处理
8.1 numpy基础
8.2 pandas基础
8.3 Matplotlib绘图基础
第9章 描述性统计
9.1 Python统计工具包
9.2 描述性统计理论
9.3 描述性统计的Python实现
第10章 推断性统计的原理与实现
10.1 理论基础
10.2 参数估计原理
……