标签分类 热门分类
当前位置:首页 > 程序设计电子书 > 自然语言电子书网盘下载
自然语言处理Python进阶

自然语言处理Python进阶 完整原版电子书

官方价: 25

更 新:

自然语言处理Python进阶 (pdf、epub、mobi、azw3)下载

下载地址:https://pan.baidu.com/s/1ZO2yBH4r9_-rZ5tz-j-j1

分享码:e074

给大家带来的一篇关于自然语言相关的电子书资源,介绍了关于自然语言、Python、进阶方面的内容,本书是由机械工业出版社出版,格式根据源资源分为PDF、epub、mobi、azw3其中一种或多种格式,资源大小38.3 MB,克里希纳·巴夫萨编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:9.1,更多相关的学习资源可以参阅 程序设计电子书Python电子书、等栏目。

自然语言处理Python进阶 PDF

第1章教你应用内嵌的NLTK语料库和頻率遍布。人们还将学什么是WordNet,并探寻其特性和使用方法。

第2章演试怎样从各种各样文件格式的数据库中获取文字。人们还将学习培训怎样从互联网源获取初始文字。*后,人们将从这种异构数据库中对初始文字开展标准并搭建语料库。

第3章详细介绍某些重要的预备处理流程,如词性标注、词干获取、词形复原和编写间距。

第4章详细介绍正则表达式,这是*基础、*简易、*关键和*强劲的专用工具之一。在这章中,你将学习培训模式匹配的定义,这是文本分析的这种方法,根据此定义,沒有比正则表达式更便捷的专用工具了。

第5章将学习培训怎么使用和撰写自身的词性标注器和文法标准。词性标注是深化句法分析的基本,而根据应用词性标识和组块标识能够造成或改善文法标准。

第6章协助你掌握怎么使用内嵌分层器及其训炼或撰写自身的分层器,即依存句法分析器。在这章中,你将学习培训评定自身训炼的实体模型。

第7章详细介绍信息内容提取和文本分类,对你说有关取名实体线鉴别的其他信息。人们将应用内嵌的取名实体线鉴别专用工具,并应用词典建立自身的取名实体线。人们将学好应用内嵌的文本分类优化算法和某些简易的运用案例。

第8章详细介绍进阶自然语言理解方式,该方式将迄今为止你所教的全部课程内容融合到一块儿,并建立解决你日常生活中各种各样难题的可用方式。人们将详细介绍例如文字相似性、引言、情感分析、回指消除等每日任务。

第9章详细介绍深度神经网络运用于自然语言理解所必不可少的各种各样基本概念,比如运用卷积神经网络(CNN)和长度型记忆力互联网(LSTM)开展电子邮件归类、感情归类等,*后在低维空间中数据可视化高维语汇。

第10章叙述怎样运用深度神经网络处理*最前沿的难题,包含文字全自动转化成、场景统计数据问与答,预测分析下个*词的語言实体模型及其生成式对话机器人的开发设计。

目录

  • 前言
  • 作者简介
  • 审校者简介
  • 第1章 语料库和WordNet  1
  • 1.1 引言 1
  • 1.2 访问内置语料库  1
  • 1.3 下载外部语料库,加载并访问  3
  • 1.4 计算布朗语料库中三种不同类别的特殊疑问词  5
  • 1.5 探讨网络文本和聊天文本的词频分布  7
  • 1.6 使用WordNet进行词义消歧  9
  • 1.7 选择两个不同的同义词集,使用WordNet探讨上位词和下位词的概念  12
  • 1.8 基于WordNet计算名词、动词、形容词和副词的平均多义性  15
  • 第2章 针对原始文本,获取源数据和规范化  17
  • 2.1 引言 17
  • 2.2 字符串操作的重要性  17
  • 2.3 深入实践字符串操作  19
  • 2.4 在Python中读取PDF文件  21
  • 2.5 在Python中读取Word文件 23
  • 2.6 使用PDF、DOCX和纯文本文件,创建用户自定义的语料库  26
  • 2.7 读取RSS信息源的内容  29
  • 2.8 使用BeautifulSoup解析HTML  31
  • 第3章 预处理  34
  • 3.1 引言 34
  • 3.2 分词——学习使用NLTK内置的分词器  34
  • 3.3 词干提取——学习使用NLTK内置的词干提取器  36
  • 3.4 词形还原——学习使用NLTK中的WordnetLemmatizer函数 38
  • 3.5 停用词——学习使用停用词语料库及其应用  40
  • 3.6 编辑距离——编写计算两个字符串之间编辑距离的算法  42
  • 3.7 处理两篇短文并提取共有词汇  44
  • 第4章 正则表达式  50
  • 4.1 引言 50
  • 4.2 正则表达式——学习使用*、 和?  50
  • 4.3 正则表达式——学习使用$和^,以及如何在单词内部(非开头与结尾处)进行模式匹配  52
  • 4.4 匹配多个字符串和子字符串  54
  • 4.5 学习创建日期正则表达式和一组字符集合或字符范围  56
  • 4.6 查找句子中所有长度为5的单词,并进行缩写  58
  • 4.7 学习编写基于正则表达式的分词器  59
  • 4.8 学习编写基于正则表达式的词干提取器  60
  • 第5章 词性标注和文法  63
  • 5.1 引言 63
  • 5.2 使用内置的词性标注器  63
  • 5.3 编写你的词性标注器  65
  • 5.4 训练你的词性标注器  70
  • 5.5 学习编写你的文法  73
  • 5.6 编写基于概率的上下文无关文法  76
  • 5.7 编写递归的上下文无关文法  79
  • 第6章 分块、句法分析、依存分析  82
  • 6.1 引言 82
  • 6.2 使用内置的分块器  82
  • 6.3 编写你的简单分块器  84
  • 6.4 训练分块器  87
  • 6.5 递归下降句法分析  90
  • 6.6 shift-reduce句法分析 93
  • 6.7 依存句法分析和主观依存分析  95
  • 6.8 线图句法分析  97
  • 第7章 信息抽取和文本分类  101
  • 7.1 引言 101
  • 7.2 使用内置的命名实体识别工具  102
  • 7.3 创建字典、逆序字典和使用字典  104
  • 7.4 特征集合选择  109
  • 7.5 利用分类器分割句子  113
  • 7.6 文本分类  116
  • 7.7 利用上下文进行词性标注  120
  • 第8章 高阶自然语言处理实践  124
  • 8.1 引言 124
  • 8.2 创建一条自然语言处理管道  124
  • 8.3 解决文本相似度问题  131
  • 8.4 主题识别  136
  • 8.5 文本摘要  140
  • 8.6 指代消解  143
  • 8.7 词义消歧  147
  • 8.8 情感分析  150
  • 8.9 高阶情感分析  153
  • 8.10 创建一个对话助手或聊天机器人  157
  • 第9章 深度学习在自然语言处理中的应用  163
  • 9.1 引言 163
  • 9.2 利用深度神经网络对电子邮件进行分类  168
  • 9.3 使用一维卷积网络进行IMDB情感分类 175
  • 9.4 基于双向LSTM的IMDB情感分类模型  179
  • 9.5 利用词向量实现高维词在二维空间的可视化  183
  • 第10章 深度学习在自然语言处理中的高级应用  188
  • 10.1 引言 188
  • 10.2 基于莎士比亚的著作使用LSTM技术自动生成文本  188
  • 10.3 基于记忆网络的情景数据问答  193
  • 10.4 使用循环神经网络LSTM进行语言建模以预测最优词  199
  • 10.5 使用循环神经网络LSTM构建生成式聊天机器人  203

上一篇:计算机网络:自顶向下方法  下一篇:Python程序设计与算法基础教程

展开 +

收起 -

自然语言 相关电子书
自然语言 学习笔记
网友NO.897442

Python自然语言处理之词干,词形与最大匹配算法代码详解

本文主要对词干提取及词形还原以及最大匹配算法进行了介绍和代码示例,Python实现,下面我们一起看看具体内容。 自然语言处理中一个很重要的操作就是所谓的stemming和lemmatization,二者非常类似。它们是词形规范化的两类重要方式,都能够达到有效归并词形的目的,二者既有联系也有区别。 1、词干提取(stemming) 定义:Stemmingistheprocessforreducinginflected(orsometimesderived)wordstotheirstem,baseorrootform—generallyawrittenwordform. 解释一下,Stemming是抽取词的词干或词根形式(不一定能够表达完整语义)。 NLTK中提供了三种最常用的词干提取器接口,即Porterstemmer,LancasterStemmer和SnowballStemmer。 PorterStemmer基于Porter词干提取算法,来看例子 from nltk.stem.porter import PorterStemmer porter_stemmer = PorterStemmer() porter_stemmer.stem(‘maximum') u'maximum' porter_stemmer.stem(‘presumably') u'presum' porter_stemmer.stem(‘multiply') u'multipli' porter_stemmer.stem(‘provision') u'provis' porter_stemmer.stem(‘owed') u'owe' Lancaster Stemmer 基于Lancaster 词干提取算法,来看例子 from nltk.stem.lancaster import LancasterStemmer lancaster_stemmer = LancasterStemmer() lancaster_stemmer.stem(‘maximum') ‘maxim' lancaster_stemmer.stem(‘presumably') ‘presum' lancaster_stemmer.stem(‘presumably') ‘presum' lancaster_stemmer.stem(‘multiply') ‘multiply' lancaster_stemmer.stem(‘prov……

网友NO.397921

Python自然语言处理 NLTK 库用法入门教程【经典】

本文实例讲述了Python自然语言处理 NLTK 库用法。分享给大家供大家参考,具体如下: 在这篇文章中,我们将基于 Python 讨论自然语言处理(NLP)。本教程将会使用 Python NLTK 库。NLTK 是一个当下流行的,用于自然语言处理的 Python 库。 那么 NLP 到底是什么?学习 NLP 能带来什么好处? 简单的说,自然语言处理( NLP )就是开发能够理解人类语言的应用程序和服务。 我们生活中经常会接触的自然语言处理的应用,包括语音识别,语音翻译,理解句意,理解特定词语的同义词,以及写出语法正确,句意通畅的句子和段落。 NLP的作用 正如大家所知,每天博客,社交网站和网页会产生数亿字节的海量数据。 有很多公司热衷收集所有这些数据,以便更好地了解他们的用户和用户对产品的热情,并对他们的产品或者服务进行合适的调整。 这些海量数据可以揭示很多现象,打个比方说,巴西人对产品 A 感到满意,而美国人却对产品 B 更感兴趣。通过NLP,这类的信息可以即时获得(即实时结果)。例如,搜索引擎正是一种 NLP,可以在正确的时间给合适的人提供适当的结果。 但是搜索引擎并不是自然语言处理(NLP)的唯一应用。还有更好更加精彩的应用。 NLP的应用 以下都是自然语言处理(NLP)的一些成功应用: 搜索引擎,比如谷歌,雅……

网友NO.765963

Python编程使用NLTK进行自然语言处理详解

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。自然语言工具箱(NLTK,NaturalLanguageToolkit)是一个基于Python语言的类库,它也是当前最为流行的自然语言编程与开发工具。在进行自然语言处理研究和应用时,恰当利用NLTK中提供的函数可以大幅度地提高效率。本文就将通过一些实例来向读者介绍NLTK的使用。 NLTK NaturalLanguageToolkit,自然语言处理工具包,在NLP领域中,最常使用的一个Python库。 NLTK是一个开源的项目,包含:Python模块,数据集和教程,用于NLP的研究和开发 。 NLTK由Steven Bird和Edward Loper在宾夕法尼亚大学计算机和信息科学系开发。 NLTK包括图形演示和示例数据。其提供的教程解释了工具包支持的语言处理任务背后的基本概念。 开发环境:我所使用的Python版本是最新的3.5.1,NLTK版本是3.2。Python的安装不在本文的讨论范围内,我们略去不表。你可以从NLTK的官网上http://www.nltk.org/获得最新版本的NLTK。Anyway,使用pip指令来完成NLTK包的下载和安装无疑是最简便的方法。 当然,当你完成这一步时,其实还不够。因为NLTK是由许多许多的包来构成的,此时运行Python,并输入下面的指令(当然,第一条指令还是要导入NLTK包) import nltk nltk.download() 然后,Python Launcher会弹出下面这个界面,建议你选择安装所有的……

一袭素白

一袭素白 发起

资源
32
粉丝
24
喜欢
269
评论
17

    Copyright 2018-2019 xz577.com 码农之家

    版权责任说明