当前位置:首页 > 程序设计 >
《自然语言处理Python进阶》电子书封面

自然语言处理Python进阶

  • 发布时间:2019年10月18日 20:30:26
  • 作者:克里希纳·巴夫萨
  • 大小:38.3 MB
  • 类别:自然语言电子书
  • 格式:PDF
  • 版本:完整原版
  • 评分:7.1

    自然语言处理Python进阶 PDF 完整原版

      给大家带来的一篇关于自然语言相关的电子书资源,介绍了关于自然语言、Python、进阶方面的内容,本书是由机械工业出版社出版,格式为PDF,资源大小38.3 MB,克里希纳·巴夫萨编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:7.6。

      内容介绍

      自然语言处理Python进阶 PDF

      第1章教你应用内嵌的NLTK语料库和頻率遍布。人们还将学什么是WordNet,并探寻其特性和使用方法。

      第2章演试怎样从各种各样文件格式的数据库中获取文字。人们还将学习培训怎样从互联网源获取初始文字。*后,人们将从这种异构数据库中对初始文字开展标准并搭建语料库。

      第3章详细介绍某些重要的预备处理流程,如词性标注、词干获取、词形复原和编写间距。

      第4章详细介绍正则表达式,这是*基础、*简易、*关键和*强劲的专用工具之一。在这章中,你将学习培训模式匹配的定义,这是文本分析的这种方法,根据此定义,沒有比正则表达式更便捷的专用工具了。

      第5章将学习培训怎么使用和撰写自身的词性标注器和文法标准。词性标注是深化句法分析的基本,而根据应用词性标识和组块标识能够造成或改善文法标准。

      第6章协助你掌握怎么使用内嵌分层器及其训炼或撰写自身的分层器,即依存句法分析器。在这章中,你将学习培训评定自身训炼的实体模型。

      第7章详细介绍信息内容提取和文本分类,对你说有关取名实体线鉴别的其他信息。人们将应用内嵌的取名实体线鉴别专用工具,并应用词典建立自身的取名实体线。人们将学好应用内嵌的文本分类优化算法和某些简易的运用案例。

      第8章详细介绍进阶自然语言理解方式,该方式将迄今为止你所教的全部课程内容融合到一块儿,并建立解决你日常生活中各种各样难题的可用方式。人们将详细介绍例如文字相似性、引言、情感分析、回指消除等每日任务。

      第9章详细介绍深度神经网络运用于自然语言理解所必不可少的各种各样基本概念,比如运用卷积神经网络(CNN)和长度型记忆力互联网(LSTM)开展电子邮件归类、感情归类等,*后在低维空间中数据可视化高维语汇。

      第10章叙述怎样运用深度神经网络处理*最前沿的难题,包含文字全自动转化成、场景统计数据问与答,预测分析下个*词的語言实体模型及其生成式对话机器人的开发设计。

      目录

      • 前言
      • 作者简介
      • 审校者简介
      • 第1章 语料库和WordNet  1
      • 1.1 引言 1
      • 1.2 访问内置语料库  1
      • 1.3 下载外部语料库,加载并访问  3
      • 1.4 计算布朗语料库中三种不同类别的特殊疑问词  5
      • 1.5 探讨网络文本和聊天文本的词频分布  7
      • 1.6 使用WordNet进行词义消歧  9
      • 1.7 选择两个不同的同义词集,使用WordNet探讨上位词和下位词的概念  12
      • 1.8 基于WordNet计算名词、动词、形容词和副词的平均多义性  15
      • 第2章 针对原始文本,获取源数据和规范化  17
      • 2.1 引言 17
      • 2.2 字符串操作的重要性  17
      • 2.3 深入实践字符串操作  19
      • 2.4 在Python中读取PDF文件  21
      • 2.5 在Python中读取Word文件 23
      • 2.6 使用PDF、DOCX和纯文本文件,创建用户自定义的语料库  26
      • 2.7 读取RSS信息源的内容  29
      • 2.8 使用BeautifulSoup解析HTML  31
      • 第3章 预处理  34
      • 3.1 引言 34
      • 3.2 分词——学习使用NLTK内置的分词器  34
      • 3.3 词干提取——学习使用NLTK内置的词干提取器  36
      • 3.4 词形还原——学习使用NLTK中的WordnetLemmatizer函数 38
      • 3.5 停用词——学习使用停用词语料库及其应用  40
      • 3.6 编辑距离——编写计算两个字符串之间编辑距离的算法  42
      • 3.7 处理两篇短文并提取共有词汇  44
      • 第4章 正则表达式  50
      • 4.1 引言 50
      • 4.2 正则表达式——学习使用*、 和?  50
      • 4.3 正则表达式——学习使用$和^,以及如何在单词内部(非开头与结尾处)进行模式匹配  52
      • 4.4 匹配多个字符串和子字符串  54
      • 4.5 学习创建日期正则表达式和一组字符集合或字符范围  56
      • 4.6 查找句子中所有长度为5的单词,并进行缩写  58
      • 4.7 学习编写基于正则表达式的分词器  59
      • 4.8 学习编写基于正则表达式的词干提取器  60
      • 第5章 词性标注和文法  63
      • 5.1 引言 63
      • 5.2 使用内置的词性标注器  63
      • 5.3 编写你的词性标注器  65
      • 5.4 训练你的词性标注器  70
      • 5.5 学习编写你的文法  73
      • 5.6 编写基于概率的上下文无关文法  76
      • 5.7 编写递归的上下文无关文法  79
      • 第6章 分块、句法分析、依存分析  82
      • 6.1 引言 82
      • 6.2 使用内置的分块器  82
      • 6.3 编写你的简单分块器  84
      • 6.4 训练分块器  87
      • 6.5 递归下降句法分析  90
      • 6.6 shift-reduce句法分析 93
      • 6.7 依存句法分析和主观依存分析  95
      • 6.8 线图句法分析  97
      • 第7章 信息抽取和文本分类  101
      • 7.1 引言 101
      • 7.2 使用内置的命名实体识别工具  102
      • 7.3 创建字典、逆序字典和使用字典  104
      • 7.4 特征集合选择  109
      • 7.5 利用分类器分割句子  113
      • 7.6 文本分类  116
      • 7.7 利用上下文进行词性标注  120
      • 第8章 高阶自然语言处理实践  124
      • 8.1 引言 124
      • 8.2 创建一条自然语言处理管道  124
      • 8.3 解决文本相似度问题  131
      • 8.4 主题识别  136
      • 8.5 文本摘要  140
      • 8.6 指代消解  143
      • 8.7 词义消歧  147
      • 8.8 情感分析  150
      • 8.9 高阶情感分析  153
      • 8.10 创建一个对话助手或聊天机器人  157
      • 第9章 深度学习在自然语言处理中的应用  163
      • 9.1 引言 163
      • 9.2 利用深度神经网络对电子邮件进行分类  168
      • 9.3 使用一维卷积网络进行IMDB情感分类 175
      • 9.4 基于双向LSTM的IMDB情感分类模型  179
      • 9.5 利用词向量实现高维词在二维空间的可视化  183
      • 第10章 深度学习在自然语言处理中的高级应用  188
      • 10.1 引言 188
      • 10.2 基于莎士比亚的著作使用LSTM技术自动生成文本  188
      • 10.3 基于记忆网络的情景数据问答  193
      • 10.4 使用循环神经网络LSTM进行语言建模以预测最优词  199
      • 10.5 使用循环神经网络LSTM构建生成式聊天机器人  203

      学习笔记

      Python自然语言处理之词干,词形与最大匹配算法代码详解

      本文主要对词干提取及词形还原以及最大匹配算法进行了介绍和代码示例,Python实现,下面我们一起看看具体内容。 自然语言处理中一个很重要的操作就是所谓的stemming和lemmatization,二者非常类似。它们是词形规范化的两类重要方式,都能够达到有效归并词形的目的,二者既有联系也有区别。 1、词干提取(stemming) 定义:Stemmingistheprocessforreducinginflected(orsometimesderived)wordstotheirstem,baseorrootform—generallyawrittenwordform. 解释一下,Stemming是抽取词的词干或词根形式(不一定能够表达完整语义)。 NLTK中提供了三种最常用的词干提取器接口,即Porterstemmer,LancasterStemmer和SnowballStemmer。 PorterStemmer基于Porter词干提取……

      Python自然语言处理 NLTK 库用法入门教程【经典】

      本文实例讲述了Python自然语言处理 NLTK 库用法。分享给大家供大家参考,具体如下: 在这篇文章中,我们将基于 Python 讨论自然语言处理(NLP)。本教程将会使用 Python NLTK 库。NLTK 是一个当下流行的,用于自然语言处理的 Python 库。 那么 NLP 到底是什么?学习 NLP 能带来什么好处? 简单的说,自然语言处理( NLP )就是开发能够理解人类语言的应用程序和服务。 我们生活中经常会接触的自然语言处理的应用,包括语音识别,语音翻译,理解句意,理解特定词语的同义词,以及写出语法正确,句意通畅的句子和段落。 NLP的作用 正如大家所知,每天博客,社交网站和网页会产生数亿字节的海量数据。 有很……

      Python编程使用NLTK进行自然语言处理详解

      自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。自然语言工具箱(NLTK,NaturalLanguageToolkit)是一个基于Python语言的类库,它也是当前最为流行的自然语言编程与开发工具。在进行自然语言处理研究和应用时,恰当利用NLTK中提供的函数可以大幅度地提高效率。本文就将通过一些实例来向读者介绍NLTK的使用。 NLTK NaturalLanguageToolkit,自然语言处理工具包,在NLP领域中,最常使用的一个Python库。 NLTK是一个开源的项目,包含:Python模块,数据集和教程,用于NLP的研究和开发 。 NLTK由Steven Bird和Edward Loper在宾夕法尼亚大学计算机和信息科学系开发。 NLTK包括图形演示和示例数据。其提供的教程……

      以上就是本次介绍的自然语言电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:计算机网络:自顶向下方法

      下一篇:Python程序设计与算法基础教程

      展开 +

      收起 -

      • 《自然语言处理Python进阶》PDF下载

      码小辫

      重要!版权问题,本电子书取消了本地下载!

      需要的朋友可以关注左边的微信号,发送 电子书名关键字 (例如:python 算法……)

      如果找不到可以联系小辫(微信:maxiaobian1024)

      自然语言相关电子书
      基于深度学习的自然语言处理
      基于深度学习的自然语言处理 完整版

      本书将深度学习技术应用于自然语言处理的实用指南,系统阐述将深度学习技术应用于自然语言处理的方法和技术,深入浅出地介绍了深度学习的基本知识及各种常用的网络结构等方面

      立即下载
      精通Python自然语言处理(Deepti)
      精通Python自然语言处理(Deepti) 原书中文高清版

      这是一本学习自然语言处理的一本综合学习指南,介绍如何使用Python执行各种自然语言处理(NLP)任务,帮助读者掌握利用Python设计和构建基于NLP的应用实践。适合熟悉Python语言并对自然语言处

      立即下载
      自然语言处理实践:聊天机器人技术原理与应用
      自然语言处理实践:聊天机器人技术原理与应用 扫描版

      本书全面系统地介绍了聊天机器人的背景、典型应用场景,以及核心技术模块。并围绕问答系统、任务对话系统和闲聊系统三种聊天机器人的具体展现,从技术原理和实践两个方面进行阐述,适

      立即下载
      文本上的算法:深入浅出自然语言处理
      文本上的算法:深入浅出自然语言处理 清晰扫描版

      NLP技术入门教程,深入浅出讲解自然语言处理和机器学习技术,力图用生动形象的方式介绍了自然语言处理的理论、方法和技术,广受读者好评的深度学习技术读物

      立即下载
      Python自然语言处理
      Python自然语言处理 完整目录版

      Python自然语言理解层面的权威性之作 迅速掌握某些定义及基础原理的必看 出示丰富多彩英语语料库和编码,便捷训练 从电脑输入法想到提醒(predictivetext)、email过虑到全自动文字归纳、翻译

      立即下载
      自然语言处理原理与技术实现
      自然语言处理原理与技术实现 超清版

      全面详解自然语言处理原理+Java实现过程,详细介绍了中文分词和词性标注的过程及相关算法,还有问答系统、聊天机器人、语音识别等众多应用广泛的案例

      立即下载
      自然语言处理综论
      自然语言处理综论 完整第2版

      本书全面论述了自然语言处理技术,新版增加反映自然语言处理最新成就的内容,增加语音处理和统计技术方面的内容,深入浅出,实例丰富

      立即下载
      读者留言
      一袭素白

      一袭素白 提供上传

      资源
      43
      粉丝
      38
      喜欢
      289
      评论
      16

      Copyright 2018-2020 www.xz577.com 码农之家

      投诉 / 推广 / 赞助:QQ:520161757