NLTK基础教程:用NLTK和Python库构建机器学习应用

NLTK基础教程:用NLTK和Python库构建机器学习应用 PDF 高清版

  • 大小:9.87 MB
  • 类型:NLTK
  • 格式:PDF
  • 热度:790
  • 作者:Nitin、Hardeniya、哈登尼亚
  • 更新:2020-05-23 20:08:41
vip 立即下载( 9.87 MB )
关注公众号免费下载
版权投诉 / 资源反馈(本资源由用户 益德厚 投稿)

我们帮大家精选了NLTK相关的资料,介绍了关于NLTK、Python库、机器学习方面,格式为PDF,资源大小9.87 MB,目前在NLTK类资源综合评分为:7.1分。

《 NLTK基础教程 》关键介绍怎样根据NLTK库与一些Python库的融合进而完成繁杂的NLP每日任务和深度学习运用。本书共分成10章。第1章对NLP开展了简易介绍。第二章、第三章和第四章关键介绍一些通用性的预处理技术、专归属于NLP行业的预处理技术及其取名实体识别技术等。第五章以后的內容侧重于介绍怎样搭建一些NLP运用,涉及到文本分类、计算机科学和数据处理方法、社交网络发掘和规模性文本挖掘等层面。 目录 第1章自然语言处理简介1 1.1为什么要学习NLP2 1.2先从Python开始吧5 1.2.1列表5 1.2.2自助功能6 1.2.3正则表达式8 1.2.4字典9 1.2.5编写函数10 1.3向NLTK迈进11 1.4练习16 1.5小结17 第2章文本的歧义及其清理18 2.1何谓文本歧义18 2.2文本清理20 2.3语句分离器21 2.4标识化处理22 2.5词干提取23 2.6词形还原24 2.7停用词移除25 2.8罕见词移除26 2.9拼写纠错26 2.10练习27 2.11小结28 第3章词性标注29 3.1何谓词性标注29 3.1.1Stanford标注器32 3.1.2深入了解标注器33 3.1.3顺序性标注器35 3.1.4Brill标注器37 3.1.5基于机器学习的标注器37 3.2命名实体识别(NER)38 3.3练习40 3.4小结41 第4章文本结构解析43 4.1浅解析与深解析43 4.2两种解析方法44 4.3为什么需要进行解析44 4.4不同的解析器类型46 4.4.1递归下降解析器46 4.4.2移位归约解析器46 4.4.3图表解析器46 4.4.4正则表达式解析器47 4.5依存性文本解析48 4.6语块分解50 4.7信息提取53 4.7.1命名实体识别(NER)53 4.7.2关系提取54 4.8小结55 第5章NLP应用56 5.1构建第一个NLP应用57 5.2其他NLP应用60 5.2.1机器翻译60 5.2.2统计型机器翻译61 5.2.3信息检索62 5.2.4语音识别64 5.2.5文本分类65 5.2.6信息提取66 5.2.7问答系统67 5.2.8对话系统67 5.2.9词义消歧67 5.2.10主题建模68 5.2.11语言检测68 5.2.12光符识别68 5.3小结68 第6章文本分类70 6.1机器学习71 6.2文本分类72 6.3取样操作74 6.3.1朴素贝叶斯法76 6.3.2决策树79 6.3.3随机梯度下降法80 6.3.4逻辑回归81 6.3.5支持向量机81 6.4随机森林算法83 6.5文本聚类83 6.6文本中的主题建模84 6.7参考资料87 6.8小结87 第7章Web爬虫88 7.1Web爬虫88 7.2编写第一个爬虫程序89 7.3Scrapy库中的数据流92 7.3.1Scrapy库的shell93 7.3.2目标项98 7.4生成网站地图的蜘蛛程序99 7.5目标项管道100 7.6参考资料102 7.7小结102 第8章NLTK与其他Python库的搭配运用104 8.1NumPy104 8.1.1多维数组105 8.1.2基本运算106 8.1.3从数组中提取数据107 8.1.4复杂矩阵运算108 8.2SciPy112 8.2.1线性代数113 8.2.2特征值与特征向量113 8.2.3稀疏矩阵114 8.2.4优化措施115 8.3pandas117 8.3.1读取数据117 8.3.2数列119 8.3.3列转换121 8.3.4噪声数据121 8.4matplotlib123 8.4.1子图绘制123 8.4.2添加坐标轴124 8.4.3散点图绘制125 8.4.4条形图绘制126 8.4.53D绘图126 8.5参考资料126 8.6小结127 第9章Python中的社交媒体挖掘128 9.1数据收集128 9.2数据提取132 9.3地理可视化134 9.3.1影响力检测135 9.3.2Facebook135 9.3.3有影响力的朋友139 9.4小结141 第10章大规模文本挖掘142 10.1在Hadoop上使用Python的不同方式142 10.1.1Python的流操作143 10.1.2Hive/Pig下的UDF143 10.1.3流封装器143 10.2Hadoop上的NLTK144 10.2.1用户定义函数(UDF)144 10.2.2Python的流操作146 10.3Hadoop上的Scikitlearn147 10.4PySpark150 10.5小结153

相关资源

  • 《数据结构编程实验:大学程序设计课程与竞赛训练教材(第3版)》源代码,试题

    《数据结构编程实验:大学程序设计课程与竞赛训练教材(第3版)》源代码,试题

    本书针对大学程序设计竞赛和课程教学,基于数据结构的知识体系结构和循序渐进的原则组织内容,包括基本编程能力训练、线性数据结构的编程、树的编程、图的编程。在每一章中,先介绍了相关的数据结构知识后,然后给出相应的范例;在每章的结尾给出相关题库。 目录 前言 第一篇训练基本编程能力的实验 第1章简单计算的编程实验2 1.1改进程序书写风格2 1.2正确处理多个测试用例4 1.3在实数和整数之间转换10 1.4二分法、实数精度13 1.5相关题库20 第

    大小:98.2 MB数据结构配套资源

  • C语言程序设计案例教程(第二版)

    C语言程序设计案例教程(第二版) 课后答案

    本书第1版出版以来,为大学理工科学生提供了一本学习程序设计方法和程序设计语言的专业教科书。与以程序设计语言功能为中心的众多教材不同,本书强调以程序设计方法的教学为中心。按照语言基础知识、控制结构、算法初步、数据组织、程序组织、应用实例和课程设计的顺序组织教学内容,通过分析精选的程序设计案例,由浅入深地逐步介绍程序设计方法以及支持这些程序设计方法的语言功能。这种组织方法力求使学生能够按照正确的程序设计方

    大小:47.8 KBC语言课后答案

  • PHP web 程序设计教程与实验

    PHP web 程序设计教程与实验 课后答案

    本书以PHP 5为主要编程工具,以MySQL 4.1为Web数据库,结合多年的Web网站开发的实际经验和教学,全面地介绍开发Web动态网页的程序设计技*,内容包括Web基础、HTML基础、客户端脚本语言、动态Web网站环境的构建、PHP语法基础、PHP面向对象编程、MySQL数据库作、PHP访问MySQL数据库、会话和用户认证、XML语法、PHP 5的XML文档解析、基于PHP 5的Web服务、XML与数据库之间数据交换、网络考试应用系统实例等内容。 本书内容丰富,结构合理,由浅入深,例题丰富,实验

    大小:117 KBPHP web课后答案

  • 《零基础轻松学SQL Server 2016》源代码

    《零基础轻松学SQL Server 2016》源代码

    本书作者根据长期开发与教学实践所积累的宝贵经验,通过基础知识+中小实例+综合案例的方式,讲述用SQL数据库的必备知识,是一本适合读者快速入门到精通的自学教程。内容包括初识数据库、操作存储数据仓库、操作存储数据单元、约束表中的数据、管理表中的数据、查询语句入门、查询语句提高、系统函数与自定义函数、视图、索引、T-SQL语言基础、存储过程、触发器、数据库备份和还原等,并通过大量实际案例对这些内容进行详细讲解,能够帮助

    大小:9.6 MBSQL Server配套资源

  • 《AI速成课:从AI编程到构建智能软件》源码

    《AI速成课:从AI编程到构建智能软件》源码

    本书从基础知识入手,详细讲解通过强化学习和深度学习构建AI系统所需的一切,并通过5个完整的项目实例,循序渐进展示如何使用最佳、最简单的AI编程工具(包括Python、TensorFlow、Keras和PyTorch)构建智能软件。具体内容包括AI工具包、Python基础、AI基础技巧、你的第一个AI模型、销售和广告中的AI、Q学习、物流行业中的AI、人工大脑、自动驾驶车辆中的AI、商业中的AI、深度卷积Q学习、游戏中的AI。 封面图 目录 译者序 前言 作者简介 审校者简介 第1章欢

    大小:220.86 MBAI编程配套资源

  • 《全国计算机等级考试全面剖析及考前冲刺二级C语言程序设计(2009版)》二级C上机文件

    《全国计算机等级考试全面剖析及考前冲刺二级C语言程序设计(2009版)》二级C上机文件

    丛书特点 紧贴最新大纲 按照大纲编排结构,内容全部依据教育部考试中心制定的全国计算机等级考试最新大纲(2008年版)中的要求编写。 全面串讲考点 对大纲要求的考点进一步细化,简单扼要、全面覆盖,还通过重要知识点和应考点拨环节进一步明确和强调考点中的重点、难点。 解析经典试题 对往年考题进行了甄选,给出必要的解析过程,阐述考生应该掌握的基本考点、主要知识点以及答题技巧,读者可在这些题目的基础上举一反三。 注重强化训

    大小:3.6 MB计算机等级考试配套资源

  • 《精通Python自动化编程》源代码

    《精通Python自动化编程》源代码

    本书由一线Python开发工程师精心编写,循序渐进地介绍Python自动化编程的相关知识,全书共20章,第1~14章讲解Python编程基础知识,第15章介绍关系型数据库SQLite和MySQL、非关系型数据库MongoDB和Redis、ORM框架SQLAlchemy的应用,第16~20章分别介绍Selenium实现网页自动化、Requests实现网页爬虫编程、办公自动化编程、OpenCV实现图像识别与定位、Web系统的开发与部署。 本书理论与实践相结合,案例丰富,非常适合从零开始学习自动化编程的读者学习

    大小:4.6 MBPython编程配套资源

  • 《Unreal Engine 4游戏开发入门经典》项目文件

    《Unreal Engine 4游戏开发入门经典》项目文件

    编辑推荐 本书是学习Unreal的经典入门级图书,是24小时系列中的一本,品质很有保障。同时,本书也是由EPIC Games官方授 权的图书,在内容专业度和可用性方面都得到了更好的保障,是读者不 可 多 得的参考读物。选用国内专业的游戏专业人士参与翻译,本书译者是知名的Unreal培训机构的讲师,对于游戏开发和计算机编程有着丰富的经验。 内容简介 虚幻引擎(Unreal Engine)是目前世界知名度高、应用广泛的游戏引擎之一,全新版本的虚幻引擎4(Unreal En

    大小:6.41 GBUnreal Engine配套资源

下载地址

相关声明:

学习笔记