`

《智能Web算法》

 
阅读更多

《智能Web算法》

基本信息

原书名: Algorithms of the Intelligent Web

原出版社: Manning Publications

作者: (美)Haralambos Marmanis    Dmitry Babenko    [作译者介绍]

译者: 阿稳 陈钢

出版社:电子工业出版社

ISBN:9787121139192

上架时间:2011-8-1

出版日期:2011 年7月

http://product.china-pub.com/198425

《智能Web算法》电子书在线阅读

 

内容简介 
    《智能web算法》涵盖了五类重要的智能算法:搜索、推荐、聚类、分类和分类器组合,并结合具体的案例讨论了它们在web 应用中的角色及要注意的问题。除了第1 章的概要性介绍以及第7 章对所有技术的整合应用外,第2~6 章以代码示例的形式分别对这五类算法进行了介绍。
  《智能web算法》面向的是广大普通读者,特别是对算法感兴趣的工程师与学生,所以对于读者的知识背景并没有过多的要求。本书中的例子和思想应用广泛,所以对于希望从业务角度更好地理解有关技术的技术经理、产品经理和管理层来说,本书也有一定的价值。

目录
《智能web算法》
1 什么是智能web? 1
1.1 智能web应用实例 3
1.2 智能应用的基本要素 4
1.3 什么应用会受益于智能? 5
1.3.1 社交网络 6
1.3.2 mashup 7
1.3.3 门户网站 8
1.3.4 维基 9
1.3.5 文件分享网站 9
1.3.6 网络游戏 11
1.4 如何构建智能应用? 11
1.4.1 检查功能和数据 12
1.4.2 获取更多的数据 12
1.5 机器学习、数据挖掘及其他 16
1.6 智能应用中八个常见的误区 17
1.6.1 误区1:数据是可靠的 18
1.6.2 误区2:计算能马上完成 19
1.6.3 误区3:不用考虑数据规模 19
1.6.4 误区4:不考虑解决方案的可扩展性 19
1.6.5 误区5:随处使用同样的方法 19
1.6.6 误区6:总是能知道计算时间 20
1.6.7 误区7:复杂的模型更好 20
1.6.8 误区8:存在无偏见的模型 20
1.7 小结 20
1.8 参考资料 21
2 搜索 22
2.1 用lucene实现搜索 23
2.1.1 理解lucene代码 24
2.1.2 搜索的基本步骤 31
2.2 为什么搜索不仅仅是索引? 33
2.3 用链接分析改进搜索结果 35
2.3.1 pagerank简介 35
2.3.2 计算pagerank向量 37
2.3.3 alpha:网页间跳转的影响 38
2.3.4 理解幂方法 40
2.3.5 结合索引分值和pagerank分值 45
2.4 根据用户点击改进搜索结果 47
2.4.1 用户点击初探 48
2.4.2 朴素贝叶斯分类器的使用 50
2.4.3 整合lucene索引、pagerank和用户点击 54
2.5 word、pdf等无链接文档的排序 58
2.5.1 docrank算法简介 58
2.5.2 docrank的原理 60
2.6 大规模实现的有关问题 65
2.7 用户得到了想要的结果吗?精确度和查全率 67
2.8 总结 69
2.9 to do 70
2.10 参考资料 72
3 推荐系统 73
3.1 一个在线音乐商店:基本概念 74
3.1.1 距离与相似度的概念 75
3.1.2 走近相似度的计算 80
3.1.3 什么才是最好的相似度计算公式? 83
3.2 推荐引擎是怎么工作的 84
3.2.1 基于相似用户的推荐 85
3.2.2 基于相似条目的推荐 94
3.2.3 基于内容的推荐 98
3.3 推荐朋友、文章与新闻报道 104
3.3.1 mydiggspace.com简介 105
3.3.2 发现朋友 106
3.3.3 diggdelphi的内部工作机制 108
3.4 像netflix.com那样推荐电影 114
3.4.1 电影数据集的介绍及推荐器 114
3.4.2 数据标准化与相关系数 117
3.5 大规模的实现与评估 123
3.6 总结 124
3.7 to do 125
3.8 参考资料 127
4 聚类:事物的分组 128
4.1 聚类的需求 129
4.1.1 网站中的用户组:案例研究 129
4.1.2 用sql order by子句分组 131
4.1.3 用数组排序分组 132
4.2 聚类算法概述 135
4.2.1 基于分组结构的聚类算法分类 136
4.2.2 基于数据类型和结构的聚类算法分类 137
4.2.3 根据数据规模的聚类算法分类 137
4.3 基于链接的算法 138
4.3.1 树状图:基本的聚类数据结构 139
4.3.2 基于链接的算法概况 141
4.3.3 单链接算法 142
4.3.4 平均链接算法 144
4.3.5 最小生成树算法 147
4.4 k-means算法 149
4.4.1 初识k-means算法 150
4.4.2 k-means的内部原理 151
4.5 鲁棒的链接型聚类(rock) 153
4.5.1 rock简介 154
4.5.2 为什么rock这么强大? 154
4.6 dbscan 159
4.6.1 基于密度的算法简介 159
4.6.2 dbscan的原理 162
4.7 超大规模数据聚类 165
4.7.1 计算复杂性 166
4.7.2 高维度 167
4.8 总结 168
4.9 to do 169
4.10 参考资料 171
5 分类:把事物放到它该在的地方 172
5.1 对分类的需求 173
5.2 分类器的概述 177
5.2.1 结构分类算法 178
5.2.2 统计分类算法 180
5.2.3 分类器的生命周期 181
5.3 邮件的自动归类与垃圾邮件过滤 182
5.3.1 朴素贝叶斯分类 184
5.3.2 基于规则的分类 197
5.4 用神经网络做欺诈检测 210
5.4.1 交易数据中关于欺诈检测的一个用例 210
5.4.2 神经网络概览 212
5.4.3 一个可用的神经网络欺诈检测器 214
5.4.4 神经网络欺诈检测器剖析 218
5.4.5 创建通用神经网络的基类 226
5.5 你的结果可信吗? 232
5.6 大数据集的分类 235
5.7 总结 237
5.8 to do 239
5.9 参考资料 242
6 分类器组合 244
6.1 信贷价值:分类器组合案例研究 246
6.1.1 数据的简要说明 247
6.1.2 为真实问题生成人工数据 250
6.2 用单分类器做信用评估 255
6.2.1 朴素贝叶斯的基准线 255
6.2.2 决策树基准线 258
6.2.3 神经网络基线 260
6.3 在同一个数据集中比较多个分类器 263
6.3.1 mcnemar检验 264
6.3.2 差额比例检验 266
6.3.3 cochran q检验与f检验 268
6.4 bagging: bootstrap聚合(bootstrap aggregating) 270
6.4.1 bagging实例 272
6.4.2 bagging分类器底层细节 274
6.4.3 分类器集成 276
6.5 boosting:一种迭代提高的方法 279
6.5.1 boosting分类器实例 280
6.5.2 boosting分类器底层细节 282
6.6 总结 286
6.7 to do 288
6.8 参考资料 292
7 智能技术大汇集:一个智能新闻门户 293
7.1 功能概览 295
7.2 获取并清洗内容 296
7.2.1 各就位、预备、开抓! 296
7.2.2 搜索预备知识回顾 298
7.2.3 一个抓取并处理好的新闻数据集 299
7.3 搜索新闻 301
7.4 分配新闻类别 304
7.4.1 顺序问题 304
7.4.2 使用newsprocessor类进行分类 309
7.4.3 分类器 310
7.4.4 分类策略:超越底层的分类 313
7.5 用newsprocessor类创建新闻分组 316
7.5.1 聚类全部文章 317
7.5.2 在一个新闻类别中聚类文章 321
7.6 基于用户评分的动态内容展示 325
7.7 总结 328
7.8 to do 329
7.9 参考资料 333
附录a beanshell简介 334
a.1 什么是beanshell? 334
a.2 为什么使用beanshell? 335
a.3 运行beanshell 335
a.4 参考资料 336
附录b 网络采集 337
b.1 爬虫组件概况 337
b.1.1 采集的步骤 338
b.1.2 我们的简单爬虫 338
b.1.3 开源web爬虫 339
b.2 参考资料 340
附录c 数学知识回顾 341
c.1 向量和矩阵 341
c.2 距离的度量 342
c.3 高级矩阵方法 344
c.4 参考资料 344
附录d 自然语言处理 345
d.1 参考资料 347
附录e 神经网络 348
e.1 参考资料 349
索引 350

  • 大小: 8 KB
分享到:
评论

相关推荐

    智能Web算法书本代码

    智能Web算法是现代互联网技术的重要组成部分,用于提升网站性能、优化用户体验、以及实现自动化决策等。这本书的代码库,"iWeb2",显然是针对智能Web算法的一系列实践示例,旨在帮助读者深入理解并应用这些算法。...

    [智能Web算法].(玛若曼尼斯).阿稳等.扫描版-带完整目录书签

    《智能Web算法》是一本深度探讨现代Web技术中核心算法的书籍,由玛若曼尼斯与阿稳等专家合著。这本书旨在为读者提供全面的Web智能算法理解,包括推荐系统、搜索引擎、网络爬虫、数据聚类以及分类器等多个重要领域的...

    智能Web算法(中文版)

    Algorithms of the Intelligent Web的中文版.本书主要介绍了5类智能Web应用的...最近一直对搜索引擎等等感兴趣,于是乎我就找到了这本《智能Web算法》.发现很多的资源都是收费的,因而呢本着分享,该资源打包了,免费下载.

    智能web算法

    ### 智能Web算法概览 #### 一、引言与定义 在《智能Web算法》这本书中,作者Haralambos Marmanis和Dmitry Babenko深入探讨了如何利用先进的算法来构建智能化的Web应用和服务。本书旨在帮助读者理解并掌握智能Web的...

    智能Web算法 最新版 pdf

    ### 智能Web算法概览 #### 一、智能Web算法的概念与意义 智能Web算法,作为现代互联网技术中的核心部分,对于提高网站服务质量和用户体验具有重要意义。本书《智能Web算法》最新版中文版对常用的智能Web算法进行了...

    智能WEB算法

    《智能WEB算法》这本书对于从事WEB开发的工程师而言,具有极高的实用价值和参考意义。WEB开发是一门综合技术,它不仅涉及到前端的设计与实现,还包括后端的数据处理、数据库管理以及服务器的优化等。WEB算法则是连接...

    智能Web算法(电子书)

    ### 智能Web算法(电子书)知识点详解 #### 一、概述 《智能Web算法》是一本经典的Web算法图书,它系统地介绍了在Web领域广泛应用的各种算法和技术。本书的特点在于采用简单易懂的方式,避免复杂的数学公式,通过...

    智能Web算法(英文版).pdf

    ### 智能Web算法概览 #### 一、引言 《智能Web算法》这本书主要探讨了如何通过一系列先进的算法和技术使Web应用变得更加智能化。它不仅为读者提供了理论基础,还介绍了实际应用中的实现方法。书中重点介绍了五类...

    《智能Web算法》源代码及示例数据

    这是《智能Web算法》该书的所有源代码,该书涵盖了五类重要的智能算法:搜索、推荐、聚类、分类和分类器组合,并结合具体的案例讨论了它们在Web应用中的角色及要注意的问题。除了第1章的概要性介绍以及第7章对所有...

    智能Web算法,开发智能的web应用

    智能Web算法,开发智能的web应用

    Web智能算法.pdf

    从提供的文件信息中,我们得知该文件为《Web智能算法.pdf》,这是一本电子书,被标记为计算机编程类资料。根据描述,这本书是个人用于学习的资料,不能用于商业用途,如果存在版权问题需要联系删除。由于文件内容未...

    基于WEB技术和人工智能算法的高校智能系统设计与实现.pdf

    高校智能系统的构建与实现依赖于现代信息技术的融合,特别是WEB技术和人工智能算法的应用。WEB技术是互联网技术的核心组成部分,它在高校智能系统中扮演着集成化管理的角色,使得校园业务得以高效整合。WEB技术主要...

    Web数据挖掘算法

    ### Web数据挖掘算法详解 #### 引言 随着互联网的快速发展,海量的网络数据成为宝贵的信息资源。**Web数据挖掘**作为一种重要的数据挖掘分支,旨在从与WWW(World Wide Web)相关的资源和行为中提取有价值的信息和...

    基于移动Agent的Web信息智能过滤算法及其实现

    ### 基于移动Agent的Web信息智能过滤算法及其实现 #### 一、引言 随着互联网技术的快速发展,Web成为了人们获取信息的主要来源之一。然而,互联网中也存在着大量不良信息,例如色情、暴力等内容,这些内容不仅对青...

    基于web技术和人工智能算法的高校智能排课系统研究.pdf

    本文主要探讨了基于web技术和人工智能算法的高校智能排课系统。Web技术的使用实现了排课系统的实时性和远程访问性,而人工智能算法的应用则为排课提供了智能化的决策支持,显著提高了排课的自动化和科学化水平。 在...

Global site tag (gtag.js) - Google Analytics