会员
自己动手写搜索引擎
罗刚编著更新时间:2018-12-28 22:52:39
最新章节:参考资料开会员,本书免费读 >
本书是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。本书全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。
上架时间:2009-12-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
自己动手写搜索引擎最新章节
查看全部- 参考资料
- 8.7 本章小结
- 8.6 RSS搜索
- 8.5 使用并行程序分析数据
- 8.4 Web图分析
- 8.3 竞价排名
- 8.2 图像的OCR识别
- 8.1 使用Solr实现分布式搜索
- 第8章 其他高级主题
- 7.11 本章小结
罗刚编著
主页
同类热门书
最新上架
- 会员
ASP.NET Core从入门到精通
《ASP.NETCore从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了进行ASP.NETCore应用开发应该掌握的各方面技术。全书分为4篇,共18章,包括ASP.NETCore入门、.NETCore环境搭建、.NETCore命令行工具及包管理、C#新语法、异步编程、LINQ编程、.NETCore核心组件、ASP.NETCoreWeb应用、Razor与A计算机11.6万字 - 会员
剑指MySQL:架构、调优与运维
MySQL是世界上最受欢迎的数据库管理系统之一,广泛应用于互联网场景,作为一名开发人员,对MySQL的学习是十分必要的。本书从安装MySQL开始,逐步深入讲解更加复杂的内容,首先宏观地介绍MySQL的体系架构和各种常见的存储引擎以及它们之间的比较,然后介绍MySQL中的索引以及索引的优化,以及连接查询的执行原理,并详细分析了Explain语句的执行结果。接着又介绍MySQL中的事务和锁机制,包括事计算机21.4万字 - 会员
代码整洁之道:程序员的职业素养
本书是编程大师“Bob大叔”40余年编程生涯的心得体会的总结,讲解要成为真正专业的程序员需要具备什么样的态度,需要遵循什么样的原则,需要采取什么样的行动。作者以自己以及身边的同事走过的弯路、犯过的错误为例,意在为后来者引路,助其职业生涯迈上更高台阶。计算机12.2万字 - 会员
深入浅出Go语言核心编程
《深入浅出Go语言核心编程》是一本全面而深入的Go语言学习手册,涵盖了Go语言的诸多关键特性,包括语法结构、内存原理、并发、上下文机制与框架应用等。本书共20章。第1章引导读者快速搭建开发环境,详细介绍Go语言的环境配置及编译运行的具体细节。第2~5章详细讨论Go语言独特的变量、常量、常用数据类型和流程控制,并重点解析复杂类型的底层实现机制。第6~8章讲解Go语言的函数及如何实现面向对象编程,打通计算机19.8万字 - 会员
Django+Vue.js商城项目实战
《Django+Vue.js商城项目实战》基于Django4.x和Vue3.x版本,以一个完整商城网站的开发流程为主线,介绍分别使用纯后端架构和前后端分离架构实现项目的全部技术细节。纯后端开发架构主要讲解Django的知识要点及每个功能模块的要点和实现方式,内容包括Django网站开发基础、项目需求与设计、路由规划与设计、商城数据模型的搭建与使用、数据业务视图、数据渲染与展示、商品信息模块、用户计算机15.4万字 - 会员
Python数据分析快速上手
《Python数据分析快速上手》通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python进行数据分析应该掌握的各方面技术。本书内容包括Python基础,用NumPy进行数据计算,用Pandas进行数据分析,用SciPy进行数据分析,用Scikit-learn进行数据分析、数据预处理、数据可视化,用Matplotlib进行可视化等内容。本书示例丰富,所有涉及的程序代码都给出了详细的注释,读者可计算机11.5万字 - 会员
机器学习系统:设计和实现
本书系统地介绍了机器学习系统的设计原则和实践经验,侧重于介绍机器学习的原理、神经网络和优化器、自动差分算法、机器学习系统编程模型、控制流和数据流,异构硬件加速器的原理和编程、数据流图编译器前端、数据流图编译器后端、数据准备和增强、模型部署相关技术、分布式训练、弹性训练、联合训练和评估平台、调试和优化工具、数据隐私和安全等。在讲授的过程中,本书将根据MindSpore的自身特点,在各个章节突出讨论M计算机19.7万字 - 会员
R语言数据分析从入门到精通
《R语言数据分析从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了R语言基础知识、核心技术与高级应用。全书分为3篇,共16章,包括初识R语言、集成开发环境RStudio、R语言入门、数据结构、流程控制语句、日期和时间序列、获取数据、数据处理与清洗、数据计算与分组统计、基本绘图、ggplot2高级绘图、lattice高级绘图、基本统计分析、方差分析、回归分析和时间序列分析计算机12.2万字 - 会员
写给青少年的人工智能(Python版·微课视频版)
本书以通俗易懂的方式介绍人工智能的基础知识及其应用,采用案例的形式讲解,方便读者轻松阅读。全书共5章,首先介绍人工智能的基础知识,然后从文本、图像、语音三方面介绍自然语言处理、图像处理、语音识别等人工智能研究领域,最后通过实战案例让读者全面了解人工智能的应用。本书适合有志于了解人工智能基础知识及应用的初、高中学生,也可以作为人工智能初学爱好者的学习资料。计算机4.9万字