![自己动手写搜索引擎在线阅读](https://wfqqreader-1252317822.image.myqcloud.com/cover/608/657608/b_657608.jpg)
会员
自己动手写搜索引擎
罗刚编著更新时间:2018-12-28 22:52:39
最新章节:参考资料开会员,本书免费读 >
本书是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。本书全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。
上架时间:2009-12-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
自己动手写搜索引擎最新章节
查看全部- 参考资料
- 8.7 本章小结
- 8.6 RSS搜索
- 8.5 使用并行程序分析数据
- 8.4 Web图分析
- 8.3 竞价排名
- 8.2 图像的OCR识别
- 8.1 使用Solr实现分布式搜索
- 第8章 其他高级主题
- 7.11 本章小结
罗刚编著
主页
最新上架
- 会员
C# 10核心技术指南
本书是一本C#10的技术指南,在上一版的基础上进行了全面更新,围绕概念和用例进行组织,系统、全面、细致地讲解了C#10从基础知识到各种高级特性的命令、语法和用法。本书首先介绍C#和.NET,第2—4章详细介绍C#语言的语法、类型和变量。其余各章则涵盖.NET6基础类库的功能,包括LINQ、XML、集合、并发、I/O和联网、内存管理、反射、动态编程、属性、加密和原生互操作性等主题。第5章和第6计算机38.2万字 - 会员
C语言从入门到精通(第6版)
《C语言从入门到精通(第6版)》从初学者的角度出发,以通俗易懂的语言、丰富多彩的实例,详细介绍了使用C语言进行程序开发需要掌握的各方面知识。全书分为4篇,共20章,内容包括C语言概述、算法、数据类型、运算符与表达式、数据输入/输出、选择结构、循环控制、数组、函数、指针、结构体和共用体、位运算、预处理、文件、内存管理、网络套接字编程、单词背记闯关游戏、学生信息管理系统、单片机基础和GSM短信控制家庭计算机18.5万字 - 会员
Vue.js 3.0源码解析(微课视频版)
本书共分为11章,将从源码角度入手,由浅入深分析Vue3框架的核心逻辑。首先通过极简demo引出Vue3框架核心思想,其次结合源码分析Vue3框架核心逻辑的实现原理,最后介绍Vue3框架常用命令、组件等底层实现逻辑。帮助读者深入理解Vue3框架的内部实现原理与运行逻辑,理解Vue3框架语法,揭开藏在表面的内容,让开发者能知其然还能知其所以然。本书面向有Vue开发经验和熟悉框架开发的前端计算机6.5万字 - 会员
Node.js开发指南
本书跟随了Node.js的标准与行业的发展趋势,在介绍新标准与新技术的同时兼顾了理论基础和实际应用,主要内容分为基础和应用两部分,基础部分内容包含了Node.js环境配置,npm项目管理,JavaScript语法基础,Node.js基本模块的原理与使用,异步代码的编写与组织,应用部分包含了网络编程,桌面应用开发以及测试和调试。本书讲解与示例并重,由浅入深地剖析了Node.js模块与语言原理,并通过计算机10.9万字 - 会员
响应式编程实战:构建弹性、可伸缩、事件驱动的分布式系统
本书展示了如何利用事件驱动和响应式原理来构建健壮的分布式系统,减少延迟并提高吞吐量——特别是在微服务和无服务器应用程序中。本书分为四部分:第一部分介绍响应式的背景、环境和内容;第二部分深入讲解响应式,涵盖分布式系统的弊端、响应式系统和响应式编程;第三部分阐述如何使用Quarkus构建响应式应用程序,涵盖响应式引擎、响应式编程库SmallRyeMutiny、HTTP以及响应式数据访问的相关知识;第计算机11.1万字 - 会员
高效C/C++调试
《高效C/C++调试》是关于软件调试技术的深度探索,融合了作者的实践智慧。书中不仅指导读者如何使用专业的调试工具,还介绍了如何宏观和微观地分析问题,并**限度地发挥调试器功能。此外,书中还深入解读了调试背后的技术原理,如调试符号、内存管理及系统内核对内存的操作机制,以揭示内存管理的关键性和复杂性。除了介绍基础概念外,本书还涵盖了许多增强调试能力的工具与插件。尽管焦点集中在C/C++,但其中的策略与计算机16.3万字 - 会员
机器学习系统:设计和实现
本书系统地介绍了机器学习系统的设计原则和实践经验,侧重于介绍机器学习的原理、神经网络和优化器、自动差分算法、机器学习系统编程模型、控制流和数据流,异构硬件加速器的原理和编程、数据流图编译器前端、数据流图编译器后端、数据准备和增强、模型部署相关技术、分布式训练、弹性训练、联合训练和评估平台、调试和优化工具、数据隐私和安全等。在讲授的过程中,本书将根据MindSpore的自身特点,在各个章节突出讨论M计算机19.7万字 - 会员
Java Web开发从0到1
自20世纪以来,互联网的发展已经堪称日新月异,人们的工作、生活、学习等各个方面越来越离不开互联网Web应用。JavaWeb是Web应用中成熟度高、普及率高、适用性广的开源技术,几乎所有Web应用程序都需要具备JavaWeb技术能力。本书分为5篇,共17章。第1篇介绍Web开发与JavaWeb开发,包括体系结构、相关技术、开发环境等;第2篇介绍JSP语言基础,包括JSP的基本概念、JSP指令、JSP计算机10.3万字 - 会员
Java+OpenCV高效入门
OpenCV作为一个应用广泛的开源计算机视觉库,正在受到越来越多的关注。目前OpenCV的各类教程基本上以Python和C++为主,基于Java的OpenCV书籍则少之又少,本书旨在弥补这一空白。本书共13章,前4章是基础部分,包括OpenCV概述和安装配置、数字图像基础及图像基础操作等内容;第5到11章则包括了图像的几何变换、图像平滑、形态学操作、直方图、边缘检测与轮廓、霍夫变换、特征点检测和匹计算机6.9万字
同类书籍最近更新
- 会员
软件测试分析与实践
本书从实际出发,通过典型案例系统地介绍了软件测试的流程和相应的测试技术。其中,第1、2章的主要内容是软件测试的起源及发展、现状及前景,以及软件测试的定义、分类、标准等;第3章、第4章的主要内容是软件测试的重点与难点分析、常见测试类型、测试策略与方法、常见软件问题等;第5章主要讲述的是软件测试5个典型阶段的工作要点;第6章的主要内容是测试过程管理的配置管理、质量监督和成果评审;第7章的主要内容是测试程序设计12.8万字 - 会员
Java程序员面试笔试真题与解析
本书针对当前各大IT企业面试笔试中特性与侧重点,精心挑选了三年来近百家IT企业的面试笔试真题。这些企业涉及业务包括系统软件、搜索引擎、电子商务、手机APP、安全关键软件等,所提供的面试笔试真题非常具有代表性与参考性。同时,本书对这些题目进行了合理的划分与归类,并且对其进行了庖丁解牛式的分析与讲解,针对试题中涉及的部分重难点问题,本书都进行了适当地扩展与延伸,力求对知识点的讲解清晰而不紊乱,全面而不程序设计19.9万字 - 会员
Android 从入门到项目实践(超值版)
《Android从入门到项目实践:超值版》采取“基础知识→核心应用→核心技术→高级应用→项目实践”结构和“由浅入深,由深到精”的学习模式进行讲解。《Android从入门到项目实践:超值版》分为5篇共20章。首先讲解了Android的基础入门、AndroidStudio的使用、Android开发和面向对象与Android布局等基础知识,还深入学习了Android基本控件、Android高级控件、活动程序设计12.2万字 - 会员
PHP程序员面试笔试真题与解析
《PHP程序员面试笔试真题与解析》针对当前各大IT企业面试笔试中特性与侧重点,精心挑选了三年来近百家IT大厂的PHP面试笔试真题。这些企业涉及业务包括系统软件、搜索引擎、电子商务、手机APP、安全关键软件等,所提供的PHP面试笔试真题非常具有代表性与参考性。同时,本书对这些题目进行了合理的划分与归类,并且对其进行了庖丁解牛式的分析与讲解,针对试题中涉及的部分重难点问题,《PHP程序员面试笔试真题与程序设计13.9万字 - 会员
Python数据整理
本书从Python最基础的知识开始,主要聚焦于数据结构,接着快速转至数据整理的基本工具NumPy和pandas库。我们着重讲述为什么应该放弃用其他语言实现的传统方法,而采用Python中预先构建程序的方法实现数据清理。之后,你将了解如何使用相同的Python后端,从各种不同的数据源(如Internet、大型数据库或Excel财务表)中提取和转换数据。然后,你还将学习如何根据下游的分析工具需求,处理程序设计9.2万字 - 会员
DevOps 精要:业务视角
本书以结构化的方式,从基本层面上阐述了DevOps的全貌,可以帮助读者了解新的领域发展趋势,洞悉下一步发展契机。书中介绍了DevOps的起源、发展的必然性、关键前提条件及其在实践中的应用效果与原理。程序设计10万字