ES的索引结构与算法解析
提到ES,大多数爱好者想到的都是搜索引擎,但是明确一点,ES不等同于搜索引擎。不管是谷歌、百度、必应、搜狗为代表的自然语言处理(NLP)、爬虫、网页处理、大数据处理的全文搜索引擎,还是有明确搜索目的的搜索行为,如各大电商网站、OA、站内搜索、视频网站的垂直搜索引擎,他们或多或少都使用到了ES。
爬虫数据采集
经常有小伙伴需要将互联网上的数据保存的本地,而又不想自己一篇一篇的复制,我们第一个想到的就是爬虫,爬虫可以说是组成了我们精彩的互联网世界。网络搜索引擎和其他一些网站使用网络爬虫或蜘蛛软件来更新他们的网络内容或其他网站的网络内容索引。网络爬虫复制页面以供搜索引擎处理,搜索引擎对下载的页面进行索引,以便用户可以更有效地搜索。这都是爬虫数据采集的功劳。这篇文章我总
Wesley13 Wesley13
3年前
MySQL5.7 基础之二
设计范式:  第一范式:字段是原子性  第二范式:存在可用主键  第三范式:任何表都不应该有依赖于其它表非主键的字段创建数据库、设计数据表  字段:字段名、数据类型、约束(通过键来实现,而键其实可以当做索引来用)DDL:CREATE、DROP、ALTERDML:INSERT(REPLACE)、DELETE、UPDATE、SELE
Wesley13 Wesley13
3年前
sqlserver常用sql语句,更改字段,建立唯一键,多个字段去重复等
修改字段类型:altertable表名altercolumn待修改字段名待修改字段类型altertableusersaltercolumnuseridvarchar(10)多个字段建立唯一索引createuniqueindex索引名on表名(字段名,字
Stella981 Stella981
3年前
Chrome浏览器配置&小技巧(面向非技术人员)
注:本文仅面向电脑小白或者非技术人员分享一些常用的Chrome浏览器配置和小技巧一、管理搜索引擎进入搜索引擎管理界面:可以直接在地址栏右键修改搜索引擎,或者进入设置页面选择搜索引擎条目进入设置页面:单击浏览器右上角三点标志选择设置菜单,或者直接在地址栏输入:chrome://settings(chrome://settings
Stella981 Stella981
3年前
Lucene 03
\TOC\1分词器概述1.1分词器简介在对文档(Document)中的内容进行索引前,需要对域(Field)中的内容使用分析对象(分词器)进行分词.\\分词的目的是为了索引,索引的目的是为了搜索.\\分词的过程是先分词,再过滤:分词:将Doc
Wesley13 Wesley13
3年前
MySQL的库表详细操作
MySQL数据库本节目录一库操作二表操作三行操作一库操作  1、创建数据库    1.1语法CREATEDATABASE数据库名charsetutf8;    1.2 数据库命名规则      可以由字母、数字、下划线、@、#
Wesley13 Wesley13
3年前
MySQL 8.0.11 中使用 grant ... identified by 时 error 1064 near 'identified by '密码'' a...
(1)问题:当使用 grant权限列表on数据库to'用户名'@'访问主机'identifiedby'密码';时会出现"......near'identifiedby'密码''atline1"这个错误(2)原因:因为新版的的mysql版本已经将创建账户和赋予权限的方式分开了
Stella981 Stella981
3年前
EventBus3.0 混淆解决方案
EventBus3.0采用注解处理,为了提高效率可在编译时通过注解处理器生成索引代码。但是如果使用索引的话就不能混淆被Subscribe注解的方法。为了能够提高效率使用索引并且混淆被Subscribe注解的方法可以使_gradle.plugin.greenrobot.eventbus_插件\TOC\gradle.plugin.gre
高性能MySQL实战(一):表结构 | 京东物流技术团队
最近因需求改动新增了一些数据库表,但是在定义表结构时,具体列属性的选择有些不知其所以然,索引的添加也有遗漏和不规范的地方,所以我打算为创建一个高性能表的过程以实战的形式写一个专题,以此来学习和巩固这些知识。