查询在A表不在B表的数据

元胞珊瑚
• 阅读 19383

假设有A、B两张表。

如果查询在A表中存在,但是在B表中不存在的记录,应该如何操作?

  • 示例数据

假设A表数据:

id
1
2
3
4
5

B表数据:

id a_id
1 3

其中,B表中的a_id是需要排除的A表的id。

这里我们要排除A表中id为3的记录,实际中可能有上万条记录。

  • 子查询方法

一般我们首先想到的可能就是not in语句:

select A.* from A where A.id not in(select B.a_id from B);

这样可以查询出正确的结果。

但是如果B表很长,那么执行上述的查询语句,需要用A表中的字段去匹配B表中的每一个字段。

相当于是A表的每一个字段都要遍历一次B表,效率非常低下。

只要A中的字段不在B表中那么肯定要遍历完B表,如果A表中的字段在B表中,那么只要遍历到就退出,进行A表中下一个字段的匹配。

  • 使用join方法

连接查询使我们平时进行sql查询用到最多的操作之一了。

相对于not in,使用连接查询的效率更高。

以下我们分步骤解析用join方法的过程。

因为我们需要搜索的是A表中的内容,所以第一步,我们使用A表左连接B表,如下:

select * from A left join B on A.id = B.a_id;

这样B表中会补null,查询结果:

id id1 a_id
1 NULL NULL
2 NULL NULL
3 1 3
4 NULL NULL
5 NULL NULL

因为A、B两表中字段id相同,所以B表中的id字段变成了id1。

仔细观察可以发现,我们需要的结果集[1, 2, 4, 5]所对应的id1字段都是null。

这样,在查询语句中加入条件B.id is null,不就可以完成对只在A表中,但不在B表中的结果集的查询。

另外,我们只需要A表中的数据,B表的数据忽略。

于是最终变成:

select A.* from A left join B on A.id=B.a_id where B.id is null;

结果就是:

id
1
2
4
5

就是我们需要的结果,在A表中,但是不在B表中的记录。

这样做还有一个好处,如果A、B表的id、和B表的a_id都加了索引,那么join方式就能够命中索引。

而如果是子查询,在MySQL5.6之前的版本,就不会用到A表的索引,查询效率大

点赞
收藏
评论区
推荐文章
blmius blmius
4年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
Wesley13 Wesley13
4年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Easter79 Easter79
4年前
sql注入
反引号是个比较特别的字符,下面记录下怎么利用0x00SQL注入反引号可利用在分隔符及注释作用,不过使用范围只于表名、数据库名、字段名、起别名这些场景,下面具体说下1)表名payload:select\from\users\whereuser\_id1limit0,1;!(https://o
Jacquelyn38 Jacquelyn38
4年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Wesley13 Wesley13
4年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
4年前
oracle查询表数据并重新插入到本表
oracle查询表数据并重新插入到本表CreateTime2018年5月17日10:30:10Author:Marydon1.情景描述查询表中数据SELECTFROMat_aut
Wesley13 Wesley13
4年前
ThinkPHP 根据关联数据查询 hasWhere 的使用实例
很多时候,模型关联后需要根据关联的模型做查询。场景:广告表(ad),广告类型表(ad\_type),现在需要筛选出广告类型表中id字段为1且广告表中status为1的列表先看关联的设置部分 publicfunctionadType(){return$thisbelongsTo('A
为什么mysql不推荐使用雪花ID作为主键
作者:毛辰飞背景在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建议采用uuid,使用uuid究
Python进阶者 Python进阶者
2年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这