前言:
此刻大家对“mysql记录行号”大约比较关心,大家都想要剖析一些“mysql记录行号”的相关资讯。那么小编也在网络上搜集了一些有关“mysql记录行号””的相关知识,希望你们能喜欢,各位老铁们快快来学习一下吧!在前面的文章【MySQL如何查询断号】中,已经介绍了如何查询断号,接下来,让我们了解一下如何查询连号。
大致的思路和前面是差不多的,我们依然使用以下表做解释:
现在有如下表:
CREATE TABLE `g` (
`id` int NOT NULL AUTO_INCREMENT,
PRIMARY KEY (`id`)
)
表中总数据行为:21318
下面我们列出前10 行:
select id from g order by id limit 10;
返回数据如下:
+----+
| id |
+----+
| 1 |
| 2 |
| 3 |
| 7 |
| 8 |
| 10 |
| 11 |
| 12 |
| 16 |
| 19 |
+----+
10 rows in set (0.00 sec)
让我们观察一下上面的数据,不难发现,针对于每一个id的连号的数据范围如下:
Start_id
End_id
1
3
2
3
3
3
7
8
8
8
10
12
11
12
12
12
16
16
19
...
...
...
(表一)
我们再总结一下范围,又可以得出,我们要的最终数据应该是以下这样的:
Start_id
End_id
1
3
7
8
10
12
16
16
19
...
...
...
(表二)
解决方法一:
基于以上对数据的分析,对于(表一)的数据,就是想办法再增加一列,此列的值就是针对每一个id所对应的缺失的值减1。讲到这里,是否大家就有点明白了呢?
要新增的此列的值,不就是如何查找缺失的数据的开始值(start_id - 1)吗?
如果一下子没想明白,请查阅前一篇文章【MySQL如何查询断号】。
完整解决SQL如下:
select id
, ( select min(id) as id
from g c
where not exists (
select 1
from g b
where c.id + 1 = b.id )
and c.id>=a.id) as end_id
from g a;
则可以获取(表一)的数据,那么接下来,只要对end_id列进行分组,再获取最小的那个id列,就可以获取(表二)的数据了。
则最后的完整解决SQL如下所示:
select min(id) as start_id
, d.end_id
from ( select id
, ( select min(id) as id
from g c
where not exists ( select 1
from g b
where c.id + 1 = b.id )
and c.id>=a.id ) as end_id
from g a ) as d
group by d.end_id;
解决方法二:
让我们再重新观察一下(表一)的数据,针对于连续号段{1,2,3}而言,期望结果的开始值(start_id)为1,期望结果的结束值(end_id)为3,也就是说,一个是连续号段的最小值,而另一个则是连续号段的最大值。
再结合解决方法一的最后那个分组思路,是否可以想办法构建一个新列,让此新列的值,针对与每一个连续号段都具有相同的值呢?
让我们继续从连续性上思考,既然,原始数据是连续的,那么数据间的差也是固定的,那么当一个连续性数据减另一个连续性数据的差是否也是固定的呢?
例如:针对连续号段{1,2,3} ,我们有另一个连续号段{1,2,3},对应的每一个id相减差都是0。
再针对连续号段{7,8},我们的另一个连续号段为{4,5},对应的每一个id相减差都是-3。
单纯这样描述,可能不那么直观,那么就让我们看看如下(表三)的数据,可能会更加清晰,且容易理解。
原始id列
新增id列
差
1
1
0
2
2
0
3
3
0
7
4
-3
8
5
-3
10
6
-4
11
7
-4
12
8
-4
16
9
-7
19
10
-9
...
...
...
(表三)
看到这里,这个新列是什么?我想大家已经都已经知道答案了,对滴,别犹豫,别怀疑,就是排序行号。
那么就不多解释了,直接给出SQL如下:
select min(id) as start_id
, max(id) as end_id
from ( select g.id
, @rid:=@rid+1 as row_id
from g, ( select @rid:=0) td ) tmp
group by (tmp.id - row_id);
解决方法三:
我们在解决方法二中使用到了排序行号,那么既然MySQL已经提供了窗口函数,
那么便又可以进一步改写为如下:
select min(id) as start_id
, max(id) as end_id
from ( select id
, row_number() over (order by id) as row_id
from g ) tmp
group by (tmp.id - row_id);
这里,我仅仅提供解题思路,对于以上三种方法的性能,我这里未作对比,感兴趣的读者可以自行测试。
本文如有不足,不妥之处,也恳请大家批评指出。
标签: #mysql记录行号