龙空技术网

MySQL如何查询连号

paulpei 329

前言:

此刻大家对“mysql记录行号”大约比较关心,大家都想要剖析一些“mysql记录行号”的相关资讯。那么小编也在网络上搜集了一些有关“mysql记录行号””的相关知识,希望你们能喜欢,各位老铁们快快来学习一下吧!

在前面的文章【MySQL如何查询断号】中,已经介绍了如何查询断号,接下来,让我们了解一下如何查询连号。

大致的思路和前面是差不多的,我们依然使用以下表做解释:

现在有如下表:

CREATE TABLE `g` (

`id` int NOT NULL AUTO_INCREMENT,

PRIMARY KEY (`id`)

)

表中总数据行为:21318

下面我们列出前10 行:

select id from g order by id limit 10;

返回数据如下:

+----+

| id |

+----+

| 1 |

| 2 |

| 3 |

| 7 |

| 8 |

| 10 |

| 11 |

| 12 |

| 16 |

| 19 |

+----+

10 rows in set (0.00 sec)

让我们观察一下上面的数据,不难发现,针对于每一个id的连号的数据范围如下:

Start_id

End_id

1

3

2

3

3

3

7

8

8

8

10

12

11

12

12

12

16

16

19

...

...

...

(表一)

我们再总结一下范围,又可以得出,我们要的最终数据应该是以下这样的:

Start_id

End_id

1

3

7

8

10

12

16

16

19

...

...

...

(表二)

解决方法一:

基于以上对数据的分析,对于(表一)的数据,就是想办法再增加一列,此列的值就是针对每一个id所对应的缺失的值减1。讲到这里,是否大家就有点明白了呢?

要新增的此列的值,不就是如何查找缺失的数据的开始值(start_id - 1)吗?

如果一下子没想明白,请查阅前一篇文章【MySQL如何查询断号】。

完整解决SQL如下:

select id

, ( select min(id) as id

from g c

where not exists (

select 1

from g b

where c.id + 1 = b.id )

and c.id>=a.id) as end_id

from g a;

则可以获取(表一)的数据,那么接下来,只要对end_id列进行分组,再获取最小的那个id列,就可以获取(表二)的数据了。

则最后的完整解决SQL如下所示:

select min(id) as start_id

, d.end_id

from ( select id

, ( select min(id) as id

from g c

where not exists ( select 1

from g b

where c.id + 1 = b.id )

and c.id>=a.id ) as end_id

from g a ) as d

group by d.end_id;

解决方法二:

让我们再重新观察一下(表一)的数据,针对于连续号段{1,2,3}而言,期望结果的开始值(start_id)为1,期望结果的结束值(end_id)为3,也就是说,一个是连续号段的最小值,而另一个则是连续号段的最大值。

再结合解决方法一的最后那个分组思路,是否可以想办法构建一个新列,让此新列的值,针对与每一个连续号段都具有相同的值呢?

让我们继续从连续性上思考,既然,原始数据是连续的,那么数据间的差也是固定的,那么当一个连续性数据减另一个连续性数据的差是否也是固定的呢?

例如:针对连续号段{1,2,3} ,我们有另一个连续号段{1,2,3},对应的每一个id相减差都是0。

再针对连续号段{7,8},我们的另一个连续号段为{4,5},对应的每一个id相减差都是-3。

单纯这样描述,可能不那么直观,那么就让我们看看如下(表三)的数据,可能会更加清晰,且容易理解。

原始id列

新增id列

1

1

0

2

2

0

3

3

0

7

4

-3

8

5

-3

10

6

-4

11

7

-4

12

8

-4

16

9

-7

19

10

-9

...

...

...

(表三)

看到这里,这个新列是什么?我想大家已经都已经知道答案了,对滴,别犹豫,别怀疑,就是排序行号。

那么就不多解释了,直接给出SQL如下:

select min(id) as start_id

, max(id) as end_id

from ( select g.id

, @rid:=@rid+1 as row_id

from g, ( select @rid:=0) td ) tmp

group by (tmp.id - row_id);

解决方法三:

我们在解决方法二中使用到了排序行号,那么既然MySQL已经提供了窗口函数,

那么便又可以进一步改写为如下:

select min(id) as start_id

, max(id) as end_id

from ( select id

, row_number() over (order by id) as row_id

from g ) tmp

group by (tmp.id - row_id);

这里,我仅仅提供解题思路,对于以上三种方法的性能,我这里未作对比,感兴趣的读者可以自行测试。

本文如有不足,不妥之处,也恳请大家批评指出。

标签: #mysql记录行号