ROW_NUMBER() OVER(…)
雖然寫法很復(fù)雜,但這確實只是一個普通函數(shù)(就像字符串轉(zhuǎn)數(shù)字這樣的函數(shù)),可以得出一個值
這個函數(shù)不會改變數(shù)據(jù)條數(shù),它的作用是給每個數(shù)據(jù)記錄增加一個字段,這個字段值就是函數(shù)得到的值
函數(shù)雖然不會改變查詢結(jié)果條數(shù),但會改變結(jié)果的順序。會按照某個字段a(這個字段會重復(fù))分組,函數(shù)的值就是在每個分組內(nèi)部的排序值(1,2,3,4.。。)
比如:一群人在排隊買東西。會自動以家庭為單位分成一段一段的“小組”,然后又在家庭內(nèi)部按照年齡大小做了排序(比如年齡大人在前面,小孩跟在大人后面),這個函數(shù)值就是這個家庭內(nèi)部排序值
按照上面的比喻,這個函數(shù)就是ROW_NUMBER() over (PARTITION BY 家庭編號 order by 年齡)
函數(shù)完整的樣子:ROW_NUMBER() OVER(PARTITION BY… ORDER BY…)。為什么要很啰嗦的再加一個ROW_NUMBER()? 因為前面這個ROW_NUMBER()會進一步控制函數(shù)的特性,后面會講解【不過我個人認為這個前綴確實很啰嗦。讓我設(shè)計的話,我會去掉它。因為對于大部分人可能就只會用最普通的函數(shù)使用方式,不寫時就默認為ROW_NUMBER()多好】
類比一個完整的查詢
select *, ROW_NUMBER() over (PARTITION BY 家庭編號 order by 年齡 desc) as “家庭地位” from 人員表
這句話除了得到了所有人員的信息之外,還額外得到了一個字段"家庭地位"(這里就默認:年齡越大,家庭地位越高)
理解了函數(shù)的含義和用法,然后我們就可以利用函數(shù),比如,只獲取所有家庭地位最高的人,那么就可以在我們再包一層,得到:
select * from( select *, ROW_NUMBER() over (PARTITION BY 家庭編號 order by 年齡 desc) as “家庭地位” from 人員表 ) t where t.家庭地位=1
引申
這樣就可以解決類似:表T中 字段a會重復(fù),但我們查詢的結(jié)果又不想要重復(fù)的數(shù)據(jù),并且要求只要其中最新的那一條
select * from( select *, ROW_NUMBER() over (PARTITION BY a order by create_time desc) as index from T ) t where t.index=1
或者topN問題:分組后,把每組前5個找出來
select * from( select *, ROW_NUMBER() over (PARTITION BY a order by create_time desc) as index from T ) t where t.index < 6
ROW_NUMBER()
這是一個控制 OVER函數(shù)特性的參數(shù),而且不能省,over前面必須有一個。但并不是只有ROW_NUMBER()這一種。
假設(shè)在一共家庭中,有四個孩子,其中兩個是雙胞胎,年齡分別是5歲,7歲,7歲,9歲。
兩個7歲的雙胞胎 誰大誰小是很難說。理論上可以講,兩個孩子年齡是相同的。那么排隊時,誰是老大誰是老二呢。
ROW_NUMBER():簡單粗暴的做了自己的判斷,哪條數(shù)據(jù)在前面,哪個就是老大(誰先生出來誰就是老大)。即便他們年齡一樣(over函數(shù)值一樣),它給這幾個孩子定的家庭地位分別為4,3,2,1
DENSE_RENK():顯得更公正一點:既然定好了按年齡排序,那么年齡相同,地位就是相同。它給四個孩子定的家庭地位分別為:3,2,2,1
RENK():比較特殊,它覺得那個5歲的孩子的家庭地位不應(yīng)該是第3位。因為家里明明有4個孩子,它是最小的,兩個并列第二之后,下一個應(yīng)該是4(所以直接把3給跳過了)。所以它給的家庭地位分別是4,2,2,1
名稱
下面這些都是這個函數(shù)的名稱:
窗口函數(shù),分析函數(shù),分區(qū)函數(shù),一般稱為窗口函數(shù)(window function)。
一般關(guān)系型數(shù)據(jù)庫都支持。由于屬于比較高級的函數(shù),都是在數(shù)據(jù)庫不斷完善的過程中增加的。比如mysql就是8.x之后才有。
和聚合函數(shù)對比
聚合函數(shù):sum(), avg() 等統(tǒng)計函數(shù) 配合 group by 稱為聚合函數(shù)
得出的是分組后 每一組等統(tǒng)計數(shù)據(jù),改變了數(shù)據(jù)條數(shù)
如果想保持數(shù)據(jù)原有的樣子,則需要使用窗口函數(shù)
窗口函數(shù)前面除了前面介紹的常用的三種,還可以使用sum() avg()等統(tǒng)計函數(shù),變成:
sum() over(partition by ...) x
這里得到的x,就是對這個組內(nèi)的求和,組內(nèi)每一條數(shù)據(jù)都得到一個相同的值
進階-和排序函數(shù)對比
雖然前面說窗口函數(shù)的核心是partition by,但實際上partition by也可以去掉。
也就是說:xxx() over(…) 這個函數(shù)非常靈活。
其中partition by也可去掉,但此時必須要有order by。
變成:xxx() over(order by …) xxx
此時窗口函數(shù) 的窗口就只有一個了:所有數(shù)據(jù)都在同一個窗口里。 只剩下排序功能,比如
dense_renk() over(over by 成績) 名次
常見作用:給班級學(xué)生成績排名,成績一樣的,名次就一樣
————————————————
版權(quán)聲明:本文為CSDN博主「發(fā)現(xiàn)存在」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/yunduanyou/article/details/122583303
該文章在 2023/10/28 15:25:45 編輯過