引言
在SQL查詢中,GROUP BY和DISTINCT都是常用的關鍵字,它們都能實現數據去重的功能。但它們的實現原理和使用場景有很大的區別。
基本概念
DISTINCT
DISTINCT用于刪除結果集中的重復行,確保每個結果只出現一次。它作用于整個選擇的列組合。
GROUP BY
GROUP BY用于將具有相同值的行組合到匯總行中,通常與聚合函數(如COUNT、SUM、AVG等)一起使用。
實際案例分析
讓我們通過一個具體的案例來理解它們的區別。假設我們有一個訂單表(orders):
CREATE TABLE orders (
order_id INT,
customer_id INT,
product_id INT,
amount DECIMAL(10,2),
order_date DATE
);
INSERT INTO orders VALUES
(1, 101, 1, 100.00, '2024-02-14'),
(2, 101, 2, 200.00, '2024-02-14'),
(3, 102, 1, 150.00, '2024-02-14'),
(4, 101, 1, 300.00, '2024-02-15');
使用DISTINCT的場景
如果我們想查看有哪些客戶下過訂單:
SELECT DISTINCT customer_id
FROM orders;
-- 結果
customer_id
-----------
101
102
這個查詢會直接返回去重后的客戶ID列表。
使用GROUP BY的場景
如果我們想知道每個客戶的訂單總金額:
SELECT customer_id,
COUNT(*) as order_count,
SUM(amount) as total_amount
FROM orders
GROUP BY customer_id;
-- 結果
customer_id order_count total_amount
----------- ----------- ------------
101 3 600.00
102 1 150.00
GROUP BY不僅去除了重復,還能進行數據匯總計算。
主要區別
- DISTINCT:對整個結果集進行去重,通常需要排序操作
- GROUP BY:在分組的同時進行計算,可能涉及臨時表的創建
- DISTINCT:不能與聚合函數直接配合使用(除特殊情況外)
- GROUP BY:可以配合多種聚合函數,支持復雜的分組計算
總結
DISTINCT和GROUP BY雖然都能實現去重,但它們的使用場景和功能特點有明顯區別。
DISTINCT適合簡單的去重場景,而GROUP BY更適合需要分組統計的場景。
合理使用索引和優化查詢語句,可以顯著提升查詢性能。
閱讀原文:原文鏈接
該文章在 2025/2/17 12:25:44 編輯過