잠시만 기다려 주세요


 
HOME   |  여기는?   |  바다물때표   |  여러가지 팁 (804)  |  추천 및 재미 (75)  |  자료실 (17)  |  끄적거림 (467)  |  시나리오 (760)  |  드라마 대본 (248)  |  

2019년 10월 15일
정의는 겸손하고 정직하며 당당하고 부정은 거만하고 과장되며 비열하고 무지는 산만하고 염치 없이 뻔뻔하다. - -
 




    DATABASE

DATABASE - mysql, mariadb DISTINCT 와 GROUP BY의 차이
이 름 : 바다아이   |   조회수 : 1068         짧은 주소 : https://www.bada-ie.com/su/?871531659664
DISTINCT는 주로 UNIQUE한 컬럼이나 튜플(레코드)을 조회하는 경우 사용되며,
GROUP BY는 데이터를 그룹핑해서 그 결과를 가져오는 경우 사용되는 쿼리 형태이다.


하지만 두 작업은 조금만 생각해보면 동일한 형태의 작업이라는 것을 쉽게 알 수 있으며,
일부 작업의 경우 DISTINCT로 동시에 GROUP BY로도 처리될 수 있는 쿼리들이 있다.
그래서 DISTINCT를 사용해야 할지, GROUP BY를 사용해서 데이터를 조회하는 것이 
좋을지 고민되는 경우들이 가끔 있다.


간단하게 아래 예를 살펴 보자
1. SELECT DISTINCT fd1 FROM tab;
2. SELECT DISTINCT fd1, fd2 FROM tab;


위의 두개 쿼리는 간단히 GROUP BY로 바꿔서 실행할 수 있다.
1. SELECT fd1 FROM tab GROUP BY fd1;
2. SELECT fd1, fd2 FROM tab GROUP BY fd1, fd2;


그렇다면 이 예제의 쿼리에서 DISTINCT와 GROUP BY 는 어떤 부분이 다를까 ?
사실 이런 형태의 DISTINCT는 내부적으로 GROUP BY와 동일한 코드를 사용한다.
즉, 동일한 처리를 하게 된다는 것이다. 


하지만 더 중요한 차이가 있다.
DISTINCT의 결과를 정렬된 결과가 아니지만, GROUP BY는 정렬된 결과를 보내준다.
GROUP BY의 작업을 크게 "그룹핑" + "정렬"로 나누어서 본다면, DISTINCT는 "그룹핑" 작업만
수행하고 "정렬" 작업은 수행하지 않는 것이다.
그런데, 여기서 "정렬"은 "그룹핑" 과정의 산물이 아닌 부가적인 작업이다.


최종적으로, 이 예제의 DISTINCT와 GROUP BY는 일부 작업은 동일하지만 GROUP BY는
"정렬"을 하기 위한 부가적인 작업을 더 하게 된다.


만약 "정렬"이 필요하지 않다면 DISTINCT를 사용하는 것이 성능상 더 빠르다고 볼 수 있다.
하지만, GROUP BY를 사용하는 경우에는 정렬을 하지 않도록 유도할 수 있다.
(자세한 내용은 "GROUP BY의 Filesort 작업 제거"를 참조)




참고로
GROUP BY와 DISTINCT는 각자 고유의 기능이 있다.


DISTINCT로만 가능한 기능
1. SELECT COUNT(DISTINCT fd1) FROM tab;
    -- // 이런 형태의 쿼리는 서브 쿼리를 사용하지 않으면 GROUP BY로는 작성하기 어렵다.


GROUP BY로만 가능한 기능
1. SELECT fd1, MIN(fd2), MAX(fd2) FROM tab GROUP BY fd1;
    -- // 이렇게 집합함수(Aggregation)가 필요한 경우에는 GROUP BY를 사용해야 한다.




<<주의사항>>
가끔 어떤 사용자는 DISTINCT가 마치 함수인 것처럼 (괄호를 사용하여) 아래와 같이 사용을 하는데
만약 fd1 컬럼은 unique 값, fd2는 전체 값을 원한다면 절대 그 결과를 얻을 수 없다.


SELECT DISTINCT(fd1), fd2 FROM tab;

SELECT 문장에 DISTINCT라는 키워드가 있으면, MySQL은 SELECT되는 모든 컬럼(튜플)들에 대해서 DISTINCT를 적용해서 결과를 보내주게 된다.
위와 같은 요건을 처리하기 위해서도 아래와 같이 GROUP BY로만 해결할 수 있다.

SELECT fd1, fd2 FROM tab GROUP BY fd1;


출처 :
http://intomysql.blogspot.com/2011/01/distinct-group-by.html
 
| |


      1 page / 3 page
번 호 카테고리 제 목 이름 조회수
72 DATABASE db .. dbeaver, db admin tool 바다아이 942
71 DATABASE postgresql SEQUENCE reset .... 바다아이 863
70 DATABASE mysql, mariadb , , , , left, substring, right, concat 바다아이 1223
69 DATABASE [PostgreSql] WITH , , Operator 바다아이 957
68 DATABASE postgresql for, foreach , 바다아이 1008
67 DATABASE postgresql , , into ... 바다아이 922
66 DATABASE postgresql PL/pgSQL - SQL Procedural Language, , 바다아이 3121
65 DATABASE postgresql ... .. 바다아이 1172
64 DATABASE postgresql CSV export/import 바다아이 1168
63 DATABASE postgresql tablespace , .... 바다아이 1384
62 DATABASE postgresql 10 partitioning, ... , ... 바다아이 1134
61 DATABASE Using PostgreSQL Arrays, ... ... 바다아이 1202
60 DATABASE PostgreSQL (TRIGGER) (function) 바다아이 1117
현재글 DATABASE mysql, mariadb DISTINCT GROUP BY 바다아이 1069
58 DATABASE Optimize and Improve PostgreSQL Performance with VACUUM, ANALYZE, and REINDEX 바다아이 1682
57 DATABASE postgresql tuple . vacuumdb .. , . 바다아이 1186
56 DATABASE RDBMS SQL MONGODB ... 바다아이 1078
55 DATABASE mysql 5.x my.cnf 바다아이 1283
54 DATABASE postgresql , .. 바다아이 1375
53 DATABASE postgresql , size, 바다아이 1774
52 DATABASE postgresql , , .... 바다아이 1194
51 DATABASE PostgreSQL Replication, , , master, slave 바다아이 1556
50 DATABASE postgresql case 바다아이 1271
49 DATABASE postgresql with 바다아이 1266
48 DATABASE postgresql , , string 바다아이 1470
47 DATABASE / SELECT , 바다아이 1348
46 DATABASE Postgresql partitioning table , , , 바다아이 1490
45 DATABASE PostgreSQL 바다아이 1548
44 DATABASE postgresql vacuumdb, psql, pg_dump password crontab 바다아이 1737
43 DATABASE postgresql sequence 퀀 auto_increment . 바다아이 2152
| |




Copyright ⓒ 2001.12. bada-ie.com. All rights reserved.
이 사이트는 리눅스에서 firefox 기준으로 작성되었습니다. 기타 브라우저에서는 다르게 보일 수 있습니다.
[ FreeBSD + GoLang + PostgreSQL ]
서버위치 : 서울 Amazon Lightsail  실행시간 : 0.02174
to webmaster... gogo sea. gogo sea.