본문 바로가기

일/코딩테스트

[MySQL] 특정 세대의 대장균 찾기

지난 주부터 java 코테와 SQL 쿼테를 일주일에 한 문제씩 풀기로 했다.

 

- 문제 설명

대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.
다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다. ECOLI_DATA 테이블의 구조는 다음과 같으며, ID, PARENT_ID, SIZE_OF_COLONY, DIFFERENTIATION_DATE, GENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ID, 개체의 크기, 분화되어 나온 날짜, 개체의 형질을 나타냅니다.

 

- 문제

3세대의 대장균의 ID(ID) 를 출력하는 SQL 문을 작성해주세요. 이때 결과는 대장균의 ID 에 대해 오름차순 정렬해주세요.

 

- 예시

예를 들어 ECOLI_DATA 테이블이 다음과 같다면

ID                PARENT_ID                       SIZE_OF_COLONY DIFFERENTIATION_DATE                          GENOTYPE
1 NULL 10 2019/01/01 5
2 NULL 2 2019/01/01 3
3 1 100 2020/01/01 4
4 2 16 2020/01/01 4
5 2 17 2020/01/01 6
6 4 101 2021/01/01 22
7 3 101 2022/01/01 23
8 6 1 2022/01/01 27

PARENT ID 가 NULL 인 ID 1, ID 2가 1 세대이며 ID 1에서 분화된 ID 3, ID 2에서 분화된 ID 4, ID 5 가 2 세대입니다. ID 4 에서 분화된 ID 6, ID 3에서 분화된 ID 7 이 3 세대이며 ID 6에서 분화된 ID 8은 4 세대입니다.

따라서 결과를 ID 에 대해 오름차순 정렬하면 다음과 같아야 합니다.

ID
6
7

 

JOIN 문을 사용하여 세대를 나열할 필요가 있다고 생각하였다. 

 

처음 시도한 답안)

SELECT c.ID AS ID
FROM ECOLI_DATA AS a
JOIN ECOLI_DATA AS b ON b.PARENT_ID = a.ID 
JOIN ECOLI_DATA AS c ON c.PARENT_ID = b.ID
ORDER BY c.ID ASC;

 

그러나 자꾸만 6, 7이 아니라 7, 8로 결과가 출력되어 SELECT로 출력할 컬럼에 1~4세대를 출력해보니

첫번째 행에 NULL - 1 - 3 - 7

두번째 행에 2 - 4 - 6 - 8 로 출력되는 것을 발견. 2가 아니라 Null이 0세대 시작이어야 한다.

 

해결을 위하여 WHERE 절을 추가하여 최상위 부모 제한을 두었다. WHERE a.PARENT_ID IS NULL 조건을 유지하여, 최상위 부모의 PARENT_ID가 잘못된 값으로 덮어쓰이지 않도록 보장.

 

수정된 답안) 

SELECT c.ID AS ID
FROM ECOLI_DATA AS a
JOIN ECOLI_DATA AS b ON b.PARENT_ID = a.ID 
JOIN ECOLI_DATA AS c ON c.PARENT_ID = b.ID
WHERE a.PARENT_ID IS NULL -- 1세대만 기준으로 필터링 
ORDER BY c.ID ASC;

 

예상 답안으로 결과 출력이 잘 됨을 확인하였다.