이언배 연구노트

[PostGRES] DTP 데이터셋 완성하기 본문

PostGRES

[PostGRES] DTP 데이터셋 완성하기

이언배 2024. 11. 29. 21:27

나의 귀중한 NDTP, DTP, ADTP 데이터셋... 마이 프레셔스...

 

이제 이 데이터들을 한 곳에 합치되, 분류용  column을 추가해줄 거다.

 

column "digi_type" 이 0이면: NDTP

column "digi_type" 이 1이면: DTP

column "digi_type" 이 2이면: ADTP

 

라고 볼 수 있다.

 

chat교수님께 문의한 결과,

materialized view 를 부를 때, 특정 column의 값을 지정하면서 만들어서 부르는 게 가능하다는 사실을 배웠다.

SELECT *, 0 AS digi_type FROM ndtp_2024;

이렇게!

Hey! 이게 최선이야? 원래 인허가 데이터가 208,664개였는데?

 

- 2024년 거쳐오면서 문 닫은 녀석들이 8,136개였다.

- NAVER 검색해서 안나온 애들도 있다.

 

정도의 오차로 생각하자.

숫자가 안 맞는게 지금 상당히 거슬리긴 하는데, 저 정도면 빅데이터 세계에서 감사한 거라고 생각해도 될까.

 

 

CREATE TABLE dtp_data_2024 AS
(SELECT distinct on (dd.pmid) dd.* FROM
	(SELECT *, 0 AS digi_type FROM ndtp_2024
	UNION
	SELECT *, 1 AS digi_type FROM dtp_2024_new
	UNION
	SELECT *, 2 AS digi_type FROM adtp_2024) dd);

 

데이터를 완성했다... 이제 TABLE을 만들어도 된다...

 

 

 

728x90