PostGRES
[PostGRES] DTP 데이터셋 완성하기
이언배
2024. 11. 29. 21:27
나의 귀중한 NDTP, DTP, ADTP 데이터셋... 마이 프레셔스...
이제 이 데이터들을 한 곳에 합치되, 분류용 column을 추가해줄 거다.
column "digi_type" 이 0이면: NDTP
column "digi_type" 이 1이면: DTP
column "digi_type" 이 2이면: ADTP
라고 볼 수 있다.
chat교수님께 문의한 결과,
materialized view 를 부를 때, 특정 column의 값을 지정하면서 만들어서 부르는 게 가능하다는 사실을 배웠다.
SELECT *, 0 AS digi_type FROM ndtp_2024;
이렇게!
Hey! 이게 최선이야? 원래 인허가 데이터가 208,664개였는데?
- 2024년 거쳐오면서 문 닫은 녀석들이 8,136개였다.
- NAVER 검색해서 안나온 애들도 있다.
정도의 오차로 생각하자.
숫자가 안 맞는게 지금 상당히 거슬리긴 하는데, 저 정도면 빅데이터 세계에서 감사한 거라고 생각해도 될까.
CREATE TABLE dtp_data_2024 AS
(SELECT distinct on (dd.pmid) dd.* FROM
(SELECT *, 0 AS digi_type FROM ndtp_2024
UNION
SELECT *, 1 AS digi_type FROM dtp_2024_new
UNION
SELECT *, 2 AS digi_type FROM adtp_2024) dd);
데이터를 완성했다... 이제 TABLE을 만들어도 된다...
728x90