일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- naver
- 베이지안
- spacesyntax
- pandas
- 도시인공지능
- 스마트시티
- SQL
- platformurbanism
- 도시공간분석
- digitalgeography
- 파이썬
- 네이버
- connectivity
- 서울
- 핫플레이스
- 서울데이터
- postgres
- 베이지안뉴럴네트워크
- 도시설계
- digital geography
- 웹크롤링
- multinomiallogitregression
- Python
- graphtheory
- QGIS
- 그래프색상
- 그래프이론
- 도시계획
- 공간분석
- 공간데이터
- Today
- Total
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- naver
- 베이지안
- spacesyntax
- pandas
- 도시인공지능
- 스마트시티
- SQL
- platformurbanism
- 도시공간분석
- digitalgeography
- 파이썬
- 네이버
- connectivity
- 서울
- 핫플레이스
- 서울데이터
- postgres
- 베이지안뉴럴네트워크
- 도시설계
- digital geography
- 웹크롤링
- multinomiallogitregression
- Python
- graphtheory
- QGIS
- 그래프색상
- 그래프이론
- 도시계획
- 공간분석
- 공간데이터
- Today
- Total
목록PostGRES (17)
이언배 연구노트

Space Syntax 중에서 angular segment analysis 를 돌리면,도로를 자근자근 쪼개서 각 segment로 분리한 뒤,각 segment끼리의 각도를 중심으로 네트워크 분석을 시행한다. 이거로 끝나면 다행이지만, 문제는DepthmapX로 돌려 나온 결과물은 좌표도 딱히 없고, 도로 객체랑 매치도 안된다.그리고 ID column도 사라져있기 때문에, geometry 로 매칭시켜야 한다. 그리고 도로 geometry 는 linestring이기 때문에,"딱 맞는다" 또는 "포함관계" 를 보기가 어렵기 때문에, 도로geometry 에 약간의 buffer를 주고,그 안에 포함되는 segment 의 평균과 합으로 계산해보자는 전략을 취해보자. CREATE TABLE seoul_ped_spaces..

서울빅데이터캠퍼스에 방문하면 신한카드 소비 데이터를 받을 수 있다.내가 가지고 있는 건 종로구의 50m 단위의 카드 소비에 관련된 데이터고,집계 방법은... 솔직히 모른다. 일단 이번 쿼리의 목적은종로구 기준으로 그리드에 포함된 DTP, NDTP의 비율과 소비의 성, 연령별 패턴의 관계성을 살펴보는 것이다. 연구에 쓸 수 있는 범위 내에서 query 를 날려보자. /* 식품, 미용, 학원, 헬스클럽 등에 관련된 업종 코드이다("SB_UPJONG" LIKE 'sb001' OR "SB_UPJONG" LIKE 'sb001' OR "SB_UPJONG" LIKE 'sb001' OR "SB_UPJONG" LIKE 'sb002' OR "SB_UPJONG" LIKE 'sb003' OR "SB_UPJONG" LIKE '..

내가 지금까지 활용한 데이터는 juso.go.kr 에서 제공하는 건축물 정보 데이터.geometry 가 가장 깔끔하고, 건축물 용도도 나오고, 가장 정리가 잘 되어있는 데이터다. 하지만 문제는, 준공연도, 건폐율, 용적률 등에 대한 정보 등 상세한 정보가 없다는 게 흠.그리고, 그런 상세한 데이터는 nsdi 데이터에 있는데,이녀석은 분명 key, id로 보였던 column 들에 중복이 있다...이런 잘못되어먹은 DB 같으니라고. 생각해보니, 이런 잘못되어먹은 DB의 데이터상의 한계를내가 극복할 (수 있다면 해야겠지만 한계가 있으니까 여기에 매달리고 있을) 수는 없지 않은가? 일단 붙여보자.우선, nsdi 데이터에서 가장 key (역할을 하는 것 처럼 보이고, juso 건물 데이터에도 있는 column 인..

가장 큰 관건이었던 데이터의 재생성 작업을 마쳤다.이제 남은 건 분석만 하면 된다.늘 그렇듯, 요리에 비유하면 재료 준비 과정이 가장 오래 걸린다. 이제 본격적으로 요리를 해볼 차례. 내가 붙여야 할 공간 변수들은도로 위계, 도로 등급, 도로 너비, 도로까지의 거리 (도로데이터)아파트까지 거리 (아파트 데이터)CBD까지의 거리 (CBD)지하철역까지의 거리 (지하철역)층수, 지하층수, 총연면적, 건물 용도, 건물 연식 (빌딩데이터를 juso 에다가 nsdi 건물까지)토지용도 (토지용도 데이터) 등이다. 일단, dtp_data_2024_buld 에 geometry 를 추가해준다.ALTER TABLE dtp_data_2024_buld ADD COLUMN geom GEOMETRY;UPDATE dtp_data_2..

지난번까지 데이터셋 구축에 완료했다.이제 빌딩 데이터셋으로 geometry 를 붙여줘야 용적률, 위치 등의 정보를 활용할 수 있으니빌딩데이터부터 차근차근 접근해보자. 우리가 쓸 건물 데이터는 JUSO_INFO. 출처는 juso.go.kr 이다.2021년 12월 기준이었지 아마.PK 는 bul_num_no 와 SIG_CD 라고 하는데, bd_mgt_sn 도 일단 모두 distinct하긴 해서 고민이 필요해보인다. 그리고 가장 열받는 포인트는 도로명이 아닌 "도로명 코드"로 되어있다는 점...이것을 위해 DTP 에 도로명 코드를 추가해주어야 한다. 전략은1. 도로명 코드 + 건물 본번 + 건물 부번 으로 geometry 를 매칭시키고2. 혹시 매칭에 실패했거나, 여러개의 건물에 붙은 경우에는 point좌표로..

나의 귀중한 NDTP, DTP, ADTP 데이터셋... 마이 프레셔스... 이제 이 데이터들을 한 곳에 합치되, 분류용 column을 추가해줄 거다. column "digi_type" 이 0이면: NDTPcolumn "digi_type" 이 1이면: DTPcolumn "digi_type" 이 2이면: ADTP 라고 볼 수 있다. chat교수님께 문의한 결과,materialized view 를 부를 때, 특정 column의 값을 지정하면서 만들어서 부르는 게 가능하다는 사실을 배웠다.SELECT *, 0 AS digi_type FROM ndtp_2024;이렇게!Hey! 이게 최선이야? 원래 인허가 데이터가 208,664개였는데? - 2024년 거쳐오면서 문 닫은 녀석들이 8,136개였다.- NAVER 검..

하... 내가 왜 ADTP를 붙일 수 있도록 nid 를 계속 추가하는 걸 까먹었을까... 문제:내가 멍청하게 인허가데이터 기준으로 ndtp와 dtp 를 구분해두어서,네이버 크롤링(naver place) 데이터베이스에 nid 로 지정해둔 adtp 데이터를다시 인허가 데이터에서 찾는 멍청한 짓을 해야 한다는 사실이다. 그럼 ADTP를 추가하는 방법은 2가지가 있다.1. 이성: 현재 DTP는 인허가 데이터 기준으로 분류가 되어있다. dtp를 구분하면서 했던 진행방식을 그대로 거치며, 인허가 데이터에 존재하는 내에서 adtp를 찾아낸다.2. 본능: 네이버에 예약 링크 있으면 그게 장사 한다는 뜻 아님? 굳이 인허가 데이터를 왜 찾음? 하지만 나는 이성애자다. 일단 예약 가능 링크가 있는 음식점들의 pmid를 찾..

좌표가 있으니까 지도에 옮기는 건 껌이네~~노노. 껌 쉽지 않음. 1. 종로의 dtp 데이터는 6389개, ndtp 는 2772개.2. 종로의 dtp 데이터 중 x좌표 가 null인 경우는 27개, ndtp는 85개 (인허가 데이터상 에서 누락)3. 종로의 dtp 데이터 중 x좌표 가 0인 경우는 88개, ndtp 는 39개 (학원데이터에는 좌표가 없음) 그런 관계로, 솔직히 얘들을 빼고 해도 문제는 없지만언젠가 하기는 해야할 일, 아예 코드를 만들어놓자. 해야할 일은 2, 3번을 골라내서 빌딩 지오메트리를 붙이고 무게중심으로 point 좌표를 만들기.그리고 기존 데이터에다가 붙이기. 일단 2, 3번을 골라내보자.SELECT * FROM jongno_dtp_2024 WHERE x = 0 OR x is n..