일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 네이버
- digital geography
- 스마트시티
- 웹크롤링
- spacesyntax
- SQL
- 그래프색상
- digitalgeography
- 베이지안뉴럴네트워크
- 서울데이터
- connectivity
- 파이썬
- QGIS
- 도시설계
- platformurbanism
- 핫플레이스
- 도시공간분석
- multinomiallogitregression
- 도시인공지능
- postgres
- 공간분석
- Python
- 도시계획
- 서울
- naver
- 그래프이론
- pandas
- 공간데이터
- graphtheory
- 베이지안
- Today
- Total
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 네이버
- digital geography
- 스마트시티
- 웹크롤링
- spacesyntax
- SQL
- 그래프색상
- digitalgeography
- 베이지안뉴럴네트워크
- 서울데이터
- connectivity
- 파이썬
- QGIS
- 도시설계
- platformurbanism
- 핫플레이스
- 도시공간분석
- multinomiallogitregression
- 도시인공지능
- postgres
- 공간분석
- Python
- 도시계획
- 서울
- naver
- 그래프이론
- pandas
- 공간데이터
- graphtheory
- 베이지안
- Today
- Total
이언배 연구노트
[Digital Geography] Digi-Third-Place 연구의 데이터 구득 본문
내 연구는 소중하다.
Digi-Third-Place 데이터는 Naver 등록 여부를 중심으로
인허가 데이터는 2023년 7월 기준으로 영업중인
- Eating: 식품자동판매기업, 제과점, 단란주점, 유흥주점, 관광식당, 휴게음식점, 일반음식점
총 165592 개의 Point.
- Recreation: 무도학원업, 서울시 학원 교습소정보(인허가 아닌 학원 정보)
4265개의 Point.
댄스학원, 무도학원은 인허가에서 받아왔지만 전체 학원 데이터는 교육부 데이터. 그래서 중국어, 어학원, 컴퓨터학원 등이 포함되어 있다. 대신 입시 중심의 학원은 확실히 제거된 것으로 보인다.
- Commercial: 미용업, 이용업
32879개의 뷰티, 네일샵, 및 이발소.
이발소의 경우, 끝에 '이용원', '이발관' 없이 '정릉', '성우', '머스마' 등 Cool 한 네이밍을 보이는 덕분에 데이터 검색에 애를 먹을 예정이다.
- Club: 체육도장업, 체력단련장업
5929개의 태권도장, 복싱장, 휘트니스센터, 체육관.
그래서 현재 문제는 무엇이냐,
"NDTP를 검색했더니 다 나온다" 는 것이 문제.
1. "도로명주소 + 음식점" 으로 검색하면 안나왔던 녀석들
2. "상호명"으로 검색해도 안나왔던 녀석들
3. 심지어 "건물주소 + 상호명"으로 검색해도 안나왔던 녀석들이 쏟아져 나온다.
문제가 있다.
정녕 NAVER 라는 플랫폼에 잠식당하지 않고 곤조있게 운영하는 식당은 없다는 말인가...
그런데 또 왜 내가 기존에 만들어놓았던 데이터베이스에는 총 203,994개의 포인트밖에 없는가... 망할...
내가 지난번에 Crawling 한 NAVER Place 들은 총 158,249 포인트.
모양새를 보아하니 2023년 8월 27일에 crawling 을 마친 모양이다.
이제 확실한 DTP들을 찾아보자.
1. 인허가 등록 되어있을 것
2. 일단 인허가 데이터와의 비교를 통해서 가려낼 수 있는 애들을 가려내자.
2-1. 일단 빌딩 데이터 기준으로, 같은 빌딩에 있는 녀석들을 가려내보자.
2-2. 같은 빌딩에 있는 NAVER 식당으로 검색이 안된 애들과 matching이 안된 naver place 들끼리 반경n 미터, 또는 동 기준으로 이름을 비교해보자. 물론, 각 업종을 별도로 분석해야 한다.
2-3. 아직도 matching 이 안된 녀석들이 있다면, 걔들은 진짜 검색을 어떻게 해야할지 알고리즘을 짜보자.
3. 앞선 논문에서 했던 짓거리를 그대로 반복해보자.
'Digital Geography' 카테고리의 다른 글
[Digital Geography] NAVER-ized 된 상권을 찾아보자 (0) | 2025.03.03 |
---|---|
[Digital Geography]Geographies of Digital Exclusion (1) | 2024.10.15 |
[Digital Geography] Inventing Future Cities 스터디 (0) | 2024.05.13 |
[Digital Geography] 빅테크 기업과 디지털 시대 스터디 (0) | 2024.05.07 |
[Digital Geography] NAVER 의 역사와 의의 스터디 (1) | 2024.05.07 |