일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- naver
- 서울데이터
- 파이썬
- 도시인공지능
- SQL
- 도시설계
- Python
- 그래프색상
- platformurbanism
- 그래프이론
- 네이버
- postgres
- 도시계획
- 베이지안뉴럴네트워크
- 공간데이터
- digital geography
- 베이지안
- 스마트시티
- pandas
- spacesyntax
- graphtheory
- connectivity
- QGIS
- digitalgeography
- 도시공간분석
- 핫플레이스
- 웹크롤링
- multinomiallogitregression
- 서울
- 공간분석
Archives
- Today
- Total
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- naver
- 서울데이터
- 파이썬
- 도시인공지능
- SQL
- 도시설계
- Python
- 그래프색상
- platformurbanism
- 그래프이론
- 네이버
- postgres
- 도시계획
- 베이지안뉴럴네트워크
- 공간데이터
- digital geography
- 베이지안
- 스마트시티
- pandas
- spacesyntax
- graphtheory
- connectivity
- QGIS
- digitalgeography
- 도시공간분석
- 핫플레이스
- 웹크롤링
- multinomiallogitregression
- 서울
- 공간분석
Archives
- Today
- Total
목록인허가데이터 (1)
이언배 연구노트

나의 웹 크롤링 데이터는 어떻게 될 것인가...일단 이전에 크롤링해두었던 나에게 칭찬하며, 18,486개의 크롤링 데이터를 얻을 수 있었다. (파이썬에서 PostGRES로 옮겼다.)그 중에서 similarity 가 0.15이상인 녀석들은 아래와 같다 SELECT title, naver_check, similarity(title, naver_check) FROM overflow_resultWHERE similarity(title, naver_check) > 0.2 ORDER BY similarity ; 사실 네이버에서 매우 러프하게 검색한 결과물이어서 text similarity 를 더욱 보수적으로 잡아야하나 했지만,어차피 걸러낼 수 있는 가능성이 별로 없어보인다. 사실 이번 단계에서는 "네이버에서 검색된..
PostGRES
2024. 10. 8. 15:02