🏞️ GIS & RS/📚 GIS (지리정보시스템)

[GIS] Foursquare 오픈소스 플레이스 데이터셋 공개

김 홍시 2024. 12. 5.
반응형

 

Foursquare Open Source Places: 지리공간 커뮤니티를 위한 새로운 기초 데이터셋

2024년 11월 19일, Gary Little 작성

기술이 빠르게 확장되고 채택되는 각 단계에서, 개별 기업과 시장 전체에 큰 도약을 이끌어낸 핵심 오픈 소스 소프트웨어를 식별할 수 있습니다. 오늘날 최첨단 인공지능(AI)에서도 오픈 소스는 프레임워크(예: TensorFlow, PyTorch)를 활용해 최첨단 모델을 구축하거나, 이를 널리 사용할 수 있도록 만드는 데 적극적으로 활용되고 있습니다(예: Stable Diffusion, Meta의 Llama 모델 또는 xAI의 Grok).

2009년 창립 이래 포스퀘어는 오픈 소스를 통해 많은 혜택을 받아왔습니다. 소프트웨어 개발에서 Kafka(데이터 스트리밍), PyTorch(기계 학습), Apache Iceberg(데이터 저장) 같은 오픈 소스 기술을 활용하며 효율적으로 혁신해왔습니다. 또한, 지리공간 기술은 Uber의 H3 인덱싱 시스템, Apache Sedona의 공간 프레임워크, OpenStreetMap(OSM) 데이터를 통해 강화되었습니다.

그러나, 지리공간 및 위치 데이터를 포함한 데이터 계층은 대규모 독점 시스템에 의해 지배되는 경우가 많아, 일반적인 채택을 어렵게 만들고 있습니다. 이로 인해 고객에게 진정한 가치를 제공하는 일반 채택 단계로의 확장이 제한됩니다.

이를 변화시키기 위해 포스퀘어는 **Foursquare Open Source Places(FSQ OS Places)**의 일반 출시를 발표합니다. 1억 개 이상의 글로벌 관심 장소(POI)로 구성된 이 기초 데이터셋은 22개의 핵심 속성을 포함하며, 매월 업데이트되며 Apache 2.0 라이선스 하에서 상업적으로 이용 가능합니다.


오픈 소스 POI의 필요성

"오랜 기간 독점 데이터셋을 구축해온 포스퀘어 같은 회사가 왜 데이터를 커뮤니티에 무료로 공개하려 할까?"라는 질문은 매우 타당합니다. 사실, 동료들 중 일부는 내가 이 결정을 발표했을 때 제정신이 아니라고 생각하기도 했습니다. 이 문제로 돌아가기 전에, 먼저 전 세계 POI 데이터베이스의 정확성이 왜 중요한지 이해해 봅시다.

기술 혁신의 새로운 시대, 즉 컴퓨터 시스템과 물리적 세계를 연결하는 공간 컴퓨팅(Spatial Computing)의 시대에 접어들면서, 이러한 시스템이 물리적 장소와 관련하여 자신들의 맥락을 부분적으로 또는 전체적으로 이해할 수 있도록 돕는 핵심 계층이 필요합니다. 이는 주변 세상에 대한 포괄적이고 정확한 이해를 기술의 기초로 만듭니다. 그렇지 않으면, 자율 시스템이 잘못된 하차 지점으로 이동하거나 증강된 광학 경험이 현실과 동떨어져 고객 경험이 나빠질 수 있습니다.

하지만 현실과 동기화된 장소 데이터베이스를 생성하고 유지하는 일은 매우 어려운 기술적 과제이자 자본 집약적 과제입니다. 최근 우리 CTO Vikram Gundeti가 새롭게 출시한 Place Engine 블로그에서 설명했듯이, 이를 잘 수행하려면 최신 디지털 발견 시스템과 조화를 이루는 휴먼 인 더 루프(Human-in-the-loop) 확인 작업으로 구동되는 운영 체제가 필요합니다. 요약하자면, 정확한 글로벌 POI 데이터베이스를 구축하는 것은 기술적, 자본적 관점 모두에서 매우 어려운 작업입니다.

따라서, Google Maps와 같은 글로벌 독점 배포 플랫폼이 없다면, 포괄적이고 정확한 장소 데이터의 기본 계층을 구축하는 문제는 오픈 소스 커뮤니티에 의해 해결되는 것이 가장 적합하다고 믿습니다.


포스퀘어의 접근 방식

우리는 이 문제를 해결하려는 다른 시도들을 인정하면서도, 현재 관찰되는 접근 방식은 데이터 연합(Federation)에 더 가깝고, 진정한 오픈 소스 커뮤니티로 성공할 가능성이 낮다고 판단하고 있습니다. 결과적으로, 이는 지리 위치 데이터에서 자주 관찰되는 디지털 메아리 효과(Digital Echo Chamber 효과)를 확대할 가능성이 큽니다.

글로벌 장소 운영 체제가 성공하려면 다음 세 가지 핵심 요소가 필요하다고 믿습니다.

  1. 일관되고 포괄적인 장소 운영 체제
  2. 대규모 AI 기여(상당한 도구가 필요함)
  3. 대규모 인간 기여 확인(또한 상당한 도구 필요)

FSQ OS Places 노력의 핵심에는 위 세 가지 원칙을 기반으로 한 Place Engine이 있습니다. 이는 인간과 AI 에이전트가 협력해 장소 데이터를 실제 세계와 동기화 상태로 유지하는 최초의 크라우드소싱 시스템입니다.


참여를 환영합니다

FSQ OS Places의 최신 버전을 지금 다운로드할 수 있으며, 곧 커뮤니티 기여 도구도 공개됩니다. 이 도구를 통해 FSQ Placemaker로서 세계에서 가장 포괄적이고 정확한 기본 데이터셋을 만드는 미션에 동참할 수 있습니다. Placemaker 대기자 명단에 등록하고 프로젝트에 대한 향후 알림을 받으려면 여기를 클릭하세요.

이 노력의 일환으로, 우리는 더 넓은 개발 커뮤니티와 협력하여 생태계를 성장시킬 것을 약속합니다. 데이터를 활용하고 접근하는 새로운 방법뿐 아니라 커뮤니티 기여를 위한 새로운 프로젝트(예: 핵심 머신러닝 모델)를 공개할 예정이니, 많은 관심 부탁드립니다.

다가올 혁신을 기대합니다.

반응형

댓글