로고

[Review] 'GIS 사일로가 무너진다'

공간 데이터 과학 현황 2024(The State of Spatial Data Science 2024) 보고서

김영도 기자 | 기사입력 2024/07/24 [15:21]

[Review] 'GIS 사일로가 무너진다'

공간 데이터 과학 현황 2024(The State of Spatial Data Science 2024) 보고서

김영도 기자 | 입력 : 2024/07/24 [15:21]

(커넥트 데일리=김영도 기자) 전 세계적으로 위치 기반의 공간정보 데이터가 타산업과 연계성을 가지면서 관련 산업의 확장성이 커지고 있는 가운데 스페인 CARTO에서 발간한 2024년 공간 데이터 과학의 발전과 변화를 분석한 유의미한 보고서가 나와 리뷰 형식으로 게재합니다(편집자 註).

 


공간 데이터 과학의 현황 2024라는 보고서는 스페인의 위치 인텔리전스(Location Intelligence) 및 지리 공간 분석(Geospatial Analysis) 전문기업 CARTO(CEO Luis Sanz)에서 지난 18일 발간했다.

 

보고서 작성자는 지리정보 전문가 Helen McKenzie이며 보고서 도표와 편집은 그래픽디자이너 Valeria Di Niscia가 맡았다.

 

CARTO는 산업 전문가, 비즈니스 임원, 팀 결정권자, 데이터 과학 전문가 및 일상적으로 공간 데이터 종사자를 대상으로 설문조사를 실시해 관련 산업의 현황을 매년 보고하고 있으며, 올해는 전 세계 모든 지역의 250명 이상을 대상으로 설문조사를 실시했다.

 

보고서 작성자 Helen McKenzie는 “대기업과 중소기업을 포함해 전 세계 거의 모든 지역에서 설문조사에 참여했으며 공간 데이터 분야 현황을 분석한 결과를 보고서에 담아 통찰력을 공유하고 있다”고 밝히면서 “앞서 두 차례 실시한 설문조사와 달리 올해는 가장 높은 참여율을 보였다”고 전했다.

 

 

본문이미지

 

설문조사에 참여한 그룹들을 살펴보면 ▲소프트웨어 및 기술 22% ▲자원 및 환경 19% ▲도시 및 정부 17% ▲컨설팅 15% 순으로 직책과 관련해서는 자주 언급된 직책의 단어는 ▲데이터 33회 ▲엔지니어 19회 ▲분석가 17회였다.

 

과거 “GIS”와 “지리 공간” 같은 핵심 용어가 반복적으로 등장했던 것에 반해 올해는 각각 12회와 9회만 언급되었다는 반응을 담았다.

 

이에 대해 Helen McKenzie는 “공간 데이터 과학 산업이 기존의 핵심 영역을 넘어 빠르게 확장되고 있다는 것”과 “공간 데이터 과학이 점점 더 주류 데이터 과학 관행과 응용에 통합되면서 포괄적인 다양성을 시사하고 있지만 특정기술과 전문성을 가진 인재를 확보하는데 어려움이 예상된다”고 평가했다.

 

<공간 데이터 과학은 더 이상 틈새 분야가 아니다.>

2023년 공간 데이터 과학 현황 보고서에서는 공간 분석이 ‘틈새’에서 ‘주류’로 전환할 준비가 되어 있다고 언급했으며 실제 그 변화가 일어나고 있다고 밝히고 있다.

 

설문조사를 통해서 공간 데이터 과학이 틈새를 넘어 데이터 과학 팀과 조직 전체에 더 잘 통합되고 있음을 확실히 알 수가 있다. 

 

다양한 산업과 분야에서 광범위한 사용 사례에 적용되며, 미래의 비즈니스 전략에 더 정밀하고 실시간의 차원을 추가하고, 중요한 의사 결정을 지원하고 있다는 것이다.

 

설문조사 응답자에게 공간 데이터 과학이 귀사의 비즈니스 전략의 핵심인가? 라는 질문을 했을 때 응답자 약 3/4이 ‘Yes’라고 답했다.

 

 

72.7%가 공간 데이터 과학이 비즈니스 전략의 핵심이라고 답해 조직의 의사결정에서 위치 정보의 가치를 보였고 특히, 건강 및 의료 88%, 통신 87.5%, 자원 및 환경 87.2% 산업에서 이 질문에 ‘Yes’라고 답한 비율이 높았다.

 

반면, 은행 및 금융 서비스 산업에서는 응답자의 66.7%만이 공간 데이터 과학이 현재 비즈니스 전략의 핵심이라고 답했는데 여전히 긍정적인 방향으로 기울면서 공간 데이터 과학이 성장할 여지가 상당히 많다는 것을 시사했다.

 

“방대한 양의 공간 데이터가 제공되어 의사 결정자들에게 의사 결정 과정을 개선하고, 비즈니스 가치의 원동력을 이해하는 것에 도움이 되는 트렌드를 드러내는 중요한 통찰력을 제공한다” - 다국적 컨설팅 회사 이사

 

또 조직에서 공간데이터 사용에 대한 질문에 조직내 25%만이 단순한 분석 및 시각화를 위해 공간 데이터를 사용하고 있는 것으로 나타났다.

 

과거 대부분 조직이 공간 데이터를 사용해 간단한 분석을 수행하고 데이터 기반 시각화를 만드는 도입 단계에 속했으며 공간 데이터가 넓은 데이터 과학 분야에서 비교적 틈새 역할을 해왔다.

 

하지만 시간이 지남에 따라, 조직이 공간 데이터를 사용하고 적용하는 방식이 점점 더 정교해지면서 새로운 수준의 공간 데이터 성숙도가 나타나기 시작했다.

 

Helen McKenzie는 조직의 성숙도 수준을 모든 범주에 걸쳐 비교적 고르게 분포되어 있지만 많은 조직이 비즈니스 의사 결정을 주도하는 엔터프라이즈 수준의 시스템을 도입하는 최고 수준의 도입 단계에 도달하기까지는 아직 갈 길이 남아 있다고 설명했다.

 

<공간 데이터 과학의 주요 사용 사례>

공간 데이터 과학이 주요 사용 사례를 보더라도 이전과 달리 더 혁신적이고 산업별로 특화된 방식으로 사용되고 있음을 알 수 있었다.

 

여러 산업에 공통적으로 적용되는 사용 사례인 지오마케팅, 사이트 선택 및 타당성 분석, 데이터 수익화가 가장 중요하게 여겨지는 모습이다.

 

 

특히 모든 산업에서 공간 데이터 과학의 응용이 더 많은 주류를 차지하면서, 공간 데이터를 창의적이고 독창적인 방식으로 사용하고 조작해 복잡한 비즈니스 문제를 해결하는 능력이 증가함에 따라 새로운 산업별 사용 사례가 등장하기 시작했다.

 

비근한 예로 보험 산업을 들 수 있는데 공간 데이터는 재난재해 모델링, 사기 분석, 포트폴리오 위험 분석 및 실시간 정밀도와 정확도를 갖춘 가격 모델 개발에 정기적으로 사용되고 있다.

 

또 최근 지구온난화로 인한 기후 변화의 복잡성으로 응답자 40%가 환경 관리 및 모니터링을 공간 데이터 과학의 주요 사용 사례로 꼽았다.

 

기후 변화는 산업 전반에서 중요한 이슈로 떠오르는 분야로 단순히 환경 문제를 다루는 분야를 넘어 비즈니스 영역으로 재편되고 글로벌 규모로 영향을 미치고 있다.

 

극단적인 기후 사건이 빈번해지면서 이를 비즈니스 전략과 비상 계획에 통합하는 방안들이 모색되고 있다.

 

교통, 여행, 보험, 부동산 등 환경 변화에 직접적으로 영향을 받는 산업에 필수적이며 다른 산업들 역시 기후 변화의 파급 효과를 무시할 수 없는 상황이어서 그 영향은 더욱 커질 것으로 전망된다.

 

이 같은 시대변화에 관련 비즈니스 기업은 공간 데이터 과학을 활용해 기후와 관련된 비즈니스 과제를 예측하고 극복해야 하는 상황에 직면한 것이다.

 

Helen McKenzie는 “공간 분석은 정확한 모델을 만들고 숨겨진 통찰력을 발견하는데 도움을 주며 보다 능동적이고 효과적인 의사 결정을 가능하게 만든다”면서 “어떤 비즈니스도 자연의 영향을 완전히 피할 수는 없지만, 공간 데이터 과학은 그 예측 불가능한 영향을 앞서가는 데 도움을 줄 수 있다”고 강조했다.

 

설문에 응한 응답자들도 기후 변화가 공간 데이터 과학에 어떤 의미를 갖는지 다음과 같이 말하고 있다.

 

“기후 변화는 우리가 인식하고 해결책에 통합해야 하는 또 다른 층이 되어야 하며, 이를 통해 장기적인 성공을 이룰 수 있습니다.” - 다국적 컨설팅 및 건축 회사 수석 엔지니어 

 

“기후 변화는 주택 비용, 부채, 경제적 양극화와 같은 현재의 문제를 악화시킬 것이므로, 이러한 주제는 미래에 분석을 통해 고려되고 해결해야 할 것입니다.” - 미국 부동산 회사 데이터 분석가

 

“기후 변화는 데이터 뱅크를 확실히 확장시켜 더 정확한 예측 모델을 통해 재해에 더 잘 대비할 수 있게 도와줄 것입니다.” - 로얄 매퍼스 컨설팅 리미티드 지리공간 데이터 엔지니어

 

<공간 데이터 작업은 여전히 어렵다>

공간 데이터 과학이 틈새 범위를 넘었음에도 불구하고, 품질 좋고 최신의 공간 데이터를 소싱하고 이를 통해 의미 있는 비즈니스 통찰을 도출하는 데 여전히 많은 조직들이 큰 어려움을 겪고 있다.

 

데이터 정리 작업이 항상 어렵다는 것은 공공연한 비밀이지만 이는 시작하기 위한 전제 조건에 불과하다고 설명한다.

 

이번 설문조사에서 데이터를 사용 가능한 상태로 만든 후에도 순조롭게 진행되지 않는다는 것을 알 수 있다는 인사이트가 제공됐다.

 

데이터 분석팀은 공간 분석 과정의 거의 모든 단계에서 계속해서 어려움을 겪고 있는데 산업 전반에 걸쳐 공식적인 합의가 없다는 것을 전제로 하고 있다.

 

관련 질문에 대한 응답자들에게 공간 데이터 과학 과정의 다양한 부분을 가장 쉬운 것부터 가장 어려운 것까지 나열하면 다음과 같다. 

 

 

▲공간 데이터 소싱 및 정리 ▲데이터 준비 및 통합 ▲공간 데이터 집계 및 분석 ▲데이터의 시각적 표현을 통한 분석 결과 전달 등이다.

 

이 같은 현상은 공간 데이터 과학의 다변화, 특히 다양한 산업에 걸친 지속적인 통합과 널리 퍼진 주요 사용 사례에 대한 새로운 응용 덕분일 가능성이 높다.

 

그럼에도 불구하고, ‘시각화’는 공간 데이터 작업의 가장 도전적인 부분으로 남아 있으며, 작은 차이일지라도 여전히 중요하다는 것을 전달하고 있다.

 

많은 사람들이 데이터에서 주요 통찰을 전달하는 시각 자료를 만드는 작업이 단순히 ‘재미있고’, ‘쉬운’ 일이라고 생각할 수 있지만, 실제 일정 수준의 창의성과 사람들이 데이터 기반 콘텐츠를 소비하는 방식을 이해하는 것이 필요하고 대규모 데이터 세트와 복잡한 분석을 다룰 때 더욱 복잡해진다.

 

그렇다면, 품질 좋은 공간 데이터를 소싱하는 데 어려운 점은 무엇인지와 데이터 소싱과 정리가 데이터 전문가의 시간의 60-80%를 차지하는지 살펴보자.

 

올해 설문조사에서는 품질 좋은 공간 데이터를 얻는 것이 왜 어려운지 깊이 이해하고자 했으며 이에 대한 응답자들은 다음과 같은 문제들을 지적했다.

 

첫 번째가 높은 획득 비용과 제한된 공개 데이터 옵션으로 53.7%이라는 절반 이상의 응답율을 보였다.

 

두 번째로 업데이트된 데이터 접근의 어려움이라고 답한 응답률이 46.7%로 최신 데이터에 쉽게 접근할 수 없다고 답했다.

 

세 번째로 기타 여러 문제들이 지적됐는데 불완전한 메타데이터와 상호운용성 부족, 라이선스 문제, 데이터 크기 등이 제기됐다.

 

전체적으로 살펴볼 때 접근성과 품질의 혼합에 있다는 것을 알 수 있다. 

 

관련된 공간 데이터 소스를 찾기 어려울 뿐만 아니라, 이러한 데이터 세트를 찾아서 구매한 후에도 데이터 자체가 높은 품질을 보장하지 않거나, 상당한 양의 정리가 필요할 수 있다는 것이다.

 

이러한 상황은 고품질 데이터에 대한 접근을 민주화하고, 비용 부담 없이 데이터에 접근할 수 있는 필요성이 계속해서 증가하고 있다는 것을 시사한다.

 

특히, 공간 데이터가 점점 더 다양한 데이터 과학 사용 사례에 통합되고 있는 상황에서 더욱 중요한 요소로 작용한다.

 

올해 설문조사에서 가장 흥미로운 발견 중 하나는 ‘데이터 크기’가 공간 데이터를 소싱할 때 가장 덜 도전적인 장애물로 지목되었다는 점이다.

 

많은 그룹들이 클라우드 기반 데이터 관리 솔루션으로 전환하고 있으며, 이는 매우 큰 데이터 양을 더 빠르고 쉽게 처리할 수 있도록 해주는 가능성이 크다고 본 것이다.

 

 

<GIS 사일로가 허물어지고 있다>

Helen McKenzie는 “공간 데이터 과학이 더 이상 GIS와 동의어가 아니다.”라고 정의했다.

 

보고서에서 이미 언급한 바와 같이, 공간 데이터 과학 분야는 빠르게 변화하면서 이전에 조직에서 매우 전문화된 공간 분석 기술과 전문성을 가진 사람들만을 위한 극히 틈새 데이터 과학 실천이었던 공간 데이터 과학은 현재 그 범위가 더욱 넓어지고 다양화되고 있다.

 

이 변화의 좋은 예는 오늘날 다양한 산업에서 공간 데이터가 적용되는 광범위하고 지속적으로 확장되는 사용 사례들에서 찾아 볼 수 있다.

 

조직들은 공간 분석의 힘을 활용해 더 정밀하고 정확하며 실시간 통찰을 제공하고, 이를 통해 더 스마트한 비즈니스 전략과 보다 정보에 기반한 의사 결정을 추진하는 데 관심을 갖는다.

 

이 같은 산업 성장에 따라 공간 데이터 과학 플랫폼의 수도 증가하는 추세다. 

 

 

조직에서 사용하는 공간 데이터 과학 플랫폼을 하나의 도구 또는 서로 연결된 도구 집합으로 사용할지에 대한 여부는 특정 산업, 조직의 공간 분석 사용 사례, 분석되는 데이터의 종류와 크게 관련이 있다.

 

이러한 이유로 오늘날 성공적인 지리 공간 인프라를 구축하는데 데이터와 기술의 상호운용성이 매우 중요하게 작용한다.

 

특히 조직에서 공간 분석을 지원하는 도구와 소프트웨어를 선택하는 데는 많은 요인이 작용하는데 조직의 규모나 운영 산업, 특정 공간 분석 사용 사례, 분석되는 데이터의 크기 등 다양한 요소를 고려해야만 한다.

 

적합한 도구를 찾는 난이도를 1에서 5까지의 척도로 평가하도록 요청했을 때, 36.6%의 응답자가 4점 이상의 점수를 주었으며, 이는 적합한 소프트웨어를 찾는 일이 쉽지 않다는 것을 반영하고 있는 반면 ‘매우 쉽다’고 답한 응답자는 7.6%에 불과했다. 

 

이 비율은 컨설팅 회사가 21.9%로 비율이 불균형하게 높았는데 컨설팅 회사가 시장에 대한 지식을 갖추고 있으며, 가장 적합한 솔루션을 추천해야 한다는 전문성과 부담감이나 압박감일 수도 있지만 프로젝트 기반으로 운영되는 특성상 프로젝트의 요구 사항에 따라 적합한 솔루션을 찾는 데 더 많은 유연성을 가져야 하기 때문이다.

 

“우리는 더 많은 일을 수행할 수 있는 적은 수의 도구를 선호합니다. 이렇게 하면 엔지니어들이 실제로 도구를 배우고 반복적으로 활용할 수 있습니다.” - 미국 부동산 회사의 제품 관리자

 

“문제는 우리의 대규모 데이터 레이크와 원활하게 연결되는 엔터프라이즈 솔루션을 찾는 것이었습니다.” - 미국 엔지니어링 회사의 고급 운전 보조 시스템 감독관

 

프로그래밍 사용 언어로 Python, R, SQL이 여전히 가장 인기 있는 프로그래밍 언어로 선택됐다.

 

 

응답자의 66%가 Python을 사용한다고 답했으며, 이는 공간 분석에 가장 일반적으로 사용되는 프로그래밍 언어로 Python의 간결함과 다양한 라이브러리 및 도구와의 상호운용성 덕분에 과거의 트렌드와 일치한다.

 

상위 세 가지 프로그래밍 언어에는 R(54%)과 SQL(53%)도 포함되어 있으며 SQL의 채택 증가 역시 지난 보고서에서 확인된 트렌드를 계속 이어가고 있음을 확인할 수 있다.

 

좀 더 떨어진 네 번째로는 JavaScript(35%)가 있으며, 이는 Consumer Apps(83%) 및 보험(76.5%) 산업에서 상당히 높은 수치를 보였다. 이들 산업에서는 HTML 사용 사례가 더 많을 가능성이 있다.

 

응답자의 8%는 ‘기타’를 선택했는데 Energy & Utilities(21%) 및 Retail(18%) 산업에서 가장 높게 나타나 이들 산업에서는 틈새 언어에 대한 필요성이 더 커 보인다.

 

마지막으로, 응답자의 거의 9%는 이 질문에 응답하지 않았는데 무코드(no-code) 솔루션에 의존하고 있을 가능성이 제기된다.

 

숙련된 공간 데이터 과학 인재를 채용하는 어려움이 있기 때문에, 무코드 솔루션 사용 결정이 현재 구직 시장에서 코드 작성 인재의 부족을 보완할 수 있기 때문이다.

 

또 응답자 54%가 데이터 분석가들이 조직에서 대부분의 공간 데이터 과학 작업을 수행한다고 확인했다. 그 뒤를 이어 데이터 과학자(46.4%), GIS 전문가(45.2%), 데이터 엔지니어(42%) 순으로 나타났다. 

 

이 같은 응답률에서 가장 흥미로운 점으로 GIS 전문가들이 더 이상 조직에서 주요 공간 데이터 과학 실무자가 아니라는 점을 강조했다.

 

비록 그들이 공간 분석에 대한 깊은 전문 지식을 바탕으로 여전히 이러한 작업을 수행하고 있지만, 데이터 일반화 전문가들이 점차 그들의 자리를 차지하고 있다는 것이다. 

 

Helen McKenzie는 “공간 데이터 과학이 조직의 더 넓은 데이터 과학 실천에 점점 더 통합됨에 따라 GIS 사일로가 무너지고 있다는 명확한 신호”라고 설명했다.

 

또 ‘기타’ 카테고리에서 발견된 점도 주목할 만하다. 이 카테고리에서 언급된 직무 제목들은 많은 조직에서 공간 데이터 과학 작업이 순수한 ‘데이터’ 중심 역할을 넘어서는 범위로 확장되고 있음을 보여준다.

 

<공간 분석은 클라우드에서>

더 많은 복잡한 데이터는 이를 이해할 수 있는 더 나은 솔루션이 요구된다. 

 

데이터는 매일 크기, 속도, 복잡성이 증가하고 있으며, 공간 데이터는 이 규칙의 전형적인 사례로, 본질적으로 크고 지속적으로 성장하는 데이터이기에 조직들은 이를 따라잡기 어려워하고 있다.

 

보고서는 실제로 전통적인 온프레미스 솔루션은 방대한 지리공간 데이터 세트를 저장하고 처리하며 분석하는 데 어려움을 겪기 시작하고 있으며 그 결과 성능 저하, 느린 분석, 제한된 확장성, 비용 증가로 이어지고 있어 공간 분석의 미래가 클라우드에 있다고 강조한다.

 

 

설문조사에서 응답자 70%가 공간 분석을 클라우드에서 수행한다고 답했다.

 

지난해 설문조사를 했던 결과에서 15%p 큰 증가세를 보이며 1년 사이에 클라우드 기반 기술과 플랫폼의 대규모 성장과 발전을 시사했다.

 

클라우드 기반 솔루션이 최신 공간 분석의 핵심이 될 것이라는 추세가 수년간 꾸준히 성장해왔다는 것을 강화한 결과이다.

 

또 모든 산업에서 60% 이상이 클라우드를 사용하고 있는 것으로 나타났다.

 

클라우드 기반 플랫폼의 채택 비율이 가장 높은 산업은 건강ㆍ의료(96%) 분야와 보험 산업(93%) 분야다.

 

이들 산업은 효과적이고 의미 있는 공간 분석을 수행하기 위해 상당량의 고품질 데이터에 접근해야 하므로, 클라우드 기반 솔루션을 채택한 것으로 보인다.

 

반면, 평균 이하로 나타난 산업은 부동산, 소비자 어플리케이션, 도시와 정부다.

 

이러한 조직들이 클라우드 네이티브 연결성이나 호환성을 지원하지 않는 소프트웨어를 사용하고 있거나, 특히 도시와 정부의 경우 데이터 거버넌스와 내부 데이터 준수에 대한 우려가 있을 수 있기 때문이다.

 

클라우드를 활용하는 가장 데이터 집약적인 사용 사례로는 보험 산업이 클라우드 데이터 웨어하우스의 주요 사용처로 대량의 데이터 분석을 요구하는 가격 모델 개발이나 정보 관리, 재해 모델링 등이 클라우드 기반 사용 사례 목록에서 상위를 차지했다.

 

또 물류 및 공급망 관리와 이동성 계획과 같은 사용 사례는 경로 최적화를 평가하는 데 계산 집약적인 프로세스를 필요하기에 클라우드의 힘을 활용하고 있었다.

 

반면, 토지 계획 및 사이트 선정과 같은 사용 사례는 조사 평균보다 낮은 비율을 보였는데 이러한 작업들이 일회성 성격을 가지기 때문에 클라우드 기반 인프라로의 전환을 위해 상당한 예산, 자원, 시간 투자가 필요하지 않을 수 있어서다.

 

<AI를 도입할 것인가 말 것인가, 그게 문제다>

Helen McKenzie는 “전 세계의 거의 모든 산업에서 AI에 대한 논의가 활발히 이루어지고 있는 상황을 고려할 때, AI가 공간 데이터 과학의 중심이 될 것이라고 예상했다”면서 “하지만 올해 설문조사에서 얻은 인사이트는 AI의 공간 분석 활용이 아직 불확실한 이동 목표로 다른 이야기를 보여주고 있다”며 분석한 결과를 설명했다.

 

조직들은 대체로 공개 또는 오픈 소스 AI 모델을 활용하고 있었다. 37%의 조직은 자사 독점 데이터와 함께 공개 모델을 사용한다고 응답했으며, 또 다른 35%는 공개 모델을 자사 요구에 맞게 조정해 사용한다고 밝혔다.

 

 

약 4분의 1은 완전히 새로운 AI 모델을 처음부터 만드는 것을 선택했는데 스포츠와 통신 산업(각각 71.4%)에서 가장 두드러졌으며, 소매와 도시 및 정부 산업(각각 27.3%)에서는 상대적으로 적은 관심을 보였다.

 

가장 놀라운 수치는 25%가 조금 넘는 조직이 공간 데이터 과학 이니셔티브에서 AI를 전혀 사용하지 않고 있었으며 그 중 통신 산업이 37.5%로 가장 높은 비율을 차지한 반면 건강 및 의료(4%)와 부동산(13.6%) 산업은 현재 AI에 대한 저항이 가장 적었다.

 

산업에 관계 없이 AI와 공간 데이터 과학의 융합은 여전히 진행 중이며, 이는 주요 AI 발전에 직면하여 빠르게 변화할 것으로 예상된다는 시각이 주류를 이뤘다.

 

“AI/ML 통합은 불완전한 데이터에서 더 빠르고 정밀한 예측과 통찰을 가능하게 하는 기능을 제공합니다.” - Skyway 선임 지리정보 엔지니어

 

또 31% 조직만이 AI 도구와 기술에 투자하고 있는 것으로 나타났다.

 

아직 투자를 하지 않은 조직 중 22%는 이러한 투자가 사업의 중기 계획의 일환으로 고려되고 있다고 답했으며, 또 다른 14.1%는 이를 장기 로드맵의 일부분으로 보고 있었다.

 

예상 외로 15.4%의 조직은 현재 AI에 대한 투자를 계획하지 않고 있다고 밝혔는데 AI가 공간 데이터 작업에서 어떤 역할을 할 수 있을지 결정하지 못해, 우선 사업 전략에 AI를 통합한 후 명확한 결정을 내리기 위한 과정에 있는 것으로 보인다.

 

17.4%의 조직은 아직 결정을 내리지 않은 상태였다. AI 도구와 기술을 어떻게 활용할 것인가에 대한 결정이 미뤄지고 있거나, AI 투자와 관련된 결정이 조직의 공간 데이터 과학 부서 외부에서 이루어지고 있기 때문이다.

 

 

AI 사용에 대해 가장 걱정되는 점으로는 데이터 보안과 개인정보 보호에 대해 가장 큰 우려를 나타냈다.

 

응답자 39.8%가 이 문제를 주요 우려 사항으로 꼽았으며, 뒤를 이어 17.8%가 자원과 지식 부족을 언급했다. AI 분야가 매일 빠르게 발전하고 성장함에 따라 불확실성이 존재하는 것은 예상되는 일이다.

 

또, “현재 공간 데이터 과학 커뮤니티의 가장 큰 도전 과제는 무엇이라고 생각하는가”에 대한 질문에 일부 응답자는 AI에 지나치게 의존할 경우 개인의 문제 해결 능력에 부정적인 영향을 미칠 수 있다는 우려를 표명했다. 

 


현재 AI를 공간 데이터 과학 작업에 사용하지 않는 조직의 응답을 살펴보면 상황은 다소 다르게 나타난다.

 

이들에게 가장 큰 장벽은 조직에서 AI의 명확한 사용 사례를 발견하지 못하고 있다는 것이다.

 

이러한 기업 정서가 장기적으로 유지될지는 아직 지켜봐야 하겠지만 AI가 모든 비즈니스 운영의 모든 측면에서 점점 더 널리 확장되면서 공간 데이터 작업에 AI를 사용하는 비즈니스 사례는 더욱 명확해질 가능성이 커 보인다고 설명했다.

 

또 공간 AI 전략을 구축하는 최선의 방법에 대한 응답에서 응답자 27%는 명확한 분석과 부가 가치의 식별이 중요하다고 답했다.

 

응답자들이 조직에서 AI 전략을 구축할 때 고려해야 할 몇 가지 주요 요소를 중요도 순위로 나열하면 ▲명확한 분석 및 부가 가치 식별 ▲데이터 수집 및 통합 ▲데이터 거버넌스 ▲적절한 AI 및 머신 러닝 도구 채택 ▲데이터 품질이다.

 

많은 조직이 여전히 공간 데이터 과학 작업에서 AI의 명확한 사용 사례를 보지 못하고 있다. 

 

 

따라서 AI 주도의 전략을 구축할 때 AI가 조직에 제공할 수 있는 부가가치를 명확히 설명하는 것이 이 목록에서 가장 중요한 요소로 작용할 가능성이 높다.

 

반면, ‘데이터 품질’과 ‘적절한 AI 및 머신 러닝 도구 채택’(공통 26.5%)은 AI 전략을 구축할 때 일관되게 가장 중요하지 않은 요소로 순위가 매겨졌다.

 

‘데이터 품질’이 낮은 순위로 평가된 것은 다소 예상 외라는 반응인데 대부분 고품질의 데이터가 모든 공간 AI 전략의 기본적인 핵심 요소라는 인식이 깔려 있기 때문으로 보인다.

 

하지만 적절한 도구와 기술 채택에 관한 것은 조직이 어떤 도구와 기술을 사용할지를 결정하기 전에 잘 정의된 AI 전략을 마련하는 것이 합리적이며 AI 전략은 조직의 필요를 안내하는 역할을 해야 한다고 강조한다.

 

<새로운 도전 과제, 전문인력 확보>

공간 데이터 과학 분야의 급속한 확장으로 인해 숙련된 전문가의 수요가 증가하고 있다. 공간 데이터 과학 분야의 빠른 진화로 인해 필요한 기술과 현재 제공이 가능한 기술 사이의 격차가 발생되고 있기 때문이다.

 

또 널리 교육되지 않은 특정된 전문 기술 세트를 필요로 하는데 데이터 과학과 지리 공간 분석 모두에 대한 전문성이 요구된다.

 

다양한 산업에는 고유한 공간 데이터 분석 요구가 있으며, 이는 채용 후보자가 도시 계획, 환경 모니터링 등 특정 사용 사례에 맞춘 기술을 갖추고 있어야 하는 것을 의미한다.

 

응답자들은 기술적 숙련도에 대해 데이터 조작 및 분석에 널리 사용되는 프로그래밍 언어인 Python, R, SQL에 대한 숙련도와 GIS 소프트웨어 및 관련 도구에 대한 지식을 중요하게 여기고 있었다.

 

데이터 관리에서도 대용량 데이터 세트를 처리하고 데이터 품질을 보장하며 다양한 데이터 소스를 통합하는 기술을 중요시하고 있었으며 여기에는 데이터 웨어하우스 및 클라우드 기반 솔루션에 대한 경험이 포함된다.

 

분석 기술 역시 공간 데이터를 해석하고 복잡한 분석을 수행하며 실행 가능한 인사이트를 생성하는 강력한 분석 능력이 필요하고 통계 분석 및 머신 러닝 기술의 전문성을 포함했다.

 

특히, 공간 데이터를 효과적으로 시각화하여 결과를 명확히 전달하는 능력이 중요한데 이는 공간 데이터에 특화된 시각화 도구 및 기술에 대한 지식을 의미한다.

 

아울러 주어진 독특한 공간 문제를 해결하고 데이터 기반 인사이트를 바탕으로 혁신적인 솔루션을 개발할 수 있는 강력한 문제 해결 능력도 수반되어야 한다고 봤다.

 

조직의 기술력 향상을 위해 기존 팀을 교육 프로그램과 워크숍을 통해 업스킬링을 하는데 투자하고 있었다.

 

교육 프로그램으로 공간 데이터 과학, GIS 및 관련 분야에 초점을 맞춘 학술 및 온라인 과정이 증가해 차세대 전문가를 양성하는 추세다.

 

또, 데이터 과학, 지리학, 도시 계획 등 학제간 다양한 분야의 전문 지식을 결합해 복잡한 공간 문제를 해결하는 것이 점점 더 보편화되고 있다.

 

앞서 제시한 것처럼 공간 데이터 과학이 데이터 과학 팀에서 주류로 자리 잡고 있지만, 고도로 숙련된 공간 데이터 과학자의 수는 같은 속도로 증가하지 않고 있다는 점이다. 

 

조직에서 공간 데이터 전문성의 필요성이 계속 증가하면서 적합한 인재를 찾고 채용하는 것이 더욱 어려워지는 상황이다.

 

데이터 과학 산업은 새로운 플랫폼, 도구, 기술의 등장으로 빠르게 진화하고 있으며, 오늘날의 변화하는 요구에 맞추기 위해 필요한 기술이 내일에 필요로 하는 기술과 다를 수가 있다. 

 

따라서 기술 향상이 인재 시장에서 경쟁력을 유지하는 열쇠로 보인다. 

 

공간 데이터 과학 산업에서 최고의 인재를 채용하는데 있어 대다수의 응답자들은 “다소 어렵다”에서 “매우 어렵다”는 의견을 보였다. 

 

여전히 큰 어려움을 주는 몇 가지 요인은 다음과 같다.

 

공간 전문성을 가진 데이터 과학자를 찾고 채용하는 것이 얼마나 어려운지 1에서 5까지의 척도로 순위를 매겼을 때, 5가 “매우 어렵다”를 나타내는데 응답자 69%가 4 이상의 점수를 주었다. 

 

 

이는 고도로 자격을 갖춘 경험 많은 공간 데이터 인재를 찾는 것이 어렵다는 산업 전반에 걸친 인식이다.

 

실제 2023년 이전의 조사와 비교했을 때, 이러한 어려움에 대한 인식은 무려 10%p 증가한 것으로 나타났다.

 

공간 데이터 과학이 데이터 과학 팀의 주류로 자리를 잡으면서 공간 데이터 전문성에 대한 수요가 계속 증가하고 있기 때문인데 공간 데이터 과학자의 공급이 수요를 따라가지 못하고 있다는 점이다.

 

또 상호 운용성에 있어 “풀스택” 및 “크로스 플랫폼”과 같은 기술이 많이 언급되었는데 데이터와 도구뿐만 아니라 이러한 데이터와 도구를 원활하게 다룰 수 있는 기술의 중요성이 강조되고 있다.

 

공간 데이터 과학자가 모든 분야의 전문가가 되어야 한다는 의미는 아니지만, 업계의 변화에 적응하고 민첩하게 대처할 수 있어야 한다는 것을 시사한다.

 

또 소프트 스킬인 “의사소통”, “대인 관계 기술”, “리더십”과 같은 단어가 부각됐는데 공간 데이터 과학 분야가 틈새에서 주류 분야로 진화하고 있다는 명확한 신호로 보여진다.

 

데이터 과학 팀은 과거처럼 고립되어 있지 않으며 그 결과 데이터 과학 팀이 공동의 목표와 목적에 대해 협력하고 소통하는 것이 점점 더 중요해지고 있다는 것을 의미하는 것으로 데이터 기반 통찰의 가치를 고위 리더들에게 명확히 전달해 비즈니스 전략과 의사 결정에 영향을 미치기 때문이다.

 

특히 인공지능에 관한 전문성을 빼놓을 수 없는데 “데이터 과학”, “프로그래밍”, “머신 러닝”, “AI”와 같은 기술이 목록에 포함됐다.

 

오늘날 모든 사람들이 AI에 대해 이야기 하고 있으며 많은 조직이 여전히 AI 도입이 느리더라도 AI 관련 기술은 미래를 준비하는 방법으로 반드시 고려해야 할 사항이라고 여기고 있다.

 

<결론>

이 보고서는 지난 10년간 가장 중요한 공간 데이터 과학 발전은 무엇인가에 대한 질문에 응답자들은 공간 데이터 과학의 세계는 지난 몇 년 동안 부인할 수 없이 크게 발전했다는 것이다. 

 

많은 응답자들은 방대한 데이터 크기를 더 효율적으로 처리할 수 있는 능력을 빠르게 언급했으며 클라우드 인프라와 클라우드 기반 컴퓨팅의 주요 발전 없이는 불가능했다고 강조했다.

 

또, 지리 공간 커뮤니티의 지속적인 성장과 특히 오픈 소스 커뮤니티의 발전, GIS가 조직 내 주류 데이터 과학 팀에 더 깊이 통합되는 현상도 언급됐다.

 

이 모든 것을 고려할 때, 앞으로 10년이 어떤 변화를 가져올지 궁금해지는데 설문에 응답한 응답자들은 다음과 같이 말하고 있다.

 

“공간 데이터 과학은 다학제적 분야로 발전하였으며, 특히 머신 러닝, 딥 러닝, 공간 통계와 같은 AI 기술의 적용이 그 배경에 있습니다.” - 도시 및 정부 파트너사 관계자

 

“클라우드 컴퓨팅과 인프라, 그리고 온라인에서 배울 수 있는 훌륭한 자원에 대한 접근이 중요합니다.” - Meteo Tech CEO

 

“자연어를 통해 맵과 상호작용할 수 있는 능력은 매우 중요합니다.” -Choreograph(마케팅 및 소프트웨어 기업) 수석 데이터 과학자

 

“[테라바이트 단위의] 정보를 매일 처리하고 거의 실시간으로 사용할 수 있도록 하는 능력이 중요합니다.” - Geocrafter(도시 및 정부) 지리 공간 개발자 

 

“특히 OSGEO와 같은 오픈 소스 커뮤니티의 성장과 QGIS, Openlayers와 같은 자금 지원 프로젝트가 중요합니다.” - Geolytix(컨설팅) 엔지니어, 

 

그렇다면 현재 공간 데이터 과학 분야가 직면한 가장 큰 도전 과제에 대해서는 일반적으로 응답자들은 데이터 거버넌스와 프라이버시, 데이터, 도구 및 플랫폼의 표준화와 상호 운용성, 데이터 크기와 품질에 대한 지속적인 우려, AI의 역할에 대한 불확실성, 인재 부족 문제와 관련된 주요 주제들을 강조했다.

 

여기서 가장 중요한 점은 서로 다른 산업이 공간 데이터 과학 분야에서 서로 다른 도전 과제에 직면하고 있다는 것이다.

 

이 분야가 더 이상 일률적으로 적용되지 않고 있다는 것을 시사하는 것으로 다양화와 주류화가 진행됨에 따라 공간 분석의 지속적인 발전과 함께 불가피하게 발생하는 새로운 도전 과제라는 것이다.

 

“기초 데이터나 가정이 잘못된 경우에도 사람들이 AI 모델을 신뢰하는 것이 문제입니다.” - Home Starter(부동산) CTO 

 

“현재 공간 데이터 과학 커뮤니티가 직면한 가장 큰 도전 과제는 데이터 프라이버시, 보안 및 윤리적 사용을 보장하면서 증가하는 공간 데이터의 양, 다양성 및 속도를 효과적으로 관리하고 분석하는 것입니다.” - 익명 (통신)

 

“공공 건강 맥락에서의 시공간 데이터의 복잡성 및 기타 데이터 문제입니다.” - Foster + Partners(도시 및 정부) 파트너 

 

“국가 안전, 프라이버시 법, 지적 재산권과 관련된 지리 공간 데이터의 수집, 사용 및 배포를 규제하는 규정이 자주 잘못 해석되거나 지나치게 광범위합니다.” - Skyway(소프트웨어 및 기술) 수석 소프트웨어 엔지니어, 

 

Helen McKenzie는 “공간 데이터 과학의 영향력이 계속 커지면서 공간 데이터의 미래는 밝지만 고유한 도전 과제가 남아 있다”고 말한다. 

 

그녀는 “올해의 조사 결과가 과거와 비교해 현재 공간 데이터 과학의 상태에 대한 완전히 다른 그림이 그려졌다”면서 “이전에는 조직에서 다소 일률적이고 틈새적인 관행이었던 것이 이제는 비즈니스 전략을 촉진하고 더 스마트한 결정을 내리는 데 사용되는 매우 다양하고 잘 통합된 데이터 과학 분야로 변화했다”고 말했다.

 

이번 설문조사에서 가장 두드러진 주요 화두는 ▲전반적인 다양성 증가 ▲다학제적 접근 ▲상호 운용성의 필요성 증가 ▲복잡한 글로벌 문제 해결 ▲대규모 데이터 분석 ▲인재 부족 등이다.

 

공간 데이터 과학은 해당 응용 분야뿐만 아니라 오늘날 실제로 공간 데이터 작업을 수행하는 사람들의 범위에서도 그 핵심을 넘어 확장되고 있는 추세이고 일률적으로 적용되는 방식이 아닌 모든 산업과 분야에 걸쳐 다양한 응용 프로그램과 사용 사례를 통해 확장되고 있다.

 

또 공간 데이터 과학 환경은 많은 플랫폼, 도구 및 기술로 구성되어 있으며 반드시 같은 언어로 소통하지 않는다는 것과 업역의 경계 보다 효율성이 강조되고 혁신을 가속화 하기 위한 데이터, 도구, 솔루션 및 플랫폼 간의 상호 운용성에 무게가 실리고 있다.

 

특히 글로벌 개선과제인 환경, 기후변화 등 인간의 삶과 직결된 지속 가능하도록 관련 문제의 핵심 해결도구로 중요성이 확장되고 있으며 과거와 달리 빅데이터의 분석과 더 빠른 통찰력을 제공할 수 있는 확장된 접근성이 주요 화두가 되고 있다.

 

아울러, 인재 부족은 오늘날 산업이 직면한 가장 시급한 도전 과제 중 하나로 남아 공간 데이터 전문성의 필요성이 증가하고 있지만, 숙련된 공간 데이터 과학 인재를 찾아 채용하며, 고용하는 것은 점점 더 어려워지고 있다.

 

※ 이 기사의 보고서 자료 내용과 이미지에 대한 저작권은 CARTO에 있습니다.


※공간 데이터 과학 현황 2024(The State of Spatial Data Science 2024) 보고서 다운로드

 

*기사 좌표값 : 위도 40.4168° N / 경도 -3.7038° W

  • 도배방지 이미지

광고
인물 포커스
메인사진
노도영 작가와의 만남, ‘그대는 무엇이 되고 싶은가’
1/2
광고
광고
광고
광고