로고

GeoAI, 지식 인프라 견인…공간정보의 보편성 확대

[인터뷰] 이화여자대학교 사회과교육과 강영옥 교수

김영도 기자 | 기사입력 2024/08/09 [15:37]

GeoAI, 지식 인프라 견인…공간정보의 보편성 확대

[인터뷰] 이화여자대학교 사회과교육과 강영옥 교수

김영도 기자 | 입력 : 2024/08/09 [15:37]

(커넥트 데일리=김영도 기자) 국내 GIS 전문가이자 GeoAI 연구 분야를 견인하고 있는 이화여자대학교 강영옥 교수와 일문일답을 통해 국내외 인공지능 기술의 변천사와 국내 공간정보 분야에서 GeoAI 기술의 활용성 및 방향성을 조망해 보고 진단한다(편집자 註). 

 

Q. 최근 ChatGPT를 필두로 인공지능에 대한 관심이 산업계 전반에 뜨겁게 나타나고 있습니다. 이러한 현상에 대한 배경이 궁금합니다. 교수님의 고견을 말씀해주시면 고맙겠습니다.

 


이지(Easy)한 공간정보로


▲ 이화여자대학교 사회과교육과 / 빅데이터 분석학 협동과정 강영옥 교수

 

강영옥 교수 : 21세기 인공지능이 급속하게 발전하게 된 계기에 대해 한 학자는 세 가지 요인으로 설명했습니다. 첫째는 다양한 센서와 사용자들이 생성해내는 대용량의 빅데이터, 두 번째는 인공지능 분야에서 통계학, 경제학, 생물학, 인지과학 등 주변 학문의 여러 가지 아이디어를 차용하면서 새로운 알고리즘과 모델을 개발한 것, 셋째는 빅데이터와 새로운 모델을 연계하여 분석할 수 있는 높은 성능의 컴퓨팅 하드웨어의 발전이라고 언급했습니다.

 

데이터 관점에서 보면 21세기 들어 우리가 접하지 못한 다양한 유형의 데이터들이 빠른 속도로 생성되고 수집이 가능해질 정도로 기술이 발전하고 있는 것을 볼 수 있습니다.

 

공간정보 분야는 기존의 항공사진, 국토위성 영상 뿐만 아니라 드론, CCTV영상, 위치정보를 얻을 수 있는 GPS기능을 갖춘 버스, 택시 등 이동체 정보를 인식할 수 있는 일상생활의 스마트폰과 인터넷 플랫폼을 통해 생산되고 있는 SNS데이타, IOT센서에서 지속적으로 수집되는 데이터 등 이전에는 상상하지 못할 정도의 많은 데이터들이 만들어지고 있습니다.

 

이들 데이터는 숫자, 텍스트, 이미지 등 다양한 형태로 나타나고 있으며 그 양도 기하급수적으로 증가하고 있습니다.

 

새로운 알고리즘이라는 관점에서 보면 데이터의 처리라고 볼 수 있는데 다양한 형태의 데이터를 효율적으로 처리할 수 있는 인공지능 알고리즘으로 발전되었다는 것입니다. 

 

기존에 데이터 처리라고 하면 통계나 수학 분야에서 오랫동안 해왔었던 영역으로 데이터를 가지고 다양한 연산을 통해 의미를 만들어내는 영역인데 기존에는 주로 숫자로 만들어진 데이터를 이용한 연산이었습니다.

 

텍스트 데이터나 이미지 데이터로 데이터를 분석할 수 있는 영역이 아니었는데 인공지능 분야에서 CNN(Convolutional Neural Network, 합성곱신경망)이라는 딥러닝 기술이 개발되면서 본격적으로 인공지능 기술이 비약적으로 발전하는 계기를 맞이하게 됩니다.

 

CNN(Convolutional Neural Network, 합성곱신경망)이라는 딥러닝 기술은 고양이의 시각 피질에서 발견된 세포의 반응에서 영감을 얻어 낸 것인데, 고양이는 사물을 볼 때 사람처럼 전체 이미지를 한꺼번에 보는 것이 아니라 특정 영역을 하이라이트 해서 본다는 것에 착안해 이미지 데이터 처리를 위한 인공신경망을 개발했습니다. 

 

합성곱신경망은 사진, 영상 등 이미지 데이터를 처리하는데 획기적인 성능을 보였으며 이미지를 분류하고, 객체 검출, 이미지를 특정 이미지 영역으로 분할 하는 등으로 기술 발전을 거듭하고 있습니다. 

 

특히 이러한 인공지능 기술의 성능이 사람의 능력을 뛰어넘는다는 것인데 사람들이 물체를 봤을 때 100% 정확도를 갖는 것이 아니라 휴먼 에러율이 약 4~5% 정도로 컴퓨터는 사람보다 물체를 더 잘 판단해 에러율이 사람보다 더 낮아지기 시작합니다. 

 

이때가 한참 알파고와 이세돌의 바둑 경기에서 알파고가 이기면서 사람들의 관심을 받던 시기로 인공지능에 대한 관심을 불러 일으켰지만 특정 분야나 전문가 영역으로만 여겨왔습니다.

 

인공지능이 일반인들의 일상생활에 본격적인 영향을 주는 전환점을 맞이하게 된 것은 open AI에서 2022년에 공개한 ChatGPT라 할 수 있습니다. 

 

ChatGPT가 나오면서 자연어로 대화, 번역, 자동응답, 자료 검색 등에서 엄청난 성능을 보이면서 인공지능을 필수 불가결한 요소로 받아들이는 모습입니다.

 

사실 ChatGPT의 근간이 되는 인공신경망은 구글에서 2017년에 공개한 ‘Attention Is All You Need’라는 논문이고 이는 트랜스포머 계열 논문의 시발점이 됩니다. 

 

텍스트 분석 영역에서는 이전에는 단어를 분절하고 벡터로 만들어서 분석하는 방법이 주를 이루다가 시계열 모델을 응용하면서 발전하게 되는데 이 시계열 모델에서 더 발전된 형태가 트랜스포머 계열이라고 할 수 있습니다. 

 

트랜스포머 계열 모델이 아주 높은 성능을 보이면서 특정 분야를 기준으로 학습을 하는 것이 아니라 인터넷 자료 등 방대한 양을 학습하고, 모델의 학습 파라미터도 수천억 개에 달하는 소위 라지랭기지모델(Large Language Model, LLM)이 개발되고, 이 LLM에 사용자의 질문에 응답하도록 한 것의 사례가 open AI사의 ChatGPT입니다.

 

즉 알고리즘이라는 관점에서 보면 학문적으로는 수학, 통계학, 생물학, 뇌과학, 컴퓨팅 분야의 지식이 융합되면서 다양한 영역의 자료를 빠르고 효율적으로 처리할 수 있는 알고리즘들이 급속하게 발전한 것입니다. 

 

마지막으로 세 번째는 컴퓨팅 하드웨어의 발전입니다. GPU(Graphics Processing Unit : 그래픽처리장치)를 갖춘 컴퓨터 처리능력의 발전은 방대한 양의 데이터를 병렬로 처리하면서 빠른 연산을 가능하게 했습니다. 

 

21세기 인공지능 기술의 발전은 방대한 양의 데이터, 알고리즘의 발전, 컴퓨팅 하드웨어의 발전이 시너지를 이루면서 폭발적으로 성장하였다고 볼 수 있는데 특히 여기에 한 가지 요소를 추가한다면 자연어로 인공지능 기술을 쉽게 이용할 수 있는 형태로 발전하면서 더욱 폭발적인 성장을 가져온 것으로 생각됩니다. ChatGPT처럼 말이죠.

 

Q. 이를 반영하듯 최근 전 세계적으로 GeoAI에 대한 관심과 참여가 커지는 모습인데 GeoA에 대해서 정의해주시고 GeoAI의 최근 기술 동향에 대해서도 말씀 부탁드립니다.

 


보편화 되는 공간정보 세상


▲ 이화여자대학교 사회과교육과 / 빅데이터 분석학 협동과정 강영옥 교수


강영옥 교수 :
GeoAI는 지리학, 또는 공간정보 학문영역과 인공지능 영역이 융합된 다학제 분야라고 할 수 있습니다. 

 

미국에서 2017년 Association for Computing Machinery(ACM) International Conference on Advances in Geographic Information System (SIGSPATIAL)에서 처음으로 GeoAI 워크샵이 개최되고, 이미지처리, 교통, 공중보건, 디지털 인문학 등에 GeoAI를 접목하는 연구가 발표되면서 이제는 하나의 영역으로 자리 잡아 가고 있습니다. 

 

GeoAI의 발전은 크게 두 개의 축으로 구분해서 볼 수 있을 것 같습니다. 

 

먼저, 하나는 기존의 공간정보를 분석하는 영역에서 공간정보 분석기능이 AI기술을 탑재해 정말 똑똑해지는 것이죠. 

 

공간정보 영역에서 다루는 데이터의 유형과 데이터 분석 방법도 다양합니다. 인공지능 분야에서 발전되는 다양한 유형의 딥러닝 모델들이 공간정보 영역에 접목되고 있습니다. 

 

예를 들면, 이미지처리 분야의 합성곱신경망 모델, 공간정보의 속성데이터로 처리되는 영역에는 머신러닝과 딥러닝 모델들, 위치기반의 텍스트를 처리하는 분야에는 자연어 처리를 위한 딥러닝모델, 시계열 데이타의 예측을 위해서는 RNN(Recurrent Neural Network) 및 트랜스포머 모델들, 그리고 객체의 특성과 관계를 분석할 수 있는 그래프신경망 모델들이 융합되고 있습니다. 

 

최근에는 알고리즘이 빠르게 발전하기 때문에 회귀나 분류라 하더라도 여러 유형의 모델들이 있어서 사용자가 개별적으로 모델을 테스트하고 성능평가를 하는 것이 아니라 컴퓨터가 알아서 자동으로 관련 모델을 모두 테스트하고 성능 평가를 거친 후 최적화 된 모델을 찾아주는 AutoML(Automated Machine Learning), AutoDL(Automated Deep Learning)분야도 빠르게 발전하고 있습니다. 

 

또 하나의 데이터에 한 가지 유형의 자료만 있는 것이 아니라 여러 유형의 자료가 함께 있기 때문에 이를 유기적으로 연계해서 분석하는 멀티모달(Multimodal) 데이터 분석도 빠르게 발전하는 추세입니다. 

 

예를 들어, 위치기반 SNS데이타의 분석은 관광이나 재난 분야에서 매우 중요한 자료원으로 활용되는데 SNS데이타에는 텍스트, 이미지, 동영상, 위치정보 등이 모두 포함되기 때문에 자료 유형별로 다른 모델을 사용한 후 결과를 결합하는 것이 아니라 멀티모달로 데이터를 분석할 수 있습니다.

 

공간정보 영역에서 관심이 많은 항공사진이나 위성영상, 드론 영상 처리 관점에서 보면 건물외곽선 추출, 도로추출, 특정 객체 추출이나 변화탐지 등 특정 목적에 맞도록 딥러닝 모델을 훈련시킨 사전에 훈련된 모델(pretrained models)들도 증가하고 있는 추세입니다.

 

또 다른 추세는 자연어 기반으로 공간정보를 처리할 수 있도록 하는 분야의 발전이라 할 수 있습니다. 

 

우리가 ChatGPT를 이용해서 인공지능의 복잡한 내용을 몰라도 자연어로 인공지능의 다양한 기능들을 쉽게 사용할 수 있는 것처럼 LLM과 공간정보분석을 연계해 자연어로 공간정보분석을 수행하도록 하는 분야입니다. 

 

이 분야는 LLM이 빠르게 성장하면서 최근에 관심이 폭증하고 있는 분야라 할 수 있습니다. 어떤 학자는 이를 ‘GeoLLM’이라고 하기도 하고, ESRI에서는 이를 GeoAI Assitant라고 명명하고 있습니다. 

 

이 분야는 공간정보가 특정 분야 전문가들만 사용하는 것이 아니라 공간정보의 기능을 모르는 일반인도 쉽게 접근할 수 있도록 하여 공간정보 활용을 보편화 하는데 큰 기여를 할 수 있을 것으로 기대되는 분야입니다. 

 

Q. 이와 관련해 GeoAI 발전을 위해 정부 차원에서 정책이나 실무적인 법적 근간을 마련하고 지원해야 한다는 목소리와 정확한 데이터 구축이라는 일각의 의견이 제기되고 있는데 이를 어떻게 바라보고 계시는지 교수님의 고견 부탁드립니다.

 


데이터 구축 보다 명확한 목표와 분석이 우선되어야


▲ 이화여자대학교 사회과교육과 / 빅데이터 분석학 협동과정 강영옥 교수


강영옥 교수 :
인공지능 모델들이 좋은 성능을 보이기 위해 잘 라벨링된 데이터, 혹은 잘 구축된 데이타는 매우 중요합니다. 그렇다고 GeoAI발전을 위해 정확한 데이터를 구축하겠다는 것은 매우 주의가 필요한 접근 방식이라고 생각됩니다. 

 

잘 아시는 것처럼 몇 년전에 한국지능정보사회진흥원(NIA)에서는 인공지능 훈련데이타 셋 구축사업을 대대적으로 진행하면서, 각 분야의 다양한 데이터를 라벨링하고 데이터로 구축하는 사업을 진행했습니다. 물론 효과를 보인 영역도 있지만 활용도가 낮다는 비판도 많이 들었습니다. 

 

어떤 목적에, 어떻게 활용될지, 모델에 입력하였을 때 보완되어야 할 사항이 무엇인지 모르는 상태에서 라벨링하는 것이 제대로 활용될 수 없다는 것이 주된 비판이었습니다. 공간정보 영역도 마찬가지입니다. 

 

어떤 목적에 어떤 용도로 활용될지를 생각하지 않고 정확한 데이터를 구축하겠다는 것은 어떤 서비스도 타게팅하지 못한다는 얘기가 될 수 있습니다. 

 

과거부터, 우리나라 공간정보산업은 데이터의 활용이나 서비스라는 관점보다는 정확하고, 정밀하고, 최신성 있는 데이터 구축에 많은 노력을 기울여왔습니다. 최근에 집중되고 있는 디지털트윈 사업도 데이터 구축에 많은 초점을 두고 있는 것과 유사하다고 볼 수 있습니다.

 

GeoAI는 AI기술과 융합해 공간정보 분야의 다양한 데이터를 의미 있게 분석할 수 있는 분야에 시너지를 낼 수 있는 영역입니다. 

 

어떤 문제를 해결하고 싶은지를 분명하게 타게팅하고 해당 목표 달성을 위해 우리가 기존에 가지고 있는 데이터와 AI기술을 접목해 성능을 평가하고, 서비스 활용 가능성을 검토하는 과정이 필요하다고 생각됩니다. 

 

이러한 과정은 실제 필요한 서비스가 무엇인지를 고민하고, 그 서비스에 어떤 AI기술이 접목될 수 있을지, 접목된 기술이 수요기관에서 요구하는 성능을 달성할 수 있는지를 검토하는 과정이 수반되어야 합니다. 

 

이러한 검토를 바탕으로 개선점이 다양하게 도출될 수 있고, 그 가운데 하나의 요소로 추가적인 데이터의 구축이나 표준화 문제를 고려할 수 있는 것이라고 생각합니다. 

 

사실 국내 공간정보산업에서 AI기술을 제대로 적용해보지도 못하고 있는 영역들이 많은데, 이러한 상황은 고려하지 않고, 정확한 데이터 구축만을 고려한다는 것은 올바른 전략이라 하기 어렵습니다. 

 

Q. 인공지능의 출현으로 일자리가 뺏길 것이라는 우려가 앞서는 부분이 있는데 인공지능은 공간정보의 위기일지 아니면 기회일지 궁금합니다. 이에 대한 교수님의 고견을 부탁드립니다. 

 


이끌거나 따르거나 비키거나


▲ 이화여자대학교 사회과교육과 / 빅데이터 분석학 협동과정 강영옥 교수


강영옥 교수 : 우리나라에서 공간정보영역은 데이터 구축이 주를 이루었습니다. 정확하고 정밀하고, 현시성 있는 데이터 구축을 위해 많은 노력과 예산을 투입한 반면 이를 활용한 업무개선, 서비스 등은 일정 부분 성과도 있지만 데이터 구축에 비해 미약한 것이 사실입니다. 

 

저는 개인적으로 공간정보영역에 인공지능을 접목하는 GeoAI의 성장은 우리나라 공간정보가 한 단계 업그레이드 할 수 있는 기회를 만들지 않을까 생각합니다. 

 

한 단계 업그레이드는 두 가지 측면을 얘기합니다. 

 

하나는 다양한 영역에서 이전보다 더 똑똑하게 분석하고, 예측하면서 다양한 문제 해결에 도움을 줄 수 있는 방향으로 발전할 수 있다는 것이고, 두 번째는 이러한 기술들이 공간정보분야 전문가만 사용하는 것이 아니라 일반인들도 쉽게 활용할 수 있도록 발전 가능하다는 것입니다. 

 

즉 공간정보를 보편적으로 활용할 수 있도록 한다는 것은 공간정보 발전과 활용 확대에 큰 도움이 될 것이라고 생각합니다. 다만 이러한 변화를 준비하지 않고 끌려간다면 위기이고, 적극적으로 대처하고 한 발 앞서 나간다면 기회가 될 수 있을 것이라고 생각합니다.

 

Q. 교수님께서 오는 8월 30일 국토지리정보원에서 개최되는 인공지능과 관련한 기술 세미나에서 기조 강연을 맡게 되셨는데, 어떤 내용이 발표될지 귀추가 주목됩니다. 발표 내용에 대한 간략한 소개의 말씀을 부탁드려 봅니다.

 


GeoAI 최신동향 강연 예정


강영옥 교수 : 발표는 30분 정도 진행될 예정인데요. AI가 공간정보영역에 어떤 시너지를 낼 수 있을지 AI기술에 대한 개요와 공간정보의 다양한 영역에서 AI기술이 접목되어 활용되는 사례들을 소개하려고 합니다. 

 

이 분야의 최근 발전 동향을 GeoAI 분석기술과 자연어 기반 공간정보 분석 분야로 나눠 소개하는데 공간정보 분야에 접목되는 AI기술과 GeoAI의 발전동향, 그리고 자연어로 처리하는 공간정보 분석 발전 동향까지 최근 동향을 살펴보고, 미래 공간정보 분야의 발전전략을 구상하는 기회를 제공할 계획입니다.

  • 도배방지 이미지

  • 숨산 2024/08/19 [16:44] 수정 | 삭제
  • 세미나 신청을 했는데, 교수님의 고견이 기대됩니다. 감사합니다.
광고
인물 포커스
메인사진
GeoAI, 지식 인프라 견인…공간정보의 보편성 확대
1/5
광고
광고