(커넥트 데일리=사공호상 교수ㆍ전 국토지리정보원 원장) 인공지능(AI)이 대세다. AI 기술의 원리는 잘 몰라도 모든 분야에 인공지능이 도입되고, 이로 인한 영향이 급격히 커지고 있음을 체감하고 있다.
나도 모르는 사이에 AI기술이 탑재된 자동차를 타고 AI로봇이 만드는 커피를 마시며 쳇GPT로 리포트를 작성하고 있다. 쳇GPT의 파라미터 수가 조단위를 넘어서고 시각과 청각 기능을 통합·구현하는 등 AI의 발전 속도는 현기증이 날 정도로 빠르다.
미래학자이자 과학자인 레이 커즈와일은 2045년에 인공지능이 인간의 지능을 초월하는 ‘특이점(singularity)’에 도달할 것으로 예견하였다. 이런 상황에서 공간정보 분야는 무엇을 어떻게 할 것인지 곰곰이 생각해 봐야 한다.
인공지능은 1957년 프랭크 로젠블레트(Frank Rosenblatt)가 인간의 신경망을 모방한 퍼셉트론(perceptron) 신경망을 만들면서 시작되었다. 퍼셉트론은 입력값(신호)과 가중치를 통해 합산(세포체)한 신호가 활성화 함수(축삭돌기)를 거쳐 출력(시냅스)으로 변환되는데, 뉴런이 신호를 받고 처리해서 내보내는 과정과 매우 유사한 구조다.
발전과 침체를 거듭하던 인공지능 기술은 2016년 딥러닝으로 학습한 ‘알파고’가 이세돌 9단을 이기며 대중의 관심을 받기 시작했다. 그리고 2020년 마침내 딥러닝과 인공신경망을 장착한 대규모 언어모델 쳇GPT-3가 출시되어 세상을 놀라게 했다.
이후 쳇GPT는 매개변수를 급격히 늘리면서 더욱 정교하고 정확해져 우리의 일상생활과 산업 환경에 깊이 스며들고 있다.
AI가 산업과 비즈니스의 생산성과 효율성에 미치는 영향이 점점 커지자, 정부는 관련 정책을 마련하고 기업은 기술도입에 분주하다.
딥러닝의 기본원리는 같아도 활용 분야별로 데이터와 알고리즘, 학습 방법 등이 달라서 산업별로 수준 차이가 있다.
공간정보 분야의 AI기술은 위성영상이나 항공사진 등 이미지 부문은 매우 발전된 수준이지만 공간분석이나 예측, 3차원 공간인지 등은 이제 시작 단계다. 공간정보 인공지능(GeoAI)의 발전 촉진하기 위해 지나온 발전 과정과 향후 대응 방안을 모색해 보고자 한다.
1990년대는 기계학습과 패턴인식 분야가 활발히 연구되었다. 특히 편지 봉투에 적힌 우편번호 숫자를 인식하는 것이 중요한 과제 중의 하나였다. 그러나 당시는 이미지 인식을 위한 AI모델을 개발하는 데 사용할 정제된 데이터셋이 부족한 상황이었다. 이때 미국의 표준기술연구소가 손으로 쓴 숫자 이미지 데이터셋 ‘MNIST(Modified National Institute of Standards and Technology)’을 1989년에 공개하였다.
이 데이터셋은 0부터 9까지 손으로 쓴 숫자로, 총 7만 개의 이미지로 구성되어 있고, 각 이미지 크기는 28x28 픽셀이다. 6만 개는 학습용이고 1만 개는 테스트용으로 사용되었다. 이 데이터셋은 공간적 패턴을 인식하고 학습하는 AI모델을 개발하고 평가하는 데 활용되어 합성곱신경망(CNN)과 같은 공간특성을 처리하는 신경망의 발전을 촉진하였다. MNIST 데이터셋은 표준 벤치마크, 교육자료, 새로운 알고리즘 개발의 촉매제로써 공간정보 인공지능의 발전에 크게 기여했다.
2000년 이후부터 객체인식, 이미지 분할 및 생성 등과 같은 컴퓨터 비전 연구가 시작되었다. 이때도 데이터셋의 규모가 작아서 모델의 능력과 실세계 성능향상이 제한적이었다. 이러한 문제를 해결하기 위해 스탠퍼드 대학교 페이페이 리(Fei-Fei Li) 연구팀이 ‘ImageNet’ 이라는 대규모 데이터셋을 2009년에 만들었다.
이들은 크라우드 소싱 플랫폼을 이용하여 다양한 이미지를 수집하고 여기에 레이블을 부여하고 검증하여 1,000개 이상의 카테고리와 약 1,400만 개의 이미지를 만들었다. 이 ImageNet은 컴퓨터 비전과 딥러닝의 발전에 결정적인 역할을 했다. 대규모 데이터셋을 통해 모델의 일반화 능력을 향상시키고, 더 나은 객체인식 알고리즘을 개발할 수 있게 되었다.
ImageNet 데이터셋을 구축한 다음 2010년부터 페이페이 리 교수는 매년 ‘ImageNet 챌린지’를 개최했다. 이 대회는 ImageNet 데이터셋을 사용하여 이미지 분류, 객체 검출, 이미지 분할 등과 같은 알고리즘을 개발하고 성능을 평가하는 경연장이다.
수많은 대학의 연구팀이 경연대회에 참가하였고, 2011년까지 챌린지 우승팀의 정확도는 75% 수준이었다. 그러나 2012년 딥러닝으로 학습한 AlexNet이 정확도를 획기적으로 개선하면서 본격적인 딥러닝 시대를 열었다. 그리고 마침내 2015년 우승팀이 에러율 3.75%를 기록하며 인간의 능력한계 5.1%를 넘어서게 되었다.
이상과 같은 GeoAI 발전 과정을 볼 때 표준화된 대규모 데이터셋이 얼마나 중요한지 알 수 있다. MNIST와 ImageNet 데이터셋은 공간정보 GeoAI 발전사의 이정표이자 전환점이었다. 또한 협업을 통해서 데이터셋을 만들고 이를 개방함으로써 기술 발전을 촉진한 것은 매우 중요한 교훈이 아닐 수 없다.
최근 국토지리정보원을 중심으로 ‘국토변화 탐지 인공지능 기술 민관협의체’를 구성하고 GeoAI 기술개발과 데이터셋의 표준을 논의하기 시작한 것은 매우 고무적이다. 산학연관이 협력하여 인공지능 기술개발과 성능 검증을 위한 표준화된 고품질 데이터셋이 구축되어 공유되는 날이 빨리 오기를 기대한다.
사공호상(司空昊相) 대학에서 토목공학, 대학원에서 도시계획(석사)과 도시공학(박사)을 공부했다.
국토연구원에서 30여 년간 위성원격탐사와 GIS, 공간정보 정책을 연구하면서 GIS연구센터장, 글로벌개발협력센터 소장, 공간정보연구본부장 등을 역임했다. 2019년부터 3년간 국토교통부 국토지리정보원 원장으로 재임하면서 ‘디지털트윈(Digital Twin) 국토’의 기반을 다졌다. 국가공간정보위원회ㆍ국가지명위원회ㆍ중앙지적위원회 위원과 한국지리정보학회 회장을 역임하고 현재, 대구대학교 부동산지적학과 초빙교수로 재직하고 있다. 주요 연구보고서로 ‘초연결 시대에 대응한 공간정보 정책 방향 연구(2016)’, ‘지능정보사회에 대응한 차세대 국가공간정보 전략연구(2017)’ 등이 있으며 저서로 국내 공간정보 정책의 역사를 집대성한 ‘한국의 공간정보 정책(회고와 전망)’을 2023년 3월 발행했다. <저작권자 ⓒ 커넥트 데일리 무단전재 및 재배포 금지>
댓글
공간정보, 인공지능, AI, GeoAI, 생성형 인공지능, 파라미터, 변수, 인공신경망, ChatGPT, 딥러닝, 학습교육, 위성영상, 항공사진, 이미지 분석, 공간분석, 예측 가능한, 3차원 공간인지, 데이터셋, 표준화, 규격화 관련기사목록
|
인기기사
시대공감 많이 본 기사
|