델코지식정보

[지식정보] 인공지능 기술 동향

관리자
[회원가입 하시면 원문 PDF파일 다운로드가 가능합니다.]

시장조사기관인 스태티스타는 2018년 인공지능 시장규모가 74억 달러에서 2025900억 달러 규모로 성장을 전망하고 있다. 인공지능 기술은 현재 미국이 선도하고 있다. 하지만 중국은 세계 최초로 고교 과목에 인공지능을 채택하고 있어 미래 성장 잠재력이 크다. 지금도 미국 다음의 약진을 하고 있다. 독일과 일본 등은 인공지능 핵심기술 개발과 플랫폼을 만들고 있어 선점을 위한 국가경쟁이 확대되고 있다. 음성인식, 시각인식, 언어처리 등 인공지능 활용 기술들을 모바일 기기, 가전, 자동차 등 다양한 분야에 접목하고 있다. 플랫폼 개발과 이를 기반으로 한 인공지능 생태계 구축이 더욱 필수적이 되고 있다. 미국의 정보 기술 연구 및 자문 회사인 Gartner에서 발표한 Hype Cycle을 바탕으로, 현재 인공지능 기술의 동향과 새롭게 태동하는 분야를 살펴보고자 한다. 이 자료는 정보통신기획평가원과 인공지능 신문의 자료를 요약 정리하였다.

 

자료: 정보통신기획평가원, 주간기술동향, 1031, 2020.01.29.

인공지능신문 http://www.aitimes.kr/news/articleView.html?idxno=14859

Gartner, “Understanding Gartner’s Hype Cycles,” 2018. 8. 20.

Forbes, “What’s New In Gartner’s Hype Cycle For AI, 2019,” 2019. 9. 25.

블로그, “DML(Decentralized Machine Learning) ICO 분석해보자”, 2018. 3. 26.

블로그, “Federated Learning: Collaborative Machine Learning without Centralized Training Data,” 2017. 4. 6.

Konečný, Jakub, et al. “Federated learning: Strategies for improving communication efficiency,” arXiv preprint arXiv:1610.05492, 2016.

Goetz, Jack, et al. “Active Federated Learning.” arXiv preprint arXiv:1909.12641, 2019.

금융보안원, “설명 가능한 인공지능(eXplainable AI, XAI)”, 2018.

DARPA, “Explainable Artificial Intelligence(XAI),” 2016. 8. 10.

Lipton, Zachary, “The mythos of model interpretability,” arXiv preprint arXiv:1606.03490, 2016.

델코지식정보

https://www.delco.co.kr/

http://www.retailon.kr/on/

 

 

 

1. 들어가면서

 

하이프 사이클은 가트너사에서 기술의 성숙도를 나타내기 위해 개발한 시각적 도구이다. 가로축은 시간이고, 세로축은 시장의 기대를 나타내어, 기술에 대한 시장의 기대 변화를 살펴볼 수 있다.

ca325d4677c14f46b12a9f87e80ac5ae_1585012

 

ca325d4677c14f46b12a9f87e80ac5ae_1585012 

 

가트너는 2019년 데이터 과학과 머신러닝 기술에 대한 하이프 사이클을 발표에서 데이터 과학과 머신러닝 분야에서 주목받고 있는 기술들을 소개했다(아래 도표 참조).

 

ca325d4677c14f46b12a9f87e80ac5ae_1585012

 

2. 연합 기계 학습(Federated Machine Learning)

 

전통적 머신러닝 방법은 대용량의 데이터가 고성능 서버에 저장되어서 모델을 학습하는 방법이다. 이때, 모델이 만드는 예측값과 실제 값과의 차이를 오차라고 하는데 오차를 줄여나가는 방법으로 학습이 진행된다. 이때 고성능 서버에 대용량의 데이터를 업로드해야 하기에 업로드 시간도 많이 소요된다. 또한, 학습에 사용되는 데이터가 대용량이기 때문에 학습시간도 많이 걸리는 단점이 있다.

 

ca325d4677c14f46b12a9f87e80ac5ae_1585012

 

연합 기계 학습은 학습에 많은 시간이 소요되는 단점을 해결하기 위해서 등장한 개념이다. 고성능 중앙 서버 대신에 성능이 부족하지만 여러 대의 컴퓨팅 자원을 활용해서 알고리즘을 학습한 뒤, 각각의 컴퓨팅 자원에서 학습된 결과를 통합하여 최종 학습 모델을 만드는 방법이다.

ca325d4677c14f46b12a9f87e80ac5ae_1585012

 

이 방법은 구글이 처음으로 제시하였다. 연산 속도 증가뿐만 아니라 정보 보안 측면에서도 우수하다. 개인의 데이터를 중앙 서버에 업로드하는 과정에서 개인 정보가 유출되는데 이를 막을 수 있다.

 

구글은 휴대폰에 저장된 학습 데이터를 이용해서 개인 휴대전화에서 기계 학습을 진행하고, 학습된 모델은 압축 암호화되어 클라우드에 전송된다. 클라우드에서는 다양한 사용자들의 휴대전화에서 학습된 정보들이 결합 되어 학습 모델이 개선된다. 개선된 모델은 다시 개인들의 휴대전화에 전송되어 기존 모델보다 더 정밀한 예측 모델이 된다.

 

아래 그림은 이를 보다 자세하게 설명하고 있다. 스마트폰은 사용량에 따라 기계학습 모델을 개인의 휴대폰에서 사용자의 특성에 맞게 학습하고(A), 이후 많은 사용자의 학습 내용이 중앙 서버에 저장된다(B). 서버에서는 개인들이 학습한 모델을 바탕으로 더 정교한 학습 모형을 만드는 방향으로 진행된다(C). 예측 모델 학습에는 컴퓨팅 자원이 많이 필요하기에, 사용자가 잠을 자기 위해서 휴대전화를 사용하지 않는 새벽 시간에 활용한다. 또한, 데이터 전송에 많은 통신 데이터를 사용해야 하기에 무료 와이파이에 접속 시에만 활용된다.

 

ca325d4677c14f46b12a9f87e80ac5ae_1585012 

 

구글은 연합 기계 학습 아이디어를 자사의 키보드인 지보드에 활용하였다. 사용자가 지보드를 이용해서 단어를 입력할 때, 지보드는 단어의 입력이 끝나기 전에 특정 단어 들을 추천해준다. 그리고 사용자는 지보드가 추천한 단어를 선택할지 말지 결정한다. 스마트폰은 사용자가 특정 단어를 이용할 때의 주변 환경 정보와 단어를 함께 저장해서 학습 데이터로 활용한다.

 

60~70대 연령층의 휴대폰은 10대가 사용하는 단어들을 학습할 수 없지만, 최종 모델이 학습될 때에는 10대의 휴대폰에서 학습된 내용도 합쳐져서 업데이트된 후, 휴대폰으로 다시 전송되기 때문에 모든 계층이 사용하는 단어를 학습할 수 있게 된다.

 

ca325d4677c14f46b12a9f87e80ac5ae_1585012

 

구글 지보드 기능 사례는 문자 메시지를 보낼 때, 연합 기계 학습이 단어의 자동완성 기능 또는 검색 결과에 활용을 보여준다. 구글은 사용자가 친구들에게 보내는 개인 정보를 서버에 전송하지 않고, 연합 기계 학습을 통해 개인 휴대폰에서 지보드의 인공지능을 학습시킨다. 지보드는 연합 학습을 기반으로 단어를 추천하고 검색어를 제안해준다.

 

연합 기계 학습 기술은 구글 TensorFlow Federated에 탑재하여 오픈소스화 할 수 있다. 현재까지는 신경망을 분산해서 학습시키는 모델이 널리 사용되고 있지 않지만, 오픈소스를 이용해서 쉽게 구현이 가능한 만큼 널리 확산될 전망이다. 또한, 개인정보보호뿐만 아니라 중앙집중형 데이터 수집을 방지할 수 있다는 장점은 머신러닝 기술이 도전받아 왔던 사생활 침해로부터 자유로워질 수 있어 더욱더 머신러닝을 확산시키는 역할을 할 것으로 기대된다.

 

 

3. 설명 가능한 인공지능(eXplainable Artificial Intelligence. 약칭 XAI)

 

컴퓨팅 성능 향샹과 잇달은 고성능 AI 칩셋 출시로 엣지에서 수많은 데이터가 생성되면서 인공지능(AI) 모델이 더 정교해지고 뚜렷한 성과도 나오고 있다.

 

기업들은 AI를 새로운 기회로 활용하는 것은 물론 일부 비즈니스의 문제 해결에 적용하고 있다. AI가 발전하면서 더 많은 비즈니스 기회도 생겨나고 이로 인해 AI 사용이 계속 증가할 것으로 전망된다.

 

하지만 AI가 일반적인 업무에서 의사 결정을 수행하는 등 더 핵심적인 업무로 이동됨에 따라 이미 결정한 최종 결과의 근거와 도출과정의 타당성을 제공하지 못하고 있다. 또 오류 원인을 즉각적으로 알지 못하고 어떻게 이런 결정을 했는지 개발자조차 파악하지 못하면서 블랙박스가 존재하는 AI에 의존할 수 없다는 인식 또한 커지고 있다.

 

이에 AI가 내린 결정이나 답을 AI 스스로가 사람이 이해하는 형태로 설명하고 제시할 수 있는 '설명 가능한 AI(eXplainable Artificial Intelligence, 이하 XAI)'가 핵심적인 비즈니스에 필수적으로 대두되고 있다.

ca325d4677c14f46b12a9f87e80ac5ae_1585012

XAI는 학습 과정 중 데이터로부터 다양한 패턴을 추출·분석해 드러나지 않았던 법칙, 전략 등을 도출할 수 있다. 이에 따라 사용자들 사이에 신뢰를 쌓고 조직이 이러한 모델을 사용해 개발하는 제품에 대한 신뢰와 자신감이 높아지는 것이다.

 

특히 AI가 사람에게 의사 결정 이유를 설명하게 되면서 질병 진단과 금융거래, 조사 보고서 등에서 그 결과에 대한 신뢰성이 높아지고 활용도도 더욱 높아질 것으로 보인다.

 

예를 들어 전자 의료기록이나 뇌 영상 이미지, 생체 데이터 등을 자동으로 분석해 췌장암이나 치매 같은 질병을 진단할 수 있다. 그러나 이것으로 끝나는 것이 아니라 진단 결과에 '' 췌장암이나 치매로 판단하는지 파악할 수 있어 AI의 진단에 대한 신뢰도를 높이는 것이다.

 

또 천연자원 구매나 주식 거래 등에서도 사고파는 결정에 대한 보고서를 받을 수 있으며, 금융에 적용하면 정확한 분석과 이를 바탕으로 예측이 가능해지는 것이다.

 

이에 기업들이 최근 적용하고 있는 '설명 가능한 AI(XAI)' 몇가지 사례를 들어 본다.

 

미국 심머신(simMachines,Inc)이 개발·공급하는 AI 심머신(AI simMachines)XAI의 일종이다. 이 솔루션은 정확한 예측과 예측에 이르기 '해석의 제시'라는 기존에 양립이 어렵다고 한 AI 활용 과제를 자체 알고리즘으로 해결한 것이다.

 

특히 머신러닝을 사용해 소비자 행동에 영향을 미치는 모든 데이터 세트를 고려할 때 심머신은 기업의 패턴을 감지하고 미래의 수요 또는 소비를 예측하며, 세부적인 과거 추이를 가시화한다.

 

ca325d4677c14f46b12a9f87e80ac5ae_1585012

 

또한, 시간 경과에 따른 두 개의 클러스터, 세그먼트 또는 클래스 비교 등의 시계열 비교와 보고 및 분석을 위해 특정 간격으로 시계열 분석을 생성하며, 시간의 경과에 따른 변화와 변화의 원인을 설명하는 데이터의 패턴을 가시화한다. 또 비정상적인 패턴 탐지와 모든 시간 범위 또는 기준을 기반으로 예측된 미래 이벤트를 작성하고 예측의 원인을 도출한다.

 

구글 또한 오랫동안 설명 가능한 XAI를 개발해왔고, 클라우드 오퍼링을 통해 이 서비스를 출시하기도 했다. 이 서비스는 다양한 모델의 결과에서 각 데이터 포인트의 기여도를 정량화한다. 이를 통해 개발자들은 모델의 성능을 더욱 향상 시키고 원하는 결과를 얻을 수 있게 한다.

 

아직 초기 서비스여서 단지 몇 종류의 머신러닝 모델로 제한돼 서비스되고 있다. 그러나 그 결과를 전달하는 데 사용되는 모델의 성격과 데이터 유형에 분석적이고 더 나은 경험을 제공하기 위해 구글은 서비스 향상 노력을 가속화하고 있다.

 

IBM은 오픈스케일(OpenScale)과 함께 설명 가능한 AI 서비스를 제공하고 있다. 이 서비스는 모델이 어떻게 작동하고 있는지를 명확히 할뿐만 아니라 관련된 문제를 해결하는 데도 도움을 준다. 또 블랙박스 문제를 해결하기 위한 지속적인 시도로 IBMAI에 대한 통찰력을 제공하고 있으며, 그 결과를 개선하기 위한 왓슨 오픈스케일(Watson OpenScale)AI를 한 단계 끌어올려 조직들을 지원하고 있다.

 

이를 통해 감독기구와 선도기업들이 신용위험 모형이 왜 특정 권장사항을 제시하고 있는지를 이해하는 데 도움을 주고 있으며 모델들이 특정 그룹에 대해 편견 없이 실행되도록 보장한다.

ca325d4677c14f46b12a9f87e80ac5ae_1585012

 

설명 가능한 AI(XAI)AI의 판단 결과를 논리적으로 설명하는 것이 가능해진 것이다. 최근 AI 이면의 신뢰성을 채우려는 일환으로 대두된 XAI에 대한 연구와 개발이 금융, 보험, 군사 등 다양한 분야에서 사용자로부터 신뢰를 얻고 있고 사회적 수용을 위한 공감대 형성과 더 나은 경험을 제공하기 위해 서비스를 향상시키고 있다.

 

현재 XAI는 다양한 비지니스에서 AI 시스템의 성능 저하 요인을 파악하고 학습 모델 간 정량화 된 비교를 통해 최적의 학습 모델을 도출하는데 효과적으로 활용되고 있다. 특히 AI 시스템의 성능 향상과 기존에 알고리즘의 복잡성으로 인해 알 수 없었던 최종 결과의 근거를 제시하고 인간과 인공지능 간 상호작용을 보다 효율적으로 높이는 도구로 사용되기 시작한 점도 주목할 만하다.

 

4. 결론

 

가트너사의 최신 하이프 사이클을 이용해서 인공지능 분야의 현재 트렌드에 대해 살펴보았다. 여기서 새롭게 등장한 기술들은 검증되지 않은 기술이기는 하지만, 한 분야의 기술의 변화 방향을 예측할 수 있는 척도가 된다. 연합 기계 학습과 설명 가능한 인공지능 기술이 새롭게 인공지능 분야 태동기에 등장한 것은 인공지능 기술에 대한 많은 시사점을 보여준다.

 

인공지능 기술이 발전함에 따라서, 기술 그 자체의 성능 향상뿐만 아니라, 사회적 역할을 고민해야 한다는 점이다. 개인 데이터의 사생활 보호에 대한 사회적 요청에 따라 연합 기계 학습이 등장하였다.

 

이 기술은 5G의 등장으로 통신 네트워크가 더욱더 빨라지고, 접속할 수 있는 기기의 수가 늘어나기 때문에, 다양한 개인화 디바이스에서 활용될 수 있을 것으로 판단된다. 또한, 설명 가능한 인공지능(XAI)의 경우, 인공지능의 결과가 사회적으로 수용 가능한지에 대한 고민에서 시작되었다.

 

인공지능의 결과가 금융과 보험 등 사회적인 신뢰가 필요한 분야에서 적용가능하기 위해서는 추론 과정이 사회 구성원 모두에게 설명이 되어야 한다.

[지식정보] 서울 자치구별 지역내총생산과 아파트 가격 비교와 개선 방향

댓글 0 | 조회 11
영국, 호주, 미국 등 대도시는 주택호수가 1천명 당 430호에서 크게 벗어나지 않는다. 이와 비교하면 서울의 경우는 380호로 50호가 부족하다. 결국, 50만호 정도는 추가로 … 더보기

[칼럼] 우리의 GDP 대비 높은 토지자산 가치가 불안해 보인다

댓글 0 | 조회 8
지난달 말 통계청과 한국은행이 ‘2019년 국민대차대조표’를 발표하였다. 비금융자산 중에서 토지자산(8767조원·54.7%)과 건물형태인 건설자산(5353조1000억원·33.4%)… 더보기

[지식정보] 미국 도시계획가 역할

댓글 0 | 조회 17
미국 노동부 노동통계국의 정의에 의하면, 도시 계획가는 토지사용(land use)에 관한 계획/프로그램(plans and programs)을 개발(develop)하여 지역사회 창출… 더보기

[칼럼] "서울 아파트 공급부족…자치구별로 고밀도 개발해야"

댓글 0 | 조회 21
정부와 서울시가 8·4대책으로 수도권 공급대책을 내놨지만, 일부 자치구에서 반발하는 가운데 자치구별로 고밀도 개발을 해야한다는 주장이 나왔다. 자치구별로 생산성이 다르고 집값 차이… 더보기

[지식정보] 미국 그린뉴딜(Green New Deal)과 시사점

댓글 0 | 조회 46
이미 파리협정과 IPCC 1.5도 특별보고서로 인해 지구 평균 온도 상승을 1.5도 이내로 제한해야 한다는 국제사회 인식이 확산하고 있다. ‘기후를 위한 청소년 파업’과 ‘멸종 저… 더보기

[지식정보] 정부 그린뉴딜 정책과 개선 방향

댓글 0 | 조회 44
정부가 2020년 7월 발표한 그린뉴딜을 추진하는 배경은 코로나19 계기로 기후변화 대응 및 저탄소 사회로 전환의 중요성이 부각 되고 있기 때문이다. 추진하는 방향은 인프라・에너지… 더보기

[칼럼] 한국형 그린 뉴딜이 성과를 내기 위해서는

댓글 0 | 조회 49
그린 뉴딜이란 환경과 사람이 중심이 되는 지속 가능한 발전을 뜻한다. 화석에너지 중심에서 신재생에너지를 사용하는 저탄소 경제 구조로 전환하고, 기후변화와 환경 문제에 대응하면서 관… 더보기

[지식정보] 서울시 그린뉴딜

댓글 0 | 조회 84
서울시는 그린 뉴딜 정책을 2020년 7월 8일 발표했다. 2022년까지 2조6,000억원을 투입해 대대적인 ‘그린뉴딜’을 추진한다. ‘서울판 그린뉴딜’ 전략은 건물, 수송, 도시… 더보기

[지식정보] EU 그린딜

댓글 0 | 조회 58
그린뉴딜이란, 환경과 사람이 중심이 되는 지속 가능한 발전을 뜻하는 말로, 현재 화석에너지 중심의 에너지 정책을 신재생에너지로 전환하는 등 저탄소 경제구조로 전환하면서 고용과 투자… 더보기

[지식정보] 유럽 디지털세와 우리나라 대책

댓글 0 | 조회 92
디지털세(Digital tax)는 페이스북·구글·아마존 등 글로벌 IT기업의 자국 내 디지털 매출에 법인세와는 별도로 부과하는 세금이다. 특정 국가 내 고정사업장 유무와 관계없이 … 더보기

[칼럼] 디지털세의 양날, 세수 기대와 무역갈등

댓글 0 | 조회 69
최근에 코로나19 확산으로 글로벌 경기 침체가 계속되면서 많은 국가가 재원 확보를 위해 ‘디지털세(Digital Tax)’를 도입하고 있다. 이를 일명 ‘구글세’라고도 한다. 그동… 더보기

[지식정보] OECD 디지털세 기본 합의안 주요 내용과 전망

댓글 0 | 조회 73
디지털세(Digital Tax)는 일명 ‘구글세’로도 불리며 특정 국가 내 고정사업장 유무와 상관없이매출을 발생시키는 글로벌 IT 기업들에 대해서 세금을 부과하기 위해 고안된 조세… 더보기

[지식정보] 구독경제(subscription economy)

댓글 0 | 조회 107
정보통신기술의 발전과 스마트 기기의 확산 등 새로운 산업이 접목하면서 ‘구독경제(subscription economy)’가 새로운 경제 트렌드로 부상했다. 콘텐트와 소비자가 만나는… 더보기

[지식정보] 디지털 콘텐츠 구매 증가

댓글 0 | 조회 94
젊은층 위주였던 디지털 콘텐츠 소비에 중장년층이 가세하면서 국내 시장은 지난 3년간 두 배 이상 성장하고 있다. 특히 디지털 콘텐츠 이용은 영상 분야에서 두드러졌다. 소비자 10명… 더보기

[칼럼] 디지털 콘텐츠 구독경제 시대

댓글 0 | 조회 97
디지털 콘텐츠는 스마트폰을 통해 접할 수 있는 영화, 동영상, 음악, 게임, 웹툰, 전자책 등의 문화를 말한다. 이를 구매하는 구독경제가 커지고 있다. 특히 영상 결제가 지난 3년… 더보기