용욱의 쉽게 읽는 머신 러닝

in #kr7 years ago (edited)

기계 학습(機械學習) 또는 머신 러닝(machine learning)은 인공 지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야를 말한다.

-wiki

안녕하세요 여러분.

@ywha12, 용욱입니다.

꽤나 길었던 여행을 마치고 대학원 연구실 책상에 앉으니, 다시 일상으로 돌아왔다는 느낌이 듭니다. 힘차게 주먹을 불끈 쥐어보고 하루를 시작합니다.

오늘은 제가 주로 연구하고 있는 분야인, 머신 러닝에 대해서 한번 다뤄볼까 합니다. 관련한 전문지식이 전혀 없으신 분들도 가볍게 읽을 수 있도록 매우 얕고 추상적으로 들춰보겠습니다.

머신러닝

머신 러닝은 여러가지 알고리즘들로 나뉩니다. 초창기 모델이었던 결정 트리 학습법부터 유전 알고리즘 그리고 최근에 각광받고 있는(제가 전공하는) 인공 신경망까지. 이 포스팅에서는 욕심내서 모든 알고리즘을 둘러보지 않고, 간략하고 대략적인 머신러닝의 기초만 다뤄봅니다.

Reveal spoiler

사람-컴퓨터 관계도.JPG
사람과 기계의 관계

아시다시피, 컴퓨터는 단순계산에 매우 능합니다. 하지만 주어진 수식에 대해 말 그대로 계산을 수행할 뿐, 스스로 어떤 계산을 해야할지 선택하는-지능-은 존재하지 않죠. 덕분에 사람이 컴퓨터에게 정해진 할 일을 주고, 컴퓨터는 규칙에 기반하여 주어진 역할을 빠르게 수행하는 공생관계가 성립해왔습니다.

머신러닝은 이러한 공생관계를 깨려는 움직임입니다.

Reveal spoiler

머신러닝.JPG
머신 러닝

기계가 스스로 어떤 계산을 할지 정하게 만드는 것이 머신러닝의 핵심입니다. 그 목표를 달성하기 위해서는 말 그대로 기계를 학습시키는 과정이 필요합니다. 기계를 학습시키는 방법론은 크게 지도학습(supervised learning)과 비지도학습(unsupervised learning)으로 나뉩니다.

지도학습과 비지도학습

용어에서도 어느정도 감이 오시겠지만, 지도학습은 기계가 만든 결과물에 대해 평가를 해줌으로서 피드백을 기반으로 학습하는 방법이며, 비지도학습은 결과물에 대한 평가가 없이 기계 스스로 학습하는 방법입니다.

지도학습이나 비지도학습이나, 머신 러닝에서 데이터는 필수적입니다. 데이터의 관점에서 지도학습이 비지도학습과 확연히 구분되는 점은 지도학습은 입력데이터에 대해 목표 결과를 가지고 있어야한다는 것입니다.

학습 방법지도방법데이터목표 결과
지도학습결과물에 대해 평가함필요필요
비지도학습스스로 학습하도록 내버려둠필요불필요

쉬운 예

지도학습

Reveal spoiler

지도학습 예시

특정 종류의 데이터를 입력하면 "토끼"라는 결과를 뽑아내는 기계를 만드려고 합니다. 초기 상태의 기계는 기대에 비해 터무니없는 결과를 내놓습니다. 하지만 입력된 데이터에 대한 결과값이 이미 있기 때문에 기계의 결과와 목표 결과를 비교하여 맞으면 칭찬을, 틀리면 패널티를 부과하는 방식으로 기계를 학습시킵니다.

기계를 학습시킨다는 것은 공식을 만든다는 것입니다.

쉽게 생각하면 입력값 x와 출력값 y 사이의 공식 y = ax + b에서 계수 ab를 얻어내는 과정이라 볼 수 있습니다.

수많은 데이터에 대해 기계가 충분히 학습하고 나면 입력값에 대한 공식이 어느정도 완성되게 되고, 특정 종류의 데이터가 입력되면 높은 신뢰도로 "토끼"라는 결과를 내놓을 수 있게 됩니다.

비지도학습

Reveal spoiler



비지도학습 - Clustering 예시

대표적인 비지도학습으로는 군집화(clustering)가 있습니다. 군집화는 보통 데이터 분석에 사용되며 전체 데이터에 대해 몇가지 부분집합을 만들고, 공통된 특징에 따라 범주를 분류하는 기능을 수행합니다.

그림에서 느낌적인 느낌이라고 적힌 부분, 즉 분류의 기준이 되는 특징은 모델에 따라 여러가지가 될 수 있습니다. 4개 이상의 기준이 사용되는 고차원 모델의 경우 시각적으로 결과를 확인하기 힘듭니다.

토끼, 기린, 고양이를 분류하는 클러스터링 모델에서는 색상, 패턴, 모양 등 고차원의 분류 기준이 필요하겠죠?

클러스터링은 주로 방대한 양의 데이터에서 공통된 성질을 가지는 데이터들을 분류할 때 주로 사용합니다.

머신 러닝에 대한 기대

이론적으로는 1970여년에 전성기를 이뤘지만 실제 구현되지 않아 반세기간 침체되었던 인공신경망(머신러닝의 한 종류)이 하드웨어의 눈부신 발전과 함께 다시 부활하면서 기계에 사람의 직관을 이식하는 작업이 계속되고 있습니다.

학계에서는 위에서 다뤄보았던 지도학습과 비지도학습을 혼합한 새로운 학습법이 매일같이 쏟아지고 있습니다. 머신 러닝은 걸음마를 떼고 이제 달려갈 채비를 갖추고 있습니다.

2016년 초 이세돌을 꺾은 알파고가 화제가 된 후, 쏟아지는 관심 덕분에 이제는 이 기술로 낯선 도로를 주행하거나 스마트폰으로 찍은 사진에서 동일 인물들을 분류하는 등, 규칙기반 시스템으로 할 수 없던 수많은 일들이 가능해지고 또 상용화되고 있습니다.

머신 러닝은 AI입니다. AI가 인간의 번영을 도와줄 동반자가 될지, 터미네이터의 스카이넷이 되어 인간을 파괴할지 장담할 수 없지만, 인간의 손에 지능이 탄생할 순간이 머지 않았음은 확실한 것 같습니다.

이 포스팅을 통해 기술의 격변기에 놓인 우리가 눈앞의 현실에서 잠시나마 벗어나 미래에 대한 생각을 할 기회를 드렸길 희망합니다.

인간의 지능을 뛰어넘는 인공지능의 등장하는 시점. 특이점이 오면, 개미가 사람의 다음 행동을 예측할 수 없듯 사람도 그 이후의 미래를 예측할 수 없다.

-레이 커즈와일

DQmfCyF6WREBtz2dMyL3oM1n8NviRcvUpB7WVjH7qrJ3AHi_1680x8400.png

Sort:  

좋은 글입니다. @홍보해

막연하고 막막하게만 알고 있을 법한
머신 러닝에 대해서 포스트 하나로 잘 정리되어졌네요

덕분에
개념을 대략적으로나마 잡게 된 것 같습니다.

어떤 상황이 오든지 간에
지금 당장하고는 다른 상황이 닥쳐올 듯 싶습니다.

잘 보고 가요

미래가 어떻게 흘러갈지 정말 모르겠어요... 기대와 우려가 동시에 됩니다..!

click here!
click here!This post received a 65% upvote from @krwhale thanks to @ywha12! For more information, 이 글은 @ywha12님의 소중한 스팀/스팀달러를 지원 받아 65% 보팅 후 작성한 글입니다. 이 글에 대한 자세한 정보를 원하시면,

오호라 좋은 글 입니다.
앞으로도 계속 올려주세요~~

넵! 앞으로는 제가 잘 아는 분야의 글들을 자주 포스팅하려 합니다.
간간히 놀러와주세요! 😃