[아무생각|D-line] #20. 보수적인 기계

in #kr6 years ago (edited)

우리 회사는 기계학습(Machine Learning)이라는 걸 사용해서 신물질을 개발한다. 나도 잘은 모르지만 기계를 학습시키려면 학습 자료가 필요한데, 회사에서는 실험 데이터가 그에 해당한다. 여기서 가장 큰 딜레마는 우리에게 새로운 물질을 알려줘야 할 기계들이 학습하는 데이터가 새롭지 않다는데 있다. 좀전에 읽은 번역가 정영목씨의 인터뷰에도 비슷한 고민이 엿보인다.

"기계번역의 수준이 올라간 건 의미를 생각하지 않고 기표만 따져 번역하면서부터입니다. 데이터와 통계에 기반해 번역하고, 사람과 다른 길을 걷기 시작하면서 번역이 좋아졌어요...(중략)...데이터와 통계를 따른 번역에는 또다른 한계가 있습니다. 데이터는 '기존의 자료'입니다. 그래서 무언가를 만들 수 없고 보수화할 여지가 있습니다. 언어는 창의적이기 때문에 재밌습니다."

신물질 개발과 번역은 전혀 다른 분야지만 기계학습을 사용한다는 것 때문에 비슷한 고민을 한다는 것이 흥미롭다. 기계는 태생적으로 보수다. 온고지신은 사람만의 특징인 것.

아, 그렇다면 기계가 전혀 새로운 물질을 개발해내거나 창의적 번역을 하려면 결국 자의식을 가져야 하는 것일지도 모르겠다. 하지만 많은 분들이 자의식이 있는, 이른바 '강한' 인공지능은 출현하기 힘들다고들 한다. 나는 이에 동의하는.. 아니 하고싶은데 그래야 내가 먹고 살 수가 있다. 보수적인 기계들을 한걸음 진보하게 만드는 일은 사람들, 그러니깐 콕 찝어 내가 할 일이란 말이야.

덧. 정영목 교수는 인터뷰에서 한국어 외연 확장의 측면에서 번역투가 가지는 의의를 말한다. 고수만의 전체를 조망하는 관점과 게으른 번역가의 자기합리화 사이, 그 경계위에 절묘하게 서있는 느낌이다.

Sort:  

화학에서 고분자 구조를 컴퓨터로 계산하여 짜맞춘다는 얘기를 들은 적 있습니다. 그 비슷한 일이 아닐까 추측해봅니다.
알파고도 처음엔 사람의 기보를 익혔으나 나중엔 두 알파고끼리 겨루며 발전했다고 들었는데, 이런 발전(?)이 번역처럼 완벽하고 이상적인 답이 있는 환경에서는 적용되기 힘들지 않을까 생각해봅니다.

네. 저희 회사는 small molecule을 주로 합성합니다. 사실 AI가 새로운 물질을 제시하는 단계까지 가려면 아직 멀었구요. 단지 합성과 실험에 들어가는 돈을 절감하는 차원에서 접근하는 중입니다. 사실 바둑은.. 정해진 답이 있는 문제라서 훨씬 단순한 문제입니다. 어찌됐던 상대보다 집이 많으면 되는 것이죠. : )