AI 다음 물결

   
류윈하오 (지은이), 홍민경 (옮긴이), 박종성 (감수)
ǻ
알토북스
   
22800
2026�� 01��



■ 책 소개


AI의 과거·현재·미래를 한눈에 꿰뚫고 
다가올 AI의 다음 물결을 선명하게 그려 낸다

이 책은 난해한 기술서가 아니다. 오히려 잘 짜인 추리 소설처럼 독자를 AI의 기원과 본질로 깊숙이 이끌고 간다. 1956년 다트머스 회의에서 ‘인공지능’이라는 용어가 처음 사용된 이래, 인공지능은 70년 가까운 세월 동안 세 차례나 열광과 침체를 오가는 파도를 맞이했다. 저자는 인공지능 역사의 ‘결정적 순간’들과 이를 가능케 한 인물들, 3대 학파인 기호주의·연결주의·행동주의의 흥망성쇠, 그리고 2022년 오픈AI가 챗GPT를 내놓은 이후 대중의 관심이 최고조에 달한 지금, 인공지능은 어떻게 진화하고 있으며 구글과 메타, 마이크로소프트와 오픈AI 등 글로벌 빅테크 기업들은 어디에 돈을 쏟아붓고 있는지까지 이야기하며, 한순간도 책에서 눈을 뗄 수 없게 한다.

■ 저자 류윈하오
칭화대학교 자동화학과에서 공학 학사학위를 받았고, 2013년부터 2017년까지 칭화대학교 소프트웨어대학 학장을 역임했으며, 2018년부터는 미시간주립대학교 특임 교수로 재직하며 칭화대학교 글로벌혁신대학(GIX) 학장을 맡고 있다. AI·로봇·엣지 컴퓨팅·인지 모델링 등 여러 분야에서 연구와 저술을 이어 가며, 중국은 물론 국제 학계에서 활발히 활동 중이다. ACM Fellow, IEEE Fellow, ACM 의장상을 비롯해 국가 자연과학상, 교육부 기술발명상, 중국 컴퓨터학회 자연과학상, 중국 전자학회 자연과학상 등의 영예를 안았다.

주요 저서로는 『위치, 위치 결정, 위치 결정 가능성(Location, Localization, and Localizability)』, 『사물 인터넷 입문(物聯網導論)』 등이 있다.


■ 역자 홍민경
숙명여자대학교 중문과와 이화여자대학교 통번역대학원 한중번역학과 석사를 이수했다. 타이완 정치대학교에서 수학했고, 현재 번역 에이전시 엔터스코리아에서 출판기획 및 중국어 전문 번역가로 활동하고 있다. 주요 역서로는 『확률로 바라본 수학적 일상』 『AI 시대 생존 전략』 『지식인들의 지적 대화: 세상과 이치를 논하다』 외 다수가 있다.


■ 차례
프롤로그 | 땅에 심은 인형

PART 1. 기계는 생각할 수 있을까?

Chapter 1. 기호주의의 야망
기계론의 관점에서 출발하기
‘논리 이론가’의 탄생
‘천재’와 ‘노력파’
탄생과 동시에 찬란하게 빛나는

Chapter 2. 연결주의: 모방에서 초월까지
대뇌 모방으로부터 출발
핵심은 ‘상식’이다
‘영웅은 출신을 따지지 않는다’
출발점은 대뇌가 아니었다
기호주의 학파와 연결주의 학파의 회고

Chapter 3. 행동주의의 세계는 넓다
P형 인간의 특징을 가진 행동주의 학파
목적 지향적 행동과 피드백 메커니즘
기계의 급부상
3대 학파 회고

Chapter 4. 대규모 모델: 하나의 중심 원칙과 다양한 응용 방식
바둑에서의 승리와 진화의 시작
왜 대규모 모델인가?
‘스스로 천재가 되어 가는’ GPT
대규모 모델의 딜레마

Chapter 5. 세상과 조화를 이루는 체화된 지능으로의 도약
기계의 지능은 어디에서 오는가?
체화된 지능은 반드시 ‘인간의 모습’이어야 할까?

PART 2. 모방 게임

Chapter 6. 감지
감각기관의 진화
센서의 탄생
감지 기술의 혁명
‘다중 모달 감지’라는 과제
감지에 필요한 체화된 경험

Chapter 7. 인지
외부 세계 인지하기
어포던스로 사물 이해하기
기계의 ‘세계관’ 구축
기계를 통한 인지 확장

Chapter 8. 결정
기계는 어떻게 결정을 내릴까?
모방에서 시작되는 학습
새로운 진전
모든 행동은 흔적을 남긴다
강화 학습과 외부 행동 피드백
궤적과 변환, 격자 미로의 사례
정확성 vs. 혼돈
벨만 방정식
실전: 다이어트 계획 세우기
세상에 공짜는 없다
계산력이 승부를 가른다

Chapter 9. 행동
어떻게 ‘해낼 수’ 있을까?
왜 로봇은 ‘팝핀 댄스’를 출까?
라마르크주의와 vs. 다윈주의
상호 작용의 기술적 난제
깨달음은 행동 능력을 높인다
지능화 엔트로피 증가와 체화 내비게이션
대규모 모델은 어떻게 현실 세계와 접목될까?

Chapter 10. 진화
트루먼 쇼
가상 세계의 원주민
체화된 진화의 시작
AI 에이전트, 실습에 들어가다
심투리얼
모방 게임일까? 아니면 진화 게임일까?

에필로그 | 기계 지능의 진화는 현실 속 '판도라의 상자'를 열게 될까?
참고문헌

 




기계는 생각할 수 있을까?

기호주의의 야망
‘슈뢰딩거의 고양이(Schrodinger’s cat)’가 생사조차 알 수 없는 존재라면, ‘라플라스의 악마(Laplace’s Demon)’는 모르는 게 없는 뛰어난 예언가이다. 이 작고 매력적인 악마는 수학자 라플라스의 상상에서 비롯된 가상의 존재로, 우주에 있는 모든 원자의 위치와 운동량을 정확히 파악하고, 뉴턴의 법칙을 이용해 미래의 모든 사건을 예측할 수 있다. 다시 말해, 세상의 모든 것이 인과 관계의 사슬로 얽혀 있으므로, 각 원자의 초기 상태만 알면 우주 전체의 운명을 얼마든지 확정 지을 수 있다는 가정을 바탕으로 한다.

도미노 게임을 할 때 첫 번째 조각이 쓰러지면 남은 조각도 순서대로 쓰러진다. 우주에서도 이러한 일이 동일하게 일어난다. 라플라스의 악마는 마치 모든 스위치를 통제하고 있는 것처럼 그것들이 어떻게 상호 작용을 일으키는지, 그리고 그 결과 우주의 미래가 어떻게 결정될지도 간파하고 있다. 이 이론은 당시 물리학계에 새로운 바람을 불러일으키며 학자들의 열정에 불을 지폈다. 사람들은 충분한 정보만 손에 넣으면 미래를 예측할 수 있을 뿐 아니라, 완벽히 통제 가능한 세상을 만들 수 있을 거라는 환상을 품기 시작했다.

기계론의 관점에서 출발하기
그런데 누군가의 머릿속에서 이러한 의문이 싹트기 시작했다. 세상 만물이 모두 운동 법칙을 따라야 한다면 인간을 포함한 동물에게도 이 법칙이 적용되지 않을까? 좀 더 심층적으로 파고들어 보면 인간의 생각과 감정도 운동 법칙에 부합하지 않을까? 우리의 머릿속에 존재하는 모든 의식이 본질적으로 물질 운동의 결과에 불과한 것은 아닐까? 더 직설적으로 말하면 뇌세포 운동의 결과가 아닐까?

세상은 물론 인간의 의식마저 수학적으로 설명하려는 관점을 ‘기계론’이라고 부른다. 이 용어는 시험에서 오답 항목으로 자주 등장하기 때문에 그리 낯설지 않을 것이다. 비록 일부 교과서에서는 기계론의 합리성을 부정하기도 하지만, 그것이 틀렸다고 직접적으로 말하는 것 자체도 불공평하다. 기계론을 제기한 사람들은 매우 뛰어난 과학자와 철학자들이었고, 그들의 원래 의도는 수학이 지배하는 완벽한 세상을 만드는 것이었다. 게다가 스피노자의 사상은 많은 사람이 평생 추앙하고 경외할 만큼 가치가 있다.

인간의 뇌와 컴퓨터는 구조와 메커니즘은 전혀 다르지만, 특정 영역에서만큼은 공통된 특징을 보인다. 따라서 인간의 뇌와 컴퓨터를 형식적인 규칙으로 기호를 조작함으로써 지능적 행위를 만들어내는 동일한 장치에서 벌어지는 두 가지 서로 다른 특수한 사례로 간주할 수 있다.

이 이론은 기계론의 2.0 버전으로 간주될 수 있으며, ‘물리적 기호 체계 가설(Physical Symbol System Hypothesis)’이라고 부른다. 이 이론의 지지자들은 ‘기호주의 학파’로 분류된다.

탄생과 동시에 찬란하게 빛나는
인간의 지능을 갖춘 물리 기호 체계를 소개하기에 앞서 IPL(Information Processing Language)에 대해 먼저 알아보고자 한다. ‘논리 이론가’ 프로그램을 개발하는 과정에서 사이먼은 ‘연결 리스트(linked list)’라는 개념을 처음으로 제시하고 응용했다. 그는 그것을 기본 데이터 구조로 삼아 리스트 처리 언어인 IPL을 설계하고 구현해냈다. IPL은 최초의 테이블 처리 언어이자 재귀적 하위 프로그램을 구현하는 언어로서 인공지능 역사에서 이정표로 자리매김했다.

IPL의 기본 요소는 기호이고, 리스트 처리 방식을 최초로 도입했다. 핵심 데이터 구조는 테이블 구조로 주소 혹은 규칙적인 배열을 대체해 프로그래머가 사소한 문제까지 파고들 필요 없이 고차원적인 사고를 할 수 있게 한다. IPL의 또 다른 특징은 생성기(generator)를 도입해 하나의 값을 만들어낸 후 그것을 저장해 두고, 다음에 다시 호출해 사용할 때 중단된 위치에서 계속 실행하는 것이다. 초기의 수많은 인공지능 프로그램은 이러한 리스트 처리 언어로 작성되었다.

요컨대 사이먼의 관점에서 볼 때 완벽한 물리 기호 체계는 다음과 같은 여섯 가지 기능을 가져야 한다.

첫째, 입력 기능이다. 우리가 귀, 눈, 코를 이용해 외부 정보를 감지하듯이 키보드와 마우스를 통해 데이터를 컴퓨터에 입력하는 것과 비슷하다. 지금은 제스처와 음성 인식도 하나의 입력 방식이 되었다.

둘째, 출력 기능이다. 예를 들어 우리가 말하기, 쓰기 혹은 신체 언어로 정보를 출력하듯이 컴퓨터도 모니터, 프린터 등의 장치를 통해 사람이나 다른 장치를 위해 정보를 출력할 수 있다.

셋째, 저장 기능이다. 인간은 기억에 의존해 입력된 정보를 저장하지만, 컴퓨터는 하드웨어와 광디스크 등 저장 장치에 데이터를 보관한다.

넷째, 복제 기능이다. 인간은 외부 자극을 반복하며 기억을 강화하지만, 컴퓨터는 파일과 데이터를 쉽게 복제할 수 있다.

다섯째, 구조 구축 기능이다. 이는 다양한 여러 기호 사이의 관계를 찾아내 시스템 안에서 구조화하는 것을 의미한다. 인간은 받아들인 정보를 학습한 후에 그 정보를 다양하게 조합해 새로운 관계를 도출하고 기호 체계를 만들어낸다. 이는 수학적으로 말하면 귀납법에 해당한다. 예를 들어 뉴턴은 사과나무 아래 앉아 있다가 머리 위로 떨어진 사과를 보며 모든 물체 역시 땅으로 떨어진다는 깨달음을 얻었으며, 이를 계기로 마침내 만유인력의 법칙을 생각해낼 수 있었다. 그래서 인간이 각종 지식을 종합해 연관성을 구축하듯 컴퓨터도 다양한 기호 사이의 관계를 통해 기호 체계를 구축할 수 있다. 예를 들어 조건과 연결을 나타내는 기호인 ‘if-then’ 어구, 다른 데이터나 메모리 위치를 가리키는 변수인 포인터(pointer), 여러 개의 노드가 포인터로 서로 연결된 선형 구조인 연결 리스트는 모두 컴퓨터가 실행 과정에서 참고하는 구조와 프레임이다.

여섯째, 조건부 전이 기능이다. 이것은 이미 습득한 기호를 바탕으로 행동을 수행해 나가는 것을 의미한다. 즉 기존의 지식을 새로운 영역으로 확장해 나가는 것이다. 예컨대 인류가 뉴턴의 법칙을 기반으로 다리를 건설하고, 미사일과 대포를 만들듯이, 컴퓨터도 기존 시스템을 업데이트하거나 업그레이드해 새로운 기능을 구현할 수 있다.

위에서 설명한 기능이 바로 물리적 기호 체계 가설이다. 이 가설대로라면 어떤 시스템이든 여섯 가지 기능을 갖췄으면 지능을 가진 것으로 볼 수 있다는 뜻이다. 필요조건의 관점에서 보면, 지능을 갖춘 시스템은 모두 물리적 기호 체계로 입증될 수 있다. 충분조건의 관점에서 보면, 충분히 큰 물리적 기호 체계는 조직을 통해 지능을 드러낼 수 있다.


세상과 조화를 이루는 체화된 지능으로의 도약
체화된 지능은 반드시 ‘인간의 모습’이어야 할까?
1950년으로 다시 돌아가서 튜링이 어떻게 말했는지 살펴보자. 그는 고전 논문인 ‘컴퓨터와 지능’의 말미에서 인공지능이 발전할 수 있는 두 가지 길을 내다보았다. 하나의 길은 체스나 바둑과 같은 추상적 활동에 집중하는 것으로, ‘탈 신체적 지능’이라고 한다. 또 하나의 길은 기계에 진정한 신체 감각기관을 부여하고, 아이를 가르치는 것과 유사한 방식으로 지능을 습득하게 훈련하는 것으로, ‘체화된 지능’이라고 한다.

그렇다면 ‘체화된 지능’은 가장 강력한 뇌 형태의 대규모 언어 모델에 ‘새로운 몸’을 장착한 것일까? 이렇게 단순한 논리라면 얼마나 좋겠는가. 하지만 감각과 인식은 여전히 세계와의 다차원적 상호 작용에서 비롯된다. ‘맛있다’는 느낌을 예로 들어 보자. 이것은 미뢰의 느낌일 뿐 아니라 음식이 주는 시각적 영향과 후각적 체험도 포함한다. 이러한 감각은 단순한 생리적 반응이 아니라, 우리가 외부 사물과 상호 작용한 직접적 결과로, 뇌 속의 의식뇌 속의 의식으로 내재되어 행동의 선험적 기준이 된다.

따라서 인간과 외부 환경의 상호 작용에는 ‘육체’와 같은 매개체가 반드시 필요하다. 하지만 인공지능은 이와 같은 실질적인 ‘육체’를 가지고 있지 않고, 단지 사전 설정된 데이터와의 상호 작용만 수행할 뿐이다. 그렇다 보니 환경과의 실제 상호 작용을 통해 ‘상식’을 얻을 수 없고, 진정한 자신만의 감각과 의식을 형성할 수도 없다. 따라서 인공지능이 진정한 의미의 의식을 가지려면, 먼저 스스로 통제할 수 있는 몸을 갖추어, 물리 법칙이 지배하는 인간 사회에 녹아들게 해야 한다.

그렇다면 ‘몸’에는 어떤 요소가 필요할까? 우리에게 가장 익숙한 인간을 참조해 보자.

‘모방 게임’의 논리에 따르면 체화된 에이전트가 인간 세상에서 물리적 환경과 상호 작용하며 인간과 자연스럽게 소통할 수 있으려면, 먼저 환경을 감지하는 능력을 갖춰야 한다. 인간의 경우 이러한 문제는 감각기관을 통해 해결된다. 예를 들어 눈은 시각 정보를, 귀는 청각 정보를, 피부는 촉각 신호를 감지한다. 만약 감각기관이 없다면 눈과 귀가 있어도 정상적인 생활을 하기 어렵다.

보고 들을 수 있으면 인간은 사고를 할 수 있고, 이 과정은 뇌가 통제하고 관리한다. 예를 들어 어린아이가 정밀하게 가공된 기계를 본다면 어떻게 다뤄야 할지 전혀 감을 잡지 못할 수 있다. 그러나 경험이 풍부한 기술자라면 이 설비를 사용해 어떻게 금속 부품을 제조하는지 빠르게 판단할 수 있다. 이것은 인지 능력이 외부 세계를 이해하고 반응을 만들어내는 데 얼마나 중요한지를 잘 보여 준다.

체화된 에이전트는 정보를 받아들인 후에 적당한 반응이나 의사 결정을 해야 한다. 물을 마시고 싶은 에이전트는 주변에 물병과 잔이 있는지 관찰하고, 물병에 물이 있는지, 컵에 물이 담겨 있는지를 인지한 후에 바로 행동 계획을 세울 수 있다. 즉 물병을 향해 걸어가고, 컵을 들고, 물을 따르고, 마지막으로 물을 마시는 일련의 계획이 세워진다. 이는 인간 신체의 정밀한 제어 능력을 보여 주는 것으로, 수백만 년에 걸친 진화를 통해 형성된 결과이다.


모방 게임
감지
센서의 탄생
기술이 진보하면서 인간은 단순히 감각을 ‘확장’시켜 나가는 데에 만족하지 못하고 ‘초인적’ 감지 능력을 추구하게 되었다. 특정 종이 지닌 고유의 감각 메커니즘을 모방하거나, 이를 이용한 기술로 자연에서 얻을 수 없는 능력을 갖추어 가고 있다.

예를 들어 ‘소나(sonar) 레이더’ 설계는 바로 박쥐의 반향 정위 능력에서 영감을 받았다. 이 레이더 덕에 잠수함은 심해에서도 선명한 ‘시야’를 유지할 수 있다. 카메라 흔들림 방지 장치는 조류가 비행 중에도 안정적인 평형 능력을 유지하는 데서 영감을 받아 만들어졌고, 심하게 흔들려도 선명한 사진을 찍도록 돕는다. 또한 수중 내비게이션 시스템은 어류가 지느러미와 꼬리를 통해 물의 흐름과 동력을 감지하는 것에서 영감을 받았으며, 잠수함이 수중에서 물고기처럼 자유롭게 이동할 수 있도록 만들어 주었다.

이처럼 인간은 자연계의 감각 능력에서 영감을 얻어, 인간의 한계를 뛰어넘는 기술적 진보를 이루어내고 있다. 그런데 여기서 의문이 생긴다. 그렇다면 우리는 기계를 통해 자연의 모든 감각 기능을 재현할 수 있을까?

사실 센서의 성능이 아무리 뛰어나다고 해도 혼자서는 모든 일을 완수하기는 어렵다. 레이더는 전방의 장애물에 대한 자세한 정보를 높은 정밀도로 탐지할 수 있고, 이를 근거로 주위 환경을 3차원으로 재구성할 수 있다. 그러나 단일 레이더는 시야가 좁아 색에 대한 정보를 얻을 수 없다. 반면에 RGB 카메라는 색채 정보를 감지할 수 있지만 심도를 직접 감지할 수 없다. 따라서 여러 센서가 완벽하게 통합했을 때 인간의 감각기관을 뛰어넘을 수 있다. 예를 들어 여러 대의 카메라와 레이더를 결합해 얻은 정보는 인간의 두 눈으로 얻은 정보보다 훨씬 풍부해진다.

또한 생물의 감지 시스템의 정교함은 ‘정보를 어떻게 감지하는지’뿐 아니라 ‘그 정보를 어떤 방식으로 처리하고, 관련 조직과 신경망이 어떻게 이를 조율하는지’에 달려 있다. 이 시스템은 신경 중추와 정보를 교환하고, 서로 협력해 복잡한 작업을 수행하게 한다.

결정
기계는 어떻게 결정을 내릴까?
우리는 기계도 사람처럼 유연하게 결정을 내릴 수 있기를 기대하지만, 현재의 컴퓨터와 인간 두뇌는 기반 구조부터 본질적으로 다르다. 튜링 머신의 설계를 보더라도, 컴퓨터는 수학적 계산의 과정을 모방하는 데 더 능숙하다. 기억 방식과 정보 처리 방식에서도 기계와 인간 두뇌는 뚜렷한 차이를 드러낸다. 인간의 뇌는 추론과 추상화에 능숙하고, 기계는 고속 연산과 대규모 데이터 저장에서 탁월한 능력을 발휘한다. 특히 인간의 뇌에는 ‘망각’이라는 특별한 기능이 있어서, 어떤 일을 잠시 잊더라도 언젠가 다시 떠올릴 수 있다. 하지만 기계는 이러한 기능을 가지고 있지 않다. 그래서 기계는 결정을 내릴 때 ‘의사 결정 모델’의 지원이 필요하다.

‘의사 결정 모델’은 무엇일까? 구체적으로 말하자면 기계는 결정을 하기 위해 특수한 ‘함수’를 학습해야 한다. 이 함수가 정확히 어떤 형태인지는 논외로 두고, 일단 하나의 블랙박스라고 간주해 보자. 기계는 현재 관찰한 상태 정보, 즉 우리가 앞서 말한 ‘감지’한 부분을 블랙박스에 넣는다. 그러면 블랙박스는 다음에 무엇을 해야 하는지 기계에게 알려 준다. 우리는 이러한 특수 함수를 보통 ‘전략’, 즉 ‘의사 결정 모델’이라고 부른다.

의사 결정 모델은 보통 다음 세 가지 측면과 밀접하게 관련된다.

1) 작업 목표 이것은 의사 결정의 출발점이자 귀결점이며, 에이전트가 도달해야 할 최종 목표를 정의한다.
2) 환경 상태 에이전트는 현재 자신이 처한 환경 상태 및 자신의 상태를 이해해야 하며, 이것은 의사 결정의 기초가 된다.
3) 자신의 능력 에이전트는 자신의 능력 범위를 명확히 파악해야 한다. 예를 들어 어떤 동작을 할 수 있는지, 이 동작들이 가져올 수 있는 효과가 무엇인지에 대해 알아야 한다.

의사 결정 모델을 구축하기 위해 머신러닝 분야에서는 다양한 방법을 발전시켜 왔다. 그중 ‘모방 학습(imitation learning)’과 ‘강화 학습(reinforcement learning)’은 각자 고유한 방식으로 기계가 의사 결정 기술을 습득하도록 돕기 위해 만들어진 두 가지 중요한 방법이다.

구체적으로 말하면, 모방 학습은 기계가 방대한 인간 의사 결정 데이터를 분석해 특정 상황에서 적절한 선택을 하는 방법을 학습하는 것이다. 모방 학습의 핵심 장점은 직관성이다. 기계는 처음부터 탐색을 시작할 필요 없이 전문가의 행동을 모방해 빠른 속도로 효과적인 의사 결정 전략을 습득할 수 있다. 물론 이러한 방법은 큰 제약이 따른다. 즉 기계가 모방 대상에 지나치게 의존해 전략을 깊이 있게 이해하는 능력이 부족해질 수 있다.

한편, 강화 학습은 보상과 처벌을 통해 기계의 행동을 유도하고, 기계가 끊임없는 시행착오를 통해 최적의 전략을 학습하도록 만든다. 이것은 인간이 경험을 통해 배우는 과정과 유사하다. 반면에 기계는 인간보다 훨씬 많은 대규모 데이터를 처리하고, 매우 짧은 시간 안에 학습할 수 있다. 강화 학습을 통해 기계는 복잡한 환경에서 빠르고 정확한 결정을 내릴 수 있고, 심지어 어떤 상황에서는 인간의 성과를 뛰어넘기도 한다.

행동
어떻게 ‘해낼 수’ 있을까?
‘체화된 지능’은 ‘체화’와 ‘지능’이라는 두 개의 단어로 이루어져 있다. 그중 먼저 ‘체화’에 대해 살펴보자.

동물, 특히 인간은 복잡하고 정밀한 과정을 통해 움직임을 조절하며, 이는 신경계, 근육계, 감각계가 서로 긴밀하게 협력해야 한다. 움직임을 제어하는 핵심 원리는 신경계과 근육계의 협동 작용에 있다. 신경계는 신호를 내보내 근육의 수축과 이완을 제어하고, 이를 통해 여러 가지 움직임을 만들어낸다.

움직임 조절 능력은 진화의 결과이다. 오랜 시간에 걸친 자연 선택을 통해 신체 구조와 움직임을 제어하는 시스템은 다양한 물리적 환경에 적응하도록 고도로 최적화되었다. 여기에는 단순한 근육 활동뿐 아니라 예측, 적응과 학습 등 복잡한 과정이 모두 포함된다. 이러한 제어 능력 덕분에 동물, 특히 인간은 변화무쌍한 환경에서 균형을 유지하고, 손과 눈을 정교하게 협응해 복잡한 수작업을 수행하며, 심지어 극한 환경에서도 생존할 수 있었다.

그러나 진화는 인간에게 요가 동작이나, 익스트림 스포츠 혹은 고도의 전문적 운동 기술까지 가르쳐주지는 않는다. 이러한 능력은 훈련과 학습이라는 완전히 다른 과정을 통해 얻어진다. 우리의 신경계와 근육계가 이러한 복잡한 운동을 수행할 수 있는 기초 구조를 제공해 주지만, 숙달되려면 의식적인 연습과 체계적인 훈련 프로그램이 필요하다.

예를 들어 요가 고수는 두 다리를 목에 둘러 걸친 상태로 교차할 수 있다. ‘요가의 아버지’라고 불리는 파탄잘리(Patanjali)의 말을 빌리자면, 이는 어떤 덩치 큰 동물의 사냥을 피하기 위한 것이 아니라 ‘생각의 파동을 멈추는’ 동작이다. 다시 말해서 요가 동작은 스트레칭을 위한 동작일 뿐 아니라 호흡 조절, 신체 각 부위에 대한 깊은 이해 및 동작의 매끄러움이나 유연성에 대한 정확한 파악과 연관되어 있다. 이러한 기술은 타고나는 것이 아니라, 수많은 반복 훈련과 경험을 통해 점진적으로 터득해 가는 것이다. 어떤 의미에서 이러한 학습의 과정은 우리의 타고난 생물학적 능력을 확장하고 뛰어넘는 과정이라고도 할 수 있다.

지능화 엔트로피 증가와 체화 내비게이션
인터넷과 사물 인터넷(IoT) 시대가 되면서, ‘연결’은 이미 사람들의 생활 속 깊숙이 파고들었고, 네트워크는 어디에나 존재한다. 하지만 문득 이러한 의문이 들지도 모른다. ‘연결은 정보를 교환하는 거 아닌가? 그렇다면 연결이 어떻게 인지에 영향을 주고 심지어 지능의 발전을 이끌 수 있다는 거지?’ 이러한 궁금증에 답하기 위해, 오랜 세월 동안 ‘체화 내비게이션’을 연구해 온 경험을 토대로 간단히 얘기해 보고자 한다.

- 연결은 인지를 전달한다
연결이 되어있지 않았을 때 감지와 인지는 어떻게 이루어질까? 당연히 관찰과 추측에 의지할 수밖에 없었다. 인간이 판단을 내리는 과정도 본질적으로 일종의 추론에 해당된다. 즉 관찰을 통해 얻은 모종의 신호와 자신의 인지를 결합해 판단을 내리는 것이다. 물론 감지에는 오차와 맹점이 있고, 인지에도 한계와 편향이 존재한다. 예를 들어 어둠 속에서 모호한 형체의 사람을 보았을 때 어떤 사람들은 공포 혹은 미신에 사로잡혀 그것을 ‘귀신’이라고 생각할 수 있다. 그러나 어떤 사람들은 이성적 판단과 분석에 근거해, 빛과 그림자 효과 혹은 착시 효과에 불과한 ‘정상적 현상’이라고 말한다.

마찬가지로, 지능형 로봇이 과일 더미에서 사과 하나를 찾는 작업을 한다고 가정해 보자. 장애물에 의해 시야가 가려질 수도 있고, 매우 비슷한 플라스틱 사과를 진짜로 오인할 수도 있다. 들어 올려 보니, 무게마저도 진짜 사과와 거의 같은 경우도 있다. 이러한 경우라면 그다음으로 냄새를 고려하거나 단면을 잘라 보지 않고, 일방적인 감지 혹은 인지만으로 진짜와 가짜를 구별하기는 어렵다.

그렇다면 만약 이 사과가 기계와 연결되어 움직인다면 어떻게 될까? 여기서는 모든 대상이 성실한 협력자라고 가정해 보자. 초기 연구에서 우리는 내비게이션 및 위치 결정에 관한 새로운 방법에 대해 모색해 본 적이 있다. 내비게이션 경로에 RFID(무선 주파수 식별) 태그를 부착해 경로 표식에 연결 기능을 부여했다. 이러한 태그들이 활성화되면, 고유 ID를 보내고 이를 바탕으로 정확한 내비게이션 정보를 제공할 수 있다. 이 방식은 학계의 큰 관심을 불러일으켰으며, 우리 연구팀이 사물 인터넷 loT의 노드 위치 추적 이론을 한 단계 더 발전시키는 계기를 마련해 주었다. 관심 있는 독자라면 우리 연구팀의 또 다른 저서인 ‘위치, 위치 결정, 위치 결정 가능성-무선 네트워크의 위치 감지 기술(Location, Localization, and Localizability-Location-awareness Technology for Wireless Networks)’ 안에 이 이론의 발전과 응용에 관해 자세히 소개하고 있으니 읽어 보기를 권한다. 실제로 많은 현대 실내 위치 추적 시스템은 모두 기준점 혹은 기지국 기반 연결 방식을 채택하고 있다.

RFID 태그는 크기가 작지만, 연결 능력은 내비게이션을 극적으로 효율적이고 정확하게 만들어 준다. 그렇다면 문득 이러한 생각이 들 수도 있다.

‘만약 지능형 로봇이 모든 상호 작용 대상과 연결될 수 있다면, 행동이 훨씬 더 단순하고 직접적으로 변하지 않을까?’

지능형 로봇은 인간에 비해 많은 장점을 가지고 있다. 인간은 주로 언어로 소통하며, 외국어는 차치하더라도 타 지역 방언은 이해할 수 없을 때가 많다. 다른 생명체나 사물과 직접 소통하기도 어렵다. 따라서 인간은 외부 세계와 소통할 때 지능형 로봇의 힘을 빌려야 한다. 반면에 지능형 로봇은 연결 매체, 통신 프로토콜, 대역폭 등을 통해 훨씬 더 강력하고 다양한 방식으로 연결될 수 있다.

또한 여러 지능형 로봇은 서로 인지 정보를 충분히 공유할 수 있으며, 그 결과 각 기계가 얻는 정보량은 더 커지고 행동 계획은 더욱 정교해진다. 이러한 집단 지능은 단일 개체의 지능을 분명히 뛰어넘는 수준이다.