한의대에 입학하기 이전부터, 그리고 입학후 한의학을 공부하면서도 끊임없이 저를 매료시켰던 한의학의 매력은 '전체성'이었습니다. 분리하고 쪼개어서 요소 (component)의 미시적 성질을 밝힘으로써 본질을 알수 있다는 환원주의(reductionism)에 맞서 요소 자체의 성질보다는 그들간의 관계와 상호작용에 주목하고 이를 통찰함으로써 대상의 본질을 이해할수 있다는 관점이 너무나 매력적이었습니다. 음양오행, 경락이론등이 바로 이런 시스템, 전체성에 대한 통찰의 결과물들이라고 생각되었고 이를 활용한 한의학은 환원주의에 기반한 현대 서양의학보다 우월하다고 생각했습니다.
하지만 막상 한의학을 공부해나가면서 이런 기대는 한의학의 이론과 현실의 괴리, 구체성의 부족 앞에 점점 어긋나는 것을 느꼈습니다. 훌륭한 철학과 경험을 가지고 있었지만 실제적인 활용에 있어서는 혼돈과 모호함 그 자체였습니다. 스스로 오의를 깨달았다는 자칭 고수들과 그의 추종자들이 넘쳐났지만 세월이 지나도 여전히 한의학은 모호했고 혼돈이었습니다. 교과서의 어디까지 믿어야 하는건지, 어느것이 실제이고 어느것이 이론일뿐인지, 정말 그렇게 작동되는 원리는 무엇인지.... 혼돈은 여전했고, 아무것도 나아진 것이 없었습니다.
누구는 여전히 전통적인 언어로 그 심원한 오의를 깨치려 하고
누구는 이론을 모두 갖다버리고 철저히 원전의 경험만을 이용하자고 했습니다.
하지만 이 둘다 극단적이거나 절름발이인 학문일 뿐 진정으로 추구해야 할 목적지는 아닌듯 싶었습니다.
한의학에 녹아있는 철학과, 이에 기반해 오랜시간동안 형성되어온 경험적 집단 지혜가
빠르게 변해가는 시대와 발맞추어 새롭게 이해되고 지속적으로 발전되어나가기 위해서는 과거 해왔던것 처럼 수천년의 경험을 또다시 기다릴수는 없다고 생각했습니다. 지금까지 발전되어온 방식과는 다른 과학적 방법론이 필요하다고 생각했습니다.
과거의 경험과 지혜는 정량적으로 계측되고 이해되어야 했고, 이를 바탕으로 새로운 발전을 지속적으로 만들어낼수 있어야 했습니다.
하지만 기존의 과학적 한의학 연구들은 이런 기대를 잘 만족시켜주지 못하는 듯 보였습니다. 언제나 '한의학은 너무 복잡해서...','복합처방의 성분들의 상호작용까지 밝히는건 도저히 불가능하니까..' 와 같은 대답이 돌아왔습니다. 환원주의에 기초한 과학의 프리즘을 통과한 한의학은 실제 한의사들이 생각하는 한의학 임상과는 너무나 괴리가 커서 연결되기 힘든 지식의 편린들로 보였습니다.
그러던 중 정량적인 수학과 물리학에 기반하고 방대한 양의 연산을 손쉽게 해내는 컴퓨터의 도움으로 자연계에 존재하는 각종 복잡한 시스템의 규율을 이해할수 있는 새로운 과학이 발달하고 있음을 알게 되었습니다.
복잡계 네트워크, 네트워크 과학, 시스템 바이올로지 등 다양한 이름으로 불리고 있는 이 새로운 분야들은 구체적으로는 그 방법론등에서 차이가 있지만 기본적으로 한의학에 숨어있는 '관계'의 법칙과 이를 통해 창발(emergence)하는 전체 계(system)의 규율을 이해하는데 매우 강력한 도구가 될수 있음이 명백해 보였습니다.
막연하게 이 분야에 관심과 동경을 가져온것은 벌써 10여년전의 예과시절로 거슬러 올라가지만 수리통계적 지식과 컴퓨터 능력의 장벽에 감히 발 들여볼 엄두조차 내지 못하고 아주 막연한 큰 그림만 오랫동안 그리고 있었습니다. 한의대 졸업 후 의과대학원에 진학하여 뇌영상 데이터를 이용하여 brain network를 분석하는 연구를 수행하면서 어느정도 이 분야에 대한 이해와 구체적 분석능력을 갖출수 있게 되었고 문득 한의학의 방제원리, 변증체계 등 다양한 분야에 복잡계 네트워크 이론을 적용하여 연구를 진행해볼 계획을 세워보니 부족한 지식과 능력이지만 지금의 수준으로도 충분히 익사이팅한 결과물들을 얻을수 있겠단 판단이 들었습니다.
아이디어를 모아볼수록, 한의학이야말로 네트워크 과학이 적용되기에 더 없이 훌륭한 대상이란 확신이 들었고 비록 대학원 박사과정생으로서 해야 할 다른 연구들이 많이 있음에도 불구하고 한의학도들과 함께 지식을 나누고 아이디어를 교환하고 실질적인 분석 결과들을 빨리 얻고 싶어 견딜수 없는 지경에 이르렀습니다.
마침, 같은 대학원에서 수학중인 000 선생님도 저와 만나기 전부터 오랫동안 네트워크 과학 분야에 관심을 가져왔던 터라 비슷한 생각으로 의기투합할 수 있었고, .., 000 선생님은 졸업후 000 생명과학과 대학원에서 분자생물학을 이용한 천연물 신약개발 연구에 전문적인 능력을 쌓아가고 있던 터라, 전문적인 학문간 융합이 필요한 이 분야에서 제대로 된 연구를 해볼수 있는 조건이 갖추어졌다고 판단했습니다.
물론 모임의 주축이 아직 박사과정의 대학원생들로서 연구역량이나 실행능력이 상당히 제한되어있지만, 이미 많은 경험데이터들이 축적되어있는 한의학의 특성과 컴퓨터를 이용한 분석, 그리고 아이디어가 가장 중요한 네트워크 과학의 특징 덕분에 지금으로서도 충분히 일을 진행해볼수 있는 상황이며 약간의 결과물을 축적한 이후엔 한의대 교수님들과 정식으로 컨택하여 임상, 실험 데이터들까지 포함한 연구를 진행할 수 있을것이라 예상하고 있습니다.
이렇게 만들어진 결과물들은 실제 한의학 이론과 괴리된 실험실용 데이터로 끝나지 않고 임상현장의 한의학에 영향을 미치고, 한단계 두단계 과학적으로 발전할수 있는 한의학 연구의 초석이 될수 있을것이라 기대합니다. 왜냐하면 복잡계 네트워크 이론을 통해 우리가 얻어낼수 있는 통찰은 수천년간 한의학이 추구하고 경험을 축적해왔던 '상호관계로 이루어진 전체' 그 자체이기 때문입니다.
이렇게 새로운 방법론과 패러다임으로 발전해나가는 한의학을 '시스템 한의학 (Systems Korean Medicine)'이라고 부르고자 합니다.
이 작은 시작이 그저 엉뚱한 한의학도들의 색다른 시도에서 그치지 않고, 한의학의 미래와, 더 나아가 현대의학의 인간에 대한 패러다임에까지 영향을 미칠 수 있게 되기를 꿈꿔봅니다.
…
라고 결의에 찬 출사표를 던지며 2011년 6월, 대학원 재학중 NeKo라는 연구모임을 시작했다.
(그리고 신기하게도 같은해 12월에 Nature에 시스템생물학을 중심으로 한의학을 재조명하는 기사가 실렸었다.)
벌써 14년 전의 일이다.
당시 멤버들은 이제 뿔뿔히 흩어져 각자의 자리에서 열심히 살아가고 있다.
반드시 그래야 한다고 기를 쓰고 억지스럽게 달려온건 아니지만,
결론적으로 모임의 창립자였던 나는 대학교에 랩을 꾸리고 내가 주창했던 비전에 따른 연구를 진행해오고 있다.
우여곡절이 있었지만 어쨌든 조금씩 성과를 내며 계속 나아가고 있다.
수년전에 이미 실질적인 연구를 끝냈지만 마무리를 짓지 못하고 끌어오던 한의학 변증의 수학적 해석(차원축소 프레임워크)에 대한 연구를 최근 기어이 수학 및 계산생물학 분야 상위 5.2%의 SCI 저널(Computers in Biology and Medicine)에 출판했다. 논문링크
팔강변증과 같은 한의학 이론과 상한론이라는 원전 텍스트 분석으로 한의학 분야 저널도 아닌 수학 및 계산생물학 분야의 상위권 저널에 출판했다는 것에 자부심을 느낀다.
새로운 관점으로 한의학 이론 연구를 하겠다며 포문을 열어제끼려던 이 연구가 지지부진 생각보다 시간을 끌며 사실 본격적인 후속 연구 진행이 힘을 받지 못하고 함께 지체되고 있었다. 이제 당당히 다시 본론을 이어갈 차례다.
아직은 미약하디 미약하지만 존재 하지 않던 방식의 연구, 완전히 새로운 관점의 개발이다.
우리 연구실에서 학문의 한 분야에서 역사를 만들어가고 있다고 생각한다.
근거 없는 지도교수의 비전을 믿고 꺾이지 않는 마음으로 결국 승리를 쟁취해낸 1저자들에게 고마움과 존경의 마음을 보내며, 이제 본론으로 나아가봅시다.
(2017년 계산신경과학자 Konradn Kording이 Plos computational biology에 매우 도발적이고 흥미로운 논문을 발표했다.
신경과학자들이 뇌를 이해하기 위해 적용하는 연구방법들을 오래된 8비트 게임기 분석을 시도했는데 작동원리(사실 우리가 이미 알고 있는) 파악을 전혀 할수 없었다는것.
"인간이 설계한 단순한 시스템에도 이 방법이 안먹히는데 훨씬 복잡한 뇌에 이게 먹히겠냐?"
논문 원문
학계에 상당한 반향을 일으켰었던 이 연구에 대해, 당시 내가 논문 내용을 소개하고 간단한 생각을 밝혔던 글이 있어 이곳에 옮겨와 게시함.
지금 시점에서도 여전히 유효한 내용이라 생각하고, 동시에 그간 신경과학계에도 분명 많은 변화가 있었으니 다시 한번 차분히 지금의 상황을 음미해보는 것도 의미있을 것 같다.)
...
#1
‘뇌와 마이크로프로세서는 다르므로 오바다’
라는 사람들에게.
‘there seems to be little reason to assume that any of the methods we used should be more meaningful on brains than on the processor.
라고 콘라드가 논문에서 이야기하고 있다.
내 생각도 같다.
‘컴퓨터가 이러이러하므로 사람 뇌도 이러이러할것이다'라고 주장하는 사람한테 ‘컴퓨터와 뇌는 다르므로 오바다’라고 하는건 적절하지만
‘이 방법으로 컴퓨터도 이해 못했으니, 뇌는 더 이해하기 힘들것 같다’라는 사람에게 할 수 있는 비판은 아닌듯 하다.
비판하려면 ‘칩 이해하는데 실패한 방법론이 더 복잡한 뇌신경망을 이해하는것엔 오히려 적합가능할’ 이유를 대야 하겠다.
#2
논문을 얼핏 보면 뇌과학의 현재 방법론을 모두까기하고 있는것 같지만 사실 들여다보면 마냥 그렇지만은 않다.
간단히 요약해본다.
1. 커넥토믹스
뇌세포 수준에서 신경망의 구조적 정보를 모조리 조사하는 연구. 칩의 커넥토믹스는 이미 덕후들이 밝혀놨으므로 비유하면 커넥토믹스는 이미 완성되어있는 셈.
콘라드는 여기에 자신들이 2015년 논문으로 낸 방법론을 적용하여 ‘cell type’ 분류를 시도함. (2015년 elife에 실린 논문으로 세포들의 연결성 정보와 세포체, 수상돌기의 위치 정보등을 활용하여 세포 타입을 예측할수 있음을 보였는데 여기에서도 동일한 칩에 이 방법을 적용한 결과가 있다. 웃긴건 이 논문에선 포지티브 데이터로 들어가있음)
결과적으로 사소한 수준의 트랜지스터 타입이 드러난 것일뿐, 실질적으로 칩의 기능을 이해하는 근처에도 못갔다고 평가(근데 이러면 2015년 elife의 데이터는 뭐가 뇌냐능;;).
2. lesion study
특정 신경세포나 영역 등에 손상을 주고 행동의 변화를 관찰하는 연구(그럼으로써 특정 세포나 영역, 혹은 유전자가 특정행동을 담당한다고 결론내리고 싶어함).
콘라드와 같은 신경정보학, 계산신경과학자들이 선호하는 방법론이라기보다는, 실험신경과학자들 사이에 광범위하게 이용되는 핵심적인 방법론.
트랜지스터 하나씩 손상시키면서 돈킹콩과 스페이스 인베이더를 이해해보려 했으나 당연히 잘 안되었고, 칩의 기능에 대해 심각하게 misleading함.
3. tuning property 조사
신경세포를 흥분시킬수 있는 자극의 레인지를 조사하는 전통적인 neural encoding의 방법론. 예를 들어 운동세포라면 다리가 어떤 각도로 움직일때 관심세포가 얼마나 발화하는지 조사하고, 각도에 대한 발화정도를 커브로 그린다. 기본적으로 개별 세포 수준에서 자극이나 행동 정보를 의미있는 수준으로 처리할것이라는 가정이 깔린것인데, 최근 비선형적인 신경집단의 다이내믹스를 강조하는 연구자들에 의해 가열차게 까이고 있다.
콘라드 역시 원래 이런 방법에 비판적인 입장이었을텐데, 분석 결과는 역시나 엉망으로 나옴. 의미있는 이해에 도움이 안됨.
4. 세포 발화의 시간적 상관성 분석
세포 발화 대신 트랜지스터 활동간 상관성 분석했는데 결과적으로 미스리딩함.
5. LFP(local field potential) 분석
신경세포들의 전기적 활동을 세포외에서 기록하는 방법으로, 두피 밖이 아니라 신경조직에 전극을 찔러넣어 기록한다는 점을 제외하면 기본적인 원리나 데이터 양상은 뇌전도(EEG)와 유사하다.
많은 뇌 연구들이 EEG로 얻은 전기활성 데이터를 주파수에 따라 분류하고 특정 인지기능에서 특정 뇌파가 얼마나 강한지 본다던가 하는 연구들을 하는데,
놀랍게도 트랜지스터도 인간뇌와 상당히 유사한 주파수와 파워의 분포, 진동등이 관찰됨. 그러나 우리는 트랜지스터가 단순히 epiphenomena로 그런 현상을 만들뿐, 실제 정보전달의 원리에 대해서 설명해주는것이 아니라는 것을 알고 있음.
나아가 뇌에 비하면 훨씬 단순한 칩 구조로도 충분히 복잡한 리듬이 만들어지는것을 볼때, 기존 뇌 연구들엥서 복잡한 뇌 리듬을 설명하기 위해 복잡한 진동자를 모델링하는 것이 뻘짓일수도 있다고 경고.
6. Granger casuality
뇌 네트워크 분석하는 연구자들이 뇌영역간 인과관계를 시간적 활성 정보를 이용해 추론하는 방법. 뇌영상이나 EEG 등을 이용하여 신경활성 정보를 기록하고 뇌 네트워크를 구성한후, 'A 영역이 B 영역을 활성화시켰다.’는 식으로 설명하게 됨.
프로세서에 적용해봤더니 (어찌보면 당연하게도) 회로 간의 영향을 일부 확인할수 있었다. 디코더가 레지스터에 영향을 주고, 레지스터가 어큐뮬레이터에 영향을 주는 등. 하지만 인과관계가 아닌것을 잘못 파악하는 경우도 있었고, 정보의 해상도가 너무 낮음(트랜지스터 수준 정보는 못준다).
7. Dimensionality reduction
신경세포가 백개 있다고 백개가 다 독립으로 활동하는게 아니기 때문에 백개 신경세포의 활동패턴을 이해하기 위해 100차원(100개의 좌표축)이 필요한것이 아니다. 이런 경우 차원축소기법을 통해 집단의 활동을 낮은 차원으로 표현할 수 있는데 빅데이터 기반의 신경과학에서 가장 주목받고 있는 기법으로 콘라드 역시 이런 방법의 중요성을 강조해오고 있는 사람중 하나.
Non-negative matrix factoriztion(NMF)라고, 아마존 책 추천같은데 많이 이용되는 기법을 적용했는데 나름 쓸만한 프로세서의 측면과 일치하는 차원이 몇개 나옴.
물론 논문에선 그 정보의 중요성이 엄청 중요한것은 아니므로 뇌연구에서도 차원축소의 결과를 확대해석해선 안된다는 말을 하고 있지만, 이어서 더 다양한 행동실험과 비선형적인 차원축소까지 더한다면 더 많은 것을 알수 있을 것이며 실험에 도움이 될것이라고 평가함. 내가 볼때 이 논문에서 가장 긍정적으로 보이고 있는 분석방법인것 같다.
전반적으로 콘라드는 우리가 이미 이해하고 있는 마이크로프로세서의 작동원리에 비해(가장 하부구조부터 위계적으로 올라가 거시적인 작동원리까지), 적용된 방법론은 오히려 잘못된 판단을 주거나, 피상적인 현상 정보 수준에 머물렀다고 판단하고 있다.
뇌 연구에서도 비슷한 일이 벌어지고 있는 것이라 예상하며 이는 아마도 설명가능한 ‘이론’의 부재에 기인하는 바가 클것이다(콘라드가 물리학자였다면 이 주장을 논문에서 더 강하게 했을 것 같은데, 데이터과학자에 가까운 포지션이라 그런지 크게 강조하는 느낌은 안듦. 어차피 지금 데이터 수준으론 좋은 이론 만드는것도 쉽지 않아보이긴 함 )
물론 콘라드는 뇌과학의 방법론이 무용함을 주장하는 것이 아니다.
논문의 말미에 더 개선된 lesion study에 대한 아이디어를 제안하고, 데이터분석기법의 발전이 필요함을 역설한다 (콘라드 전문분야다).
"Ultimately, the problem is not that neuroscientists could not understand a microprocessor, the problem is that they would not understand it given the approaches they are currently taking."
(박사과정 당시 에릭켄델의 '기억을 찾아서'를 읽고 한의학 전공자들의 현실과 에릭켄델이 이야기하는 정신의학의 역사에 상당한 유사성이 있다고 느꼈다.
정신분석학에 심취해 정신과의사로 커리어를 시작했지만 결국 평생을 바다달팽이의 분자수준 기전 연구에 투신한 에릭켄델은, 인간의 정신현상과 같이 복잡하고 추상적인 대상을 이해하기 위해 (당장은) 현상을 온전히 설명하기에 턱없이 부족해보이는 극단적인 환원주의적 접근이 어째서 반드시 필요한지, 자신의 일생을 통해 증명해냈다.
환원주의와 기계론적 접근이 결여된 전일론은
가설위에 가설이 추가되고 무너지고 또 추가되며
정작 한걸음도 앞으로 나아가지 못하는 허울좋은 구호일뿐임을
우린 이미 많이 보아왔다.
10년이 훌쩍 지난 글이지만 여기에 다시 옮겨서 게시해본다.
글을 쓰고 발췌문을 한의사들에게 공유하던 당시와 비교하면 현재 한의계 분위기가 그때와 많이 다르긴 하다. 그럼에도 여전히 한의학 임상에 있어 분자수준 연구는 아무런 기대할 것도 없는 그저 '기초'과학일 뿐이라고 생각하는 사람이 많다.)
...
사실 100년 전의 프로이트는 뇌의 해부학을 공부하며 뇌의 생물학적 신비를 풀고자 했던 의사이자 과학자였습니다. 하지만 당시의 기술수준으로는 뇌에 대해 구체적으로 알수 있는 것이 거의 없었고, 결국 임상적 관찰을 통해 세운 가설체계로 정신분석학을 완성합니다.
하지만 프로이트 역시 그의 학문체계의 한계점을 잘 알고 있었습니다. 정신분석학이 폭발적인 관심을 받고 있던 그의 생애 후기 저술에선 자신의 정신분석 이론은 이후 발전될 생물학적 뇌연구결과에 따라 수정되어질 것이라 예언했죠.
그의 예언대로 1900년대 초반부터 중반까지 세상을 풍미했던 정신분석학 이론은 이제 발전된 뇌과학의 발달과 함께 폐기되거나, 수정, 보완되고 있습니다. 물론 이러는 와중에도 물리적 실재에 기반한 생물학적 뇌를 애써 외면하며 형이상학적 정신분석 이론에 집착하는 사람들도 있습니다.
기억의 생물학적 기전 연구로 노벨상을 수상한 세계적인 석학 에릭 켄델은 1960년대 하버드병원에서 정신과 수련을 한 의사입니다. 정신분석학에 심취하여 인간의 정신을 연구하고자 하는 의사였던 켄델은 이드, 에고, 수퍼에고의 뇌과학적 실재를 찾고자 신경생물학 연구에 뛰어들었고, 추상적인 정신현상과 물질적인 신경세포간의 연결고리가 거의 전무했던 당시 상황에서 어쩔수 없이 극단적으로 환원적인 방식을 택하여 바다달팽이의 시냅스를 연구하였습니다.
임상적으로 화려한 꽃을 피웠던 당시의 정신분석학과 비교해볼때 실용적으로 거의 무의미해보이는 연구였지만 거기서부터 쌓아올린 그의 기억에 대한 연구는 이제 약물로 인간의 기억능력을 비롯한 정신현상을 조절하고, '기능적'이상이라고 생각했던 인간의 고차원적인 형이상학적 능력들을 물질적으로 해석하고 진단할수 있는 수준에까지 이르렀습니다.
지금의 정신의학은 더 이상 실체 없는 인문학적 추론 위에 기반하는 가설이 아니라, 보고, 검증하고, 보완하여 발전할수 있는 과학적 의학으로 변하고 있습니다.
하지만 정신분석학이 탄생한 이래 정신의학의 역사를 보면 이런 발전의 역사는 모두의 동의에 의해 순탄하게 이뤄진 것이 결코 아니었습니다. 오히려 대다수의 정신분석학자를 비롯한 정신의학자들은 물리적 실재에 기반한 생물학적 연구에 대해 무지했으며 외면해왔습니다.
그 와중에 켄델과 같은 선구자들이 환원적인 방법론을 통해 생물학적 기초를 한계단 한계단 쌓아올렸고, 그 계단이 충분히 높이 쌓여 이제는 추상적인 정신분석학 이론이 생물학적으로 해석되고 접목되어 이해되는 단계에 이른것이죠.
이제는 생물학에 기반한 뇌과학의 이론을, 정신의학의 임상에 도움이 안되거나 무관한 것이라고 말하는 사람은 없습니다. 바다달팽이로 시작한 최초의 기억 연구는 그렇게 보였을지 모르지만, 그 결과로 꽃피운 지금의 뇌과학은 전혀 상상하지 못한 학문으로 발전한것입니다.
에릭 켄델의 자서전인 '기억을 찾아서' 말미에서 정신의학의 역사와 생물학의 역사를 그의 경험을 바탕으로 개괄하고 있습니다.
정신분석학의 임상적 효용성에 집착하며 뇌의 생물학적 연구를 외면했던 정신분석학자들. 가설의 검증보다는 새로운 가설의 창출에 열을 올리며 진보를 멈추어버린 정신분석학자들. 생물학에 바탕을 둔 환원적 연구 성과의 당장의 미미함에 그 미래 가능성마져 단정지어버리고, 그들의 인문학적 연구방식에만 집착했던 정신분석학자들.
저에게는 지금 한의학과 한의사들이 처해있는 모습과 굉장히 유사해보입니다.
한의학을 공부하는 사람들에게 너무나 흥미로운 이야기가 될수 있을것 같아 한번 '기억을 찾아서'의 해당 내용들을 부분적으로 발췌해 올려볼까 합니다.
혹시 정신현상의 과학적 이해에 대해 관심 있으신 분들은 직접 일독해보시길 권합니다.
신경과학 비전공자가 보기에 다소 어려운 부분이 있을수도 있겠지만, 과학서적으로서 정말 손가락에 꼽을수 있는 명저라고 감히 추천할만 합니다.
20세기의 첫 10년에 빈에서 정신분석이 등장했을 때, 그것은 정신과 정신장애에 대한 혁명적인 사고방식이었다. 무의식적 정신 과정에 대한 이론을 둘러싼 열광은 20세기 중엽에 이를 때까지 가열되었고, 정신분석은 독일과 오스트리아에서 온 이민자들에 의해 미국에 전해졌다. 하버드대학 학부생이었던 나는 그 열정을 공유했다.
...
그러나 내가 정신의학 임상수련을 시작한 1960년에 나의 열정은 이미 한풀 꺾여 있었다.
...
나는 여전히 정신분석이 도입한 풍부하고 미묘한 정신관을 존중했지만, 정신분석이 경험적인 학문이 되고 자신의 생각들을 검증하는 방향으로 거의 진보하지 않았음을 임상 수련을 하는 동안 알고 실망했다.
또 하버드 대학에서 만난 많은 선생들에게도 실망했다. 그 의사들은 나처럼 인본주의적 관심에서 정신분석적 정신의학에 입문했으며 과학에는 거의 관심이 없었다. 나는 정신분석이 비과학적 단계로 퇴보하고 있으며 정신의학을 함께 퇴보시키고 있다고 느꼈다.
....
1950년대에 대학의 정신의학은 생물학과 실험적 의학에 두었던 뿌리의 일부를 포기하고 점차 정신분석이론에 기초를 둔 치료분야가 되었다. 그리하여 기이하게도 경험적 증거나 정신활동을 담당하는 기관으로서의 뇌에는 무관심했다.
대조적으로 이 시기 의학은 처음에 생화학에서, 그 다음에는 분자생물학에서 비롯된 환원주의적 접근법을 기초로 삼아 치료 기술에서 치료 과학으로 진화했다. 나는 의과대학에 다니면서 이 진화를 목격했고 그로부터 영향을 받았다.
정신분석은 환자의 정신적 삶을 조사하는 새로운 방법을 도입했다. 그 방법은 자유로운 연상과 해석에 기초를 둔다.
...
이 접근법은 대단히 새롭고 강력해서 프로이트뿐 아니라 지적이고 창조적인 다른 정신분석가들도 환자와 분석가의 정신치료적 만남은 정신에 대한, 특히 무의식적 정신과정에 대한 과학적 탐구를 위한 최선의 맥락이라고 오랫동안 주장할 수 있었다.
...
그러나 탄생 이후 60년이 흐르자 정신분석은 신선한 연구역량의 대부분을 잃어버렸다. 1960년에 이르렀을 때는 심지어 나까지 포함해서 누가 보아도 개별 환자를 관찰하고 그의 말을 주의 깊게 들음으로써 얻을 수 있는 새로운 지식이나 통찰은 거의 남지 않았다는 것이 명백했다.
정신분석은 그 야심에서는 역사적으로 과학적이었지만-정신분석은 항상 경험적이고 검증 가능한 정신과학을 개발하고자 했다-그 방법에서는 거의 과학적이지 않았다. 그 이론은 자신의 전제들을 재현 가능한 방식으로 실험하는데 실패했다.
사실 전통적으로 정신분석은 아이디어를 검증하는 것보다 산출하는 것에 더 뛰어났다. 그 결과 정신분석은 다른 몇몇 심리학 및 의학분야들처럼 진보하지 못했다. 내가 보기에 정신분석은 심지어 길을 잃은 것 같았다.
...
프로이트가 1894년에 행동에서 무의식적인 정신 과정의 역할을 최초로 탐구할 당시에, 그는 경험적 심리학을 개발하려는 노력도 병행했다. 그는 행동의 신경학적 모형을 구성하려 노력했지만, 당시 뇌과학의 미숙함 때문에 생물학적 모형을 포기하고 주관적 경험에 대한 언어 보고에 기초한 모형을 채택했다.
내가 하버드 대학에서 정신의학 수련을 받기 시작했을 때, 생물학은 고등한 정신 과정들에 대한 이해에서 중요한 진보들을 이루어 내고 있었다. 그 진보에도 불구하고 여러 정신분석가들은 훨씬 더 극단적인 입장을 취했다.
그들은 생물학은 정신분석과 무관하다고 주장했다. 생물학에 대한 경멸까지는 아니더라도 무관심을 보였던 것이다.
...
더 심각한 또 다른 문제는 정신분석가들이 객관적 연구에, 또는 심지어 연구자의 선입견을 통제하는 데 관심이 없다는 점이었다. 다른 의학분야들은 blnd experiment를 통해 선입견을 통제했다.
.......
정신분석가들은 치료적 상담에 대한 설명이 필연적으로 주관적이라는 사실을 고민하는 경우가 드물다.
정신의학 전공의 수련을 시작할 당시에 나는 정신분석이 생물학과 힘을 합하면 엄청나게 풍부해질 수 있으리라고 느꼈다. 또 20세기 생물학이 인간의 정신에 관한 오래된 질문에 답해야 한다면, 그 답들은 정신분석과의 협동 속에서 산출될 때 더 풍부하고 의미심장할 것이라고 생각했다. 그런 협동은 또한 정신분석에게 더 확고한 과학적 토대를 제공할 것이었다. 생물학은 정신분석의 핵심에 있는 여러 정신과정들의 물리적 토대를 규명할 수 있을 것이다.
다시 말해서, 무의식적 과정들, 심적 결정성, 정신병리에서 무의식이 하는 역할, 정신분석 자체의 치료 효과등을 생물학을 통해 물리적 차원에서 규명할수 있을 것이다. 당시에 나는 그렇게 믿었고, 지금은 더욱 강력하게 그렇게 믿는다.
......
다행스럽게도 정신분석학계의 모든 사람이 경험적 연구는 정신분석의 미래와 무관하다고 생각한 것은 아니었다.
내가 임상 수련을 마친 이후 40년동안 두 경향이 점차 힘을 얻었고 현재 정신분석 사상에 상당한 영향력을 발휘하기 시작했다.
한 경향은 증거에 기초한 정신 치료를 강조하는 것이다.
더 복잡한 두번째 경향은 정신분석을 새롭게 출현하는 정신생물학과 연계하려는 노력이다.
첫번째 경향을 주도한 가장 중요한 인물은 아마도 펜실베니아 대학의 정신분석가 에런 백일 것이다.
......
벡과 그의 조수들은 이 새로운 치료의 효율성을 평가하기 위해 위약(플라시보) 및 항우울증 약을 받는 환자들과 새 치료를 받는 환자들을 비교하는 통제된 임상 실험을 진행했다. 그들은 새로운 인지행동 치료가 경미하거나 웬만한 우울증 환자를 다루는 데 있어서 대개 항우울증 약 못지 않게 효율적이며, 일부 사례에서는 재발을 막는다는 점에서 약보다 우월하다는 것을 발견했다.
......
전통적인 정신분석과 달리 위의 네가지 단기 정신치료법들은 경험적 데이터를 수집하여 치료법의 효율성을 평가하는 데 쓰려고 노력한다. 그 결과 그 치료법들은 단기 치료(심지어 장기치료)가 실행되는 방식에 커다란 변화를 가져왔고, 정신분석을 과정과 결과에 대한 경험에 기초한 연구로 탈바꿈시키고 있다.
그러나 새로운 치료법들의 장기적인 효과는 아직 불확실하다.
......
과학적 입장에서 볼때 더 중요한 것은, 벡을 비롯한 증거 중심 치료법 옹호자의 대부분이 생물학의 실험 전통이 아니라 정신분석의 관찰 전통을 본향으로 삼는다는 것이다. 드문 예외가 있긴 하지만, 이 정신치료경향의 주도자들은 아직 관찰된 행동의 토대를 이해하기 위해 생물학으로 눈을 돌리지 않았다.
필요한 것은 정신치료에 대한 생물학적 접근이다. 정신역동적 생각을 검증하거나 여러 치료법의 효율성을 평가하는 생물학적으로 확실한 방법은 최근까지도 거의 없었다. 그러나 이제 효과적인 단기 치료와 뇌 영상화를 결함하면 바로 그 방법을 얻을 수 있을 것이다.
......
뇌 영상화를 이용하여 다양한 정신 치료의 성과를 평가한다는 생각은 강박장애에 대한 연구들이 보여주었듯이 불가능한 꿈이 아니다.
......
우울증 환자의 뇌영상은 대개 전전두엽피질의 배면(등쪽 면)에 활동감소가 있고 복면(배 쪽면)에 활동 증가가 있음을 보여 준다.
......
만약 프로이트가 <과학적 심리학에 관하여(On a Scientific Psychology)>를 쓴 1895년에도 뇌 영상화가 가능했더라면, 그는 정신분석을 아주 다른 방향으로 이끌었을 것이다. 그는 위 에세이에서 언급한 대로 생물학과 긴밀한 관계를 유지하면서 정신분석을 발전시켰을 것이다. 이런 의미에서 뇌 영상화와 정신 치료를 결합하는 일은 하향식 연구이며, 프로이트가 원래 계획했던 과학적 프로그램의 계승이다.
......
즉, 뇌영상화는 정신 치료들이 각각 별개의 뇌 속 메커니즘을 통해 효과를 발휘한다는 것을 드러낼 가능성이 있다. 따라서 정신치료들도 약과 마찬가지로 바람직하지 않은 부작용을 가질 가능성이 높다. 정신 치료들에 대한 경험적 검증은 약에 대한 검증과 마찬가지로 그 중요한 치료들의 안전성과 효율성을 극대화하는 데 기여할 수 있을 것이다.
......
정신분석의 아이디어들에 생물학을 적용하는 일은 현대의에학서 정신의학의 역할을 강화하고, 경험적으로 정초된 정신분석 사상이 현대 정신과학에 동참하도록 북돋을 것이다.
이 융합의 목표는 기초생물학을 추진하는 극단적 환원주의와, 정신의학과 정신분석을 추진하는, 인간 정신을 이해하려는 인본주의적 노력을 결합하는 것이다. 결국 뇌과학의 궁극적 목표는 자연세계에 대한 물리학적, 생물학적 연구들과, 그 세계에서 인간 정신과 인간 경험의 내밀한 결을 이해하면서 살아가는 거주자들을 연결하는 것이다.
랩탑에서 옛날 글 찾다가 7년전 사진을 발견했다.
랩 문 연지 2년째, 시애틀 Allen institute와 워싱턴대에서 열렸던 계산신경과학회 참석했다가 마운틴 레이니어 국립공원 놀러가서 찍은 사진.
신생랩 오픈하고 공격적인 마케팅으로 전국 한의대졸업생들을 끌어모아 무려 6명의 한의사출신 전일제 대학원생으로 구성된 랩을 꾸렸는데, 당연히 인생 첫 PI 역할이니 경험도 일천하고, 주변에 선례를 찾기 어려운 랩 형태였던지라 사실 무모하기까지 한 도전이었으나...
주변에 많은 분들이 좋게 봐주셔서 먼저 손내밀어 도와도 주시고, 나와 학생들도 정말 한눈 안팔고 열정과 진심으로 매진하다보니, 그래도 이제 한 사이클이 지난 입장에서 요란했던것이 부끄럽지 않은 성과 정도는 만든것 같아 참 다행이다.
사진 중 한명은 석사 마치고 임상으로 돌아가 얼마전에 박사학위를 받았다고 논문 전해주겠다며 연락이 왔고, 나머지 3명은 모두 지난 2년 사이에 정년트랙 교수가 됐다(그리고 사진에 없는 한명도 역시). 다들 내 연구실에서 혹은 졸업 이후에 어디가서 당당히 소개할만한 좋은 연구들 발표하고 교수가 되었으니 솔직히 이정도면 내 입으로 자랑해도 될만하지 않나 싶다.
의사과학자 양성 프로그램이나 MRC 같은 거 지원 한번 안받고도 이 정도 성과를 만들어온건데,
사실 한 연구실에서 한의사 출신 기초전공 대학원생을 이렇게 단시간에 대량으로(?) 길러내는게 믿기 어려운 일인지라,
몇년전 우리학교 부총장님이 우리 랩 대학원생 현황보고는 "아, 한의사들은 요즘 어려워서 의사랑 달리 기초의학 지원을 많이 하나보군?"이라고 했었다. ...??!!
"그게 아니라 한의사들도 의사만큼이나 기초전공자가 없는데요, 우리학교 저희 랩에만 이렇게 많은겁니다"라고 대답했는데 뭔가 석연찮은 표정을 지으셨던것 같다. 아마 '우리 학교가 경희대 한의대도 아니고 니가 뭔데 도대체?' 뭐 이런 생각을 하셨던걸지도 모르겠다.
내친김에 좀 더 자랑하자면, (내 실명으로 운영되는게 아니라 사실 아는 사람들이 거의 없지만) 벌써 10년 가까이 내가 만든 장학기금으로 전국의 한의사과학자 학생들의 모임과 활동을 지원해오고 있다. 아마 한의계 유일의 한의사과학자만을 지원하는 장학기금일거다. 내가 직접 운영하거나 관여하지 않는 형태이긴 하지만 이 장학기금을 바탕으로 한 활동이 더 커지고 좋은 영향력을 발휘해나갔으면 하는 바램이 있다. 요새 갑자기 이 장학기금 지원활동 어떻게 더 발전시킬수 있을지 생각을 자주 하게 되네...
아무튼 그런데,
한의계에서도 꾸준히 한의사과학자 육성에 대한 필요성과 방법 등에 대한 논의가 이뤄지고 하는데 나한테 관련해서 뭐 물어보거나 하는 사람은 여태 한 사람도 없었다. 내가 어떻게 학생들을 모집하고, 교육과 처우를 어떻게 해왔길래 중도 이탈 (거의) 없이 성공적으로 학위과정을 마쳤는지, 그리고 또 성공적으로 학계에 안착까지 시켰는지. 당연하게도 많은 부분은 내가 잘해서가 아니라 학생들의 성향과 능력, 외부여건등이 상호작용하는 과정에서의 행운 때문이겠지만 내가 수행한 전략과 방법론, 성공과 실패의 경험담들은 분명 흔치 않은 데이터일텐데 말이다.
그나저나 7년전 여름 우리 모두 다들 너무 파릇파릇하다. 대책없이 꿈만 크고 미래는 불확실했지만 사진 보니 잠시라도 돌아가고 싶네. 저때 참 행복했다 얘들아.
학위과정 때 당시로선 매우 복잡한 일련의 데이터 분석 코드를 완성하고서 기진맥진해하며 "나 정말 대단해. 그런데 다음에 또 이렇게 복잡한 작업을 다시 해낼 수 있을까?"라는 생각을 했던 기억이 난다.
처음이라 어려웠던것이지, 곧 그 정도의 복잡한 코딩은 프로젝트마다 일상적으로 해내게 되었다.
5년여전, 경험적 관찰들 이면을 관통하는 간결한 이론적 설명을 찾고 수식을 전개하고 시뮬레이션을 진행하면서 창의력이 폭발하는듯한 희열을 느꼈을 때, "나 정말 대단해. 그런데 내게 또 이런 순간이 올까" 라는 생각을 했던 기억이 난다.
역시 처음이 어려웠을 뿐이었나보다.
이번 여름방학은 5년전 느꼈던 나름의 희열이 무색할만큼 상상력과 창의력이 주체할수 없이 폭발한 방학이었다. 오래 끌던 논문을 마무리하고, 다소 흥분상태를 주체하지 못하고 두번의 해외학회를 포함해 다양한 국내외 학회와 세미나에 참석하여 발표하고 돌아다녔는데, 새로 접하는 내용마다 조금만 아이디어를 전개하다보면 이론/시뮬레이션 연구거리가 뚝딱 하나씩 만들어지는 경험들이 반복되었다. 덕분에 앞으로 기대감을 갖고 발전시켜볼만한 연구주제들의 핵심 스토리라인 4-5개의 윤곽을 완성했다.
AI 발전으로 인한 학습 & 연구 생산성의 폭발 덕이 컸다.
수식을 많이 쓰다보니 overleaf 띄워놓고, Gemini 2.5 Pro, GPT-5 thinking 왔다갔다 하며 주로 작업하는데
(그리고 물론 deep research 모드와 notebookLM으로 자료 검색 및 정리), 손으로 노테이션 하나하나 고민하며 전전긍긍 적어나가던 어려움 따위는 이제 있을수가 없다. 증명도 시키면 다 함.(바이브 수학, 바이브 모델링). 코딩도 당연히 바이브코딩. 무지하게 똑똑한 AI 조수를 데리고 작업하니, 지난한 자료조사, 익숙하지 않은 수식 전개과정에서 벽에 부딛히는 일 등으로 작업이 막히는일이 없고, 막히는 부분에서의 피로감으로 재미난 행위가 방해받지 않으니 중간에 이걸 끊지 못하고 계속 하게 된다. 밤새워 게임하고 코딩하듯, 밤새서 이론/모델링 작업을 계속하게 된다.
암스테르담 CCN(Cognitive computational neuroscience) 학회에서는 학회장에서 공부하고 맛잇는 저녁 먹는 시간 외에는 거의 매일 연구에만 매달렸다. 관광보다 이 작업이 더 재미있으니 어쩔수가 없었다. 마지막 돌아오는 날 하루 그래도 운하 유람선 타고, 시내 광장에 나가 궁궐 한번 구경하고 오긴 했는데 이정도면 충분하다고 느꼈다. 이런 재미의 경지가 있다니??
...
CCN 학회 자체에 대해서는,
개인적인 인상으로 이번 암스테르담 CCN은 작년에 비해 AI 쪽이 살짝 줄고, 인간뇌영상 기반의 cognitive neuroscience 주제가 보다 늘어난것 같았다. 올여름 피렌체에서 열린 CNS에서 좀 고생하고, CCN에 온 첫쨋날엔 사실 '아무래도 내년부턴 CNS 버리고 CCN만 올까...' 싶었는데, 문득 이 학회에선 low level에서의 이론적 모델링 연구가 거의 안보인다는 사실을 느끼면서 CNS가 좀 그리워지기도 했다. 여름방학에 유럽/북미 학회 두번 가는건 아무래도 무리인데 내년부터 어떻게 할지는 더 고민해봐야겠다. 내년엔 뉴욕이란다.
오랜만에 타 학교에 임용된 제자 만나서 잔소리 또 듬뿍 해주고, 서울대 차지욱 교수님, 성균관대 홍석준 교수님과 학회장 및 식사자리에서 본격 토크를 나눌수 있었던것도 큰 수확이었다. 역시 학회에서 같은 결의 연구를 하는 연구자들을 만나 친목을 다지는건 정말 건전하고 즐겁고 아름다운 풍속이다. 사진을 남겼어야 했는데 식사 내내 이야기만 열심히 나누다 타이밍을 놓쳤다. 두분 모두 한국의 NeuroAI를 이끌어나갈 분들이라고 느꼈고 조만간 내가 도움을 청할 일이 있기를 기대해본다.
일단 이렇게 두서없이 CNS @ 암스테르담 후기 끝
1.
한국인공지능학회 @ 평창 참석 (8/7-9)
올해부터 한국인공지능학회 학술이사로 힘을 보탤수 있는 기회를 얻었다. 아주 기쁜 마음으로 참석하여 여러 임원 교수님들께 인사드리고 공부도 열심히 하고 왔다. 객관적으로 많이 부족하지만 의료AI, NeuroAI 측면에서 한국 인공지능 분야가 발전하는데 미력을 보태볼수 있을거라고 생각하고, 진지하게 노력해보고 싶다. 정말 실질적으로 의미있는 기여를 하고 싶고, 개인적으로도 한 단계 더욱 성장할수 있는 기회로 만들고 싶다. 다양한 배경으로 이 주제를 연구하는 똑똑한 사람들에 둘러싸여 그들의 연구 얘기 듣고, 온통 공부 관련 이야기만 하니 성장하지 않을수 없을 것 같다(추천해주신데 누가 되지 않게 열심히 하겠습니다!)
학회에선 내게 지도를 받고 올초 교수로 임용된 제자도 만났다. 이틀 내내 틈만 나면 붙들고 함께 하던 연구들 발전시켜나갈 아이디어와 실행계획을 논의했는데 매우 프로덕티브한 시간이었고 오랜만에 비싼 한우 먹으며 즐겁게 회포도 풀었으나, 그가 다음번에도 같이 학회에서 보자고 할지는…조금 걱정된다.. 부디 즐겁고 행복한 시간이었길 바란다.
2.
CCN (cognitive computational neuroscience) 2025 @ 암스테르담 학회 참석 (8/11-)
작년 보스톤 MIT에서 열렸을 때 처음 참석해보고 너무나 인상적이어서 올해도 참석. 아직 본학회 전 Satellite 미팅 워크샵만 참석했지만 역시 이 학회 너무 좋다. 다루는 주제(인지계산신경과학이라고 하는데 결국 NeuroAI: Neurosciene + AI가 메인 주제인 8회째 신생학회), 행사 진행방식, 참여한 사람들의 밝은 열정 모두 좋다.
암스테르담은 거의 15년 전쯤 대학원생 때 왔던 적이 있는데…이렇게 깔끔하고 세련되고 감각적인 도시였는지 새삼 놀랐다. 그동안 유럽 여러 나라에 가보면서 어느정도의 비교 기준이 생기게 되어 더 그렇게 느껴지는것 같다. 학회가 열리는 암스테르담 대학교 건물도 매우 인상적이다. 보통 미국이나 유럽에 비해 우리나라가 깔끔하고 세련된 느낌으로 매우 앞선다고 느끼는데…암스테르담이 우리나라보다 더 앞선 느낌.
여기서도 내게 지도를 받고 올초 교수로 임용된 제자를 만났다. 8년전 내 랩의 내 학생들과 처음 해외학회 다니기 시작할 때부터 함께 해왔던 제자인데, 이제 이렇게 같은 교수가 되어 또다시 해외학회에서 만나니 감회가 새롭다. 어제 벌써 한바탕 연구 이야기를 했는데, 아직 학회 일정이 많이 남았으니 생산적인 논의들 더욱 많이 나누고 교학상장할수 있는 시간이 되었으면 좋겠다. 반성같은건 없음…
3.
지난달 피렌체에서 열린 CNS 학회 다녀오면서 하이젠베르크의 ‘부분과 전체’를 읽었다. 인류 역사에 몇번 없었던, 최고의 지성들이 인류 문명을 한단계 도약시키던 그 현장들, 영웅들의 고민과 행동, 토론들을 보면서 많은 영감을 받았다. 농담이 아니고 진짜 그 영감의 영향으로 지난 몇주간 기존 연구들의 후속 연구에 대한 핵심적인 이론전개와 모델개발에 몰입하고 메달렸는데…흥미진진하고 아름다운 결과들을 만들어낸것 같다. Nature comm. 논문의 머신러닝 레벨의 이론과 프레임워크를 보다 생물학적인 모델로 연결하는 작업을 했고, 또 이 과정에서 얻어진 노이즈 모델링에 대한 경험을 한약 복합성분 상호작용 연구로 확장해서 몇년전 진행하다 멈춰있던 네트워크 약리학 기반 연구를 새롭게 발전시켰다.
한의학 주제 연구로 한빛사급은 한번 넘어봤는데 이제는 그냥 한빛사급을 넘어 더 높은 수준까지 가보고 싶다. 어쩌면 이걸로 가능하지 않을까 꿈을 꾸기 시작했다. (한의학 무시하지 마라!).
시뮬레이션을 진행하고, 실제 약물/동물실험 결과를 얻어 논문화하는데까지 시간이 좀 걸리겠지만…일단 이걸 들고 있으니 내 마음이 매우 부자다. 부자의 마음으로 또 똑똑한 사람들 모여있는 학회에 와있으니 이게 뭐랄까…매우 마음이 풍성하고 당당하면서 공부도 더 재밌다.
지난번 학회 출장 독서 경험과 그 효과를 한번더 기대하며 이번에는 이언 해킹의 ‘우연을 길들이다’를 들고 왔다. 오는 비행기에서는 사실 진도가 거의 못나갔는데, 귀국 전까지 최대한 음미하고 또다른 영감들을 받기를 기대해본다.
이탈리아 피렌체에서 열린 계산신경과학회에 신입생 2명을 포함해 5명의 학생들과 함께 다녀왔다.
학회 말미에 멤버 미팅에서 회장님이 한국인 참석자 수를 특별히 언급하며 글로벌한 학회였다고 자축하고 다른 멤버랑 이걸로 뭐라뭐라 이야기도 나눴는데 제대로 못들었다. 우리랩이 큰일한거라고 말하고 싶었으나…물론 내게 그런 말할 기회는 없었음.
#1
현지 도착한 바로 다음날 엘리베이터 추락 사고를 당했다.
애어비앤비에 짐 풀고 구경좀 하러 첫 외출하는 중, 빈티지 엘리베이터에 한도무게를 넘어 탑승했고(…), 경보음같은 것도 없이 문이 열린채로 엘리베이터가 그대로 하강(추락인지, 하강인지 불명확하나 자유낙하 속도에는 못미쳤던듯). 다행히 안전장치가 작동해 층간에서 멈췄고, 땀을 뻘뻘 흘리며 2시간여 갇혀있다가 소방관들이 출동해 엘리베이터 천장을 뜯어내고 구출됨
땀을 비오듯흘리며 엘리베이터에 6명이 팩킹된채로 구조를 기다리는 동안 유머와 여유를 잃지 않으려 모두 애썼으나, 소방관들이 이것저것 시도함에도 구조가 여의치 않고, 결국 전기톱으로 천장이 갈려나가고, 온몸에 상처를 입으며 지붕으로 탈출할땐 진짜 재난영화 주인공 같았다.
우리 모두 성인이긴 하지만, 대학원생 5인 인솔하고(?) 나온 지도교수로서 매우 미안하고 참담한 기분이었다.
그럼에도, 이렇게 우리의 아름다운 추억과 동기부여, 낭만의 기회를 날려버릴수는 없기에 금새 회복하고 열심히 공부하고, 맛집 찾아다니고 관광도 하려 노력함.
아직 사건이 모두 끝난 것은 아니지만, 다행히 아무도 안죽고 큰 부상 없이 학회 일정 잘 소화했다는걸로 무한히 감사하다. 피렌체 소방관분들, 응급구조사분들 감사합니다.
#2
오자마자 재난상황을 겪어 멘탈이 살짝 나간 상태에서 인증평가 업무로 한국과 계속 연락하며 행정업무 처리해내고(gemini 2.5 pro 고맙다!) 이렇게 정신없는 와중에 하필 피렌체 도착한 이틀 정도가 그곳에서도 기록적인 폭염이라 뭐 여러모로 온전히 학문의 세계에 빠져들기가 버거웠다. 포스터 세션에서의 커뮤니케이션 비중이 매우 큰 학회인데 포스터에서 떠들 에너지와 시간이 부족했다.
그래도 Konard Kording, Sara Solar 등의 초반 키노트 강의가 매우 훌륭했고, 다행히 신입생들도 어느정도 익숙한 내용이었는지 크게 영감을 받은것 같았다.
도발적인 질문을 잘 던지는 Konrad Kording은 이번에도 기존 신경과학에 대한 여러가지 비판적 통찰과 함께 전통적인 과학적 접근이 아닌 machine science에 대해 어필했는데, 대략 이해한바로는 기존 과학에서 인간이 가설 세우고, 이를 검증하기 위해 실험하고, 이로부터 인과관계 기반 메카니즘을 밝히겠다는 게 신경과학에서 상당히 어렵다는 것. 대신 방대한 데이터로부터 똑똑한 기계(AI)가 데이터를 설명하는 모델을 만들고 우리가 이걸 이용하는 방법이 가능하니 그 길을 추구하자는 것 같았다.
이런 방향으로 논의를 이끌어가는 와중에 기전(how)을 밝히는 것에만 가치를 두는 기존 과학계를 ‘fundable neuroscience’라고 신랄하게 비판하며, how보다 why에 해당하는 normative 측면도 언급하여 매우 반가웠다. 우리 최근 논문에서도 리뷰어들에게 이 부분을 설명하는 게 너무나 힘들었었기에(우리 논문에선 how보단 why에 촛점을 맞추고 있다구요~!!)
실제로 실험가들이 실험하면서 발견한 재밌는 결과를 얻은 후, 과학자들의 관습과 기대에 맞추기 위해 자신의 결론을 가설로 제시하고 이를 검증한척? 논문을 쓰는 상황을 비판하면서 칼 다이세로스의 최근 빅페이퍼를 예시로 저격하기도 함.
Sara Sollar의 neural manifold 강의는 늘 그렇듯 매우 훌륭했고, 뒷 부분에선 매니폴드 데이터의 CCA(canonical correlation analysis) 기반 alignment를 통해 BMI(brain machine interface) 과제를 원숭이 간에, 심지어 원숭이에서 훈련한 데이터로 인간에까지 적용하는 최근 성과를 소개했는데 인상적이었다.
#3
새삼 크게 느껴졌던 점. 메인 학회는 어딘지 모르게 너무 유럽 커미티 중심의 로컬학회 느낌 + 주니어들에게 기회를 주는 차원에서 다소 덜 집중되고 방만한 발표가 이어지는 듯했고, 본 미팅 이후에 이어지는 workshop 에서 주제별로 진짜 글로벌하게 쟁쟁한 연자들이 모여들어 치열하게 더 알찬 시간을 가지는 것 같다(이 사람들은 본 학회엔 아예 얼굴도 안보였던것 같음).
종일 진행된 NeuroAI workshop에선 주옥같은 발표들이 이어졌는데 완전히 새로 알게 된 연구내용과 인물들도 있었고, 이미 랩에서 저널클럽해가며 익숙한 연구자들도 몇명 있었다. 내 연구와 밀접한 관련이 있는 연구를 하는 쟁쟁한 논문의 연구자들을 실제로 보게 되어 매우 반가웠는데, 나도 나름 내 연구를 네이처컴에 출판했으므로(!), 자신있게 다가가 나를 소개하고 토론을 할수 있었다(유치하지만 사실임). 어차피 학회라는게 사람 모이는 곳이고, 나도 이제 중견연구자로 접어드는데 국내파라고 언제까지나 포스터세션에서의 일회성 커뮤니케이션 정도로만 머물수는 없을 것 같고, 더 높은 수준의 PI 급 연구자들과 밀접한 관계를 만들어나가며 상호작용해야 의미가 있을것 같다는 생각을 하고 있었는데, 이번 학회에서 크진 않지만 약간의 성과는 있었던 것 같다.
#4
NeuroAI 워크샵이 만족스럽긴 했지만, 보다 본격적으로 NeuroAI 접근을 추구하는 CCN(cognitive computational neuroscience) 학회와 비교가 되는것도 사실. 다음달 CCN에도 참석 예정인데, 아마도 매년 여름마다 두 학회 모두 정기적으로 참여하는 것은 쉽지 않을터라…장기적으로 내가 어떤 학회에서 더 네트워크를 만들어나가고 발전할수 있는 기회를 만들수 있을지 고민해봐야 할 것 같다. CCN에 아무래도 북미 연구자들, 그리고 AI 쪽 연구자들이 더 많이 참여할텐데 역사가 짧은 학회인 대신 이 부분은 분명 장점이 될것 같다.
#5
엘리베이터 사고로 일정이 꼬여 기대했던 대표적 관광지는 거의 포기했고 자그마한 갈릴레오 박물관에서만 3시간을 보냈다. 갈릴레오가 진짜로 만들어 썼다는 망원경이 전시되어있었고!(사진), 엽기적이지만 갈릴레오를 흠모한 추종자들이 그 망원경을 만졌을 갈릴레오 손가락을 사체에서 몇개 잘라냈다는데 그 중 중지가 전시가 되어있었다(…). 갈릴레이가 실험한 사이클로이드 체험관도 있어 매우 신났다(동영상 참조).
갈릴레오 박물관이긴 하지만 13세기 메디치가문 무렵부터 르네상스를 거쳐 이어지는 과학기술 박물관이라고도 할수 있었는데, 당시 귀족들의 고급취미로 실험과학이 대유행(?)했던 구체적 사례들을 보면서 여러가지 생각이 들었다. 요즘의 돈많은 카메라, 오디오, 시계 덕후들이 덕질하는것과 본질적으로 비슷한 상황이 아니었을까 싶은데, 그렇게 생각한다면 왜 그렇게 실험장비가 예술적으로 우아하게 생겼는지도 이해가 될 것 같았다. 그렇게 수세기동안 수많은 덕후들의 덕질을 바탕으로 쌓아올려진 서양과학의 문화적 자본이라는게 분명 우리에게 없는 부분인것 같아 매우 부럽기도 함.
이상두서 없지만 CNS25 학회 나름의 후기 끝.
내가 쓴것 같이 맘에 드는 글을 발견했다.
Breaking the barrier between theorists and experimentalists
"실험을 먼저 수행한 후 사후적으로 설명을 덧붙이는 접근법의 문제점은, 내가 흔히 “무작위 걷기 과학(random walk science)”이라고 부르는 현상으로 이어진다는 것이다. 가능한 실험의 공간이 너무나 넓기 때문에, 연구자들이 어떤 가설을 검증하려 하는지 명확한 아이디어가 없으면 최근 수행한 실험들에 근거하여 특이한 방향을 임의로 선택하게 된다. 각각의 연구자들이 이렇게 임의로 방향을 선택하기 때문에, 그들이 집단적으로 움직이는 방향은 사실상 무작위적이고 작은 범위에 머무르게 되며 결국 크게 발전하지 못한다. 놀랍게도 많은 과학자들이 이것을 나쁘다고 생각하지 않는다. 특정한 목표 없이 많은 양의 사실들을 축적하는 것이 목적이라면, 무작위 걷기 과학은 오히려 훌륭하기 때문이다."
"현재 무작위 걷기 과학에 대한 열광은 이론(theory)을 실험 연구의 안내자로 보는 가치를 낮게 평가하는 과학 문화에서 비롯되었다. 이론가들은 보통 자신들만의 세계에 갇혀 소수의 실험가들만이 이해하고 실제로 사용하는 일은 더더욱 드문 계산 모델을 만들며 일한다. 가끔씩 실험가들은 연구비 지원서를 쓸 때 이론가들을 잠시 끌어들여 분위기를 낸다. 그러나 일단 실험이 시작되면 이론가들은 빠르게 잊힌다. 실험가들이 정말로 난처해졌을 때만 데이터를 설명하기 위해 이론가들에게 조언을 요청할 뿐이다."
"하지만 곧 대부분의 학생들에게 가장 어려운 부분은 개념적인 부분이라는 것을 알게 되었다. 즉, ‘계산 모델(computational model)이란 도대체 무엇인가?’라는 질문이었다."
"내가 학생들에게 제시한 핵심 답변은 이렇다. 계산 모델이란 특정한 문제를 해결하는 알고리즘을 통해 시스템의 기능을 설명하는 것이다. 이는 신경 시스템이 진화 과정에서 해결하도록 선택된 문제의 종류는 무엇이며, 시스템이 알고리즘을 구현하는 데 사용하는 메커니즘이 무엇이고, 데이터를 이용해 그런 메커니즘의 증거를 어떻게 찾을 수 있는지를 고민해야 함을 의미한다."
"대부분의 학생들은 실험 우선(experiment-first)의 사고방식에 너무 깊이 빠져 있었기 때문에, 계산적 관점에서 이론적인 질문을 제기한다는 개념 자체가 생소했다. 많은 학생들에게 '계산(computation)'이란 그저 데이터를 처리하는 소프트웨어를 의미할 뿐, 뇌가 어떻게 작동하는지에 관한 이론이 아니었다."
"현대 신경과학은 (특히 첨단 머신 러닝 알고리즘과 같은) 분석 도구들이 충분한 데이터를 입력하면 뇌의 조직 원리를 알아낼 것이라는 깊은 믿음을 갖고 있다. 그러나 내가 다른 곳에서 주장했듯이, 분석 도구만으로는 결코 목표를 달성할 수 없으며, 가장 큰 제약은 개념적인 측면에 있다. 즉, 우리가 뇌에서 찾아야 할 계산의 종류는 무엇인가? 우리가 무엇을 찾고 있는지 모른다면, 아무리 정교한 분석 도구를 사용해도 찾을 수 없을 것이다.
나는 학생들에게 구체적인 모델을 만드는 것보다 명확한 이론적 질문을 제기할 수 있게 되는 것을 수업의 목표로 변경했다. '먼저 분석하고 나중에 질문을 던지는' 방식을 도전하고자 했던 것이다. 이 작업이 수업의 대부분을 차지했다."
계산적 모델에 대한 '개념'이 중요함에 100% 공감한다.
퓨리에 분석이 뭘하는 건지 기본적인 개념이 있으면 그 수학적 원리를 몰라도 도구로 활용할수는 있다. 딥러닝 예측모델의 디테일을 몰라도 개념만 있다면 내 데이터에 적용해볼 수는 있다. 실제로 이런 도구로서의 개념들은 상대적으로 쉽게 이해되고 활용된다.
하지만 도구가 아닌 연구 주제 자체에 대한 계산적 모델의 개념은 보다 어렵다.
신경집단의 고차원 공간이 매니폴드라는게 무슨 의미인지,
입력을 고차원 공간으로 프로젝션하는 신경망 회로가 왜 일반화에 어려움을 겪을수 있는 것인지,
신경세포집단에 분산표현된 정보가 직교함으로써 서로간에 간섭하지 않을수 있다는게 어떤 의미인지,
low-rank network가 저차원 매니폴드의 다이내믹스를 만들어낸다는게 무슨 말인지,
이런 종류의 이론적 개념들은 그 의미를 모르면,
그 개념을 바탕으로 하는 질문을 던지거나, 그 질문에 어떤 실험데이터로 답할수 있을지 계획을 세울 수 없다. 심지어 이에 답하는 연구가 왜 중요한지 조차 공감할 수 없다.
신경과학자가 모두 신경활성공간의 매니폴드와 고차원 공간의 일반화 문제를 풀어야 한다는것이 아니라, 디테일한 분자기전 못지 않게 중요한 문제들이 신경과학을 주도적으로 이끌어가는 실험가들의 관심에서 배제되고, 중요하게 다뤄지지 못하는 것이 문제라고 생각한다.
2013년 시작된 Brain Initiative 이후 분명 세계적 분위기가 많이 바뀌긴 한것 같지만 여전히 실험가와 이론가 사이의 벽은 매우 두텁고 소통은 어려운것 같다.
결국 답은 양 분야에 어느정도의 전문성을 겸비한 차세대 신경과학자 교육에 있다고 생각한다.
실험물리학자가 수학을 바탕으로 한 물리학의 정량적 이론을 이해하고, 이에 대한 실험을 수행하듯, 차세대 신경과학자(특히 시스템 신경과학자)는 선형대수학과 확률, 통계적 학습이론을 이해하고 이에 대한 실험을 수행할 수 있을 것이다.
이 책 정말 물건이다.
이론과 실무를 겸비한 저자의 깊은 내공과 인사이트, 머신러닝 곳곳에서 선택된 맛깔나는 주제들, ai는 쓰기 힘들 살아숨쉬는 문체까지…
지하철 들고 댕기면서 흥미진진한 소설책 보듯 읽고 있다. 진부한 설명은 하나도 없다.
그런데, 5점 만점에 6점 주고 싶은 흥미진진한 책이지만 소프트맥스와 시그모이드 설명은 ‘굳이 이렇게 사촌도 아니라고 할것 까지야?’ 싶다.
나도 강의할때 소프트맥스가 시그모이드의 다차원 확장판이라고 설명한다. 그냥 말이 그렇다는게 아니라 실제 수학적으로 그러함을 간단히 확인할 수 있다(사진)
저자분은 애초에 확률분포를 만들기 위해 도입된 softmax와 달리 sigmoid는 비선형을 만들고 미분가능성을 위해 도입된 것으로 애초에 도입 의도가 다르다고 하는데, 인공신경망의 역사만 놓고 보면 그래보일지 몰라도 원래 sigmoid 함수를 먼저 활용한 통계학의 logistic regression에선 애초에 sigmoid 함수가 실수범위의 아웃풋을 확률로 해석할수 있는 범위로 변환하는데 사용되었다. 그러니까 softmax도 아웃풋을 확률처럼 만들기 위해 고안된 것이고, sigmoid도 (ai 분야가 아닌 오리지날 통계학 분야에선) 아웃풋을 확률처럼 만들기 위해 이용된것. 그리고 둘이 일반화 관계라는 것은 수학적으로도 확인 가능하다.
참고로 1950년대 세상을 떠들썩하게 한 최초의 인공신경망 perceptron은 비선형함수로 step function을 썼는데 이후 한참 뒤에야(80년대?) 시그모이드 함수로 교체되었고, 알고보니 perceptron with sigmoid function은 이미 통계학계에서 1940년대 발명된 로지스틱 회귀랑 같은 꼴이었다.
(앞선 글 '음양오행, 어떻게 할 것인가 -1'의 반응에 대한 답변 및 추가글)
#'앞으로의 연구는 음양오행에서 힌트를 얻어와 현대과학적으로 이루어져야 한다'는 의견에 대하여
-> 맞습니다. 한의학의 전통적 이론과 이들이 바탕하고 있는 소박한 언어체계는 더 정밀하고 정량적인 현대과학적 모델이 한의학 임상경험을 더 효과적인 방식으로 적절히 설명해내지 못하는 상황들에 '한해' 도구적 효용을 갖습니다. 다만 아직 이에 해당하는 상황이 상당히 많고, 여전히 많은 전통이론과 모형들이 실제 임상현장에서 제법 잘 작동하므로 전통이론의 교육이 이뤄져야 한다는 입장입니다.
동시에 이 이론들을 더 정확하고 예측가능하고 강력한 과학기반 설명으로 업그레이드하려는 노력을 열심히 해야합니다. 한의학은 양방과 달리 전세계의 우수인력들이 알아서 그런 작업을 해주진 않으니 한의학 전공자 중에 의과학적 연구역량을 갖춘 전문 연구자가 많이 배출되기를 희망합니다.
# "음양오행은 환원주의에 바탕을 두고 있지 않다"는 의견에 대하여.
-> 맞습니다. 중국을 중심으로 한 동북아시아는 현상 이면의 실체(플라톤의 이데아든, 기독교의 신이든, 헤겔의 절대정신이든)를 밝히려는 형이상학보다는 현상세계 내에서의 실용성과 실천에 보다 집중하는 경향이 강했습니다. 동양고대의 대표적 사상중 하나였던 음양오행이론이 분석적, 환원주의적 사고에 기원을 두고 있지 않은것도 맞는 말입니다.
하지만 과거 한의학의 경험과 이를 활용하기 위해 도입된 이론체계가 특정한 사고방식에 기반을 두고 있었다는 사실이, 앞으로도 한의임상경험의 가치를 극대화하하기 위해 그 방식을 따라야 한다는 결론으로 이어지진 않습니다.
중국에 최초의 노벨상을 안겨준 투유유 여사의 알테미시닌은 1500년도 더 된 갈홍의 주후비급방에 실린 학질치료제 청호에서 나왔습니다. 이미 오래전부터 한의학에선 말리라이치료제를 치료하기 위해 청호를 상온추출해서 써온것입니다. 하지만 갈홍의 방식만으로는 낮은 추출률과 정확한 용량설정의 어려움, 일관된 함량 컨트롤의 난점등으로 알테미시닌처럼 강력한 효과를 낼수 없었습니다. 갈홍의 임상경험이 비록 현대적 약리학이나 병태생리에 바탕을 두고 있지 않지만, 환원주의의 분석과학을 만나 청호의 위력은 x1000 으로 강화되었습니다. 수많은 사람을 구했고, 개발자에게 노벨상의 영예까지 안겨줬죠.
음양오행의 시스템적 사고, 역동적 평형에 대한 통찰, 범주적 사고 방식이 환원주의에 바탕을 둔 분자생물학이나 분석화학에서 태어나지 않았다는 것이, 이들 새로운 방법론을 적용할 필요 없다거나 적절치 못한 방향이라는 결론으로 이어질 필요는 없습니다. 나무보다 숲을 보려는 시스템적 사고가 나무를 자세히 보게 해주는 환원주의적 사고와 융합함으로써, 나무와 숲을 동시에 잘 보는 더욱 강력한 사고를 만들어낼수 있습니다.
이미 현대의 시스템생물학, 복잡계 네트워크 과학, AI와 한의학이론과의 융합이 이런 가능성들을 보여주고 있습니다.
다음은 이와 관련하여 제가 예과1학년 수업시간에 강의하는 내용들입니다. 여기에 간단히 슬라이드(사진)와 함께 옮겨봅니다.
한의학을 음양오행으로 더욱 가열차게 발전시키든, 분석화학으로 쪼개서 이해하든, 뭐가 됐든 우리 논의의 본질은 '한의학이 더욱 강력해져서 인류의 건강에 기여'하는 것이어야 한다고 생각합니다. 구체적으로는 한의학이 가진 특장점 -시스템적 관점과 경험, 그리고 맞춤의학적 관점과 경험(한의학에는 관점과 말만 있는게 아니라 실천적인 각론이 갖추어져있죠), 혹은 뭐가 됐든 한의학의 특장점을 더 잘 발휘할수 있게 해준다면 그게 맞는겁니다. '음양오행에 우리민족의 혼이 담겨있어서', 혹은 '성분으로 설명하면 더 폼나보일 것 같아서' 등이 기준이 될수는 없겠죠.
음양오행을 포함한 전통한의학의 이론체계를 한번 평가해봅시다.
이미 지난글에서, 그리고 이번 글의 첫번째 답변에서 밝혔다시피 전통한의학의 많은 이론과 용어체계들이 현재에도 여전히, 인체라는 복잡계와 복합성분 한약이라는 복잡계의 상호작용을 연계하는데 상당히 효과적으로 작동합니다. 한열허실조습등의 은유적 표현들로 인체의 증상을 패턴화하고, 청열, 온리, 보간신, 자윤, 조습 등의 (역시나 은유적인) 약물에 대한 패턴분류를 바탕으로 적절한 치료제를 매칭합니다. 많은 한약들의 유효성분과 분자수준 작동기전이 연구되고 있지만 실제 한약 투여시 일어나는 복합성분-다중표적 상호작용의 극히 일부분만을 단편적으로 이해할수 있을 뿐입니다. 한약의 현대과학적 연구성과를 공부하고, 심지어 직접 연구하는 한의사들조차도 실제 한약을 처방할때 기존 한의학 이론을 적절히 활용하고 있는 이유입니다.
하지만 동시에, 전통적인 이론들은 많은 한계를 갖고 있습니다. 분석적 환원주의, 정량적이고 객관적인 방법론에 기반하지 않는 전통적 이론체계가 지난 2천년간 다듬어져온 방식으로 얼마나 더 발전되고 강력해질 수 있을까요?
"전일론적 관점이 결여된 환원주의적 접근의 한계는 명백하다.
그러나,
환원주의에 기반하지 않는 전일론적 접근은 공허하다."
"개별특성을 고려않는 획일화, 표준화의 한계는 명백하다.
그러나,
평균도 모르고 표준도 없이 개별특성과 차이를 추구하는 것은 공허하다."
결국 전통한의학의 전일론적 관점과 이론체계는 현대과학을 통해 새롭게 발전해나가야 합니다.
과거 환원주의 일변도의 과학기술은 한의학적 특장점을 이해하는데 큰 한계점을 갖고 있었습니다. 부분밖에 보지 못하는(그리고 부분만으로 모든걸 환원시켜 이해하고 싶어하는) 20세기 과학기술은 시스템 수준에서 질병을 이해하고 치료적 개입을 시도하는 한의학을 설명하기에 역부족이었습니다. 하지만 21세기 빠르게 발전하고 있는 새로운 도구들은 한의학이 추구했던 가치를 더욱 강화시켜줄 수 있는 잠재력을 갖고 있습니다.
새로운 도구들이 한의학의 특장점(시스템적 접근, 맞춤의학적 접근)을 더욱 강력하게 업그레이드시켜줄 수 있다고 판단된다면 우리는 그 방향으로 가야 합니다.
그 결과물이 생각처럼 빠르게 우리 앞에 주어지진 못할지도 모릅니다. 아마도 앞으로도 꽤 오랜시간 한의사들은 전통적 이론체계와 현대적 접근의 하이브리드로 사고하고 전문성을 발휘해나가야 할수도 있을겁니다. 그러는 와중에 조금씩 조금씩 한의학의 면면들이 새롭게 이해되고 조금씩 대체되며 더욱 강력한 형태로 진화해나갈거라 예상합니다.
‘음양오행’ 네글자는 언제부턴가 한의계에서 누군가의 이념적 입장을 구분하는 리트머스지 같은 역할을 하고 있는것 같습니다. 음양오행을 옹호하면 시대에 뒤떨어진 수구꼴통으로 재단되거나, 반대로 음양오행 무용론을 펼치면 경솔한 좌빨로 낙인찍힙니다.
한의학에서 대략 ‘전통적’ 컨텐츠라고 할만한 것들에 대한 입장차이가 갈수록 양극화되면서 정치사상의 좌우 이념적 대립처럼 격렬한 분열과 대립을 만들게 되었고, 한의계 사람들은 상대가 내 진영인지 아닌지 확인하기 위해 ‘음양오행’에 대한 입장을 확인합니다. (“음양오행을 옹호하네? 말 안통하는 보수주의자”)
하지만 보다 건전한 논의를 위해서라면 이렇게 ‘음양오행’ 네글자에 모든걸 함축할 것이 아니라, 전통적인 한의학 이론의 어떤 활용에 대해 긍정적, 혹은 비판적 논의를 하는것인지 구체화해서 대화를 해야 한다고 생각합니다.
예를 들어, 어떤 한의사는 소화기 약한 환자를 누가 화생토 , 목극토 생각하며 심을 보하고 간을 억제하느냐며 음양오행이 무용 하다고 주장합니다. 동시에 다른 한의사는 소화 안되는걸 비의 습으로 보고 습을 말린다고 ‘이해되는’ 조습건비약 을 쓰는걸 음양오행 이라고 표현하며, 도대체 이정도의 한의학 이론도 배제하고 어떻게 한약을 운용하냐며 음양오행 무용론자들을 답답해합니다 .
가만 보면 둘은 실상 비슷한 수준의 한의학적 언어 체계를 사용 하는데 (둘다 성분 수준 만으로 한약 작용이 환원 되기에는 한계가 있고, 한열조습과 같은 한의학적 개념이 임상에 도움이 된다고 생각하고 활용함) , 한사람 은 자신이 음양오행을 사용한다고 말하고 , 다른 한사람은 음양오행이 필요 없다고 말합니다.
한쪽은 ‘음양오행 다 버려’ 라고 하고, 다른 한쪽은 ‘도대체 음양오행 버리자고 하는 한의사들은 어떻게 진료한다는건지 이해가 안된다’고 하는데, 사실 알고보면 생각의 간격이 그리 크지 않았던거죠.
따라서 ‘음양오행’을 주제로 대화할 때, 그저 감정적으로 각자 생각하는 그 무언가를 ‘음양오행’으로 싸잡아 논의하기보다는, 구체적으로 전통한의학 이론의 어떤 내용이 비합리적이고 실제 임상에 부합하지 않는다고 생각하는지, 반대로 어떤 이론은 (생물학적 기전 수준의 명료성과 별개로) 인체와 약물이라는 복잡계의 상호작용을 이해하고 다루는데 의미있는 모델이 될수 있다고 생각하는지 구체적인 생각을 밝히는게 필요하지 않을까 합니다.
다음은 제가 한의학개론 수업에서 예과1학년 신입생들에게 음양과 오행을 소개할 때 취하는 대략적인 입장입니다.
먼저 ‘음양’.
’음양’적 사고는 사실 까기가 쉽지 않습니다. 너무나 추상화된 개념이라 만물을 설명할수 있고, 그만큼 그 어떤것도 구체성 있게 예측하거나 설명하지는 못합니다. 큰 틀에서 생리와 병리의 대대적이고 상호보완적인 현상에 집중할 때 매우 훌륭한 개념적 틀을 제공하지만 어차피 구체성이 떨어지므로 ‘이현령 비현령’ 비판받을만큼 억지스런 적용사례도 잘 생기지 않습니다. 사실 Google Scholoar나 Pubmed에 ‘yin-yang’으로 검색해보면 이미 수많은 자연과학적 문헌들이 생명현상에 대한 묘사에서 음양의 개념을 거부감 없이 적절하게 활용함을 볼 수 있습니다.
’오행’에 대해 이야기할 때는
오행배속(귀류)
상생상극
두가지를 나누어서 논할 필요가 있습니다. 임상에서의 활용도를 논한다면, 오행 배속 정도의 개념을 의미하는건지, 금극목, 화생수하는 상생상극 원리 개념 까지 생각하는 건지 구분할 필요가 있다는 말입니다.
먼저 오행배속은,
자연계와 인체생리병리현상의 다양한 변수들을 5가지 카테고리로 묶고 이들이 추상화된 잠재변수(latent varaible)로서 복잡다단한 현상 이면에서 작동한다고 제안함으로써, 인체와 한약과 같은 복잡계를 효과적으로 다룰 수 있는 툴을 제시합니다. ‘목’이라는, 봄의 생명력을 떠올리게 하는 에너지를 상정하고 여기에 간, 풍, 근, 눈, 분노의 정서등을 배속해줍니다. 이 배속들이 이렇게 함께 묶여 인식되는것이 의학적으로 정말 얼마나 타당한가에 대해선 다양한 평가가 있을수 있을겁니다. 개인적으론 별 의미 없는 부분도 제법 있지만, 현상에 대한 설명력이 높은 분류도 제법 있다고 생각합니다. 특히 육기로 연결되는 부분에 있어서는 본초에 대한 설명과 병리, 진단체계를 연결시키는데 있어 강력한 툴을 제공합니다(토-비-습의 소화기 장애를 조습하는 약재로 치료하는 등)
하지만 크게 의미를 찾기 쉽지 않아보이는 배속들에 대해서도 기존 한의학이론의 용어체계를 이해하고 활용하기 위해 기본적으로 숙지할 필요는 있습니다. 본초의 이름과 설명들, 한의학적 병인간의 연결들은 오행배속에 대한 이해를 바탕으로 이루어진게 많습니다.(뇌혈관질환이나 다양한 신경계 질환을 ‘풍’으로 이해하고, 이 증상들에 효과를 보이는 약재들은 ‘풍을 치료하는 약’이라고 설명됩니다. 맞든 틀리든 모두 오행배속에 대한 기초이해가 있어야 이해가 됩니다)
반면 상생상극은 상황이 많이 다릅니다.
상생상극 이론은 5가지 잠재변수간의 매우 구체적이고 도식화된 상호작용을 주장합니다.
매우 구체적인만큼, 복잡한 현실을 설명하는 모델로서 틀릴 가능성도 높아집니다. 이현령비현령 비판을 받을 가능성도 높아집니다.
저의 지식범위도 그리 넓지 않습니다만, 실제 임상한의학에서 진단과 약물 운용에 오행의 도식적인 상생상극작용이 활용되고 있다고 보기는 어렵습니다. 오행을 추앙했던 고인들도, 약물에 대한 반응을 명확히 확인할수 있는 한약임상에서 “신수가 약하니 금기를 보하기 위해 폐를 보하고, 신을 극하는 토기를 억제하기 위해 비기를 억제하는 약을 써야겠군”따위로 한가롭게 사변적인 주장을 하지는 못했다는겁니다.(진사탁 같은 위인들이 그런 시도를 했다고 하기도 합니다만, 역사적으로 의미있게 살아남아 영향을 주지는 못하고 있습니다). 간혹, 오행상생상극 이론이 장부 변증과 약물치료에 이용되는 사례들을 보면 하필(마침?) 상생상극 이론이 합리적으로 잘 이뤄지는 경우에 한해서 오행상극이론에 대한 애정듬뿍담긴 정당화 시도 노력에 불과한 경우가 많습니다.(간기범위를 목극토로 해설하는 등…단골로 나오는 패턴은 결국 몇가지). 즉, 사후적 끼워맞추기 홍보사례 정도라는거죠.
일본이든 한국이든, 현대과학에 열려있고 합리적으로 한의학을 활용하기 위해 노력하는 임상의들이라면 약물치료를 위한 진단 및 처방과정에서 상생상극을 의사결정을 위한 추론도구로 사용하지 않을겁니다. 하지만 풍한서습조화 와 같은 육기적 개념과 이들이 오행배속을 통해 확장된 범주적 사고는 적지 않게 실제적으로 활용을 합니다. 아직 매우 제한적인 현대자연과학의 방법론으로 밝혀진 약재들의 유효성분에 대한 지식과 네트워크 약리학 모델링 정도로는 전통한의학의 이론적 모델과 경험을 대체하기 쉽지 않기 때문입니다. 네트워크 약리학과 한약기전 연구를 해왔던 제가 보기에도 이건 매우 합리적인 판단입니다.
결국 한약 임상에 대해서라면 오행배속(특히나 육기 관련)은 유효하고 상생상극 이론은 거의 활용되고 있지 못하다고 봐야 한다는게 현재로서의 제 판단입니다.
그렇다면 오행상생상극 이론은 임상에서 전혀 활용되고 있지 않은가? 사암침, 팔체질침 분야에서 도식적인 상생상극 이론이 맹활약하고 있습니다.
이 현상을 어떻게 해석해야 할까요?
오행의 생극이론은 왜인지 장부생리 및 약물반응보다는, 오수혈을 통한 경락생리에서 더 유의미하게 잘 작동한다.
경혈반응이 약물반응에 비해 잡음대비신호(SNR:signal to noise ratio)가 낮아, 우리가 관찰하는 치료-반응 관계의 신뢰도가 떨어지고, 이 때문에 관념적인 이론이 (폐기되거나 대체되지 않고) 유지되기 쉬웠다.
1이거나 2이거나, 1과 2가 함께 작용하고 있거나, 혹은 제3의 설명도 가능할수 있겠습니다.
개인적으로 오수혈과 같은 원위취혈을 통한 침자극이 근육학적 침법들이 해내지 못하는 방식의 효과를 분명히 낸다고 생각하고 있고-아직 신경생리학적, 신경해부학적으로 밝혀지지 않은 reflex들이 많이 있는것 같습니다, 오수혈의 오행생극 이론에 대한 부정적 입장이 있다고 해도 이는 그 치료효과에 대한 견해와는 별개라는 사실을 확실히 하고 싶습니다.
추가로, 오행상생상극 이론의 실제 현상에 대한 구체적 설명력과 임상활용이 떨어진다고 해도, 오래 전 고인들이 인체를 끊임없이 서로 촉진하고 억제하는 동태적 평형시스템으로 이해하고자 했던 부분에 대한 가치는 존중할 필요가 있다고 생각합니다.
인체를 다이내믹한 동태적 평형시스템으로 보고자 했던 이들의 일종의 ‘선언적’ 의미가 있다는 것이죠.
Dean, Paul, et al. "The cerebellar microcircuit as an adaptive filter: experimental and computational evidence." Nature Reviews Neuroscience 11.1 (2010): 30-43.
1.
생물학적 신경망과 인공신경망 양 분야를 아우르는 neuroAI 분야에서 역전파(backpropagation) 알고리즘은 언제나 "biologically implausible"한 아쉬운 불일치 포인트다. 생물학적으로 "plausible"한 hebbian rule 같은걸 인공신경망에 적용을 해보기도 하지만, 경쟁력 있는 ai 모델들은 성능때문에 결국 역전파 알고리즘을 쓰는게 현실이다.
그런데 생물학적 신경망중에 AI의 신경망 학습 기전이 너무나 깔끔하게 맞아들어가는, 그래서 계산모델의 학습규칙에 인공과 생물간 불일치가 거의 없는 신경망이 있으니, 바로 소뇌(cerebellum)다. 소뇌가 역전파를 쓰는건 아니고, 단층인공신경망에서 개발된 delta rule(혹은 LMS rule)이라는걸 소뇌가 쓴다.
소뇌의 granule layer에는 뇌 전체의 무려 80%에 달하는 신경세포가 밀집되어있는데 (대뇌 쨉도 안됨), 이 graunule cell들에서 뻗은 parrallel fiber들이 빔처럼 달리며 크고 납작한 purkinje cell들의 무성한 가지들과 수직방향으로 컨택하고 지나간다(전선들이 송전탑 지나가는걸 떠올리면 비슷). 이들 시냅스를 pf-pc synapse라고 부르는데 이 시냅스들의 가중치가 학습을 위해 변화하여 pc(purkinje cell)의 출력이 조절되는 현상은 고차원의 인풋을 단일 출력으로 바꾸는 함수의 가중치 조절로 이해될수 있고, 사실 그 유명한 통계학의 MLR(multiple linear regression)에 다름 아니다.
좀 더 생각해보면 granule layer는 이미 그 전의 인풋을 받아 엄청나게 고차원공간으로 맵핑을 하고 있는 상태이므로, 복잡도 높은 표현을 위해 데이터를 고차원의 feature들로 변환시키고 이어 퍼킨지 세포가 고차원 데이터를 선형회귀모델로 예측하는 상황이라고 볼 수 있다.
adaptive filter model이라는 소뇌의 대표적인 계산모델에선 pf-pc 시냅스의 가중치 조절을 위해 퍼킨지세포의 출력을 정답과의 편차제곱(y-y예측값)^2을 최소화시키는 문제로 모델링하는데, 회귀분석의 최소자승법을 normal equation 대신, SGD(stochastic gradient descent)로 푸는 방법과 수학적으로 완전히 일치한다. SGD에서 미분값인 gradient 벡터의 i 번째 gradient는 학습률*(y-y예측값)*x_i 가 되는데, error를 의미하는 (y-y예측값)의 시그널은 climbing fiber가 전달하고, x_i는 해당 가중치로 들어오는 pf의 입력값이 된다.
정말 놀랍게도, 신경생리학적으로 실제 pf, climbing fiber의 pairng이 일어나면 모델의 예측결과대로 pf 입력값에 따라 LTD가 일어남이 확인되었다.
그러니 소뇌는 역전파알고리즘처럼 찜찜한 구석 없이 인공신경망의 모형이 생물학적 신경망의 학습규칙을 너무나 잘 설명해주는 예인셈
2.
소뇌신경망의 학습원리와 단층인공신경망에서의 SGD 기반 학습법(delta rule), 통계학의 회귀분석과 최소자승법. 이 복잡한 관련성이 어떻게 생긴건지 역사적으로 추적해보면 매우 흥미롭다.(어쩔수 없이 한의사라 그른가, 다양한 아이디어가 섞이며 기술이 발전하는 역사공부가 재밌다)
일단 gradient descent란 기법 자체는 1800년대 중반 그 유명한 프랑스의 코시(코시-슈바르츠 부등식의 그 코시 맞음)가 함수의 미니멈값을 구하는 방법으로 제안했다고 함. 그런데 그냥 순수 수학적 작업이었고...
1950년대 통계 쪽의 회귀분석 연구과정에서 어느정도의 인식이 있었던것 같다. 그러나 이건 머신러닝 쪽 외에서의 일이었으므로 실제 우리가 머신러닝에서 쓰는 gradient descent의 역사로 보기는 무리일것 같고,
본격적으로 머신러닝에 활용된건 1960년 스탠포드의 Widrow & Hoff 가 ADALINE이란 단층신경망 모형을 개발하면서부터다. ADALINE은 단층 신경망이면서 아웃풋이 연속값이므로 사실상 통계학의 다중회귀모형 구조였는데(에러까지 편차제곱으로 정의), SGD를 써서 매 샘플마다 파라미터를 gradeint descent로 업데이트하는 방식을 제안했다. 이걸 delta rule이라고 불렀고, 이후 LMS(least mean squares) 알고리즘이라고도 부르게 되었는데 훗날 70년대에 테렌스 세즈노스키가 같은 식을 에러와 인풋값의 covariance로 해석하는 관점을 소개하며 covariance learning rule이라고도 불리게 되었다.
암튼, 머신러닝에 gradient descent 기법이 처음 적용된건 ADALINE이었고, 이건 사실상 통계의 MLR의 신경망적 구현 + 수치적 접근이었던것. 80년대 럼멜하트 등이 역전파 알고리즘을 제안할 때도 이걸 delta rule의 일반화라고 표현했다고 하니, 현재 우리가 아는 gradient descent의 세상이 분명 1960년 Widrow & Hoff로 부터 시작된게 맞는것 같다.
1957년 인공신경망의 세상을 연 로젠블랏의 퍼셉트론은 지금도 AI 역사에서 늘 언급이 되는데, 저 유명한 gradient descent를 머신러닝 세계에 소개한 ADALINE 모델이 세간에 많이 언급되지 않는것은 아쉬운 일이다.
3.
더욱 놀라운건, 마빈 민스키가 퍼셉트론 기반의 인공신경망을 맹공격하여 가사상태로 만든 이후에도 ADALINE 방식의 모델들은 신호처리 분야에서 꽃을 피우며 공학적으로 잘 나갔다. 이쪽에서 망했지만 저쪽에서 화려하게 잘 나간 셈.
그리고 더더욱 놀라운건,
1980년대 초 일본의 Fusita에 의해 adaptive filter model이 제안되며 이전까지 Marr, Albus, Ito 등에 의해 다듬어져오던 소뇌의 계산적 모델이 ADALINE의 delta rule을 받아들여 (글 서두에 강조했다시피) 생물학적 신경망과 인공신경망이 정말 같은 방식으로 학습을 하는 모델로서 수렴하게 됐다는것이다.
80년대 이후 지금까지도 다양한 소뇌의 계산모델들이 제안되고 있지만 delta learning rule을 기반으로 한 adaptive filter model은 여전히 강력하다.
좀 심하게 말하면 "소뇌는 다중회귀분석을 SGD 기반으로 풀고 있다"고 할수 있다. 그리고 나아가 "이 다중회귀분석의 독립변수들은 미리 트랜스폼된 고차원의 변수들"인셈.
4.
그리고 최근 내가 이 모델에 응당 포함되어야 하는, 그리고 실제 실험적으로, 계산 모델 수준에서 다양한 방식으로 포착되어왔지만 아무도 통계 모형 관점으로 해석해내지 못했던 요소를 추가로 발견했다.
granule layer에 의해 expansion된 고차원 공간을, 소뇌는 과적합을 만들지 않고 어떻게 컨트롤해내고 있는가? 에 대한 통계학습이론적 답이 될수 있을것 같다.
이걸 후다닥 이론전개로만 소박하게 논문을 써야 할지, 공동연구로 실험을 함께 해서 큰걸로 만들어야 할지 매우 고민된다. 5년전에 비슷한 사건이 있었는데, 그때는 실험과 함께 가는 길을 택했고, 똘똘한 박사과정생의 학위기간을 통으로 투입하여 이제서야 진짜 마무리를 눈앞에 두고 있다.
여튼 행복한 순간이다.
5.
앞선 모든 내용은 마지막 자랑을 위한 것처럼 보일수도 있는데, 그게 맞음.
한의학의 다양한 재료와 경험체계를 현대과학의 분석적인 힘으로 해체하여 의과학 발전에 기여하는 것도 매우 중요한 작업이지만,
상관적 사고를 바탕으로 자연의 다양한 은유물을 이용하여 질병현상을 모델링했던 한의학적 인식론을 이해하는 것도 매우 중요한 접근이라고 생각함.
누군가는 비과학이라 비웃겠지만, 아직도 임상한의사의들의 머릿속에서는 한의학 특유의 인체와 질병에 대한 모델을 기반으로 진단과 치료가 이루어지고 이게 working하고 있음. 그 모델의 추상적 용어체계가 모호하고 물리적 실체로 명확히 환원되지 않음을 한의사가 몰라서 그러는게 아니라, 그냥 그게 실제 잘 작동한다고 느끼기 때문에 이용하는 것임
한의사의 머릿속에서 돌아가는 한의학적 개념과 이론체계는 의학적 맥락상의 어떤 'world model'임. 이 모델에서 유용하고 의미있는 무언가를 추출해내든, 문화적 편향에 의한 착각으로 판명하여 폐기하든, 어떤 학파의 모델이 어떤 상황에 더 실재에 부합한 것으로 판명을 하든, 뭘 하든간에 이 모델에 대한 진지한 과학적 연구가 필요함. 모조리 "음양이..뭐? 너 무당!" 이럴 문제가 아님.
한의사의 머릿속에서 실제 돌아가고 있는 한의학이론체계에 대한 인지계산신경과학적 모델을 만들고자 함. 그리고 이런 모델링에 딥러닝 기반의 AI 모델을 활용하는게 매우 강력한 접근이 된다고 생각함.
어떤 결과로까지 발전할지 모르지만, 최악으로 예상해도 의료인류학적, 인지계산과학적으로 매우 흥미롭고 독창적인 연구가 될것이라 생각함.
대한미병의학회지에 실은 이 글은, 사실 뚝뚝 끊어서 작성했던 글들을 연결시켜 다듬은 글인데 영 매끄럽게 읽히지가 않아서 굳이 홍보할 생각은 없었으나...그래도 누군가 봐달라고 쓴글인데 그냥 아무도 모르고 잊히는듯 하여 이렇게 홍보합니다.
#1. 요며칠 한국 일이 바쁘다는 핑계로 랩에 출근을 안했었다. 몸은 편했지만 연구실 사람들이 '이제 돌아갈 때가 되어 마음이 떠난' 것으로 볼까봐 마음이 너무 불편했다. 오늘은 아침일찍 출근하여 포닥 말년차 친구와 앞으로 진행할 공동프로젝트 미팅을 했다. 질병모델에서의 안구운동 데이터를 많이 쌓아놨고 이걸 분석해서 진단예측기술을 개발하거나, 나아가 기전 연구를 하고 싶어하는 중이었는데(안구운동이 autism, Parkinson's disease 등 다양한 신경학적 이상과 관련됨), 나로서도 내가 하고자 하는 소뇌관련 계산신경과학적 연구를 하면서 한의학 분야 과제를 딸수 있는 주제로 안성맞춤이란 생각이 들어 조심스럽게 이야기를 나눠보고 있다. 한국에 돌아간 후 스스로 변화의 역점을 둘 사항 중 하나로 globalization을 꼽고 있다. 비록 1년의 짧은 시간이었지만 지금 만든 네트워크를 잘 살리고 확장해서 장기적으로 나와 랩에 큰 변화를 만들어내고 싶다. 이 친구는 이제 곧 Raymond 랩을 떠날텐데 언제 어떤 곳에 본인의 랩을 차리게 될지는 알수 없으나, 현재 PI에게 이 데이터의 향후 활용과 나와의 공동연구 계획에 대해 이미 허락을 구해놓았다. 일단 한국 돌아가면 현재 내가 여기서 하고 있는 일을 바탕으로 한 공동연구 외 이 친구와의 공동연구를 함께 수행해나갈 것 같다.
#2. 미팅 후엔, 같은 방 포닥 친구와 포백 친구 꼬셔서 Wu Tsai Neurosciences Institute 의 올해 마지막 점심 세미나에 참석했다. 이 세미나는 학기중 매주 목요일 점심마다 간단한 커피, 쿠키 등과 함께 진행되는데 전세계에서 다양한 연자들이 다양한 신경과학 주제로 톡을 한다. 한국 돌아가면 이곳에서의 많은 것들이 그립겠지만, 쾌적한 세미나룸에서 커피와 함께 진행되던 Wu Tsai 세미나 신선놀음이 특히나 그리울 것 같다. 오늘 발표는 motor learning을 주제로 psychophysics 기반의 행동실험과 약간의 computational modeling, 뇌영상 연구등을 포함하는 심리학/인지신경과학적 연구였다. 언제나 그렇듯 심리학 기반의 연구는 재밌다. 물론 세포 수준의 기전을 전혀 다루지 않는다는 면에선 언제나 그렇듯 뭔가 부족한 듯한 느낌이 있다. 아마도 (세포수준을 다루는) 많은 신경생물학자들이 비슷한 레벨의 인지신경과학 연구를 보면서 비슷한 감정을 느낄 것이다. 전공이 신경생리학이지만 뇌영상 데이터로 박사학위를 했던 나는 생리학교실에서 처음 내 주제를 발표하며 비로소 깨달았었다. So WHAT? 그래서 그게 다인가? 기전은 어디있나? 식의 질문들을 받으며 생물학/생리학자의 사고가 무엇인지 비로소 조금 감을 잡았던 것 같다.
행동결과를 설명하기 위한 간단한 확률모델 설명을 들으면서 문득, 내가 몇년전부터 해오고 있는 '한의사의 진단과정에 대한 인지과학적/수학적 모델' 연구를 위해 주제가 좀 다르더라도 psychophysics 기반의 모델링 연구들을 많이 들여다봐야겠단 생각이 들었다. 이쪽에 이미 행동데이터를 바탕으로 하는 수많은 경험과 사례들이 있을터이니, 진즉에 참고를 했어야 하는게 아닌가 싶었다. 살펴보아야 할 주제가 자꾸만 늘어나는건 좀 걱정되긴 한다. 내가 다 할수 있는 일인가... 내가 해야 할일과 굳이 내가 하지 않아도 될일에 대해 구분하고, 시간과 에너지를 전략적으로, 효율적으로 쓰는 방법 밖에 없을 것 같다.
#3. Korea가 정말 힙하고 쿨한 나라라는, 대한민국이 멋진 문화강국이란 사실을 느낄 일들이 심심찮게 있다. 확실히 젊은 사람일수록, 어린 학생들일 수록 그런 경향이 강하다고 느낀다. 50대 이상의 사람들에게선 분명 덜 느껴지고 일본에 대한 인식이 훨씬 좋다고도 느낀다. 연구실에 스낵바가 있는데 이것저것 메뉴가 바뀌는 와중에 항상 자리를 지키는 메뉴가 신라면, 햇반, 김 뭐 이런것들이다. 한번은 정관장 홍삼까지 등장했었다. (연구실에 한국인 나 말고 없음). 지난주 연구실 친구들이 쉬운 한국어를 가르쳐달라기에 본인들 한국 이름을 써줬는데, 오늘 와보니 자기 자리에 크게 붙여놨다. 슬랭을 하나 알려달라길래 '존나와 '겁나'중에 고민하다가 '겁나'를 가르쳐줬다. 어원을 물어봐서 설명해줬더니 약간 실망하는것 같았다. '존나'를 알려줬어야 하는건데... 한국에 대한 긍정적 이미지는 사실 내가 직접 겪는것보다도 아이들이 학교에서 겪는 이야기들이 훨씬 놀랍다. 그리고 이런 변화가 10년도 아닌 불과 5년 이내에도 빠르게 가속화되고 있다는것이 또 놀랍다.
#4. 주말엔 드디어 Tahoe lake 와 스키장에 다녀왔다. 눈도 안오는 캘리포니아에서 크리스마스를 즐기는걸 가소롭게 생각했는데, 불과 4-5시간만 차타고 올라가면 눈 덮인 광활한 산맥에서 스키를 탈수 있었다. 내가 캘리포니아를 너무 대충 알았던것이다. 적어도 날씨에 관해선 캘리는 그냥 모든 것을 갖춘 곳이다. 동네 친한 가족과 함께 다녀왔는데, 원어민이 모든걸 처리해주니 너무나 든든함과 동시에, 자생의 필요성을 잃어버린 내 영어는 더욱 퇴화하는것처럼 느껴졌다. 리프트를 타는데 우리 말고는 아무도 안전바를 내리지 않는다는 사실을 발견했다. 더구나 한국과 달리 리프트 아래엔 안전그물 같은 것도 없었다. 이거 정말 괜찮은걸까, 까불다 떨어지는애들 분명 있을텐데 사고는 안나는걸 까 생각했는데...갑자기 리프트가 정지하고 엠뷸런스와 구급헬기가 날아왔다. 16세 아이가 리프트에서 떨어졌다고 했다. 다행히 잘(?) 실려가고 해결이 된듯 하긴 했다. (현장에 갔던 직원이 환하게 웃으며 잘 해결했다고 말함..)
#1. 어제는 랩이 아닌 동네 스벅으로 출근했다.
연구실 내 자리 뒤편에 스낵바가 있어서 배고픈 사람들이 계속해서 드나드는데 바쁜척 안돌아보고 그냥 일하는 것도 한두번, 계속 무시하고 일하기도 좀 민망해서 인사 나누고 이런저런 이야기 하다보면 사실 일하기가 좀 힘들다. 어제는 이곳 프로젝트가 아닌 다른 일들을 해야 할게 많아 스벅으로 나갔는데, 한국과 달리 화장실 갈 때마다 짐을 챙겨다녀야 하므로 또 장시간 죽치고 있기는 불편한면이 있다.
나름 크리스마스 분위기낸다고 상점들이 캐롤도 틀고 장식도 하고 하는데, 이렇게 쨍한 날씨에 크리스마스라니 참 어색하다. 뭔가 좀 가소로운 느낌도 들고?
#2. 어제 밤엔 박사과정 졸업을 준비하는 지도학생 1차 심사를 진행했다. 어찌하다보니 이번학기에 석사졸업1, 박사졸업 2, 총 3명의 지도학생 논문심사를 진행하게 됐다. 지도교수도 없는 와중에 디펜스라니, 고생하는 학생들에게도 미안하고, 심사위원으로 참여해주시는 위원분들께도 매우 송구하다. 지도교수이자 심사위원중 1인으로 참여하는 학위심사에서 나의 스탠스는 언제나 애매하고 어렵다. 심사위원처럼 행동했다가 지도교수처럼 행동했다가 왔다갔다 한것 같다. 심사를 빙자한 매우 건설적이고 열띠고 흥미로운 연구미팅 시간이었던듯 하다. 아무튼 이제 드디어 심사 일정이 스타트를 끊었다. 우리모두 화이팅.
#3. 오늘 아침 랩미팅에선 나 제외, 이 랩의 유일한 ComNeuro 가이인 포닥친구 저널클럽이 있었다.
네이쳐 컴에 실린 이 분야 빅가이의 논문이었는데 당연히 이 분야의 또다른 빅가이인 우리 PI와 서로 너무나 잘 아는 사이이므로, 논문에 드러난 것 이상의 많은 비하인드 이야기들을 들을 수 있었다. 처음 겪는 기분도 아니지만, 세계적인 탑티어 연구자들이 서로 소통해가며 좋은 저널에 논문 쓰고, 별도의 소규모 미팅으로 의견 나누며 최신 담론을 만들어나가는 이야기들을 들으면 내 현재의 여건이 너무 초라하게 느껴진다. 역시나 몰랐던 바도 아니지만, 더 어린 나이에 영어 장벽을 허물고 글로벌한 경험을 했더라면 더 풍부한 환경에서 내가 가진 잠재력을 발휘했을수도 있었겠다는 아쉬움이 남는다. 그렇다고 억울하진 않은 것이, 사실 이미 알고 있었고 다만 내가 선택한 것이었다. 학부에서 한의학을 전공한 내가 계산신경과학과 AI를 접목한 새로운 분야를 전공으로 삼기 위해선 지불해야 하는 비용이 있었다. 신경과학을 전공하고 AI 랩과 통계학과를 전전하고, 수학과학위를 새로 추가하고 좌충우돌하며 원하는 모습을 향해 달려오는 과정에, 해외진출까지 겸하기는 현실적으로 어려웠다. 어떻게든 확보한 짜투리 시간들을 투자해야 한다면 영어보단 수학공부에 투자해야 한다고 판단했고 실제로 대부분의 시간을 그렇게 썼다. 뭐 더 쥐어짜내 영어를 더 열심히 했어야 했다는 생각도 별로 안든다(나도 어느정도 사람답게 살아야지), 조금 아쉬움이 남지만 지금이라도 이런 기회를 얻은것에 감사하고, 다만 학생들과 후배들에게는 나보단 빨리 글로벌 환경을 경험할수 있는 기회를 만들어주고 싶다.
#4. 논문은 전통적으로 간결하고 단일한 구조로 알려진 소뇌에 생각보다 풍부한 heterogeniety가 있음을 보이는, 언제부턴가 유행하고 있는 흐름과 궤를 같이 하는 내용이었는데, AI 관점에서 뇌에 관심을 갖는 연구자들과 정확히 반대되는 이러한 발상에 대해 여러가지 생각이 들었다.
인공신경망 개발 역사 초창기부터 AI guy들은 뇌의 작동원리를 심플하게 추상화하고, 그걸 컴퓨터로 옮김으로써 AI를 만들고 싶어했다. 그들은 언제나 간결하게 정리될수 있는 원리를 찾는다. 그리고 뇌가 지능을 만들어내는 핵심은 그렇게 간결하게 추상화될 수 있을거라고 믿고 싶어한다. 반면 신경과학자들은 엔지니어들이나 물리학자가 감당하기 어려운 다양성과 복잡성이 biology에 있다는 사실에 자부심을 느끼는듯 하다. 복잡한 현상을 간결하게 만드는 수학적 모델링을 본인들이 감당하기 어려워서이기도 하겠지만, 어쨌든 단순해보이는 와중에도 파고들면 복잡하고 다양하다는 것을 밝히고 싶어하는..어떤 정서적 편향 같은게 있는것 같다. 최근 제프리 힌튼(AI개발을 통해 뇌를 이해하는 것이 평생 목표였던 딥러닝 갓파더)은 이제 AI는 뇌에서 얻을만한 힌트를 거진 다 얻은것 같고, 앞으로 뇌에서 배워올건 별로 없을것 같다는 의견을 피력했다. 엔지니어링이 너무 발전해 이제 AI 개발을 위해선 그냥 그만의 길을 가게 될것 같다는것이다. 그게 사실이라면 현재 인공신경망에서 찾아볼수 없는 수많은 뇌신경계의 디테일들은 인간의 뇌를 생물학적, 의학적으로 이해하는 측면에서만 의미를 갖게 된다(물론 여전히 매우 중요하다). 하지만 많은 신경과학자들은 그들이 잘 아는 생물학적 디테일과 복잡성의 중요성을 강조하며, AI가 다음 단계로 도약하기 위해선 그런 디테일들이 더 잘 이해되고 구현되어야 한다고 주장하고 싶어한다.
누구 말이 맞을까? cerebellum의 heterogeniety는 생물학의 제약조건에 따르는, 그리고 진화의 주사위 던지기중에 그저 출현한 epiphenomenon일까, 아니면 AGI 구현을 위한 비장의 진화적 솔루션일까.
#5. 오전 Raymond 랩 저널클럽을 마치고는 곧바로 Jay 랩의 랩미팅에 참가했다.
인공신경망 연구 역사의 초창기부터 심리학 연구자로서 이 분야를 주도해온 살아있는 화석…아니 레전드인 Jay의 연구실에선 딥뉴럴넷을 이해하기 위한 연구들을 꾸준히 수행해왔다. 오늘은 transformer 구조의 작동원리를 탐색하는 발표를 한다길래 (접근법도 내가 하는 연구랑 비슷해보여서) 참석했는데 발표도 매우 흥미로웠고, 열띤 토론과 Jay의 설명들도 매우 좋았다. 스스로도 좀 웃기다는 생각이 들었던것이, 내가 그래도 소뇌 연구를 몇년간 해왔고 지금도 소뇌연구실에 방문연구원으로 소속되어있는데, 오늘 아침 저널클럽보다도 이게 더 쉽게 이해가 되고 스스로 할말도 많았다. 오전 저널클럽에선 얼빠진 기초 질문만 두개 던지고 왔는데, 여기 와선 날카로운 질문들과 함께 아이디어도 제안하고, 대학원생들의 질문에 대한 수학적 설명까지 해줬다. 다시 한번, biology가 참 어렵다는 생각을 했다. 아님 적성에 안맞는건가? (이제와서)
#1
지난 10월말 번개같이 부산에 들러 한중학술대회 발표를 하고 왔다. 발표하고 연구실 식구들만 후다닥 만나고 바로 미국으로 복귀. 나 없는 동안 랩생활을 시작한 신입생들이 둘이나 있어 한번은 이렇게라도 챙겨야 한다는 생각을 하고 있었다. 사실 온라인으로 일주일에 2-3번씩 얼굴을 볼정도로 자주 보는 사이였지만, 실제로 만나 함께 밥먹고 다양한 이야기를 나누다보니 여러가지 다른 감각과 감정들이 느껴졌다.
#2
학회가 한국어-중국어 통역으로 진행된다길래 근거없이 동시통역으로 생각하고 준비했는데, 알고보니 동시통역이 아니라 순차 통역이었다. 준비한 내용을 절반으로 줄여 발표했는데 여러모로 아쉬움이 남는다. 다행히 한의신문 기자님이 내 발표를 상당히 자세하게 기사로 다뤄주셨다. https://www.akomnews.com/bbs/board.php?bo_table=news&wr_id=55438
#3
며칠전 openAI의 첫 Devday 발표로 또한번 난리가 났다. 나름 LLM으로 뭘좀 해보려던 기술스타트업 수만개가 하루아침에 망했다는 이야기들이 돈다.
내가 LLM 관련해서 하는 연구는 크게 1. 의료AI 연구자로서의 응용연구(한의 AI) & 2. 계산신경과학자로서의 신경과학-AI 융합연구, 두가지 방향인데
1번과 관련해서는 그간 오픈소스 모델을 기반으로 좀 더 들어갈 것인가, 아니면 openAI 모델과 서비스에 맘편하게 종속되고 그 다음 단계에 더 집중할 것인가... 고민하던 와중 후자에 일단 더 마음이 기울게 되는 상황이다. 머신러닝과 AI 를 활용해서 엔지니어링한다는게 어떤 것인지에 대한 기본개념이 많이 바뀔수도 있겠다는 생각이 든다. 지금 컴퓨터로 AI 관련 일을 좀 한다고 어셈블리어를 들여다 볼필요는 없듯이, 사전훈련모델 수준에서 뭘좀 해보겠다는 시도들도 그런 종류의 일이 되어버리는걸지도?
당장 진행하고 있던 프로젝트들도 openAI의 새 발표와 후속조치에 많은 영향을 받을 것 같다. 앞으로는 관련 연구를 하더라도 언제든지 벌어질수 있는 이런 상황들에 대해 예상하며 스탭을 밟아야 할것 같다. 안그래도 첫번째 프로젝트의 경우 아카이브에 preprint 올린 후 정식 저널에서 심사를 받기까지의 몇개월 시간 동안, 챗쥐피티를 둘러싼 상황이 이미 많이 변해버린 바람에 revision 과정에서 모든 데이터를 새로 만들고 결과 역시 크게 수정을 하기도 했다.(GPT-4에게 일을 조금 더 잘 시키면 객관적으로 한의사국가고시를 과락 없이 실제로 통과할수 있습니다)
신경과학-AI 융합연구로서의 llm에 대한 관심은 어찌되었건 인공신경망의 신경해부학, 신경생리학을 훤히 파악하고 실험해볼 수 있는 오픈소스 모델 중심으로 갈수 밖에 없을것 같다. 좀 작은 사이즈의 LLaMA 2나 허깅페이스 트랜스포머 모델을 가져다 쓰는 접근들을 주로 생각하고 있다. 결론적으로 1. 의료AI 관련 연구와 2. 신경과학 관련 연구에서의 llm 활용과 접근은 좀 다른 결로 가야 할것 같다는 생각.
#4
쫒아가야 하는 변화의 속도가 빨라질수록 배우는 입장에선 기본기를 확고히 다질 여유가 없어질것만 같다. 아무리 GPT가 똑똑하다고 해도, AI 관련 연구를 하겠다는 사람이 확률통계, 선형대수, 알고리즘도 모르고 최신 기술 깃허브만 들여다볼수는 없는 것 아닌가. 결국 기초공부는 할수 있을때 압축적으로 가능한 빡시게 다져놔야 하는것 같은데 말이 쉽지 제대로 가르치기도, 배우기도 만만치 않은것 같다.
비록 학생신분이 아니지만 여기서 이런저런 활동과 수업에도 참여하고 사람들을 사귀다보면 미래의 일리야 슈츠게버 같은 친구들이 어떻게 단시간동안 성장해나가는지 엿볼수 있는 기회들이 생기는데 (스탠포드 재학생 뿐 아니라 의외로 MIT 등 다른 탑티어학교에서 와있는 학생들도 많이 볼수 있다), 이들을 보면서 많이 배우고 있다. 그들이 성장하는 환경을 내가 학생들에게 만들어주는 건 불가능하지만, 최소한 어떤 방향으로 노력이라도 해봐야 할지는 좀 알것 같다.
#5
사실 학생들 교육도 교육이지만 나 스스로의 성장에 대한 욕심 역시 아직 너무나 크다. 한국을 벗어나 완전히 다른 삶의 방식으로 살면서 돌이켜보니, 한국에서의 지난 6-7년간 서서히 번아웃되어가고 있었음을 명확히 알게 됐다. 내가 좋아하는 일에 집중하는걸로 번아웃되진 않는다. 밤 세워 게임하며 폐인처럼 산다고 번아웃되진 않는다. 그냥 폐인이 될뿐. 작은 학교에서 많은 수업과 보직, 과제를 수행하면서 동시에 내가 좋아하는 사람들과 좋아하는 일을 통해 성장하고 싶어 발버둥쳐왔는데 아무래도 내가 좋아하기보단 해야 하는 일들에 에너지와 시간을 너무 많이 썼던것 같다.
그런면에서 지금의 미국생활은 내게 문자 그대로 천국같다. 사실 여기서 다시 그곳으로 돌아가야 한다는게 말이 안되게 느껴질 정도다. 한국에 돌아가서, 보다 원하는 삶의 방식을 셋업할 수 있을까. 내가 가진 자유는 어느정도인걸까. 궁리를 열심히 해봐야겠다.
#1. 이제 프로그래밍 언어가 아닌 그냥 일상어로 AI와 대화하며 데이터 분석도 하고, 웹페이지도 만들고 앱도 개발할수 있는 시대가 되었다. 이제 코딩 배울 필요가 없어졌다고 말하는 사람들도 있다.
개인적인 생각으론 여전히 코딩을 '아는' 것은 필요하고(매우 익숙하진 않아도), 그보다 상위영역에서의 도메인이나 기술에 대한 지식과 창의력이 더욱 중요해지는 것 같다.
다양한 시각화툴의 명령어들을 능숙하게 기억해서 자유자재로 활용할필요는 없다. "파스텔 톤으로 색깔 넣고, 블럭마다 짙은 검은색으로 수직 바를 그어줘"와 같은 식으로 명령하면 알아서 코드 잘 짜준다. 결과 맘에 안들면 다시 지적하고 시키면 된다. 영어나 한국어로.
머신러닝 라이브러리의 모델을 조작하는 디테일한 명령어 잘 기억 못해도 괜찮다. "X는 행이 샘플이고 열이 피쳐야. PCA 적용해서 2차원으로 차원축소한 결과와 MDS 결과 비교할수 있게 한 figure에 subplot 나눠서 그려주고, PCA는 explained variance도 구해줘. 별도의 figure로 t-SNE 시각화도 만들어줘"라고 하면 몇초만에 코드 만들어준다.
하지만 모든걸 말로만 할수는 없다. 과제가 복잡해지면 결국 잘 못하고 헤매는데 (어떨땐 1초만에 돌아갈 코드를 비효율적으로 짜서 2분 동안 돌아가게 만들때도 있다), 이럴 때는 코드 전반의 구성은 내가 짜고, 타스크별로 쪼개서 코딩을 시켜야 한다. 결국 이녀석이 만들어준 코드를 내가 이해할수 있어야, 내가 원하는 방향으로 끝까지 나아갈 수 있다.
비유하자면 매우 두뇌회전이 빠르고 아는게 많으며 코딩을 잘하는데다가 무한체력과 인내심까지 갖고 있지만, 넓게 볼수 있는 안목과 경험이 부족한 천재 연구비서(솔직히 내게는 대학원생 비유가 더 떠오르지만)를 데리고 일하는 연구책임자 역할을 하게 되는건데, 이 연구 책임자가 실제로 코딩을 아예 할줄도 모르고, 머신러닝이나 통계의 기술적 측면을 제대로 이해하고 있지 못하면 이 들이 할수 있는 업무의 범위가 매우 제한될수 밖에 없을 것이다.
#2. 세상의 사람들을 1. 코딩을 할줄 아는 사람과 2. 아예 못하는 사람으로 이분할 때, 1그룹과 2그룹의 역량 차이가 그 어느때보다도 더 크게 벌어질 것 같다. 1그룹 내에서의 실력 격차는 llm 덕분에 상당 부분 줄어들수도 있을 것이다. 일단 1그룹 내에 진입할수 있으면 AI 비서와 함께 많은 것을 할수 있다.
#3. 어쩌면 얼마간의 시간이 지난 후엔 정말 시작부터 끝까지 자연어만으로 모든 작업이 가능할수도 있겠다. 하지만 여전히 그때도 코딩 지식이 필요할 가능성이 높다.
마치 수학자나 공학자가 난해한 개념을 수식으로 표현하고 이해함으로써 자연어로 소통하기 어려운 개념들을 명료하게 소통할 수 있듯, 우리가 다룰 많은 복잡한 작업들이 모호한 자연어로만 완전하게 소통되긴 어려울거다. 결국 보다 정돈되고 명확한 언어체계는 여전히 필요할테고, 프로그래밍 언어와 수학이 그 역할을 계속 하겠지. 수학자가 소통할 때 서로 말을 할줄 몰라 수식을 사용는게 아니듯, 인간의 자연어를 완벽히 이해하는 기계라 할지라도 이녀석과 소통할 때 자연어보다 코딩언어가 갖는 가치는 여전히 있을것이라 생각한다.
오늘 마침 존경하는 Andrew Ng 선생님의 The Batch에서 내 평소 생각과 일치하는 내용의 메일을 받아서 반가운 마음에...
아래는 The Batch Andrew Ng 교수님 편지 전문 번역
======
친애하는 친구 여러분,
딥러닝의 영웅 중 한 명으로 현재 OpenAI에서 일하고 있는 안드레이 카르파시(Andrej Karpathy)는 "가장 인기 있는 프로그래밍 언어는 영어"라고 말했습니다. 그 말에 공감하지만, 컴퓨터에게 영어로 명령하는 것이 쉽다는 이유로 코딩을 배우는 것을 꺼려해서는 안 됩니다. 영어를 모국어로 사용하고 파이썬을 제2외국어로 사용하는 다국어를 구사하는 사람은 대규모 언어 모델(LLM)을 프롬프트하는 방법만 아는 사람보다 훨씬 더 많은 것을 성취할 수 있습니다.
컴퓨터에게 영어(또는 가장 유창한 인간 언어)로 원하는 것을 말하면 컴퓨터는 사용자가 요청한 것을 충분히 이해할 수 있을 정도로 잘 이해할 수 있습니다. LLM 이전에도 Siri와 Alexa는 기본적인 명령에 응답할 수 있었고, 컴퓨터가 따를 수 있는 영어 명령의 영역은 빠르게 확장되고 있습니다. 하지만 코딩은 여전히 엄청난 가치를 지니고 있습니다. 오히려 LLM의 등장으로 코딩의 가치는 더욱 높아지고 있습니다. 그 이유를 설명해드리겠습니다.
오늘날 대기업, 중소기업, 심지어 생물학 실험을 하는 고등학생까지 거의 모든 사람이 데이터를 보유하고 있습니다. 따라서 자신의 데이터로 작업할 수 있는 맞춤형 AI 시스템을 확보하는 능력은 매우 중요합니다. LLM에 프롬프트하면 다양한 질문에 대한 답변을 생성하고 에세이부터 시까지 모든 것을 생성할 수 있지만, 코딩과 프롬프트를 결합하면 현재와 가까운 미래에 할 수 있는 일의 범위가 훨씬 더 넓어집니다.
제가 지금까지 쓴 모든 편지의 요약을 The Batch에서 만들고 싶다고 가정해 봅시다. 한 번에 한 글자씩 ChatGPT와 같은 LLM에 복사하여 붙여넣고 각각의 요약을 요청할 수도 있지만, 데이터베이스에 있는 모든 문자를 반복하고 LLM이 요약을 생성하도록 하는 간단한 코드를 작성하는 것이 훨씬 더 효율적일 것입니다.
앞으로는 채용 담당자가 몇 줄의 코드를 작성하여 후보자 리뷰를 요약하거나, 추천인과의 대화에서 음성 인식을 실행하거나, 채용 워크플로에 필요한 사용자 지정 단계를 실행할 수 있기를 바랍니다. 교사가 수업 계획에 적합한 학습 과제를 생성하도록 LLM을 유도하는 등의 작업을 수행할 수 있기를 바랍니다. 많은 역할에서 코딩 + 프롬프트가 웹 인터페이스를 통한 프롬프트보다 더 강력할 것입니다.
게다가 영어는 모호합니다. 이는 프롬프트에 대한 LLM의 출력을 완전히 예측할 수 없는 이유입니다. 반면 대부분의 프로그래밍 언어는 명확하기 때문에 코드를 실행하면 매번 동일한 결과를 안정적으로(합리적인 범위 내에서) 얻을 수 있습니다. 실시간 가격을 기반으로 고가의 비행기 티켓 구매 시기를 결정하거나 회사 내 모든 사람에게 파티 초대장을 보내는 등 신뢰성이 중요한 중요한 애플리케이션의 경우, 목적지 조사나 초대장 초안 작성에 LLM이 관여하더라도 작업을 수행하는 최종 단계는 코드를 사용하는 것이 더 안전합니다.
코딩을 배움으로써 누구나 혜택을 누릴 수 있는 시대로 접어들고 있다고 생각합니다. LLM은 코딩의 가치를 그 어느 때보다 높여주었습니다. LLM을 호출하는 코드를 작성하면 LLM API가 널리 사용되기 전보다 지능형 애플리케이션을 더 쉽게 구축할 수 있습니다. 특히, AI 펀드 포트폴리오 회사인 Kira Learning의 CEO인 Andrea Pasinetti와 함께 작성한 글처럼 누구나 AI 애플리케이션 코딩을 배움으로써 이점을 누릴 수 있습니다.
아직 코딩을 해보지 않았다면 Python 강좌를 수강하여 시작하는 것이 좋습니다. 이미 코딩을 하고 있다면 다른 사람들에게도 이 기술을 배우도록 권유해 주시기 바랍니다. 지금은 누구나 파이썬을 제2외국어로 배울 수 있는 좋은 시기입니다!
Keep learning, Andrew
1. 연구실 인원 구성이 급격하게 변동하면서 반년만에 이 연구실의 최고참급이 되었다. 내가 조인하던 시점에 시니어 포닥 4명에 테크니션 1명이었는데, 직후에 IT 테크니션 들어오고, 시니어 포닥중 한명이 패컬티 포지션으로 옮기며 멜버론 졸업하는 프레쉬 포닥 합류. 그리고 지난주 장기 여행 마치고 오랜만에 복귀하니 스탠포드 다른 랩에서 전학온 4년차 포닥 한명과, 포백(post-doc이 아니라 post-baccalaureate) 과정의 새멤버까지 합류해있었다.
처음 왔을 때 남자 시니어포닥 한명과 둘이 방을 썼는데, 언느샌가 보니 나보다 늦게 합류한 3인의 여성들과 방을 쓰고 있다. 나름 몇개월 먼저 와있었다고 여유롭게 스몰톡도 시도하고 웰컴해주면서 분위기를 부드럽게 만들어보려 노력중인데, 제법 스스로 미쿡 쿨내 난다고 자평하며 대견해하고 있다.
2. 오늘은 여기서 반년동안 진행했던 프로젝트 발표를 했다. 덕분에 반년만에 학교 연구실에서 날밤을 꼴딱 새어봤는데, 밤에 이 건물에 어떤 일들이 일어나는지 처음으로 낱낱이 경험할 수 있었다. (그동안 오피스 문잠그고 가는법도 몰랐음. 맨날 조기 퇴근해서)
교수되고 연구실에서 발표 준비하거나 연구하면서 밤새본적이 제법있긴 하지만, 랩PI와 함께 하는 랩미팅에서 발표할 준비를 하며 밤새 컴퓨터 붙들고 있자니 15년 전 서울의대 의생명과학관에서 밤을 지세우며 “ 게임보다 더 재밌다! 이런 재미라면 평생할수 있을것 같아.”고 결심했던 순간이 떠올랐다. 그때는 통증동물모델 뇌 네트워크를 분석하고 있었다.
양질의 복잡한 뇌신경활성 데이터가 내게 있고,이걸 나의 데이터직감과 수학과 논리, 툴셋을 총동원해서 파헤쳐나가는 재미는 정말 게임보다 재밌다. 내가 나의 기술로 찾아내는 패턴은, 내가 그렇게 해내지 못한다면 그냥 자연이 거기에 숨겨놓은 채 아무도 알아채지 못하고 잊혀질수도 있는 뇌의 비밀일수도 있다.
2시간이 넘는 발표는 치열했다.
발표직전까지 연구 진도를 조금이라도 더 빼고 싶었던지라, 포멀하게 슬라이드나 멘트들 준비할 시간이 부족해서 introdoctory한 내용 전반은 순발력으로 떼울 각오로 그림만 대충 붙여갔는데, 학부생부터 포닥, PI까지 계속되는 질문과, 영어패치로 잃어버린 나의 설명스킬로 인해 미진한 완성도의 발표가 되어버렸다. 그래도 무려 스탠포드에서 나같이 다른 사람들은 다른 접근으로 새로운 돌파를 시도할 수 있다는 가능성 정도는 보여준것 같다.
아무튼, 이렇게 멋진 곳에서 책임자가 아닌 일개 플레이어로서 매진하는 것도 무척 행복한 일이다.
연구실 컴퓨터 앞에 앉아 퍼즐 풀듯 문제에 매진하다 잠시 바람 쐬러 나와 벤치에 앉으면, 더이상 좋을 수 없는 날씨와 신선한 공기, 나무들, 새지저귀는 소리 속에 이런저런 연구에 대한 상념도 떠오르고 아이디어도 떠오른다. 이것이 어렸을적 그리던 과학자의 삶인가? ….후훗
물론 집에 오면 저녁식사 후에 연구책임자로서의 한국 일들을 다시 시작해야 한다. 퇴근이 없음. 주중 평균 3-5일 새벽이나 야밤에 수업이나 회의를 하고 있는 것 같다.
3. 연구년 생활 하반기 접어들면서 스스로의 생활을 다잡고 새출발을 하려고 결심했고, 여기에 가장 중요한게 늘 해왔던 루틴화된 운동이란 사실을 새삼 깨달았다. 매번 가던 교내 체육관에 사람이 너무 붐비고 락커룸도 제대로 안되어있어서 운동을 빼먹게 되는 일이 잦았는데, 알고보니 더 가까운 교내에 큰 수영장(인데 나처럼 태닝만 하는 사람들도 제법 있다. 아예 태닝하는 잔디가 있다) 딸린 락커룸 샤워실도 완벽한, 거기다 사람까지 덜 붐비는 체육관이 있음을 알게 됐다. 비록 한동안 체중이 많이 불긴 했었지만, 오랜만에 본격 운동하니 컨디션도 금방 회복되고 몸도 오히려 더 좋아진 듯한 느낌이 들어 당당하게 여기저기 옮겨다니며 운동하고 있었는데, 사람들이 자꾸 힐끔힐끔 쳐다보는게 느껴졌다. ‘옷이 좀 붙어서 너무 역삼각으로 보이나?’라고 부끄러워하며 거울을 보니, 옷을 뒤집어 입고 있었다.
4. 아이들 학교가 개강하고, 다시 평온한 일상이 시작됐다. 역시 아이들은 학교를 다녀야 귀엽다. 우리처럼 한국에서 잠시 나온 아이 친구들, 그리고 부모님들 상당수가 작별인사를 하고 떠나고 있다. 기초과학자보다는 의대임상교수님들이 압도적으로 많은데, 덕분에 여기서 나는 나대로 연구자로서 교류하고(공통 관심사는 chatGPT ㅋㅋㅋ), 아이들은 또 또래들끼리 친해져서 한국에서도 안하던 가족간 친목의 시간을 많이 갖고 있다. 떠나는 분들 보면 벌써 마음이 촉촉해지는 것이, 나도 이제 돌아갈 날이 많이 안남았구나 싶다. 쉬든, 일하든 하루하루 경험을 흘리듯 스쳐보내지 말고 밀도 있게 보내고 싶다.
주말에 드디어 옆동네(실리콘밸리) 컴퓨터역사박물관에 다녀왔다. 나혼자만 재밌을줄 알았는데 의외로 와이프도 재밌어해서 매우 만족스러웠다.
그리스시대 계산도구, 주판 등 원시적인 컴퓨팅 도구부터 차근차근 따라가다 인구조사 등 목적으로 이용된 펀칭카드 기계 들이 등장하고(데이터과학툴의 시초?), 드디어 IBM의 거대한 컴퓨터가 등장할때는 전율을 느꼈다. 당시 사람들이 이 거대한 계산기계를 보며 느꼈을 경외감을 상상해보니 50년대 인공지능 태동기, 이 압도적인 계산능력의 기계가 조만간 인간수준지능에 도달할 거라 낙관했던 전망들에도 갑자기 수긍이 갔다.
당시로서는 이 압도적인 계산능력(이라고 했지만 메모리가 막 40KB..인건 조금 멋적)과 인간수준지능 사이의 엄청난 간격을 파악할 수 있는 인지적 해상력이 없었을것이다. 상상력의 한계일 수도 있겠다.
엄청난 계산과 고도로 복잡하고 정교한 알고리즘을 수행하는 컴퓨터가 인간수준지능 관점에선 얼마나 멍청할수 있는지 수십년간 경험을 하고 나서야 이제 우리는 그 간극을 자연스럽게 인식한다.
문득 그런 생각이 들었다.
분명 언젠가 이 컴퓨터역사박물관에 전시될 작금의 거대언어모델 컨첸츠들은, 훗날 나같은 방문객들에게 어떤 의미로 다가올까? 어쩌면 그들 역시 ‘당시엔 최초로 말귀를 알아먹는 AI의 등장만으로도 충격을 받고 압도되어 인간수준지능이 눈앞에 있다고 믿었지. 그 다음부터 인간수준지능까지 얼마나 큰 간격이 있는지 파악할수 있는 해상력이 없었지…‘라고 말할수도 있지 않을까.
이미 확인된 GPT-4의 인지능력만으로도 세상은 돌이킬수 없는 단계로 도약할거라 생각한다. 정말 많은 것이 바뀔것리라는데는 이견이 없다.
그런데 어쩌면, 혹시나? 이 레벨과 AGI 사이엔 또다른 거대한 간극이 있을지도??
지나봐야 알 일이다.
어제오늘 딥러닝의 Godfather 제프리 힌튼이 인공지능의 AGI로의 발전가능성과 위험성에 대해 경고하기 위해 구글을 퇴사했다는 뉴스 때문에 세상이 동요하고 있다. 불과 2년전만 해도 아직 수십년 걸릴거라 예상했던 그가 GPT-4를 경험하고 생각이 바뀌었고 한다.
첨단의 전문가로서의 책임감 있고 지혜로운 처신일지, 부족한 인지적 해상도에 따룬 섣부른 호들갑일지.
chatGPT (GPT-3.5), GPT-4와 같은 '생성형' 언어모델들은 transformer의 encoder와 decoder 중 decoder만 이용한다.
반면 GPT 직전에 세상을 호령했던 BERT는 transformer의 encoder 구조만을 이용했다. 사전훈련된 encoding 모델은 텍스트인풋에 대한 임베딩 벡터를 내놓게 되는데, 이 임베딩벡터에 바로 다운스트림 작업을 이어하던가, 추가적인 학습을 통해 transfer learning 방식으로 도메인별 모델을 만들 수 있다 (트랜스포머 구조는 아니지만 이렇게 사전훈련된 신경망으로 임베딩벡터를 만들어 이용하는 방식은 word2vec, glove 시절까지 올라간다.).
어쨌든 지금은 온 세상이 GPT와 같은 생성형 모델에만 집중하고 있는 것 같지만, 임베딩 벡터를 산출하는 언어모델 또한 많은 가능성과 활용영역을 갖고 있다.
openAI에서도 transformer의 인코더 구조를 이용한 임베딩 모델을 제공하는데 transformer의 encoder 구조에 contrastive learning 방식으로 훈련된 것으로 짐작된다.('짐작'이라고 한 이유는 2022년1월 모델과 논문이 발표되고, 12월에 새로운 업그레이드 모델이 발표됐는데 이 새로운 모델은 논문이 아예 없다. 아마도 첫번째 모델과 비슷할 것으로 짐작할 수 밖에 없는 상황...이게 뭐람.)
chatGPT, GPT-4, 임베딩 모델 모두 API를 통해 결과만 받아볼 수 있을 뿐, 내부를 들여다볼 수 없다.
하지만 임베딩 모델은 아웃풋 자체가 거대언어모델이 데이터를 처리하는 잠재변수 공간에 해당하므로, 아웃풋을 들여다봄으로써 transformer 기반의 거대언어모델이 작동하는 이면을 들여다보는 것과 유사한 경험을 기대할 수 있다.
신경과학자의 관점에서 뇌의 신경활성 기록의 카운터 연구대상으로 거대언어모델의 내부를 들여다보고자 할 때, GPT 자체는 아니지만 임베딩 모델의 아웃풋을 들여다보는 것도 의미가 있으리라 생각한다.
최근 openai 임베딩 모델의 공간을 다양하게 탐색중인데, 재미난 사실을 많이 발견하고 있다. 인간의 사고를 잘 흉내낼 수 있는 이 모델이 고차원(1536차원)의 공간에 어떻게 세상만사 개념을 맵핑하고 있는지, 그 기하학적 구성을 체계적으로 살펴보는 것도 충분히 훌륭한 연구주제가 될 수 있을 것 같다.(라고 생각하며 이것저것 주제를 벌써 많이 찾아냈는데, 일 시킬 대학원생이 없다. 이미 일을 너무 많이 시켜서...)
인풋토큰은 트랜스포머 구조를 통해 1536차원 공간에 맵핑되고, 모든 벡터의 norm이 대략 1로 normalize되어있으므로, 1536차원의 초공간에 구형(spherical)으로 아웃풋이 분포되어있다고 상상할 수 있겠다.
인풋토큰에 대한 1536차원 벡터(이자 구형 위의 한 점)는 인풋자극에 반응하는 1536개 신경세포 집단(neural population)에 대한 활성기록이라고 볼 수 있겠다.
이제 openai의 임베딩모델은 인간언어의 의미론을 처리할 수 있는 생물학적 신경망에 대한 모델이 된다!
약간의 탐색을 통해 놀랍게도, 이 신경망 모형에 천둥의 신 토르에 선택적으로 반응하는 뉴런들을 찾아냈다 (그림1). 조금 더 찾아보니 타노스에만 반응하는 뉴런도 있고, 닥터 스트레인지에만 반응하는 뉴론도 있다 (그림2. negative하게 반응하는 뉴런까지 찾아서 카운팅함).
어찌 된 일일까.
1536차원이라는 비교적 큰 공간에서 고작 10개의 카테고리를 넣고, 그 중에서 선택성이 높은 세포를 찾은 것이 문제다.
기하학적으로 상상 가능한 3차원으로 비유해보자면, 3차원(1536차원 대신)의 구위에 3개의 데이터 포인트(10개 대신)를 무작위로 찍고, x,y,z 축으로 각각 projection 해보면 그리 드물지 않게 1개의 데이터에만 값이 크게 찍히는 경우가 생길거라는 걸 상상할 수 있다.
신경과학자가 많은 신경세포 혹은 영역들을 조사하며 특정 자극에 선택적인 반응을 보이는 세포를 찾을 때도 비슷한 상황이 벌어질 수 있으리라.
.....
그런데 단순히 이런 무작위성만으로는 설명할 수 없는 개념특이적인 뉴런이 분명히 존재한다. 우리 뇌에도 많이 존재하고, openai의 임베딩모델에도 존재한다!
숫자 0-100까지 인풋으로 넣고, 특정 숫자에만 고도로 선택적인 뉴런들을 찾아 갯수를 조사했는데, 분포가 무작위와는 거리가 멀다 (그림3). 대략 10 이내의 숫자들에 대해선 선택적인 뉴런이 굉장히 많고 그 이후로는 전반적으로 적어지는데 10단위의 숫자들은 다른 숫자들에 비해 확연히 선택적인 뉴런을 많이 보유하고 있다. 24,64,86 등의 숫자들도 범상치 않다.그림엔 없지만 100에 선택적인 뉴런은 다른 짝수들에도 어느정도 규칙적인 선택성을 보인다.
왜 이런일이 벌어졌을까.
이런 일이 벌어진 배경에 인간 뇌에서의 개념뉴런의 출현과도 공유하는 사연이 있을까.
막강한 지적 성능을 보이는 (인공)신경망 모형은 뇌를 이해하려는 신경과학자에게 너무나 소중한 (생물학적) 신경망 모형임에 틀림 없다.
90년대 고전게임중에 ‘의천도룡기 외전’이라는 게임이 있다.
대만게임으로 원제는 ‘김용군협전’인데, 게임하다 김용 무협세계로 들어간 주인공이 의천도룡기, 사조영웅전, 신조협려, 소오강호 등 온갖 김용 소설에 나오는 무림에서 무공을 익혀가며 이벤트를 해결해나가는 RPG 게임이다. 김용의 무협세계관 속 인물들과 실제 중국지도를 돌아다니며 무공을 익히는 재미가 굉장하고, 대사 속 자연스럽게 녹아있는 병맛코드도 매우 훌륭한 명작고전게임이다.
주인공이 익힐수 있는 무공 중에 강룡십팔장(항룡십팔장) 정도가 가장 강한 축에 해당하는 무공이었던걸로 기억하는데 (일양지나 독고구검 등은 엄청 강력하지만 주인공이 익힐수가 없음), 제작자들이 숨겨놓은 게임속 최강의 무공은 사실 주인공이 게임시작부터 갖고 있는 가장 기본 무공인 ‘야구권’이다(이름이 야구권이라니 ㅋㅋㅋ).
너무 형편 없는 무공이라 당연히 게임 극초반에 잠깐 쓰다 버려지는 무공인데, 무지막지한 노가다로 뚝심있게 이 야구권의 레벨을 10까지 올리게 되면(모든 무공은 사용시마다 얻는 경험치로 1에서 10레벨까지 승급할수 있음), 9,10 레벨쯤 돼서 갑자기 공격력과 공격범위등이 수직상승하고 강룡십팔장 따위와 비교가 안되는 궁극의 무공이 된다(그림1).
만약 주인공의 ‘자질’이 낮다면 주백통의 ‘쌍수호박술’을 전수받을 수 있는데(실제 김용소설에서도 쌍수호박술은 자질이 낮아야만 배울수 있음. 그래서 곽정이 배울수 있었던걸로 기억), 야구권 + 쌍수호박술이면 게임의 모든 퀘스트를 어렵지 않게 깰수 있다.
지금 판단하는 최선이 진짜 최선이 아닐수도 있다는,
greedy algorithm(탐욕 알고리즘-그때그때 최적의 선택을 해나가는 알고리즘)이 최적해를 찾지 못할수도 있다는,
이보전진을 위한 일보후퇴, 인생지사 새옹지마, ‘내가 무릎을 꿇었던건 추진력을 얻기 위함이었다’, 등등
결국 다 비슷한 이야기로 야구권 + 쌍수호박의 교훈과 통한다고 생각되는데
인간수준지능을 구현하는 여정에 대해 이 교훈을 optimization 관점에서 그림으로 그려볼 수 있겠다(그림2).
제일 왼쪽에 global optimum이 있지만 매우 좁은 hole이라, 바로 근처에 오기 전까진 gradient update로는 여기에 최적해가 있는지 알기 어렵다. 반면 오른쪽의 local optima들은 구덩이가 좀 더 넓게 퍼져있어서 쉽게 발전방향을 알수 있고, 지속적인 개선을 경험하며 확신을 얻을 수 있다. 그러나 이렇게 local optima의 구덩이에 깊게 빠지면 빠질수록 더 좋은 local optima나 global optima에 가는게 오히려 어려워 질수도 있는데, 얀르쿤이 지금의 LLMs(거대언어모델)을 ‘인간수준지능으로 가는 고속도로의 off ramp(고속도로 출구)’라고 말한게 이런의미라고 볼 수 있겠다. 르쿤 생각에 지금 chatGPT에 사람들이 열광해서 모두 LLM으로 몰려가는게 연두색 화살표에 해당하는것이고, 우리는 힘들어보여도 파란색으로 나아가야 한다는 것.
Embodiement로부터 혹은 multi-modal 데에터를 학습하여 세상에 대한 모델을 갖추게 하려는 노력이라던가, backpropagation 같은 biologically implausible한 학습이 아닌 보다 생물학적인 새로운 학습규칙을 개발하려는 노력이라던가(힌튼도 최근에 새로운 방법 하나 발표함), 신경세포의 타이밍이 살아있는(temporal coding이 가능한) spiking neural network를 개발하는 연구자들, 더 나아가 보다 세부적인 dendritic computation을 모델링하는 신경과학자들을 포함해 현재 LLM과 다른 접근을 하고 있는 연구자들의 다수는 자신들이 파란색 화살표에 해당한다고 믿고 있을 것이다.
사실 이미 인공신경망과 딥러닝이 그런 역사를 경험한 바 있다. 2000년대 초반까지 통계적 기계학습기법들의 비약적인 발전속에 인공신경망은 더이상 가망이 없는 방법론이라고 치부되었지만, 그 평탄한 gradient의 끝에 깊고 좁은 홀이 있는 것으로 밝혀졌고 지금 우리는 그 구멍 속 경사를 따라 계속 내려가며 열광중이다.
미래가 어떻게 펼쳐질지 현재의 우리는 알수 없다.
AI 개발자든 신경과학자든, 본인이 연구하는 방향이 궁극의 ‘야구권’으로 향하는 파란색화살표일지 그냥 평탄한 구덩이로 이어지는 길에 불과할지 모른다. 설사 방향이 맞더라도 기껏해야 40년 넘기 힘든 나의 당대에 골짜기를 발견할수 있을지 없을지 모르는 일이다.
하지만 적어도 각 연구자는 나의 세대든 아니든 내 방향이 파란색 화살표일거라 믿고 각기 조금씩 (각기 다른 방향들로) 전진할 수 밖에 없을 것 같다.(적어도 인간수준지능의 구현이라는 측면에서는. 사실 신경과학연구자에겐 AI개발과 다른 맥락의 중요한 가치가 많다)
지금의 신경망 구조엔 temporal coding 적인 요소가 없다.
Biophysical level의 신경망 모형을 미분방정식으로 기술하고, 조금씩 추상화하며 식을 단순화시켜나다가 1. 시냅스 conductance + dendrite cable effect에 따른 시간효과에 대한 상수와, 2. 막전위 capacitance에 따른 시간 효과를 반영하는 상수 두가지를 0으로 놓으면 미분방정식이 갑자기 지금 인공신경망 모형의 내적연산으로 바뀐다.
즉 지금 우리 모두 이용하고 있는 딥러닝은 실제 신경세포 사이의 정보전달을 모델로 하되 막전위가 변화하는 시간적요소를 제거함으로써 ‘rate coding’과 ‘temporal coding’중에 ‘rate coding’ 만을 고려하는 모델이다. (RNN이 그럼에도 불구하고 recurrent한 연결구조로 뇌와 유사한 dynamics를 어느정도 보이기도 했지만, 트랜스포머 구조가 RNN을 대체하면서 그런 다이내믹스가 현재의 딥러닝엔 없다.)
소뇌를 연구하는 신경과학자로서, 소뇌에서 특히 중요하게 다뤄지는 spike 수준의 timing 정보와 dynamics에 대한 이해가 과연 인간수준의 AI를 개발하는 측면에서 의미를 가질 수 있을지 생각해보게 된다. 의심의 여지 없이 필요한 방향이라고 생각하지만(어쩔수 없는 bias) 나의 시대에 이 방향의 gradient가 가파라지는걸 볼 수 있을지는 잘 모르겠다.
세상의 복잡하고 messy한 현상들(그림 위 “complex, real world phenomenon”) 이면엔 그보다 단순한 규칙들이 있음(그림 아래 “simple rules governing the world”)
간단한 규칙이라고 표현했지만 온우주를 설명하는 궁국의 방정식 같은 것일 필요까지는 없고, 적어도 드러나는 현상보단 간단한 규칙들이 그 이면에 존재하는 것은 사실(복잡한 생명현상 이면의 자연선택원리나 복잡한 동역학계 이면의 F=ma 처럼)
complex, real world의 고차원은 그보다 훨씬 낮은 차원의 simple rules에서 창발(emerge)하는 것.
과학자들이 하는 일이 결국 고차원으로 표현되는 복잡한 정보 이면의 저차원 ‘원리’를 찾는 것이고, 물리학에 비해 생물학은 이게 더 어렵기 때문에 한때는 우표 수집에 비유되며 폄하받기도 했었음. 물론 옛날 이야기긴 하지만, 지금도 끝도없이 디테일하게 복잡한 현상의 구석 어딘가에 돋보기를 들이대고 계속 관찰 결과를 묘사하는 수많은 연구들이 많다. 물론 이런 우표들이 예상치 못한 방식으로 저차원상의 principle의 발견으로 이어지게 될수 있음.
인간은 감각 & 운동 경험을 통해 simple rules(그림 아래)가 아닌 complex phenomenon(그림 위)와 상호관계를 맺음.
진화와 학습을 통해 뇌는 complex phenomenon(그림 위) 속에 더 잘 예측하여 더 잘 살아남기 위해 고차원의 messy한 정보 속 invariant한 속성들을 추려내서 저차원의 simple rule(그림 아래)에 대한 모델을 만들수 있게 되었음(인간의 추상화 능력). 이게 우리가 갖고 있는 세상에 대한 모델(world model)이며, 감각과 운동경험을 바탕으로 진화/학습 과정에서 만들어진 이 모델로 ‘지능’을 발휘함.
과거 인공지능 초창기 기호주의 인공지능(symbolic AI)은 simple rules governing worlds(그림 아래)와 이를 바탕으로 인간 마음속에 추상화된 world model을 명시적으로 다룸으로써 지능을 구현하려 했으나 실제 마주해야 하는 복잡하고 messy한 세상 앞(그림 위)에서 좌절.
머신러닝, 딥러닝 시대 인공지능은 complex, real world 현상(그림 위)을 드디어 잘 다룰수 있게 되었으나 (개, 고양이 패턴 인식), 이로부터 추상화된 원리(그림 아래)까지 다룰수 있는 방법을 아직 못찾고 있음(chatGPT가 자주 틀리는 산수, 논리 부분은 오히려 계산기나 구식 기호주의 프로그램들은 안틀린다)
Gary Marcus 같은 인지과학자들(인지과학의 뿌리가 기호주의)은 그래서 messy한 현상의 perception(무의식적, 자동화된 패턴인식)은 딥러닝 구조로 하더라도 많은 사람들이 이미 끝났다고 믿는 오래된 기호주의 방법을 hybrid로 사용해서 논리, 추론과 같은 그림 아래 영역을 풀어야 한다는 입장이고,
딥러닝을 탄생시킨 얀르쿤, 요슈아 벤지오 같은 연구자들은 절대 기호주의 접근을 다시 활용할 일은 없을거라는 입장(즉, 뉴럴넷 구조로 그림 아래 simple rules governing the world까지 구현할수 있다. 인간의 뇌가 그러하듯)
인간 뇌는 실제로 딥뉴럴넷과 같은 분산병렬처리 구조로 생겼지만, 이를 이용하여 simple rules governing the world(그림 아래)에 대한 world model을 만들고 운용하고 있음.
실제로 우리 마음속에서 기호를 조작하고 있는데(symbol manipulation), 이를 하드웨어에 임플라멘트 할때는 연결주의자의 분산병렬처리 구조를 쓰고 있는 것.
마치 우리가 컴퓨터로 프로그래밍할 때 변수에 정보를 할당하고 이 변수들로 기호조작을 함으로써 프로그램을 만들지만(심지어 symbolic AI를 혐오하는 딥러닝쟁이도, 딥러닝 구현 코드를 만들기 위해 열심히 변수 할당하고 기호조작함), 실제 하드웨어상에서 구현은 트랜지스터로 하는 것과도 상황이 비슷함.
chatGPT와 같은 거대언어모델(LLMs, large language models)의 열광적 지지자들은 지금의 방식으로 scale을 계속 키우면 인간수준의 지능이 구현될수 있다고 믿음. 거대언어모델들이 작동하는 원리는 기본적으로 transformer 구조이고, transformer가 하는 일은 attention 이란 방법으로 인풋으로 들어온 토큰들간의 ‘어떤’ correlation(상관성)을 열심히 찾아내는 것. 찾는 기준은 그냥 텍스트 중간에 괄호 뚫어서 잘 맞출수 있는 가임(한의대생들이 많이 보는 시험과 유사하다...) 놀랄정도로 단순하지만, 사실 인간의 뇌가 하는 가장 본질적인 계산이 예측이라 본다면, 가장 본질적인 훈련 기준일수도 있음. correlation의 종류가 엄청 다양하고(multi head), 더 많은 토큰들간의 attention 구조를 배울수 있게되었으며, 이 작업을 엄청나게 많은 웹상의 텍스트로 부터 할수 있게 되면서 놀랄만한 성과가 나오고 있는데,
그림으로 이해하자면 그림 위의 데이터를 무지막지하게 학습하면서 그림 위의 고차원상 지저분한 노란색 상관정보들로부터 그림 아래의 저차원상 추상화된 규칙에 대한 모델에 많이 가까워진것이라 볼수도 있음.
물론 아직 간단한 산수도 틀리고 있으니 충분히 가까워진 것은 아니지만, 각종 NLP 벤치마크 테스트의 기록을 예상보다 빠르게 경신하고 있는 것은 분명 우리 예상보다 많이 가까워졌음을 의미함.
얀르쿤이 최근 이런 거대언어모델들에 대해 강도 높은 비판을 쏟아내면서, 그들의 이해가 ‘superficial’하고 world model이 없기 때문에 결코 인간수준 지능에 이를 수 없다고 주장하는건, 그림위(complex, real world)의 노란연결 관찰로부터 무식하게 attention 학습하는 것만으로 저차원상의 원리(그림 아래 굵은 선들)를 찾아내는건 불가능하다는 주장이고,
LLMs 열광적 지지자들은 이 방법만으로도 가능할것이라는 입장.
나는 신경과학자의 입장에서 인간수준 인공지능이 인간 뇌의 많은 디테일까지 복제해야 할 필요는 없어도 적어도 모듈화된 구조와 특유의 dynamics 등 상당히 많은 부분에서 뇌를 모방해야 할거라고 생각하긴 하지만 (따라서 인간뇌와 상당수준 유사한 world model 구축과 운용방식이 있어야 할것 같음),
최근 chatGPT가 저 단순한 attention 구조로 이정도까지 잘 하는 것을 보면(물론 기본적으로 자기가 뭔말 하는지 모르고 떠드는 잠꼬대 수준이긴 함), 진짜/혹시나/어쩌면 attention 구조만으로 world model에 해당하는 구조까지 찾아낼수도 있지 않을까? 싶은 생각도 아주 조금 들긴 함.
Winter quarter에 진행되는 수업들 중에 두 과목을 청강 신청했다(홈페이지에 방문학자 권리중 하나로 명시되어있었다).
한 과목은 Linderman이라는 젊은 교수님이 진행하는 ‘neural data analysis를 위한 machine learning methods’란 제목의 수업인데 나름 내 전문분야라 가볍게 구경하는 마음으로 신청했지만, 기대보다 많이 배우고 있고 수업자료도 너무 알차다.
청강생이라 조별 실습에는 참여하지 않지만, 이런 컨텐츠로 실습해가며 수업을 듣는 학생들은 정말 단기간에 많이 성장할 수 있을거란 생각이 든다. 컴공, 통계, 신경과학 전공에 모두 개설되는 과목인데 수학 부분 설명하는걸 보면, 선형대수학과 수리통계까지는 알고 있어야 따라갈 수 있는 수준으로 설명을 한다(그냥 얄팍하게 기계학습 활용법 소개하는 강의는 아니란 말).
교실에 2-30명 앉아있는데 질문이 너무 많아서 거의 토론식 수업 같다. 교수는 이 질문을 또 다 받아주면서 용케 시간 내 진도를 맞춘다. 실험적인 부분에 대한 설명을 할 때 어떤 학생이 너무 깊은 질문을 했더니(교수는 실험가가 아님), 실험전공자로 보이는 학생들이 너도 나도 손을 들어서 대신 대답을 해주는데 설명하는 태도, 자신감이 이미 교수급이다.
또다른 수업은 제이 맥클릴랜드라는 교수님의 인지계산모델에 대한 강의인데, 이분은 그 유명한 데이비드 럼멜하트(역전파 알고리즘을 개발해 인공신경망의 부흥을 이끈)와 함께 PDP(Parallel Distributed Processing, 병렬분산처리)를 세상에 주창하고, 80년대 연결주의(connectionist) 진영을 이끌었던 분으로 70대 중반의 나이로 아직도 왕성한 활동을 하고 계셨다. 최근엔 트랜스포머 기반의 거대언어모델과 인지과학의 접점에서 연구를 많이 하시고, 딥마인드에 자문도 하고 계심.
알고보니 딥러닝과 신경과학의 교차영역에서 주목할만한 논문을 발표하고 있는 Andrew Saxe라는 젊은 교수도 이 랩 출신이었다(사실 몰랐다가, 논문목록을 보니 삭세 교수 논문들에 다 이분 이름이 들어있었다).
처음에 가볍게 제이 교수님에게 청강요청 메일을 보냈는데, 직접 한번 보자는 답장이 왔다. 내 백그라운드를 좀 파악하면 어떤 레퍼런스가 내게 좋을지 추천해줄수 있을 것 같다며. 오피스에서 만나 무려 한시간 정도 이야기를 나눴는데 생각보다 내 백그라운드를 심도있게 체크했다.(‘기술적인 부분..예를 들어 백프랍같은거 얼마나 아냐?’ ->’딥러닝 이면의 수학적인 부분들엔 quite strong background 있다’->’보다 심화된 수준 어느정도까지 아냐’->’최근 고전적인 statistical leanring theory를 벗어나는 딥러닝의 이론적 측면들에 대한 연구들도 공부하고 있다’->’구체적인 예를 들어봐라’->’%%^%^’…)
embodied cognition 측면에서 소뇌가 고등인지기능에 기여할 가능성에 대해 어떻게 생각하냐고 물어봤는데, 조지 레이코프의 ‘수학은 어디서 오는가’ 책을 이야기하시며(사실 이미 대강 읽어봤고 나도 그 책 영향을 많이 받았음) 그런 관점이 있긴 한데, 솔직히 본인은 딱히 그렇게 필요할것 같지는 않다고 말씀하심 ㅎㅎ
그동안 해오셨던 연구중에 내가 관심가질만한 논문들추천해주고, 매주 있는 랩미팅에 참여해도 좋다고 해서 어제는 레이몬드 랩(현재 소속 랩)의 랩미팅 마치고, 제이 랩에 가서 랩사람들 모두 통성명하고 랩미팅에도 참여했다. 수학적 인지과정을 인공신경망으로 구현하는 박사과정생의 발표였는데 매우 재밌었다. 신경과학자와는 상당히 다른 그들의 입장도 느낄수 있었고.
앞으로 두과목 수업, 두 랩의 랩미팅 일정을 모두 소화해보려고 하는데, 상당히 빡실것 같지만(월화수목 수업, 화요일 랩미팅 2개) 이렇게 공부와 연구에만 파묻혀 바쁠수 있다는 것은 참으로 감사한 일이다.
연구년,아직 일주일 밖에 안됐지만…지금까지의 감상은
와우…THIS IS STANFORD…막 이런느낌
Data has shape, shape has meaning
데이터를 공간상의 점구름(points cloud)으로 생각하면, 그 모양은 데이터가 갖는 '의미'가 됩니다.
한의학 데이터의 모양으로부터 의미를 추출할 수 있다면, 모양을 이해할 수 있게 해주는 수학적 관점과 도구들이 한의학을 연구할 수 있는 강력한 무기가 됩니다.
이 무기들-새로운 관점과 도구들을 통해 한의학의 '복잡성'을 풀어내는 것이 가능하다는 것을 보다 많은 한의대생, 한의사들과 공유하고 싶습니다.
데이터를 공간상의 모양으로 바라보는 방법에 대한 소개에 대부분의 시간을 할애하느라 막상 한의학 데이터 적용에 대한 내용은 뒤에 약간만 다뤄지고 있긴 합니다.
전체 뇌세포의 절반 이상을 차지하고 있는 소뇌 granule cell 들은 mossy fiber input을 고차원으로 expansion함으로써(저차원 정보를 고차원으로 transform함으로써) 효과적으로 정보를 처리하고 있다고 볼 수 있는데, 이 과정이 단순히 무작위 연결을 통해 고차원공간을 활용하는 정도가 아니라, kernel machine처럼 작동함으로써 사실상 무한차원을 효과적으로 다루고 있는 것이라는 가설을, 약간의 시뮬레이션 결과와 함께 perspective 형식으로 출판했습니다.
granule cell 하나 하나가 진화/발달 단계에서 경험한 특정 형태의 인풋자극패턴에에 gaussian 모양으로 튜닝되어있다면, 이미 소뇌의 구조가 특정샘플을 'memorizing'함으로써 무한차원을 다룰수 있는 커널 머신의 구조가 된다는 관점을 제안했고, 그렇다면 어떤 기준으로 샘플이 선택될것이냐(granule cell이 아무리 많아도, 기계학습과 같이 모든 훈련샘플들(=진화와 발달단계에서 경험한 모든 인풋패턴)에 대한 커널을 만들수는 없을 것이므로)에 대한 질문을 던지고 몇가지 시뮬레이션을 수행해보았습니다.
그 과정에서 예상치 못했던 통찰들도 얻을 수 있었고, 무엇보다도 (지금 우리는 그렇게 하지 못했지만) 구체적인 실험결과를 통해 확인해나갈 수 있는 새로운 질문, 그 질문을 던질 수 있는 새로운 관점을 얻게 되었다고 생각합니다.
썰(관점?)의 대부분을 개발해놓고, 막상 실험연구로 뒷받침되는 원저 논문으로 만들자니 현실적으로 여건이 안된다고 판단되어 고민하던 차에 좋은 기회가 생겨 perspective 형태로 출판하게 되었는데 저널의 impact factor 같은 지표를 떠나 개인적으로 참 의미있고, 소중한 연구라고 생각합니다. (독창적이고 새로운 관점을 제안한다는 면에서)
역사적으로 소뇌는 계산신경과학의 위대한 선구자인
Marr-Albus 부터 시작하여 현재까지 많은 연구자들이 심도있는 계산적 연구를 수행해온, 계산신경과학의 시그니쳐중 하나입니다. 대뇌피질보다 그 구조가 명확하여 접근하기 쉽기 때문이죠. 그런 사실을 대강 알고 있었음에도, 부끄럽지만 그간의 관련 문헌을 꼼꼼히 뒤져보지 않은채 막연히 우리 연구실과 같은 스타일의 접근(인공신경망과 통계적 학습이론 관점에서의 접근)은 별로 없을 것이라고 생각하고 과감하게 연구주제를 디벨롭하여왔습니다.
논문을 작성하면서 뒤늦게 꼼꼼히 참고문헌을 뒤져보니, 이미 우리 아이디어의 상당 부분이 최근 몇년 사이에 심도있는 이론+실험 연구로 활발하게 연구되고 있는것을 알게 되었습니다.
놀랍고 부끄럽기도 했지만 우리 생각이 허황되지 않았다는 안도감이 들기도 했고, 기존 연구들을 고려해도 우리가 제안하는 아이디어의 새로움은 충분히 있었기에 기쁜 마음으로 논문을 마무리했습니다.
소뇌 공부를 시작한지는 3-4년 된 것 같은데, 이제서야 정식으로 논문이 하나 나왔네요.
사실 커널 머신이면서 동시 에 OOO 구조를 띤다는 큰 그림으로 모델을 만들어왔는데, OOO 구조에 대한 연구는 실험적 검증 연구와 함께 오리지날 페이퍼로 투고하기 위해 writing 중입니다.
아마도 내년엔 나도 당당한 소뇌연구자...
꺾이지 않는 마음과 열정과 낭만으로 논문을 완성시킨, 그리고 또 다음 논문을 작업중인 1저자에게 진심으로 감탄과 감사를.
‘…(칸토어의 집합론은) 모든 구체적인 집합이 갖고 있을 터인 원소 간 상호관계, 이른바 원소의 사회성을 모조리 파괴하고, 집합을 원소 간에 어떤 연락도 교섭도 없는 군집으로 바꿔버렸다. 이 철저한 파괴 뒤에 남아있던 것이 기수였다. 집합이라는 하나의 사회에 가장 철저한 혁명, 개인주의적인 혁명이 일어나서 모든 사회성을 때려부수었지만, 이 혁명은 개인(즉 원소)의 생명만은 보장하는 ‘무혈혁명’이었으므로 인구(기수)만은 그대로였다.
집합론에서 집합이 대단히 추상적인 개념임은 말할 필요도 없다. 그러나 집합론으로 추상화의 절정까지 올라간 현대수학은, 적어도 구체적인 자연이나 사회의 연구로 향하기 위해서는 집합론 입장에만 머무는 것은 결코 용납될 수 없다. 그러기 위해서는 다시 반전하여 구체화의 방향을 정해야 한다.
집합론에 의해 단절된 각 원소 간의 상호관계, 즉 사회성을 회복하고 집합을 단순한 군집에서 사회로 재조직하는 것, 이것이 현대수학의 다음과제였다.
이 일을 계승한 것이 추상대수학과 토폴로지였다.
추상대수학이 도입한 상호관계는 결합이라고 칭해지는 것이며, 토폴로지의 그것은 어떤 의미에서 원근관계이기도 하다.’
-무한과 연속(도야마 히라쿠)
흙속의 진주같은 책이다.
집합론과 추상대수학과 위상수학의 관계를 이렇게 정리해주다니.
아직 전반부 보는 중이지만 그간 본 수학교양서 중 두손가락안에 꼽을만한 책인것 같다.
무려 1951년에 쓰여진 책(1963년에 증명불가능으로 결론난 연속체 가설이 현재 연구중이라고 소개 되고 있을 정도)이지만 말투만 좀 옛스럽지 저자의 설명센스는 요즘 블로그나 sns에 자유롭게 썰푸는 수준. 물론 이 주제를 마스터한 고수의 직관적 이해에 기반하는만큼 가볍지 않은 심오한 이해에 바탕을 두고 있다.
이어지는 군 이론도 교과서에서 절대 찾아볼수 없는 생동감 있는 설명들이 일품이다.
서점 구석탱이에서 아무 기대 없이 집어들었다가,
저자 서문의 글빨에 매료되어 예정에 없이 사들고왔는데,
서문에 드러난 저자의 범상찮음이 본문에서 유감없이 발휘되는 것을 보니,
아니 이런 좋은 책이 이렇게 세상에 알려지지도 않고 아무도 언급하지 않는다는게 안타까워
미약하나마 내가 한조각 언급을 남겨봄
데카르트가 날아다니는 파리의 움직임을 좌표계로 표현할 발상을 떠올린 순간 기하학이 대수학의 방정식으로 표현되고 수학과 과학에 새로운 문이 열렸다는 사실을 언급하며 내 연구를 소개한다면 너무 과대망상적 자화자찬이겠으나
늘상 보아오던 대상을 새로운 관점으로 바라보는 순간. 그 순간부터 완전히 새로운 방식의 사고와 통찰, 발전이 가능해진다는 점에서
내가 전통한의학에 대해 하고 싶은 긴 이야기의 첫 페이지, 인트로를 드디어 출판했다는 오늘의 기쁨을 표현하고 싶다.
한의학의 변증이란 결국 기계학습의 차원축소다.
경험적으로 인풋(관찰증상)-아웃풋(치료) 사이에 최적의 함수를 찾고자 하는 목표함수가 있었을 것이고
목표함수에 해당하는 cost function을 minimize해나가는 과정에서
우리 뇌의 인지적 로딩의 한계로 인해 인풋정보는 저차원의 공간으로 맵핑되어야 했을 것이다(우리는 복잡한 대상을 있는 그대로 기억하지 못하며 언제나 추상화를 통해 정보의 차원을 줄인다. 물론 이를 통해 일반화 능력이 증가하므로 이 자체가 큰 강점이 됨).
그런데 의학적 맥락에서 그 저차원의 공간이란게, 과거사람들이 익숙했던 속성들-찬지 더운지, 건조한지 축축한지, 안인지 밖인지 등-늘상 경험하며 익숙하게 체화하고 있었던 소박한 물리적 표현들로 이루어진 공간이다. 당연하게도 옛날 사람들이 유전자와 단백질을 알리는 만무하니.
인간은 알수 없는 미지의 대상을 이해하려 애쓸 때, 이미 익숙한 무언가로 은유함으로써 대상을 이해하려고 노력한다. H2O의 수소결합은 이해가 가지만, 양자역학의 세계가 이해가 가지 않는건 우리의 거시적 경험세계에 설명에 비견될만한 경험적 은유대상이 있느냐 없느냐의 차이다.
눈앞의 환자가 아팠고, 어떤 증상을 나타냈고, 어떤 약초들을 먹였는데 나았거나 죽었다는 경험이 누적되는 와중에 그 복잡한 인풋-아웃풋 함수를 찾기 위해 단순 memorize하지 않고 무언가 일반화된 법칙을 찾으려 했고(그럼으로써 민간요법에서 이론이 있는 의학으로 발전), 그때 그들이 이용할 수 있는 언어는 늘상 경험하던 자연의 소박한 물리적 속성들이었고 그게 바로 음양오행 육기였다.
한의학의 변증이란 결국
머리부터 발끝까지 수집된 증상 정보를 한열허실조습 등의 저차원 은유공간에 맵핑하여 환자를 특정 그룹으로 카테고라이징하고, 역시 비슷한 방식으로 저차원에 맵핑된 약재들을 대응적으로 연결시켜주는 전략이다.
'찬' 사람은 '더운'약으로
'축축한' 사람은 '건조한' 약으로.
수십수백가지 증상과 수백가지 약물간에 존재가능한 함수의 경우의 수는 조합폭발로 인해 우리 인지적 캐파를 아득히 벗어나지만, 이상과 같은 저차원공간을 경유하는 맵핑함수는 인간이 뇌로 커버가능하다.
그런데 이런 은유 공간으로서의 차원축소는 어느정도는 훌륭하게 워킹하고(현재의 한의사들이 현대과학을 알지만, 여전히 음양오행을 이용하는 이유)
당연히 어느이상으로는 잘 작동하지 않는다(충분하다고 믿는 일부 사람도 있겠으나 솔직해지자. 그게 정말 충분한지..)
현대인이 과거 한의학의 변증에서 쓸만한 지혜와 통찰을 발굴해냄과 동시에 실제가 아닌 관념과 믿음을 걷어내는 작업을 해야 한다면,
저차원 은유공간을 중심으로 한 차원축소가 어떻게 형성되어왔는지
과거의 한의학과 현재의 한의학은 차원축소 관점에서 어떻게 작동하고 있는지 객관적이고 정량적인 방식으로 평가하고 분석할 수 있어야 한다고 생각했다.
데카르트가 3차원 공간상의 파리의 움직임을 직교좌표계로 표현하는 순간
오랜 시간 기하학과 무관한듯 발전해왔던 대수학이 기하학을 설명해내는 강력한 무기가 되었듯,
음양오행 같은 소박한 이론에 기반한 전통한의학의 진단체계를 어떤 목적합수를 최적화하는 차원축소라고 바라보는 순간
한의학과 하등 무관해보이는 기계학습, 통계적 학습기법의 이론들이 한의학의 인지체계를 분석하고, 평가하고, 객관화시키고 발전시킬수 있는(긍정적이든 부정적이든) 강력한 무기가 될수 있다.
한의사과학자 진로 선택시 우선 고려해야 할 사항 (2021.10)
여러분이 만약 한의대를 졸업하고 한의사과학자의 진로를 꿈꾸고 있는 (예비)한의사라면, 가장 우선적으로 결정해야 하는 사항은,
실험연구자 훈련을 받을 것이냐(wet), 이론/분석 연구자의 훈련을 받을 것이냐(dry)에 대한 결정이라고 생각합니다.
국내/해외, 한의대/비한의대의 선택, 그리고 구체적으로 어떤 전공을 선택할 것인지는 그 다음입니다.
두 방식의 연구는 필요로 하는 적성도 매우 다르고, 갖추어야 할 연구자로서의 역량, 공부해야 할 내용, 그리고 향후 전개될 과학자로서의 매일매일의 삶의 방식도 완전히 다릅니다. 누군가에게는 천국이, 누군가에게는 지옥이 될 수도 있습니다. 무엇보다도 이 부분을 우선적으로 고려해야 하는 이유입니다.
Wet work (실험 연구)
한의학을 전공한 여러분이 의과학 분야의 연구자로서 훈련받고자 한다면 아마도 95% 이상은 Wet lab에서 트레이닝을 받게 될 것입니다. 고도의 복잡계인 생명현상을 탐구하기 위해선, 실제 인체와 동물과 세포를 대상으로 실험을 수행하고(손에 물을 묻히면서-wet), 이를 바탕으로 새로운 발견과 이론의 검증을 해나가는 작업이 가장 기본입니다.
종종 펜과 종이만으로(그리고 컴퓨터도) 물리학을 연구하는 이론물리학자들이 손에 기름묻히며 실험하는 실험물리학자보다 물리학을 대표하는 사람들처럼 보이기도 하지만, 그건 물리학이 다루는 문제가 생명현상에 비하면 '비교적' 간단하기 때문입니다.
행성궤도의 움직임이 구름의 이동이나 유체의 난류에 비해 극히 간단했기 때문에 뉴턴은 수학모형으로 우주를 설명해내는 쾌거를 이룰 수 있었습니다. 농담같은 말이지만 뉴턴의 성공은 그가 쉬운 문제를 잘 골랐기 때문이라는 말도 있습니다.
요소들이 복잡한 상호작용을 하는 복잡계는 이와 다릅니다. 어느 수준 이상의 복잡한 시스템이 되면 수학적 모형의 활용은 극히 제한됩니다. 그러한 복잡계의 가장 대표적인 예가 생명현상입니다. 수학과 물리학의 방법론들이 화학, 기계공학, 화학공학, 전자공학, 심지어 경제학의 바탕으로 자리잡는 동안에도, 생물학자들만은 수학을 익히지 않고 손에 물묻히는 실험만으로 첨단 분자생물학을 발전시켜올 수 있었습니다. 생물이 너무 복잡해서 수학방정식과 이에 기반한 예측이 애당초 잘 안맞았기 때문입니다.(생물에 바탕을 둔 응용학문인 의학 역시 마찬가지입니다. 소위 이공계학문중에 대학교에서 수학적 방법론을 제대로 공부하지 않는 분야가 생물, 의학계열 정도죠).
이런 이유로, 생물학을 대표하는 사람들은 누가 뭐래도 실험생물학자들입니다. 생물학의 역사에서 이론생물학자가 주인공이었던 적은 한번도 없었습니다. 사실 주연급 조연이었던 적 조차 없었다고 봐야 할겁니다.
한의학을 전공한 여러분이 한의대 실험실, 혹은 한의대 외부의 생명과학 관련 실험실에 진학한다면, 아마도 여러분 대부분은 손에 물묻히며 세포를 키우고, 샘플을 채취하고, 동물을 다루는 wet experiment를 하게 될 것입니다. 그리고 그러한 실험중심 연구야말로 복잡한 생명현상을 (그리고 한의학의 생물학적 상관물을) 이해해나가기 위한 우리의 핵심전략이 될 것입니다
현실적인 이유도 있습니다. 한의학을 전공한 여러분은 기본적으로 생물/화학, 생화학, 생리학 등 생명과학 분야의 기초학문들을 이미 섭렵했습니다(물론 자신 없다고 느끼겠지만). Wet experiment를 시작하기 위해서, 일단 그정도면 충분합니다. 웨스턴 블랏을 하고, 세포이미징을 하고, 동물행동 실험을 하는데 미분방정식이나 선형대수학의 선수지식은 전혀 필요가 없습니다. 때문에 경쟁력 있는 신입생을 원하는 실험실의 PI(책임연구자) 입장에서도, 학부수준의 수학적 기초나 컴퓨터 프로그래밍, 혹은 공학적 백그라운드가 없는 한의대졸업 지원자를 마다할 이유가 전혀 없습니다. (하다가 좀 힘들면 임상으로 돌아갈까 하는 걱정이 마다한다면 유일한 이유일거에요). 2) Dry work (이론, 분석 연구)
손에 물을 묻히지 않고 종이와 연필, 화이트보드와 컴퓨터를 이용하여 생명현상을 연구하는 사람들도 있습니다. 전통적으로는 물리학의 승리공식을 생물학에 적용하려는 이론생물학, 혹은 수리생물학 분야가 이에 해당합니다. 앞서 기술했듯, 이론생물학자들은 물리학이 경험한 화려한 영광을 생물학에서 재현하지 못했습니다. 대개 학부에서 수학, 물리학 등 정량적 방법론(quantitative skills)을 전공하고 박사과정에서 생물학 분야(유전학, 신경과학 등)로 전향한 이들 연구자들은 생물학계의 메인스트림을 차지하진 못한채로 나름의 커뮤니티를 발전시켜왔습니다. 신경세포 활동전위의 수학적 모델로 노벨상을 수상한 Hodgikin & Huxley 처럼 수학적, 이론적 접근의 강력함을 증명한 사례도 있었습니다만 전반적으로 이러한 성공사례가 예외에 가까운 상황이었습니다.
그러다 2000년을 지나면서 전통적인 이론생물학자들과는 조금 다른 부류의 dry worker 들이 등장하기 시작합니다.
유전체학, 대사체학 등 대용량정보획득 기술을 바탕으로 한 오믹스 학문들이 발전하면서 생물학 전반이 빅데이터의 시대로 진입합니다. 부분이 아닌 전체의 정보를 담고 있는 생물학적 빅데이터는, 때마침 부상하던 빅데이터 분석기술들 -기계학습(machine learning), 네트워크 분석, 데이터 마이닝 등-의 도움을 받아 시스템 생물학 시대를 본격적으로 태동시키게 됩니다. 동시에 대용량의 데이터를 가공, 저장하고, 공유하고, 분석하기 위해 생물정보학(bioinformatics)이란 신생학문도 등장합니다.
언제부턴가 첨단 생물학 현장들에서, 전통적인 실험생물학자들과 함께 크든 작든 dry work 전공자들이 당연한듯 함께 하는 것을 볼 수 있습니다. 이들은 대게 학부에서 컴퓨터공학, 통계 등을 전공하고 박사과정에서 생물학 분야로 전향한 사람들입니다.
생물학 내에서의 흐름을 좀더 세분화해보자면,
유전학, 분자생물학 분야가 2000년 이후 생물학적 빅데이터의 등장과 함께 오믹스 시대가 열리며 dry work 분야가 화려하게 꽃피웠고,
2010-2015년 무렵을 경계로 뇌과학(신경과학) 분야에도 대용량 데이터 획득 기술이 발전하며 본격적인 시스템 신경과학 중심의 dry work 분야가 태동하고 있습니다. 2014년 미국 오바마 정부에서 시작한 Brain Initiative project 역시 이 새로운 흐름을 잘 보여주는 사례라 볼 수 있습니다.
한의학 전공자가 의과학자의 진로로 진출하고자 할 때, dry lab에서 훈련받게 되는 경우는 그리 많지 않습니다.
일단 dry lab이 절대적으로 적습니다. 공부할 수 있는 곳이 적으니, 눈에도 덜 띄고 진출도 적습니다.
또한 한의계 외부 dry lab의 PI 입장에서 볼때, 수학, 통계학, 컴퓨터 공학 등 관련 기초를 학부에서 탄탄하게 쌓고 온 통계, 컴공 전공자 등에 비하여 한의대 졸업생은, 실질적인 연구활동을 위한 업무투입까지 준비 시간이 오래 걸립니다(오래 걸려도 해낼 수 있을거라는 보장도 없습니다. 대부분의 경우 대학원에서 학부생처럼 차근차근 공부시켜주진 못하기 때문에). Wet lab에 비하여 지원시 경쟁력이 아무래도 부족할 수 밖에 없습니다.
같은 dry work이라 하여도 연구주제가 이론적/수학적으로 깊이 들어가기보단, 데이터 분석과 통계처리 및 AI 분석 적용, 이를 위한 코딩 위주라면(의대 소속의 랩등), 한의대 학부졸업생에게 조금 더 관대함을 기대할수는 있겠습니다. 반대 극단으로, 겉으로는 비슷한 시스템생물학을 한다고 하는데 수학, 물리학 소속랩이라면 가능성이 더 적습니다.(이론 연구가 주가 되는 연구실들은 학부에서 해당전공을 하고도, 석사 기간 내내 연구 없이 공부만 하고 박사과정에서도 2,3년차 되어서야 연구가 겨우 가능한 경우도 있습니다.)
손에 물을 묻히는 wet scientist를 다르게 표현한다면 experimentalist, bench scientist 등으로 부를 수도 있을겁니다. Dry scientist의 경우 computational scientist, bioinformatician, data scientist, theoretician 등에 해당한다고 볼 수 있겠죠.
이번 글에선 여러분이 만약 졸업후 wet lab 혹은 dry lab에서 대학원생 생활을 하게 될 경우 예상해볼 수 있는 평범한 일상을 묘사해보려 합니다. 사실 같은 wet lab이라고 해도, 구체적으로 어떤 종류의 실험을 하는지에 따라, PI가 랩을 운영하는 방식에 따라 다양한 상황이 펼쳐질테고 이는 dry lab도 마찬가지입니다.
따라서 제가 이해를 돕기 위해 묘사하는 내용은 제 경험을 바탕으로 한 하나의 사례로서 모든 랩 생활로 일반화하기는 힘들겁니다. 다만 이정도의 예시만으로도 두가지 진로가 얼마나 다른지, 내가 만약 둘 중 한가지의 길을 간다면 어떤 일상을 경험하게 될지 약간의 가늠은 되리라 생각합니다. (아래의 구체적인 예시는 제가 겪었던 특수한 상황에 기반하므로, 한가지 경우라고 생각해주십시오)
대개 매일 실험 스케줄이 잡혀있습니다.
큰 수술을 하고 오랫동안 실험하는 경우는 1회만 진행하기도 하고, 실험 준비와 진행시간이 길지 않다면 연달아 실험을 하거나, 다른 종류의 실험을 2-3가지 진행하기도 합니다.
오전에 간단한 실험이나 실험 준비 작업등을 하고 점심식사 후 본격적으로 실험을 하는 경우도 있고, 쥐의 야행성에 맞추기 위해 저녁에 본격적인 실험을 시작하여 밤늦게까지 진행하는 경우도 있습니다. 데이터를 얻기 위한 실험 외에 실험에 이용할 용액을 제조하거나, 약물을 준비하거나, 쥐를 미리 실험에 적응시키는 등의 보조적인 작업들도 있습니다.
본 실험이 아직 안정적으로 이루어지는 단계가 아니라면, 실험기계들을 셋팅하고 조건을 잡기 위한 예비적인 실험을 해본다던가, 수술연습 등으로 시간을 보내기도 합니다. 이러한 기간이 생각보다 긴 경우가 많은데(특히 새로운 실험을 셋업하는 경우라면), 1-3년동안 논문에 쓸 데이터 하나도 얻지 못하고 이런 작업만 하며 시간이 지나는 경우도 있습니다. 그러다가도 운이 좋다면 적절한 조건이 찾아지고, 이후 3-4달만에 논문에 들어갈 데이터를 모두 뽑는 일이 벌어질 수도 있습니다("운이 좋다면").
하루도 손에 물을 묻히지 않는 날이 있어선 안됩니다. 실험가는 부지런해야 합니다. 일단 부지런해야 데이터를 많이 모을수 있습니다. 부지런한것만으로 충분하진 않지만, "게으른 천재 실험가" 따위는 애초에 존재할 수가 없는 것이 이 동네입니다. 기본적으로 실험일은 고도로 노동집약적인 일입니다.
실험종류에 따라서 테크닉을 익히는데 많은 연습이 필요하고 수행시에도 고도의 집중력과 체력이 필요한 일들이 있는가 하면, 쉽게 익히고 무념무상의 반복동작으로 수행할 수 있는 일들도 있습니다. 정밀한 수술실력과 손기술이 필요한 실험도 있고, 정확한 루틴을 오차없이 반복하는 것이 중요한 실험도 있습니다.
실험을 하지 않는 시간에 자기 자리에 앉아있다면 대개 논문들을 찾아보며 연구방향을 잡고, 실험방법을 확인하거나, 자신의 실험 데이터를 정리하고 분석하는 작업을 합니다. 지도교수와 실험결과에 대해 개별미팅을 하거나, 주기적으로 진행되는 랩일정(랩미팅, 저널클럽 등)에 참여하여 발표하거나 토론합니다.
아직 코스웤이 끝나지 않은 경우라면(석사2년, 박사2년), 대학원 수업에 참석하여 공부하기도 합니다. 그러나 솔직히 말하자면, 국내 의생명과학계열 대학원의 코스웤은 대개(전부라고는 못하겠지만) 충분한 강도로 이루어지지 않습니다. 그래도 제가 경험한 근 15년 정도에, 거의 허울뿐이던 대학원 코스웤 과정이 실질적인 교육이 이루어지는 과정으로 발전해나가는 것을 보았습니다. 그렇다고는 해도, 학교와 교수가 학생들에게 요구하는 코스웤의 강도는, 전공과목의 이론적 기초가 매일의 연구에 더욱 많이 필요한 dry lab에 비해 적은 편입니다.
사실 방대한 의생명과학 분야에서 전공자들도 자기 연구분야외엔 잘 모르는 게 당연한 일이라(개인적으론 바람직한 일은 아니라고 생각합니다) 학부레벨 정도에서 얕게 기초를 쌓고 올라오면, 어차피 그 이상의 지식은 코스웤과 교과서가 아닌 자기 분야 연구 논문들을 통해서 좊고 높게 쌓아가면 된다는 인식들이 많은듯 합니다.
실험벤치와 동물실을 오가며 실험하고, 실험중이 아닐 때 자신의 자리에 앉아있는 wet scientist와 달리, dry lab의 학생들은 대개 하루종일 자기 자리 컴퓨터 앞에 앉아있습니다. 겉에서 보면 구경할 거리가 별로 없습니다.
겉으로는 평온해보이지만, 연구자들의 머릿속은 치열합니다. 모순되어 보이는 결과를 설명하기 위한 수학적 모형을 구상하고, 새로운 모델을 시뮬레이션하기 위해 코딩하고, 예상과 다른 결과를 확인하곤 코드에서 버그를 찾다가, 버그와 함께 이론적 모델상의 헛점을 발견하게 되고, 현재 상황을 설명할 수 있는 가능성 있는 시나리오를 몇가지 추린 후 모델의 문제인지, 구현코드의 문제인지를 확인하기 위해 각각의 시나리오에 대한 시뮬레이션을 수행하고, 얻어진 결과를 해석하며 다시 수학적 모형을 개선하고, 이를 확인하기 위해 오픈소스 데이터를 다운받아 데이터 분석작업을 합니다. 만약 새로운 라이브러리를 적용해야 하는데 충분한 관련 경험과 지식이 없다면, 필요한 지식을 유튜브와 블로그를 통해 속성으로 익혀야 합니다. 엉망진창 데이터를 클린징하기 위한 씨름을 자주 해야 하는데, 경우에 따라선 무식하게 직접 하나하나 들여다보며 큐레이션을 하기도 합니다.
뻔한 쉬운 문제를 풀고 있는게 아니라면, 반드시 어느 단계에선 막다른 골목에 다다르게 됩니다. 이론적으로 설명할 수 없는 데이터를 보면서, 내가 알고 있는 수학적 지식과 이걸 구현하는 라이브러리의 수치적 작동방식을 다시 들여다보게 됩니다. 코스웤에서 공부해던 수학지식들을 다시 확인하고, 경우에 따라선 상황을 명확하게 이해하기 위한 가상데이터를 생성하여 수학이 어떻게 작동하는지 확인해보며 나의 기초지식을 날카롭게 다듬어야 합니다. 결국 (내가 승리한다면) 문제는 해결됩니다.
실험가와 달리, dry worker들은 세포의 성장이나 동물의 학습을 기다릴 필요가 없습니다. 어지간한 대용량의 데이터 처리 작업이라도, 고성능 컴퓨터가 밤낮으로 돌아가면 대개 일주일을 넘기지 않고 결과를 뱉어냅니다. 보다 흔한 경우에, 연구진행의 병목은 결과를 생산하는 컴퓨터보단, 연구자 스스로의 문제에 대한 이해와 사고과정의 진도에 달려있습니다. (손에 물을 묻히는 대신) 컴퓨터와 종이와 화이트보드 앞에서 씨름하는 시간 외에, 랩미팅을 포함한 랩일정을 소화하고, 지도교수와 개별미팅을 하는 시간 등은 wet lab과 크게 다르지 않습니다.
그러나 코스웤의 비중은 아무래도 제법 차이가 납니다. 물론 dry lab중에서도 분야에 따라 차이가 있겠으나 전반적으로 wet lab에 비하여 코스웤의 비중이 높은 경향이 있습니다. 위에 예로 든 정도의 연구를 진행하기 위해서 숙지해야 하는 이론적 지식(수학 지식)과 컴퓨터 프로그래밍 지식량이 결코 적지가 않기 때문입니다. 코스웤을 통해 학생의 기초지식이 쌓이지 않으면 연구의 진행 자체가 불가능한 경우가 많습니다. 전공에 따라서 이론 비중이 특히 높은 경우, 아예 석사과정까지는 연구에 참여를 안시키고 공부만 시키는 경우도 있을 정도입니다.
수학, 컴퓨터 분야의 기술적 지식이 없는 의생명과학분야의 연구자들과 협업을 많이 해야 하는 경우, 커뮤니케이션 스킬도 상당히 중요합니다. 사실 wet이든 dry 든 과학활동이라는 것 자체가 상당한 수준의 커뮤니케이션 스킬을 필요로 합니다. 다만 dry work을 하는 사람들에겐, 내 분야의 난해한 내용들을 타분야 연구자들에게 효과적으로 전달해야(만) 하는 그런 상황이 연구 프로세스 초기부터 더 자주 발생합니다.
그냥 dry work이라고 퉁치긴 해도, 사실 그 내부에도 다양한 분야가 있고, 각각에 필요한 역량이나 적성도 다양합니다. 이론과 수학에 치중한 작업도 있고, 코딩과 개발능력이 주가 되는 작업도 있고, 논리적이면서도 창의적인 데이터분석센스가 필요한 작업도 있습니다. 종사하는 사람들의 성향과 적성도 다양합니다. 수학적 이론을 잘다루지만 코딩이 쉽지 않은 사람도 있고, 데이터 분석에 필요한 감각이 매우 좋고 코딩도 잘하는데, 수학이 부족한 사람도 있고, 수학을 매우 잘하지만 실제 데이터 적용에 서툴다던가, 수학과 코딩 모두 잘하는데 컴맹끼가 있다던가...
모두 잘하는 완벽한 사람은 아마도 없을테고, 강점은 살리고 약점은 가능한 보완하면서 강점을 살리는 방향으로 연구방향을 잡게 되는것 같습니다.
wet/dry work에 대한 개념 외에 연구자진로를 희망하는 한의학전공자들이 생각해봐야 할 또다른 개념을 소개하고자 합니다.
Hard science (경성과학) & soft science (연성과학)라는 과학을 분류할 때 종종 이용되는 개념을 소개하려 하는데, 사실 이 표현이 편견을 바탕으로 특정 분야의 과학활동을 얕잡아보는 뉘앙스가 있기때문에 언급하기 조심스러운 면이 있습니다.
일반적으로 경성과학은 물리학, 화학, 생물학 등을 가리키며 연성과학은 사회과학, 심리학, 인류학 등을 주로 지칭합니다. 간혹 경성과학이 연성과학에 비해 더욱 엄격하고, 객관적이며, 재현성있고, 일관되고, 현상을 더욱 잘 설명할 수 있다는, 그러므로 더 우월한 ‘진짜과학’이란 인식이 있고, 이런 인식을 바탕으로 경성과학 입장에서 연성과학을 낮게 바라보는 경향이 있습니다. 당연히 이러한 관점과 표현에 대한 비판이 매우 많은데, 경성과학계의 일관성이 연성과학보다 더 낮다는 조사결과도 있다고 합니다.
또한 경성과학자들의 오만과 달리 최근 재미있는 현상이 관찰되는데, 원자, 유전자, 세포와 같이 물리적 실체를 직접 관찰하고 실험해볼 수 있는 경성과학에 비해 연구대상이 물리적 수준에서 명확치 않은 연성과학들이 약점을 보완하기 위해 수학적 모형이나 고급통계기법 등 dry한 방면으로 빡센 방법론을 많이 발전시켜오다보니(대표적으로 경제학이나 심리학), 최근 소위 dry work의 중요성이 새롭게 부각되는 분위기에서 오히려 연성과학자들이 익숙히 사용해오던 방법론들을 경성과학자들이 뒤늦게 도입하며 쫓아가는 모양새가 많다는 겁니다. 실험 결과에 대해 간단한 통계분석 정도로 보고하던 생물학자들이, 이제는 더 나아가 고급통계기법이나 수학적 모형을 적극적으로 활용한다던가 하는 모습들이 그런 예가 되겠습니다.
지금부터의 제 글에선 기존의 경성과학/연성과학 이분법이 내포하고 있는 다양한 편견들을 각각의 특성으로 전제하지 않으려고 합니다. 다만 물리적 실체(physicial reality) 수준에서의 설명, 즉 우리의 관심사로 국한한다면 biological level에서의 기전적 설명을 지향하는가, 그렇지 않은가로 경성과학과 연성과학을 구분하고자 합니다.
한의학을 공부하고 전공할 수 있는 과학분야중에 이런 기준으로 경성과학/연성과학을 구분해본다면 분자생물학, 면역학, 약리학, 신경과학, 생리학 등이 경성과학, 보건학, 역학, 의료정보학(생물정보학적인 측면 없이 임상데이터를 정보학적으로 다루는 경우. 임상정보학이라고 표현하는게 더욱 정확할 수도) 등이 연성과학에 해당할 것입니다. 물론 역학이나 의료정보학이 다루는 대상이 인류학, 사회과학보다는 경성이라고 할 수 있겠습니다만 여기선 유전자, 단백질, 세포 수준의 기전을 그들의 적극적인 연구범위로 삼는가 여부로 경성, 연성을 구분하겠습니다.
두 종류의 과학은 다루는 범위가 다르고, 그에 따라 각자가 기여할 수 있는 내용도 다릅니다.
이해를 돕기 위해 COVID 사태에서 두 과학의 역할을 비교해본다면, 역학자와 같은 연성과학자들이 펜데믹 초기부터 지금까지 바이러스 전파경로를 추적하고 예상하며 방역정책과 전략을 짜는 역할을 맡았고, 바이러스 학자와 같은 경성과학자들이 바이러스에 대한 생물학적 기전에 대한 이해를 바탕으로 백신을 개발하고, 치료제를 개발하고 있습니다. 당연하게도 둘 중 어느 것이 우월한가를 따질 수는 없는것이며, 각 학문의 역할이 다른 것입니다.
어느정도 픽션을 첨가하여 한의학 연구 상황에서 예를 들어볼까요?
연성과학자인 임상정보학자가 임상빅데이터 분석을 통해 한의학적으로 신정고갈로 진단된 환자들이 골밀도의 감소와 함께 기억력 저하가 함께 동반되는 패턴을 발견합니다. 이에 역학을 전공한 연성과학자는 이 세가지 변수 (한의학적 신정훼손 진단-골밀도감소-기억력 감소)의 인과관계/상관관계를 파악하기 위한 전향적 관찰연구를 디자인하고 수행할 수도 있을겁니다. 한편 신경과학과 분자생물학을 전공한 경성과학자는 뼈의 단백질 중 하나인 오스테오칼신이 해마 CA3 영역의 신경세포들에 작용함으로써 기억 및 인지기능에 관여하며, 골밀도 감소와 함께 감소하는 오스테오칼신이 감소한 것이 이러한 연관현상의 기저의 메카니즘이라는 것을 밝힙니다. 나아가 약리학, 본초학 전공의 경성과학자는 신정을 보함으로써 뼈를 튼튼하게 하며 기억력을 개선한다고 알려진 본초들이 실제로 오스테오칼신의 활성에 관여함을 밝혀낼 수 도 있을 것입니다. 이로써 한의학이론에서의 신정-골-기억력의 연계성에 대한 현대적 이해에 한발짝 다가갈 수 있겠죠 (이상의 예는 아직 가설 단계이나 일부 실제 연구결과들 있음).
역학, 보건학, 의료정보학 등의 연성과학들이 보다 응용학문으로서 현실의 문제를 푸는데 가깝다면, 분자생물학, 신경과학 등의 경성과학들은 기초학문으로서 응용학문이 발을 딛을 인류의 기초지식 증진 자체에 기여하는 측면이 더 강하다고 할 수도 있겠습니다. 그리고 이러한 스타일의 차이는 각 분야에 종사하는 연구자들의 성향과도 관계가 있을 겁니다.
여러분이 만약 연구자의 길을 고려하고 있다면, (wet/dry work에 대한 결정만큼 중요하진 않겠지만) 본인이 경성과학을 추구하고 싶은지, 보다 연성의 과학을 하고 싶은지에 대해서도 생각해보면 좋겠습니다. 아무래도 임상한의학을 공부해온 한의학 전공자로선 보건학, 역학과 같은 분야가 더 가깝게 느껴지고 쉽게 흥미를 느낄 수 있는 측면이 있는 것 같습니다(실제로 한의대를 졸업하고 국내외에서 연구자의 길을 가는 한의사들 중에 보건학, 역학, 인류학 등을 전공하는 경우가 경성과학 전공보다 많아 보입니다. 하버드, 존스홉킨스, 옥스포드와 같은 해외 유수의 기관에서 이 분야들을 전공했거나, 현재 전공하고 있는 한의사도 제법 있습니다.)
반면 경성과학을 전공하는 것은 아무래도 임상의학을 공부한 한의사에게 더 낯설고 어렵게 느껴질 수 있습니다. 특히 생물학이나 생리학같이 순수 기초과학에 해당하는 분야들에서 추구하는 지향점과 그 연구문화는 임상응용과 관련성이 높은 학문들에서의 그것과 다른 경우가 많아 공부중 방향을 잃어버리고 표류할 가능성도 존재합니다. 혹은 반대로 공부를 진행하면서 당초 한의학 전공자로서의 연구동기와는 영 멀어져버리는 경우도 있습니다.
사실 개인적으로는, 그럼에도 불구하고 한의학 전공자들이 보다 경성과학에 많이 도전해주기를 희망하는 마음이 있습니다. 위의 두가지 예에서 볼 수 있다시피,어차피 둘 중 한 가지만으로는 온전한 과학적 탐구를 할 수 없습니다.
EBM의 피라미드에서 RCT 연구와 systematic review가 동물실험보다 위에 있다고 그것이 더 가치있는 연구인 것은 아닙니다. 다소 도발적인 이야기일 수도 있겠습니다만, 코로나 팬데믹을 마침내 우리가 종식시킬 수 있다면, 그 솔루션은 역학자가 아닌 보다 근저의 기전을 이해하고 대응책을 만들 수 있는 바이러스 전문가와 약리학자들에게서 나올겁니다.
한의학의 이론과 경험들이 마침내 새로운 차원의 미래의학으로 발전해나가게 된다면, 그 결정타는 기존 한의학의 중재요법이 통계적으로 유의미한지를 밝히는 역학연구보단, 생물학적 기전을 이해하고 이를 바탕으로 더욱 정밀하고 강력한 진단, 치료기술을 개발해내는 생물학적 연구들에서 나올 것입니다. 사실 막연한 희망사항도 아닙니다. 중의학은 이미 항말라리아 치료제 개발로 노벨상을 받았습니다.
저는 그래서 제 연구실의 학생들에게 -설사 학생이 임상정보학 연구를 메인 주제로 한다고 하여도- 한가지 분야의 경성과학적 역량을 전문가 수준으로 갖출 것을 요구합니다. 약리학이든, 신경과학이든, 유전자와 단백질과 세포 수준의 디테일을 다룰 것을 추천합니다. 물론 훨씬 어렵고 힘든 일입니다. 공부할 것이 배로 많아집니다. 하지만 어렵다는 것은 그만큼 내가 해냈을 때 희소성과 그로 인한 보상도 크다는 이야기일겁니다.
쓰다보니 보건학이나 역학 전공자분들이 볼 때는 다소 불편할 수도 있는 내용이 된 것 같긴 합니다. 하지만 EBM이 시대정신인 지금의 의료현실에서 누구나 인정할 수 밖에 없는 그분들의 중요성과 영향력을 생각할 때, 이정도 경성과학을 응원한 것으로 기분 상하진 않으실 거라 생각합니다.
음양오행은 모델이다. (2020.05)
모든 한의대신입생이 개론수업에서 마스터해야 하는 음양오행(이란 네글자는, 사실상 현대 한국 한의학 내부에서 투쟁하는 두 이데올로기의 가치관을 대변하는 상징적 용어가 되었다고 생각함).
진도를 나가기에 앞서 최근 연구주제의 일부 아이디어를 바탕으로 한의학 이론에 대한 강의자료를 만들었다. 강의를 끝내고 뒤늦게 아쉬워 하며 윤필주 사진을 추가했는데
생각해보니 2000년대생들에게 윤필주는 어차피 무리였던것일까.
좀 늦었지만 바르셀로나 ocns 2019 참석 후기
올해가 3년째 참석
첫해엔 첫경험으로 분위기 살폈고
둘째해엔 본격적으로 우리 연구 발표도 했으나, 아직 나아갈 방향에 대한 갈피는 잡지 못했었다.
올해 새번째엔, 우리가 나아가는 방향의 첨단에 있는 그룹들을 확실히 파악했고 이제 막 형성되어가는, 그래서 우리도 그 시작에 함께 기여해나갈수 있으리라 확신하는 주제를 잡았다.
물론 아직 겉으로 드러난 성취에서 그들과 우리의 차이가 크지만, 그들 역시 우리가 해온 수준의 struggling을 하고 있음을 보았고, 그들이 최근에 발전시키고 있는 방법론들을 우리도 빠르게 따라갈수 있으리란 자신감도 얻었다.
computational neuroscience에서 com도 neuro도 잘 몰라 abcd 해설을 반복해야 했던 학생들이, 이제는 어엿히 자신의 연구를 발표하고, 나보다 더 잘 강의를 이해하고 설명하는 모습을 보면서 또 자신감을 얻는다.
이제 진짜 달려보자.
일단 9월 IBRO 포스터발표까지 최대한 발전시켜보는걸로
무려 4달전에 아마존에서 선주문한 Buzsaki의 신간이 도착!
일단 서문과 책 전반의 주장 요약인 챕터 1을 단숨에 읽었다.
뇌를 이해하기 위한 연구 방법론에 대해 그가 어떤 주장을 하는지 다른 글들을 통해 대략은 알고 있었지만, 이렇게 밀도 있게 그의 주장을 음미한건 처음.
서문에 보니 카할 이름 들어간 무슨 대단한 상을 받고 평판 높은 저널에서 원고를 부탁받았는데, 에세이 형태로 현대 신경과학 접근에 대해 모두까기를 시전했다가 리젝을 먹었단다...(invited인데ㅋㅋ)
그일로 빡친게 이 책을 쓰게 된 계기가 되었다고...이정도 되는 수준의 양반들에게 이런 일들도 일어나는 구나
19세기 윌리엄 제임스 시절에 나온 마음에 대한 용어들을 뇌의 연구 주제로 삼고, 대응되는 뇌구조와 기전을 찾는다는게 골상학이랑 하나도 다르지 않다는 (오히려 더 나쁘다고 함) 신랄한 비판부터 시작해서
뇌가 수동적으로 외부의 (인간이 자의적으로 정의한 feature를) "represent"한다는 개념 -나 역시 이 분야를 연구하는 사람으로서 이건 정말 뿌리깊은 신경과학자들의 기본 사고 프레임 맞다, 그래서 뇌가 정보를 표상한다고 표현하고-, 마치 그것이 뇌(특히 sensory areas)의 job인것처럼 생각하는 관점을 맹렬히 비판한다.
뇌세포들이 보이는 활성패턴은 누군가에게(호문쿨루스) 암호를 펼쳐 읽으라고 보여주기 위한것도 아니고, 그냥 지들끼리는 upstream, downstream neuron들끼리만 소통할 뿐이며, 그런 소통이 특별한 활동패턴으로 다듬어지게 되는 이유는(진화를 통한 prewired + 후천적 learning), 결국 action-perception arc 때문이라는것. 어떤 행동이 뭔가 도움이 되면 그런 행동을 강화하는 방향으로 센서리도 조절.
당연히 호문쿨루스는 없고 action을 중심으로 뇌가 어떻게 코드를 "만들어내는가" 그 syntax를 봐야 한다는 주장. 뇌 활성패턴 자체를 독립변수로 놓고(외부 자극이라는, 인위적으로 인간의 잘못된 관념하에 설정된 독립변수에 대한 종속변수가 아니라), action을 primary source of knowledge로 삼아 신경활성패턴의 'meaning'을 찾아야 한다고..
체화된 인지 개념이나 로돌프 이나스 등의 신경과학자들의 입장, Friston의 free energy 이론 등과 기본적으로 철학이 통하는 면이 많다고 느끼는데, 실제 이들 이론과의 비교를 이후 챕터에서 전개한다고 함.
머리가 짜릿하니 복잡하다.
지난해부터 나름 진지하게 신경세포집단의 활성 데이터에서 표상하는 feature를 정하는 문제에 대한 이론적 연구를 진행해왔고(물론 데이터 바탕으로),
최근엔 학생들과 딥러닝 모델을 활용하여 신경과학자들이 ML등으로 feature 특정시도시 오류에 빠질수 있는 사례를 탐색해나가는 중이었다. (부자키가 비판하는 experimenter selected feature 를 기반으로 연구하는 상황에 대한 비판. 그러나 큰 틀에선 다 부자키의 비판을 벗어날수 없는 접근)
부자키의 통찰이 막연히 내 연구의 방향에 도움이 될거라고 생각은 했지만, 생각보다 더 이거 완전 내 연구 얘기네..
일단 딥러닝 모델부터..CNN보단 RNN을 파는걸로..
#1일차
작년에 비해 학생들과 나도 많이 성장했고, 데이터사이언스적 접근을 한다고 할수 있는 Allen에서의 학회라 튜토리얼을 포함한 내용적으로도 매우 만족스러운 첫날이었다.
무엇보다도 학회 공부중 내용들을 나뿐 아니라 같이 온 학생들도 이해하고 함께 소화해내고 있다는 느낌이 정말 뿌듯하다. 레벨0부터 시작하는 육성 시뮬레이션 게임 느낌이랄까. 힘들지만 그간 많이 경험했고, 좌충우돌하면서 성장해나가고 있구나 싶다.
별로 기대치 않았던 시애틀의 환상적인 날씨와 쾌적함, 맛난 음식과 스벅 1호점 커피맛 등은 덤.
내일은 포스터 발표. 진짜 학술활동을 할 시간이다.
#3일차
지홍이와 함께 기대했던 발표를 잘 마쳤다.
두 사람 합해서 10명 정도 이야기 한듯.
Theoretical framework을 formal하게 전개한 부분이나 개념의 실제적인 적용을 위해 통계적인 정량값을 정의한 부분 등은 처음 보고 따라가기 쉽지 않을수도 있을거라 생각했는데 내가 OCNS를 너무 무시했던듯. 무시 같은걸 할 처지가 아닌데 ㅋ
방문한 사람들이 대개 이미 관련지식과 연관연구에 대한 이해도가 충분한 사람들이어서 기대보다 훨씬 본격적인(?) 논의를 할 수 있었다.
준비하고 발표하고 디스커션하다보니 확실히 우리 연구가 실험가와 이론가 모두에게 중요하고도 실천적인 내용을 담고 있다는 확신이 생김.
추가적으로 진행해나갈 수 있는 방향들이 벌써 2,3가지 떠오르는데, 여기서 새끼쳐서 내년 스페인 바르셀로나엔 학생포스터 3개 들고 가야겠다고 결심(하고 학생들에게 통보). 그리고 난 오랄로 지원해야지.
# 4-5
포스터나 오럴세션에서 작년에 비해 확실히 deep learning, ML 관련 내용이 좀 늘었다.
딥러닝과 신경과학의 관계를 크게
1. 딥러닝이 신경과학에 활용되어 기여
2. 신경과학이 딥러닝에 기여
로 나눠 본다면 1이 2보다 더 많았음. 근데 사실 어떻게 보면 이건 양쪽에 지식을 갖추고 있으면 크게 어렵지 않은 아이디어라..
이번에 보았던 것중에 예를 들면
Allen Inst. 에서 세포들을 electrical property, transcriptomics, morphology 등등 다양한 feature를 이용하려 클러스터링하는데, 기존에 쓰이던 스탠다드한 접근법들보더 coupled autoencoder를 활용하여 clustering하는게 훨 나았다거나
수십만개의 세포에서 동시기록된 zebra fish의 2-photon imaging 데이터를 이용하여 세포활성패턴의 변화를 예측하는데, LSTM 적용한 것 (단순 적용은 아니고 부족한 data augmentation을 위하여 기존의 컴뉴로 이론적 모델을 기반으로 가짜 데이터를 대량생산하여 트레이닝 셋으로 이용. 실제 단순 LSTM에 비해 퍼포먼스도 현저히 상승. 이런게 재밌는 융합포인트인듯).
2가 1에 기여하는게 사실 더 창의적이고 재미난 일이라 생각하는데 기억 나는 몇가지.
나방의 후각신경계에 대한 뉴럴넷 모델을 이용하여 일반적인 ML 적용전 feature detector로 이용, 훨씬 적은 양의 데이터로 빠른 learning 을 보임. 실제 deep learning 이 높은 퍼포먼스를 보여도 생물과 달리 비현실적으로 많은 데이터를 필요로 하는게 문제인데, 나름 생물학적인 메카니즘이 이런 부분에 기여할 수 있다는걸 보인 사례로 생각됨. 실제 적용대상은 MNIST 숫자 데이터였음ㅎ
연구 초기인듯 하여 좀 싱겁긴 했지만, CNN과 실제 시각계의 구체적인 해부학적 매칭을 시도한 뒤 실제 연결패턴응 CNN과 시각계간에 비교한 연구. CNN에서 receptive field가 레이어에 따라 변화되어거는 과정이 생물학적인 관찰과 일치한다는건 이미 잘 알려진 사실이지만 정확히 어느 레이어쯤이 생물학적 시각계의 어느영역쯤 되느냐라고 물으면 명확히 말하기 힘든 상태였다. 이 포스터에선 나름 데이터를 바탕으로 기준을 설정하고 밉핑을 시도. 결론적으로 몇가지 CNN 모델과 생물학적 신경망의 connectivity matrix를 비교했는데 전반적으로CNN의 연결패턴이 생물학적 시각계에 비해 long range connection이 현격히 부족한 양상이었음. 어떤 의미가 있을까?
마지막 기억나는건, hebbian rule, lateral inhibition 등의 생물학적 메카니즘을 CNN에 적용하여 퍼포먼스를 향상시켰다...뭐 이런 내용이었던것 같은데, 연자가 이미 바빠 잠시 대기하던중 화제 경보기 울리고 다 대피하느라 제대로 보진 못함. (알고보니 왠 흑인이 워싱턴대 깃발 태우고 난동부린 거였음. 난 대피해있다 그 범인이 참가자 한명 노트북 뺏어서 부수는 현장에 있었는데, 공부만 한 사람들이라 다 쫄아서 멀뚱멀뚱 feeezing되어있었...:;;) 경찰 출동하고 결국 잡혔다는. )
여튼 이 학회의 메인스트림과는 거리가 있지만 이 방향의 융합연구도 점점 자연스러워지는듯 하다(애초에 CNS 창립 계기가 비슷한 목적으로 창립한 NIPS가 ML쪽으로 치우치는 바람에 따로 다시 만든거라 이게 메인이 될수는 없을듯 함).
한편으론 관련 포스터에서 함께 질문하던 연구자들 질문을 들어보면 생각보다 deep learning의 구체적 방법론에 대해선 생소한 경우가 많은듯 했음. 아직 이 동네 연구자들의 관심이 그만큼 떨어진다고 볼 수 있을 듯.
#마지막 날
나름 computational한 이론전개와 실제 분석결과를 고루 갖춘 내용을 준비했는데 어떤 반응들을 받을지. 궁금해서 잠이 안온다.오늘 마지막 키노트 강의는 랍스터 위장관 운동계 (STG) 분야의 대가라는 분 강의였는데, 잘 모르는 분야라 별 기대없이 의무적으로 들었으나, 결론적으로 이번 학회 키노트강의중에 가장 인상적이었음.
Eve Marder라는 여성과학자였는데 처음 소개받을때 브레인 이니셔티브 어쩌고 오슬로 상도 받고 어쩌고 휘황찬란하길래 ‘오 이론가중에 저렇게 뉴로사이언스 중심에서 유명한 분이 또 있었는데 내가 전혀 몰랐구나...’ 했는데 알고 보니 이분은 정통 실험가였음 (역시나).
우리가 연수에서 오실레이션 리듬 만들어서 somatic motor nerve를 통해 diaphragm의 striated muscle을 조절하는 것처럼(자율신경계를 통한 smooth m. 조절이 아니라!), 랍스터의 위장관 운동조절은 somatogastric ganglion의 pace maker cell들이 리듬을 만들고 이게 위장관의 striated m. 을 조절하는 형태로 이뤄진다(는걸 오늘 처음으로 제대로 알았다).
암튼 STG는 그 구성과 연결이 잘 파악된 small circuit임에도 (C. elegans에서도 그렇듯) connectome과 기타세부지식만으론 모든게 put together됐을때 창발하는 신경계의 복잡한 behavior를 알수 없다(충분치 않다)는걸 보여주는 사례로 볼수 있겠다.
이렇게 간단한 서큣에서 창발하는 다이내믹스도 이해하기 힘들다면 하물며 그보다 복잡한 동물에서야..
여튼 이분은 철저히 정통 실험가로서 circuit 수준 behavior를 연구하다보니 많은 이론가들과 활발한 협력연구를 해왔고 물리나 CS, ML 스러운 관점에서 실험신경과학의 문제를 (문제가 있어 문제가 아니라 풀고자 하는 문제) 바라볼수 있는 통찰력을 갖출수 있었던 것 같다.
현실에 발을 딛고 이론을 이용할 수 있었던 이 지점이 이분을 대가로 빛나게 만든 힘이 아니었을까.
구체적으로 건질만한 인사이트가 정말 많았는데 글이 넘 길어지니..관심 있으신 분은 사진을 참고하세요.
동일한 신경계의 행동을 설명할수 있는 파라미터 솔루션은 한개가 아니라 여러개이고(어찌보면 당연) 바이올로지는 그 중 한가지 해를 고른게 아니라, 개체마다 다른 솔루션(파라미터 셋의 컴비네이션)을 갖고 있더라는 것. 그리고 이게 극한 상황에 대한 개체별 레질리언스에 영향을줬고, 크게는 이것이 환경변화에서 종수준 적응해나갈수 있었던 힘일것이라는 것.
개인적인 인상으로
컴뉴로를 하는 이론가들은 물리학에서 이론 물리학자의 위치와 역할, 영향력을 지향하나, (역사적으로나 대중적 인식으로나 이론물리학자들이 갖고 있는 위상과 달리) 이론신경과학자는 거의 언제나 신경과학계의 중심보단 변방이었다. 호지킨 헉슬리와 같은 전설도 물론 있었지만.
생물은 물리가 아니라서 그렇다. 어찌보면 당연한 이야기. 그래서 실제 현장의 날것을 취급하지 않는 이론신경과학자는 역시 비슷한 이론물리학처럼 될수 없음.
이브 마더처럼 이론을 잘 알고 이론가들과 협력할수 있는 실험가가 이론의 극한까지 밀어붙이는 온리이론가보가 뇌에 대해 말해줄수 있는 통찰이 대개는 더 크리라.
문제는 이론가와 실험가들이 같은 신경과학자들이라 해도(이론물리학자-실험물리학자와 달리), 기초적인 백그라운드가 너무 심하게 차이가 나 소통이 정말 정말 안된다는 것.
요즘 추세를 바탕으로 상상을 좀 해보면
neural data scienctist가 이 간극을 메우며 핵심적인 역할을 해나가게 되지 않을까.
실험가와 마찬가지로 굳건히 현실에 발을 딛고 있는 이들은, 수학을 이용하고, 컴퓨터에 능하며, 이론가들의 언어를 이해할 수 있다.
5-6년이면 확연해지리라 예상해본다. SFN에서도 CNS에서도.
그리고나면 지금과 같은 이론신경과학자와 실험신경과학자의 완벽한 따로국밥놀이는 자연스럽게 해결되어나가리라
2012년 Nature에 튜링 탄생 100주년을 맞아
<Is the brain a good model for machine intelligence?>라는 제목으로 몇몇 연구자들의 코멘트가 실렸던 것을 최근에 우연히 발견했다.
AI-신경과학 양쪽에 어느정도 이해가 있는 4인이 짤막하게 생각을 썼는데
통찰력 넘치는 로봇공학자 로드니브룩스와 함께
알파고의 아버지 데미스 하사비스가 UCL 소속 신경과학자로서 포함되어있다 허(Neuroscientist, computer-game producer and chess master 라고 소개가..).
질문에 대해선 4인 모두 Yes 한 것으로 봐도 될 것 같다.
로드니 브룩스는 튜링이 생각했던 symbol manupulator와 뇌는 전혀 다른데도 불구하고, 정작 computational neuroscience 한다는 사람들이 뇌를 컴퓨터로 이해하려고 70년동안 삽질했다는 식의 훈계 (컴퓨터가 뇌를 닮아야 하는데, 뇌를 컴퓨터랑 닮은 것으로 모델링해왔다고)를 퍼붓고 있는데 사실 이 훈계는 좀 과한 것 같다.
5,60년대 최초의 인공신경망인 perceptron이 만들어질 당시, 인공지능=기호연산으로 생각했던 1세대 AI 연구자들이 neural network 모델로 논리연산을 수행했고, 이 결과를 보면서 인공지능이 연결주의로 구현될수 있네 없네 웃고 울고 했던 것은 사실이나 (마빈스키가 XOR 못한다고 퍼셉트론 까고 했던게 결국 다 기호, 논리 연산으로 인공신경망의 성능과 한계를 논하고 있는 것)
vision, memory 등 다양한 분야에서 전개되어온 computational neuroscience의 연구성과들을 1세대 GOFAI(Good Old-Fashioned Artificial Intelligence) 스타일을 추구하는걸로 본다면 완전 잘못이다.
초기 ANN이 기호연산으로 지능구현을 꿈꿨지만 정작 현재 딥러닝을 포함한 연결주의 AI 모델들이 pattern recognition에 집중하며 발전하게 된 것과 마찬가지로,
computaitonal neuroscience의 연구들도 AI 엔지니어링 필드와 성과를 주고 받으며 감각의 표상과 기억의 앙상블에 대해 연구해왔지, GOFAI 스타일의 기호조작을 이야기해오지 않았다. 세포수준에서 신경망을 연구하는 연구자들에게 기호연산은 너무나 추상적이고 동떨어진 이야기였고, 그 때무에 오히려 이 부분이 과도하게 외면받아왔다고 봐야 하지 않을까.
데미스 하사비스가 뇌를 더 이해하자고 열정적으로 주장하는 것은 너무나 당연한 이야기라 놀랄 것이 없으나 그가 드는 예가 재밌다.
"For example, if we knew how
conceptual knowledge was formed from perceptual
inputs, it would crucially allow for the
meaning of symbols in an artificial language
system to be grounded in sensory ‘reality’."
하사비스는,
튜링과 GOFAI가 추구했던 기호연산을 실재하는 감각에 ground하여 이해할 수 있기를 희망하고 있다. 그리고 그러기 위해선 perceptual input이 어떻게 conceptual knowledge를 만드는지 (실제 뇌신경망 수준에서) 알아야 할 것이라고 말하고 있다.
개인적인 생각으로
우리 뇌에서 가장 GOFAI가 추구하는 기호표상과 조작에 따른 지능과 유사한 부분이 hippocampus를 비롯한 측두엽이라고 생각한다. 극단적인 개념표상 뉴런(grandmother cell)이 있는 곳도 이 곳이고, 이렇게 기호 수준으로 '차원축소'가 충분히 이뤄져 있기 때문에 에피소드의 표상과 저장이 가능한 것이 아닐까 (우리가 기억하는 에피소드 자체가 기호-개념(예를 들면 특정 인물)들간의 고차적인 상관/인과관계이므로).
사실 하사비스가 신경과학자로서 전공한 분야가 이쪽이다. hippocampus 를 중심으로 memory encoding/decoding. 튜링 특집인 이유도 있겠지만, 자신의 전문분야때문에 저런 남다른 예를 드는게 아닐까 싶다.
말 나온 김에 아무말좀 더 하자면,
통찰력 대장 라마찬드란이 의식(감각질)이 나오는 곳으로 측두엽쪽을 지목했는데(의식 연구의 대세는 아니지만), 어쩌면 기호표상과 의식경험 자체가 밀접한 관련이 있을수 있지 않을까 싶다.
둘다 충분히 차원이 축소되어 상당히 '단순화'된 상태가 아닐까 생각하는데,
정보가 차원축소, 단순화되는게 어떤 이점이 있냐면
추상화를 통해 단순화된 개념, 기호 들간의 고차적 상관/인과관계를 파악할 수 있게 되고 (수학에서 기호를 이용하여 더 어려운 현상 이면 관계를 파악할 수 있듯이), 이는 개체를둘러싼 환경의 고차적 상관/인과관계의 파악을 통해 결국 생존에도 도움이 된다(라고 생각한다).
오만가지 차원의 감각인풋이 converge하여 grandmother cell로 개념, 기호화되며 차원축소되는 것이 맞다면,
'의식경험'은 갑자기 왜 차원 축소냐..점점 아무말 막말이 심해지는 느낌이지만...
우리 의식의 영역으로 들어오는 정보의 복잡도라는 것이 생각해보면 (무의식적 정보처리의 복잡도에 비해) 높지 않다. 무의식 영역에서 오가는 정보의 차원에 비해 훨씬 저차원상에 있을 수 있다는 말이다.
별것 아닌 걸음동작을 비롯해, 로봇으로 구현하려면 엄청나게 복잡할 정보처리의 대부분은 무의식중에 일어나고 있으며, 우리 마음 속엔 그와 달리 극도로 추상화된 '개념'들이 그들간에 관계를 이루며 세상을 표상하고 있지 않은가.
그래서 만약
무의식적 수준에서 이뤄지는 신경회로의 복잡한 계산과정을 설사 과학자가 다 밝혀놓는다 해도우리는 '이해'할 수 없다.
그렇게 복잡한 내용은 우리 의식 영역, 마음 속으로 들어올 수 없다.
컴퓨터에서 시뮬레이션 돌려 나온 결과를 확인할수는 있겠지만,
그 과정을 마음 속에 떠올리며 '이해된다'라고 표현하기는 힘들 것이다.
즉, 우리 의식이 다룰수 있는 정보, 의식화될 수 있는 정보는 충분히 추상화된 저차원 정보 뿐이고, 사실 또 그게 복잡한 계산 잘 하는 컴퓨터 대비 의식을 가진 인간의 미덕일 것이다(라고 생각한다).
마음속에 추상화된 개념과 기호를 갖고 더 복잡한 큰 그림, 먼 그림, 다양한 상황의 그림을 그릴수 있기 때문에 의식이 없는 컴퓨터보다 인간이 뛰어난 것 아닌가.
대부분의 의식연구자들이 인정하고 있는 '의식경험 상황에의 뇌의 광범위한 synchrony 현상'도 이런 내 아무말과 통한다. (누가 이런 관점에서 시도해봤단 얘긴 못들어봤지만) 광범위한 sync는 반드시 다차원 신경세포 활성 상태의 엄청난 차원축소를 유발할 것이다. 계산해보나마나.
잡설이 길었지만, 다시 돌아와서
하사비스가 덧붙인 제안도 재밌다.
"AI researchers should not only immerse
themselves in the latest brain research, but
also conduct neuroscience experiments to
address key questions such as: “How is conceptual
knowledge acquired?” Conversely,
from a neuroscience perspective, attempting
to distil intelligence into an algorithmic
construct may prove to be the best path to
understanding some of the enduring mysteries
of our minds, such as consciousness
and dreams."
AI 연구자는 직접 뉴로사이언스 실험하고, 신경과학자는 직접 만들어보라고. (아무나 못할 제안을 막 던지고 있다.)
“감각은 진화적으로 몸 표면에 가해지는 자극에 '평가반응'으로 화답하는 일종의 신체활동이라는 사실로부터 감각 특유의 현상학이 도출된다.”
“의식적인 감정은 ‘의도적 행위’의 두드러진 한종류이다”
“감정이란 우리에게 일어나는 사건으로서 의식에 들어오는 것이 아니라, 우리 자신이 일으키고 참여하는 활동으로서 의식에 들어온다”
“장미냄새를 맡을 때, 자신의 콧구멍에서 벌어지는 일에 ‘가상활동 패턴’으로 반응한다. 그것은 몸 표면의 다양한 자극에 대한 ‘평가반응’으로서 오래 전에 진화한 활동 패턴의 집합, 즉 수용이나 거부의 꿈틀거리는 몸짓 중 하나다. 현대 인류에서도 이런 반응은 여전히 자극 부위를 향하며, 원래의 기능과 쾌락의 정도의 흔적을 여전히 간직하고 있다. 하지만 그런 반응은 외현 행동으로 이어지는 대신에 뇌의 내부 회로 안에 ‘고립되어’ 있다.”
"사실 그 원심신호는 오늘날 멀리 간다고 해야 감각피질로 투사되며, 감각 기관으로부터 오는 신호와 상호작용하여 자체적으로 얽히면서 '회귀하는 일시적 순환 고리'를 형성한다."
-니콜라스 험프리
'의식' 에 관한 수많은 이야기가 있다. 철학자의 이야기도, 심리학자의 이야기도, 신경과학자의 이야기, 물리학자의 이야기도 있다.
코흐와 토노니의 계산신경과학적 정보통합 이론도 매력적이고, 데하네의 정통 신경과학적 접근도 탄탄하지만, 니콜라스 험프리의 통찰력 있는 접근이 개인적으로 가장 가슴에 푹! 박힌다.(원숭이에서 맹시(blind sight)를 발견한 의식 연구자로 '빨강보기'라는 책으로 유명. 번역되어있음.)
뇌는 움직이기 위해서 존재한다는 이나스, 월포트 등의 통찰과도 통한다.
통증 연구에서 엉뚱하게 cerebellum이 많이 활성화되는 이유중의 하나도 이걸로 설명할 수 있지 않을까.
학회에 가면서 사놓고 그동안 대기시켜놨던 토노니의 의식에 관한 통합정보이론(IIT) 책을 챙겼다.
가는 비행기에서 논문 리뷰도 한편하고, 영화도 한편 보고, 와인 먹고 취침까지 하고 남은 시간에 책 절반 가량을 읽었다. 그냥 술술 읽히는 내용들.
이번 학회 웍샵 발표중에 IIT의 내용을, 의식에 관한 이론이라는 힘을 좀 빼고(?) 신경과학 툴로서 다루겠다는 발표가 있어 기대했는데 연자발표 순서가 바뀐걸 놓치고 있다가 못듣고 말았다.
돌아오는 비행기에서 토노니의 책 나머지 반을 읽으려 하였으나…
너무 추상적이고 모호하다.
수식을 모두 빼고 직관적으로 가볍게 의미를 전달하고자 한 저자의 의도를 모르는 바는 아니나, 이런 방식으로는 답답함만 더 커진다.
프랑크푸르트 환승시에 재빨리 수식이 나온 논문 몇편을 다운받았다.
환승후 비행기에서 책 대신 그냥 논문을 봤다.
훨씬 이해가 쉽다. effective information과 phi에 대한 수학적인 정의, 그리고 간단한 toy example이 나와있다.
사실 핵심 이론의 수학은 전혀 어려운 내용이 아니다.
information entropy에 대한 개념을 숙지하고 있고, 확률분포를 이용하여 information entropy를 계산하는 테크닉에 어느정도 베이스가 있는 사람이라면 금새 이해할 만한 수준이다.
핵심은 의식이 있으려면 두가지 상반되는 조건을 만족해야 한다는것인데
1. 정보의 함량이 많고 -즉, effective information이 크고
2. 동시에 통합력(?)이 커야 한다. 따로 놀때보다 하나로서 의미있는 정보를 더욱 줄 수 있어야 함. -이걸 phi로 측정함.
두가지 동시에 만족하는게 쉽지 않다.
간세포들은 정보의 함량은 많지만, 통합이 안되어 각각 열심히 일하는 집합체에 불과하고(GPU? ㅋ)
심장은 통합력(?)은 좋지만 경우의 수가 단순해 정보의 함량이 적다.
뇌는 두가지 다 높아서 의식이 있다(고 저자들은 생각)
나아가 뇌세포덩어리가 아니더라도 두가지 다 높으면 의식이 있을 것(이라고 저자들은 추측)
좀 더 구체적으로…
effective information과 phi 둘다 확률분포간의 KL divergence로 구한다.
KL divergence는 쉽게 말하면 두 확률분포간에 얼마나 다른지에 대한 측정이다 (symmetric한 값이 아니라서 거리라고 하진 않는다).
effective information은 시스템의 최대정보량을 보일때의 분포(=uniform distribution) vs. 특정 state(t = 1) 하나를 알고 있을때 불확실성이 줄어든 확률 분포(t=0에서의) 간의 거리다. 두 확룰분포간의 차이가 클수록, 그 state가 많은 정보를 줬다고 할수 있다 -> 이런 스테이트를 다~해보면 결국 시스템의 정보함량을 알수 있게 됨(여기서 state들 각각에 대해 다~한다는게 현실적으로 적용할때 감당하기 힘들듯 싶다)
phi 는 특정 state (t=1)을 알고 있을때 t=0에서의 확률분포(위에 나온것과 같은것) vs. 시스템을 최대한 작게 쪼갰을때 각 부분별로 확률분포를 구하고, 독립을 전제로 각 부분의 확률분포를 모두 곱했을때의 분포. 간의 차이를 (KL divergence)로 구한다.
이 값이 클수록 전체는 부분의 합 이상이 된다는 의미.
근데
이 두가지는, ‘의식은 이러이러한 걸꺼야’라는 직관적 추론에 기반한 ‘공리’다.
사실 충분히 잘 발전한 인공신경망이 저 정의에 따라 정보함량과 통합력 모두를 달성한다면, 저 공리에 따라 의식이 있다고 인정해야 하는걸까?
그러려면 저 공리 기반의 측정값들이 성공적으로 작동함을 검증해야 하는데, 무얼 상대로 검증하나?
(주어진 공리가 ‘의식’의 필요충분조건이 아니라, 높은 수준의 지적 능력에 대한 필요충분조건이라는 반론이 일단 쉽게 떠오르므로) 가장 좋은 검증대상은 ‘의식이 없는 것은 확실하지만, 인간의 뇌 만큼이나 복잡한 추론, 예측, 지능적 행동을 구현할 수 있는 AI’ 가 되어야 할텐데..(이걸 의식이 없다!고 측정해내면 성공적일듯), 근데 그런 AI가 나왔을때 의식이 확실히 없다는건 어떻게 알수 있나?
순환논리다.
브레이드 러너의 안드로이드든, her든, 채피든… 의식이 있다, 없다 어차피 아무도 판단 못함.
인간대상으로 의식이 있을때와 없을때 측정하여 이론을 뒷받침하는 시도가 가능하겠지만, 의식이 없는 환자가 충분히 복잡한 고도의 사고를 하고 있는 중이 아니라면 역시 위의 반론을 방어하기 힘들것 같다(토노니의 측정값들과 그에 따른 판단은 ‘의식’ 그 자체에 대한 것이 아니라, ‘복잡한 추론과 예측 등의 지능을 가능케 하는 시스템’에 대한 것이라는).
여튼, 일단 힘을 좀 빼고 더 공부해봐야겠다.
관련 논문과 최신 업데이트 내용도 상당히 많은것 같은데 아직 하나도 못봤음..
적어도, 신경계의 작동원리를 시스템 수준에서 연구하는데 좋은 방법론이 될 수 있을것 같단 기대감은 커지고 있다.
(결국 이게 어제 들으려 했던 워크샵 주제였던것 같은데..)