[쿠오바디스와 행로난](44) 인문학과 기술이 만나 디지털 도서관을 낳았다

2017. 7. 4. 12:37쿠오바디스 행로난

ㆍ한국형 ‘문헌 바벨탑’ 을 쌓자

피터르 브뤼헐(1525~1569)의 <바벨탑>(1563). 114×155㎝의 대작이다.

피터르 브뤼헐(1525~1569)의 <바벨탑>(1563). 114×155㎝의 대작이다.

지난 대선 기간 내내 인구에 회자되었던 열쇳말 가운데에 하나가 4차 산업혁명이다. 기계가 사람의 일자리를 빼앗을 것이라는 걱정에서부터 지금 서두르지 않으면 한국의 산업과 경제가 국제적으로 경쟁력을 잃을 것이라는 우려에 이르기까지 많은 말들이 오간 것으로 알고 있다. 이런 걱정과 우려를 해결하기 위해 이 글을 쓰는 것은 아니다. 대개는 정치가 해결해야 하는 일이기에. 사실 나는 이런 문제를 해결할 수 있는 능력의 소유자도 아니다. 사정이 이러함에도 4차 산업혁명의 논의가 기술 중심으로만 흘러가는 것 같아서 몇 마디 거들겠다. 결론부터 말하면, 4차 산업혁명을 주도하는 핵심 동력 가운데에 하나가 실은 인문학과 기술의 만남이다. 인문학과 기술이 만나면 무슨 일이 일어날까? 김월회 선생의 말대로 “기술은 인문을 진화”(2017년 5월27일자 경향신문)시킬 수 있을까? 답은 당연히 양가적이지만, 이 글에서는 긍정적인 면에 집중하겠다.

■세상이 바뀌었다 

바야흐로 인문학과 기술의 짝짓기가 가장 활발하게 이뤄지고 있는 시기이다. 그 덕분에 세워진 디지털 도서관이 이제는 인문학의 교육과 연구의 토대까지 근본적으로 바꾸고 있다. 요컨대 지금은 ‘디지털 인문학(Digital Humanities)’의 발전 덕분에 언제 어디에서나 누구나 전 세계의 주요 문헌보관소에 소장된 각종 원천 자료들을 디지털 문헌의 형식으로 마음껏 접근하고 수집할 수 있다. 디지털 도서관은 과거의 마이크로필름보다 훨씬 선명한 고해상도의 화질까지 제공한다. 물론 디지털 문헌으로 공개되지 않은 필사본들도 여전히 많다. 하지만 전 세계 주요 문서보관소는 각종 필사본을 디지털 문헌으로 변환하는 작업을 수년째 하고 있고, 새롭게 이 프로젝트에 동참하는 기관들도 유럽 전역에서 날로 증가하고 있다. 이 추세를 감안할 때 앞으로 수년 내에 전 세계 연구자들에게 모든 필사본들을 인터넷을 통해서 디지털 문서로 접근할 수 있는 연구 환경이 구축될 것이다. 도서관을 방문해서 카탈로그를 펼치고 특정 문헌을 메모하며 사본 목록을 직접 수집하는 장면도 사라질지 모르겠다. 각종 문서보관소에서 제공하는 디지털 카탈로그와 검색 서비스를 통해서 즉각적으로 사본에 접근할 수 있는 통로가 만들어졌고, 각종 문서보관소의 정보를 한 군데 집대성한 일종의 사본 포털 사이트(portal site of catalogues)까지 개설되어 운영되고 있기 때문이다. 이와 같은 변화 덕분에 필사본이 소장된 현지의 기관을 굳이 방문하지 않아도 이제는 서양 고전의 비판정본(editio critica) 작업을 유럽의 반대편인 한국에서도 얼마든지 수행할 수 있게 되었다.

여러 사례 중에서 가장 방대한 정보와 체계적인 정보를 제공하는 IRHT(Institut de recherche et d’histoire des textes)의 Pinakes 서비스를 소개하겠다. 이 서비스는 국가와 소장 기관의 이름, 필사본 명칭, 필사본 안에 문헌의 위치를 알려주는 페이지 번호, 기록 추정 시기, 심지어 이 필사본이 인용된 최신 연구 자료 등이 수록된 카탈로그를 제공한다. 또한 각 기관이 소장하고 있는 모든 필사본 목록도 확인할 수 있다. 

이 서비스는 전 세계에서 가장 방대한 사본의 보고 중 하나인 프랑스 국립 문서보관소 BNF(Bibliotheque nationale de France)에서 디지털 문서로 공개하는 최신 필사본들의 정보를 알려주는 링크를 제공한다. 필사본 추적과 입수에 있어서 가히 최고의 지도라 할 수 있다.

이런 지도 덕분에 문헌 추적 방식에 혁명적인 변화가 이뤄졌음에 대해서는 이제 어느 누구도 부정하지 않는다. 이 변화는 여기에서 멈추지 않고 20세기 초반에 만들어진 비판정본들이 누렸던 학문적인 신뢰도와 권위를 흔드는 것으로 이어진다. 교통의 불편함과 전쟁의 여파로 인해서 참조하지 못했던 중요한 필사본들이 디지털 문서로 오픈소스의 형태로 제공되고 있기 때문이다.

<일리아스> 1권의 디지털 텍스트(위)와 11세기에 필사된 <일리아스> 1권 서문의 필사본.

<일리아스> 1권의 디지털 텍스트(위)와 11세기에 필사된 <일리아스> 1권 서문의 필사본.

West E, Escorialensis Υ.I.1 필사본, 마드리드에 소장된 것으로 11세기에 필사된 것이다.

West E, Escorialensis Υ.I.1 필사본, 마드리드에 소장된 것으로 11세기에 필사된 것이다.

이와 같은 변화를 반영한, 예컨대 디지털 도서관을 통해서 제공된 검색 자료와 필사본 문서들을 바탕으로 탄생한 대표적 비판정본이 호메로스의 <일리아스>와 <오디세이아>이다. 이 작품들은 웨스트(M L West)가 편집하고 독일 토이브너(Teubner) 출판사에서 2002년에 출판된 것들이다. 웨스트의 비판정본들은 디지털 시대의 디지털 고전학의 도래를 선언하는 작품들로 평가받는다. 20세기에 출판되어 서양고전학계에서 신뢰를 받고 권위를 누렸던 종이 비판정본들이 디지털 비판정본으로 대체되는 것은 이제 시간문제일 것이다. 디지털 시대의 도래로 세상이 변했다는 소리다. 이제는 11세기 필사본과 같은 문헌들을 디지털 텍스트와 한 화면에서 바로 비교-대조(collatio)할 수 있는 시대가 되었다. 

■원천 자료 없이 디지털 도서관은 가능하다 

문제는 원천 자료가 없거나 부족한 경우다. 이 경우에도 디지털 도서관이 가능할까? 가능하다.

대표적인 사례로 페르세우스 디지털 도서관 프로젝트가 있다. 이 프로젝트는 1494년에 알두스(Aldus Manutius·1449~1515)가 금속활자 기술을 바탕으로 하는 출판사를 베니스에 설립한 사건에 준하는 사건이다. 알두스 출판사의 설립은 필사본 중심의 중세 문헌학에서 활자본 중심의 근세 문헌학으로 서양고전문헌학을 전환시킨 사건이었다. 서양고전학계에서 인정받는 비판정본들의 거의 모든 초판본(editio princeps)들이 이 출판사에서 출판되었다. 

페르세우스 프로젝트는 거의 이에 준하는, 아니 이보다 규모와 내용에 있어서 더욱 큰 의미를 지닌 사업이다. 현재 종이 매체에서 디지털 매체로의 전환이 급속도로 그리고 대규모로 진행되고 있는데, 알두스의 출판사가 고전 작품들을 유럽에 확신시킨 공로가 있다면, 페르세우스 프로젝트는 서양 고전 작품들을 언제 어디서나 누구나 간편하고 쉽게 활용 가능하게 만들었다.

“언제나-어디에서-누구나” 정신에 의해서 구축된 디지털 도서관을 통해서 서양 고전들은 이제 전 인류의 자산으로 활용되고 있다. 시작은 아주 미약했다. 물론 지금은 서양고전문헌학 분야에서 가장 방대하고 가장 전문적인 디지털 도서관이 되었지만 말이다. 프로젝트는 미국의 터프츠(Tufts)대학의 작은 학과에서 1985년 9월에 시작되었다. 하지만 현재는 국가 차원의 지원을 받아서 진행되는 미국의 대표적인 디지털 학술 사업으로 자리 잡았다. 한마디로, 콘텐츠가 좋으면 그러니까 연구의 내실이 좋으면 지원과 후원은 자동적으로 따라온다는 것을 방증하는 사례다. 도대체, 내세울 만한 소장 자료 하나 없는 페르세우스 디지털 도서관이 세계적 연구소로 성장할 수 있었던 비결은 무엇일까? 여러 비결 중에서 세 가지만 소개하겠다. 

■디지털 정본 덕분이다 

한 가지 비결은 페르세우스 디지털 도서관에서 제공되는 디지털 텍스트들을 선정하는 원칙들에서 발견된다. 신뢰성, 표준성, 편이성이다. 신뢰성과 관련해서 디지털 도서관을 구성하는 개별 텍스트들이 적게는 수십개, 많게는 수천개의 필사본들의 대조와 검증 과정을 본업으로 삼는 비판정본 작업을 거친 문헌들이라는 점을 강조하고자 한다. 검증을 거치지 않은 문헌은 학문적으로는 물론, 상업적으로도 사랑받지 못한다. 표준성과 관련해서 텍스트 구현에 사용되는 편집 부호와 약식 표현들은 모두 국제적으로 통용되는 표준 약호라는 점을 지적하고자 한다. 편이성과 관련해서는 텍스트의 원문 이해를 돕기 위해서 사전류의 공구서와 학습용 주석서와 현대 번역이 제공된다는 점도 언급하고자 한다. 이 같은 세 원칙을 바탕으로 구현된 디지털 도서관은 그 자체로 교실인 동시에 연구소 역할을 수행한다. 

■<역동 사전>도 한몫 거들었다 

또 다른 비결은 기존의 오프라인 도서관에서 수행되던 연구가 온라인 디지털 도서관에서도 수행될 수 있다는 점에서 찾을 수 있다. 이런 특성은 기관 소개가 주요 기능인 기존의 홈페이지와는 근본적으로 다른 것이다. 이는 페르세우스 디지털 도서관이 그 자체로 진화하고 있는 연구체라는 점에서 쉽게 확인된다. 이를 잘 보여주는 사례가 미국 국가인문학재단이 후원하는 <역동 사전(dynamic lexicon)>이다. 이 사전은 독자에게 혹은 연구자에게 기계화 처리가 가능한 모든 정보를 제공하는 공구이다. 이 공구는 독자와 연구자로 하여금 기존의 학습용 사전으로는 포착할 수 없는 새로운 의미 형성의 과정이나 언어 변화의 특징은 물론, 언어 사용의 빈도와 통사론적으로 새로운 용법을 스스로 발견할 수 있는 참고 용례를 제공한다. 이런 기능 덕분에 <역동 사전>은 그냥 사전이 아니라 더 정확하게는 의미 생성기로 보아야 한다. 기술이 인문학을 진화 혹은 발전시키고 있는 좋은 사례가 <역동 사전>일 것이다. 또한 국가가 정책적으로 지원해야 할 사업이 무엇인지를 보여주는 좋은 사례이기도 하다. 

이런 연구 기능을 통해서 페르세우스 도서관은 기존의 오프라인 연구소의 기능을 수행하고 있는데, 특정의 소수 전문가들이 아니라 모두에게 열린 공간으로 진화하고 있고, 이 공간을 통해서 전 세계의 연구자를 하나로 모으는 연구 공동체로 성장하고 있다는 점이 중요하다.

눈여겨보아야 할 점은 항목에 소개된 용례의 출처들이 모두 하이퍼 텍스트로 처리되어 있다는 것이다. 한번의 클릭으로 바로 그 자리에서 원하는 문헌의 본문으로 이동할 수 있다. 이와 같은 연동 구조는 페르세우스 디지털 도서관에 구축된 텍스트들의 개별 단어들의 차원에서 상호 치밀하게 연동 관계를 맺고 있음을 보여주고, 디지털 도서관이 곧 연구체이고 진화하는 의미 생성기임을 여실히 증명해준다. 한마디 덧붙이자면, 일반 독자와 전문 연구자로 하여금 페르세우스 디지털 도서관을 방문하도록 만드는 것이, 다시 말해 디지털 시대에 서양 고전이 살아남기 위한 노력 가운데에 하나가 <역동 사전>의 기능이라는 점을 강조하고자 한다. 얻는 것이 있어야, 그러니까 새롭게 배울 수 있는 것이 있을 때에 사람이 찾아오고, 사람들이 모이기 때문이다. 

■문헌 바벨탑은 인문학과 기술의 짝짓기를 통해서 가능할 수도 있다.

페르세우스 디지털 도서관의 성격을 규정하면, 그것은 한마디로 문헌의 ‘바벨탑 쌓기’다. 전통적인 오프라인 기관들(도서관, 박물관, 기록소, 연구소)이 추진하는 디지털 도서관들이 자신이 소장한 자료들을 온라인을 통해서 외부에 제공하는 구조로 구축되어 있다면, 페르세우스 디지털 도서관은 비판정본, 번역서, 주해서와 독해와 전문 연구에 요청되는 공구서 기능을 일반 독자와 전문 연구자에게 직접 제공하는 방식으로 구축되어 있다. 기원전 8세기의 호메로스부터 서기 6세기의 보에티우스에 이르는 그리스와 로마의 모든 작가들을 아우르고, 개별 작품들에 대한 고대 주해서들을 아우르고 있다는 점에서, 집적된 텍스트의 양과 질에 있어서도 다른 디지털 도서관과는 근본적으로 다르다.

여기에서 페르세우스 디지털 도서관을 성공으로 이끈 마지막 비결이 드러난다. 그것은 오픈소스 운동이었다. 이 프로젝트를 총괄하는 터프츠대학이 미국에 위치한 탓에 유럽의 대학이나 연구기관처럼 그리스와 로마의 필사본들을 소장하지 못했기 때문이다. 사정이 이러함에도, 페르세우스 디지털 도서관은 신뢰할 만한 디지털 정본의 제공과 <역동 사전>과 같은 연구 기능을 통해서 명실공히 세계적인 디지털 도서관으로 우뚝 서게 되었다. 원천 자료가 없어도 얼마든지 디지털 도서관을 구축할 수 있다는 소리다. 그 모범 사례가 페르세우스 디지털 도서관이다.

동양 고전이든 서양 고전이든 한국 고전이든, 이것들의 비판정본을 제공하고 아울러 각종 사전류의 공구서들이 자동적으로 연동되는 한국형 ‘페르세우스’ 디지털 도서관의 구축을 감히 제안한다. 이를 위해 당장은 디지털 도서관의 개념 정립과 디지털 도서관의 구축을 논의하는 학술대회를 개최할 필요가 있을 것이다. 물론 장기적으로는 국가 차원에서 ‘디지털 인문학’ 위원회를 만드는 것도 검토해야 할 것이다. 어쨌든, 4차 산업혁명 시대의 성패를 좌우하는 힘이 역설적으로 자연언어의 처리 능력에 기반을 둔 문화 생산 능력이라고 할 때, 인문학과 기술의 짝짓기가 앞으로는 국가 경쟁력을 좌우할 것이기 때문이다.



원문보기: 
http://news.khan.co.kr/kh_news/khan_art_view.html?code=960205&artid=201706021912005#csidxa36af5dee9069488f5fe4a1ec48da4a