영상 10-16초 사이에 이런 발화가 나온다. '힘듦이 어떠하다' 구성은 이해하는 데는 무리가 없지만 익숙하지 않은 구성이다. 영어식으로 보이기도 하는 표현이랄까?사실 일상에서는 이런 식의 표현을 (캡쳐하기가 힘들 뿐)꽤나 자주 접하게 된다. 일반적이고 익숙한 표현으로 바꾸어 보자면 다음과 같은 정도가 아닐까?
매우 익숙한 구성으로 충분히 표현할 수 있음에도 불구하고 영상에서는 굳이 '그 힘듦이 현재 진행형인'이라고 표현한 걸 보면 우선 이런 생각이 든다. '한국의 영어 교육이 언어 변화에도 모종의 영향을 미치고 있기는 있다 보다.'
문장 생성에 관한 언어 처리에 대한 생각도 해 볼 수 있다. 영상을 보면 화자는 머리 속에서 사례를 나열한 후에 이런 사례를 '빅데이터'라고 언급한다. 그러니까 다음과 같은 관념구조를 가지고 발화하고 있음을 알 수 있다.
빅데이터 = { 사례 1(힘들게 살다가 결국 이혼한 무료 카지노 게임),
사례 2(이혼하지는 않았지만 힘들게 살고 있는 무료 카지노 게임),
사례 3, ... , 사례 N}
이 중에서 '사례 1'과 '사례 2'를 실제 발화로 구성했다. 언어는 선조적이니까 '사례 1'은 선행절, '사례 2'는 후행절로 표상할 수밖에 없다. 두 사례에 해당하는 관념을 순서대로 조직(구성)한 후에 이를 문장으로 구현해한다.
언어학의 주요 통사 이론에서는 문장의 핵을 서술어(동사)로 보고, 동사와 관련된 논항의 자리를 생성하는 방식으로 문장을 생성한다. 두 절의 서술어인 '이혼하다'와 '살다'의 공통 논항인 '무료 카지노 게임'를 절 밖으로 핵이동 시키고, 그렇게 만들어진 두 명사절('~ 이혼한 무료 카지노 게임'와 '~ 살고 있는 무료 카지노 게임')를 가지고 배열 순서를 결정하는 과정을 거치는 방식이다. 그런데 정말 그럴까? 우선 두 명사절의 배열 순서를 결정하는 통사적 기능 핵은 무엇인지 알 수 없다. 논의를 매우 단순화하여 머리 속에 있는 관념의 구조를 도상적으로 구현한 것으로 보는 게 제일 자연스러워 보인다.
혹시 통사적 처리는 관념적으로 배열된 두 사례 중 우선하는 절 대응 관념을 통사적으로 표현하는 정도의 처리 영역을 가지고 있는 것은 아닐까? 통사 처리 버퍼에는 선행절 정도만 표상할 수 있을 정도의 비교적 적은 정보량만을 처리하고('주위에 힘들게 살다가 이혼한 무료 카지노 게임'), 다음에는 의미 버퍼가 선행절과 후행절의 관계를 계산(처리)하고([[AND/OR]]), 다시 그 관계를 표상하는 통사 처리를 한(', 아니면') 후, 후행절을 표상하는 다음 통사 버퍼 단위의 처리('그 힘듦이 현재 진행형인 무료 카지노 게임')를 하는방식일 가능성은 없을까?
후행절에 포함된 '힘듦'과 같은 표현의 등장은 서술어 중심으로 구성되는 문장 생성의 방식으로 설명하기에는 너무 복잡할 수밖에 없어 보인다. 통사 버퍼, 의미(관념) 버퍼, 맥락 버퍼 등을 독자적으로 상정하고 이들 버퍼 간의 조합이 언어 처리의 본질에 더 가깝지 않을까 싶다. 현재는 언어학에서나 인지과학에서나 언어 처리에서 통사 처리의 역할(기능 부담량)이 절대적인 것 같은데, 내 생각에는 그럴 필요가 없을 것 같다. 통사 처리는 익숙한 구문 패턴에 맞추는 정도의 역할만 담당하는 독자적인 버퍼가 수행하고, 절 관계 이상의 관계는 의미 버퍼나 맥락 버퍼가 처리하는 것이 아닐까 싶다. 구문 구조나 통사 구조는 사실상 절 내부에서만 기능하고 절과 절 이상의 구조에 대응하는 구문 구조는 사실상 의미 구조가 아닐까 싶다.
다만, '통사'든 '의미'든 '무엇의 구조'라고 할 때, 이 '구조'는 도대체 신경망에서 어떻게 구현 혹은 처리되는가에 대한 의문만은 풀리지가 않는다. 딥러닝의 수학적 처리 과정은 구조에 관한 인간의 직관을 어떤 식으로 처리하는 걸까?