여느 때와 마찬가지로 주말 아침에 카페에 노트북을 들고 나와 부인냥과 함께 공부와 번역에 매진하다가 DeepL에 대한 이야기가 나왔다. 우리는 OpenAI의 ChatGPT도 부인냥이 먼저 쓰기 시작했고, 지금은 둘 다 ChatGPT Plus 구독 결제를 하고 쓰고 있다. 그리고 DeepL도 마찬가지로 부인냥이 먼저 쓰기 시작했다.
두 개의 서비스가 가지고 있는 공통점에 대해 생각해 보면 둘 다 자신들이 학습한 방대한 데이터를 사람이 자연스럽다고 느끼는 형태의 어투로 표현한다는 것이다. 사람인 나 자신도 잘못된 자료를 기반으로 학습을 하게 되면 잘못된 지식을 옳다고 생각하듯이, 이 아이들도 마찬가지일 수 있다. 따라서 결과가 올바르다고 속단하면 안된다는 점도 두 개의 서비스가 비슷했다.
DeepL에게 영국의 61개 회사에서 6개월동안 실시된 주4일제 근무에 대한 실험 결과를 보도한 BBC의 뉴스 기사를 번역해 달라고 부탁했다. 그 결과는 얼핏 보면 나는 기계예요! 라고 외치는 Google 번역과 달리 사람이 번역한 것처럼 자연스러워 보였지만, 번역 결과가 올바른 것은 아니었다. 최종적으로 올바른 결과를 얻기 위해 결국 전체를 검수하고 재번역하고 다듬는 과정을 생략하는 것은 불가능했다.
그럼에도 불구하고 영어, 중국어, 일본어 번역을 자주 하는 나와 부인냥으로서는 이렇게 다양한 도구들이 시간을 확실히 절약해 주고 다른 방향의 인사이트를 받을 수 있다는 점에서 매우 만족하고 있다.
그리고 하나 더 유념해야 할 점은 AI가 내놓는 결과가 올바른지에 대해 판단하는 것은 아직까지는 사람의 손이 절대적으로 필요하다는 것이다. AI로 보고서를 쓰건 시험 답안을 쓰건 내가 그걸 이해하지 못하고 그 순간의 결과를 내는데 급급하다면 나중에는 더 큰 문제로 돌아올 것이 뻔하기 때문이다.