레이블이 TeX인 게시물을 표시합니다. 모든 게시물 표시
레이블이 TeX인 게시물을 표시합니다. 모든 게시물 표시

2011년 9월 10일 토요일

만주문자 식자

신문에서 재미있는 기획연재물을 보면, 스크랩해 놓기도 한다. 그러다가 TeX을 알게 되고 난 다음에는, 브라우저에서 기사를 긁어서 TeX 형식으로 간단한 편집을 해서 저장을 해 놓게 되었다.

이 주 쯤 전에 지인을 만나, 요즘 모으고 있는 그 연재물에서 읽었던 내용을 이야기한 적이 있다. 집에 돌아와서 스크랩 한 것을 보내주면 어떨까 생각했었는데, 아무래도 신문기사에 난 것이다 보니, 이것 저것 정보를 더 보태고 싶어졌다. 등장하는 역사 인물의 한자 이름과 생몰년도 따위를 추가하고, 간단히 언급된 사실에 대하여 내가 아는 대로 좀 더 보충하고, 뭐 그런 짓을 하고 싶어졌던 것이다.

요즘은 인터넷이 하도 좋아져서 어지간한 자료는 인터넷에서 다 찿아졌다. 생몰년을 찾으려고 사람 이름으로 검색하면, 위키로 들어가서 항목을 읽게 되는데, 유명한 인물을 찿을 때 조차도 완전히 처음 알게되는 그런 일화들에 빠져들게 되면서, 작업이 상당히 지체되었다. 또한 그러면서 또 배움이 있어 한편으로는 즐거웠다.

나는 아는 바가 일천하게 그지 없지만, 원전에 대한 욕구는 강한 편이다. 일종의 속물근성이기도 하다. 그런데, 인물의 생몰년을 찾는 과정과 요 몹쓸 속물근성이 합쳐지면서 상당히 곤란한 지경에 빠져들게 되었다. 찾는 인물중에 누르하치와 홍타이지가 나왔던 것이다. 생몰년은 크게 상관이 없다. 문제는 이름이다. 이 사람들은 중국사람이 아니니까 오른쪽에 붙은 괄호 안에 음차된 한자를 적어 넣는 것은 예의가 아니다. 따라서 만주문자를 붙여 넣어야 되는데, 이것이 쉽지 않다는 것이다.

일단 다언어 식자를 훨씬 수월하게 할 수 있는 XeTeX로 컴파일 할 수 있게 약간의 수정을 했다. 그리고 fontspec 팩키지를 어떻게 사용하는지 KTUG에서 배웠다. 그런데 문제는 만주문자 폰트였다. 처음에 찾은 것은 만주문자를 키보를 통해 입력할 수 있게 하는 프로그램이었다. 말하자면 날개셋 같은 프로그램이었다. 그리고 그 프로그램에 딸려 나오게 되어 있는 만주어 폰트를 찾아서 깔고, 테스트를 해 보았는데, 결과가 마음에 들지 않았다.

만주문자는 아랍어와 마찬가지로 단독·어두·어중·어미에서 쓰일 때 그 모습이 변화하는데, 방금 깔았던 그 만주어 폰트는 그 과정을 완전히 처리하지 못했다. 어두형이 중간에 박히거나 하는 식이었다. 깨끗하게 포기하고, 프로그램과 폰트를 지웠다.

다음에 찾아 낸 프로그램은 중국인이 개발한 프로그램이다. 이 프로그램은 입력창에 로마자로음차된 만주문자를 쳐 넣으면, 그것을 기초로 하여 만주문자를 짜 내 비트맵 형식으로 오른쪽에 출력하였다. 즉 범용으로 만주문자를 입력할 수 있는 시스템도 아니고, 따라서 IME 설정을 건드릴 필요도 없다. 그런데 친절하게도 그 중간단계를 보여주고 있다. 그 중간단계라는 것은 어두·어미·어말형이 각각 어떤 로마자에 할당되었는지 보여주는 것이다. 간단하게 말하면, 어두형은 로마자 I에, 어중형은 i에 각각 대응하도록 만든 것이다. 음차된 만주어를 어두·어중·어말형이 구분된 스크립트로 부호화 하고, 마지막으로 그 부호에 따라 이미 정해져 있는 만주문자를 출력하는 시스템이었던 것이다. 좀 엉성해 보이기는 하지만, 이런 방식으로 얻은 출력물이 훨씬 퀄리티가 좋았다. 이 프로그램이 사용하는 만주어 폰트는 유니코드의 만주·몽골 문자 영역에 할당되어 있는 것이 아니라, 로마자 영역에 할당되어 있는 것이다. 그래서인가, 그 프로그램의 만주어 폰트 이름은 Times New Manchu였다.

아, 나는 당연히 만주어 배운 적도, 할 줄도 모르나, 그 테스트라는 것은 간단히 그 만주어 모양을 (위키를 통해서) 알고 있는 누르하치나, 홍타이지 같은 만주 단어를 표시했을 때 얼마나 비슷하게 나오는가를 비교하는 것으로, 눈만 달려있으면 누구나 할 수 있는 것이다.

마지막 단계는 이 폰트를 TeX에서 사용하는 것인데, 그 결과가 역시 예상했던 대로였다. 기뻤다.

2011년 1월 17일 월요일

학회 논문

곧 학회가 있다. 그 준비때문에 무척 바쁘다. 프리젠테이션은 당연히 발표시점까지 준비해야 하는 건데, 문제는 이번 학회는 풀 페이퍼를 학회 마지막 날까지 제출해야 한다는 것이다. 동시에 해야 할 일이 둘이나 되다 보니 바빠지는 것이다.

논문을 쓰는 흉내를 내 보면서 몇 가지 배운 것 중에 요긴한 것이 있다면, 그림을 준비하는 방법이다. 보통 웹상에서 문서를 읽을 때는 jpg나 gif 정도의 그림이면 충분했다. 당연히 처음에 학회 논문을 준비할 때도 그리 하였었다. 문제는 화면에서는 충분해 훌륭해 보이는 해상도의 그림들이 종이에 출력되고 나면 형편없는 품질을 보여준다는 것이었다. 불만스러웠지만, 그림의 해상도를 높이는 임기응변으로 그 문제를 해결하였다. 그러다가 석사 논문을 준비하면서, eps포멧이라는 것을 알아버렸다. 이제, 그래프 따위를 그릴 때, jpg나 gif같은 래스터 형식은 개나 줘버리라지.

일단 흰 바탕에 선이 몇 개 있고, 점이 몇 개 있는 그래프는, eps포멧이 훨씬 더 경제적이다. 래스터 형식은 모든 점에 대한 정보를, 그것이 흰바탕이라도, 저장하고 있어야 하는데, eps는 그런 낭비를 하지 않는다. eps는 벡터이기 때문에 어디서부터 어디까지 선을 긋고, 좌표 얼마에 점을 찍고, 그 밑에는 내장 폰트에서 글자 아무개를 읽어서 찍어라. 이런 식으로 정보가 저장되므로, 정보의 양에서 훨씬 이득을 본다. 게다가 eps는 아스키 형식으로 되어있어서 사람도 그 내용을 해석할 수 있다. eps는 그래서 (인캡슐래이티드) 포스트스크립트 “언어”이다. 정 급하면, (이론상) 메모장을 열어서 축의 숫자를 바꾼다든지 할 수 있다. 훨씬 적은 용량에도 불구하고, 종이에 출력했을 때, eps형식의 그림은 jpg나 gif에 비해 품질이 탁월하다.

처음에 학회초록을 쓸 때였다. 내가 직접 쓴 멍청하기 짝이 없는 영문들을 타임스 뉴 로만으로 폰트만 바꿔주니, 웬지 그럴듯 하게 보여 우쭐했던 기억이 난다. 선생님에게 제출한 다음에는 완전히 빨갛게 되서 돌아왔지만. 한 몇 년 있다가 텍을 알고 난 뒤에는, 역시 멍청한 영문들이지만, 웬지 텍의 article 서식에 맞추어져서, 컴퓨터 모던 폰트로 찍혀 나오는 문서들이 또 역시 그럴듯하게 보여서 한참 우쭐해 하던 적도 있었다. 학회서식은 그보다 좀 더 멋진데, 거기에 샤프한 eps그림들이 박혀 있으면, 내용은 차치하고서라도, 어쨌든 미적으로는 상당히 만족스러워진다.

eps의 또 다른 좋은 점은 ppt에서 자유로운 편집이 가능하다는 것이다. jpg로는 좀 어려울 것이다. eps를 그림 삽입을 통해 불러 들여서 그룹 해제를 하면, eps파일을 이루는 선분 요소들을 개별적으로 조작할 수 있다. 그래프 같은 것을 자동적으로 일단 그리고, 강조해야 할 부분을 편집할 때 매우 유용하게 사용할 수 있다. MS의 eps 불러오기 루틴이 썩 훌륭하진 않아서, 선분이 지나치게 많은 eps파일을 불러들이면 깨지는 현상이 발생하기는 한다.

그렇지만 eps가 만병통치약이 될 수는 당연히 없다. 사진 같은 그림이 들어가야 할 경우에는 eps는 그것을 지원하기는 하지만, 최선의 선택은 아니다. 각 화소마다 값들을 넣되, 그 저장되는 형식을 아스키로 취하기 때문에, 용량이 엄청나게 불어나게 된다. 요즘이야 컴퓨터 저장장치가 워낙에 방대하다보니, 방만하게 사용하지만 않는다면 큰 문제는 없는데, A4용지 한 구석에 들어갈 8cm x 8cm짜리 그림이 10메가가 된다거나 하는 것은 썩 효율적인 것은 아닌 것 같다.

이 놈의 학회는 풀 페이퍼를 여덟장이나 써 내야 한다. 글자도 작고. 아, 아주 죽어나겠다.