User:Yes0song/제주어 위키백과

이 글은 현재 저(Yes0song)의 입장과 일치하지 않을 수 있습니다. 이 글은 참고용입니다.

※ 관련 문서: Requests for new languages/Wikipedia Jeju

이 글은 제주어 위키백과(濟州語 위키百科)를 만들기 위한 방안을 생각해 본 것이다.

언어 코드 edit

ko-jeju

표기법 edit

  • 한글: s:ko:제주어 표기법에 의거함. 옛한글을 처리하는 기술적인 방법은 #자동 변환기에서 다룸.
  • 한자: 한글 전용으로 할 것이면 한자는 필요할 때만 괄호 안에 넣어 표기하는 방법을 사용함. 한글 전용판과 한자 혼용판을 모두 사용할 것이면 자동 변환기를 사용, 한자→한글 자동변환을 사용함(#한자 혼용을 도입할 경우 참고).

자동 변환기 edit

한글 전용으로 할 경우 edit

한글 전용으로만 제주어 위키백과를 꾸려 나갈 것이라면, 옛한글 처리 방식에 따라 첫가끝 코드한양 PUA로 나눈다.

'첫가끝 코드' 모드에서는 첫가끝으로 입력된 옛한글은 보존하고, 한양 PUA로 입력된 옛한글은 첫가끝 코드로 변환한다. 부가적으로 날개셋 한글 입력기에서 자체적으로 사용하고 있는 옛한글 처리 방식(ko:날개셋 한글 입력기#단점 참고)도 지원한다. 이는 날개셋의 초성 채움 문자(U+10FF)는 자동으로 유니코드 표준 초성 채움 문자(U+115F)로 변환해주고, 날개셋의 종성 채움 문자(U+11A7)는 자동으로 제거하는 방식으로 한다. 이것은 날개셋 한글 입력기를 쓰는 편집자를 배려하는 것이다.

'한양 PUA' 모드에서는 한양 PUA로 입력된 옛한글은 보존하고, 첫가끝으로 입력된 옛한글은 한양 PUA로 변환한다. 역시 부가적으로 날개셋 한글 입력기의 초성·종성 채움 문자도 고려하여 한양 PUA로 변환하도록 설계한다.[1]

한자 혼용을 도입할 경우 edit

자동 변환기의 모드를 첫가끝 코드+한글 전용, 첫가끝 코드+한자 혼용, 한양 PUA+한글 전용, 한양 PUA+한자 혼용으로 나눈다.

한글 처리 방식은 #한글 전용으로 할 경우에 의거하여 설계한다.

한자와 한글의 변환은 한자→한글만 지원하며, 한글→한자는 기술적으로 불가능하므로 배제한다. 따라서 한자 혼용으로 작성된 문서는 자동 변환하여 한자 혼용·한글 전용 문서 두 가지를 모두 출력할 수 있게 되지만, 한글 전용으로 작성된 문서는 한글 전용 문서만 출력할 수 있게 된다. 이것은 한국어 위키백과에 있는 다양한 표기법 지원 모임(다지모)의 한자 혼용판 도입 방안과 동일하다.

단, 한자→한글 자동 변환은 서울 방언(표준어)의 한자음 표기가 아니라 s:ko:제주어 표기법에 의한 제주 방언의 한자음 표기여야 한다. 面(면·멘·민)처럼 여러 발음을 허용하는 경우 서울 방언과 동일한 발음(面의 경우 '면')으로 변환하도록 한다.

각주 edit

  1. 제주어 위키백과에서는 그다지 필요가 없겠지만, U+200D(ZERO WIDTH JOINER)를 사용하여 한글 글자 마디 영역으로의 변환을 방지하는 경우도 배려하면 좋을 것이다(참고: ko:틀:첫가끝, ko:틀토론:첫가끝#유니코드 정규화).