TEUS.me

 
 

 

유니코드에서 한글 테이블을 만들 때 많은 분들이 각고의 노력을 기울였던 결과 넓은 한글 코드 영역을 사용하고 있다.

심지어 여기엔 고어도 포함되어 있고, 일반적인 코드 외에 초성, 중성, 종성이 분리된 자소 역시 별도로 코드를 할당받았다.

 

그런데, 이게 약간 과유불급이 되어버린 면이 있다.

우리가 흔히 사용하는 한글(가, 각, 간... 힢, 힣) 외에 자소 분리 코드도 정식으로 사용할 수 있게[각주:1] 된 것이다.

특히, iOS에서는 자소 분리 코드(U+1100..U+11C2)[각주:2]를 기본으로 사용하기 때문에 아이폰 등에서 파일을 받으면 뭔가 좀 복잡하다.

 

이러한 현상을 불편하게 여긴 게 하루이틀도 아니라 솔루션들이 꽤 있다.

심지어 압축 프로그램인 반디집에서도 압축을 했다 해제하는 과정에서 이러한 파일명을 정리해주기도 한다.


이와 별개로 인터넷에서 파일을 다운받을 때 겪는 불편함 중 하나는 URLEncode된 파일명 들이다.

%EB%98%90%EB%8A%94+%EC%97%86%EC%9D%8C

지금은 이런 현상이 대폭 줄어들긴 했지만, 그래도 가끔 저런 파일을 볼 수 있다.

게다가 URLEncode된 파일명들은 자소 분리 코드와 달리 한 눈에 알아볼 수도 없다.

 

이왕 프로그램 만드는 김에 이 두 가지 파일명을 모두 한꺼번에 정리할 수 있게 하고, 약간의 서비스 기능도 추가했다.

파일명이 아니더라도 입력된 텍스트를 변환할 수 있는 기능을 추가했다.

 

이 프로그램은 아래와 같은 기능들을 깔끔하고 가볍게 지원한다.

  • 1. 자소 분리된 파일명을 자소가 결함된 파일명으로 수정
  • 2. UTF-8 형식으로 URLEncode된 파일명을 URLDecode
        - UTF-8을 WCHAR(UTF-16)으로 완벽하게 변환
  • 3. 서브폴더를 포함하도록 지정하면 폴더명과 파일명을 모두 수정
  • 4. 중복된 파일명이 있으면 해당 파일은 작업하지 않음
  • 5. 순수 C++ 만으로 만들어 대단히 빠름
  • 6. 입력된 텍스트에 대해 동일한 변환 테스트

 

이 프로그램은 아래 링크에서 다운받을 수 있다.

 

HangulFilenameFixer.rar
0.23MB

password: teus.me

 

 

  1. 윈도우 이용자들에겐 어색할 수 있지만, 형태소 단위로 분리해서 분석해야 하는 프로그램들이 많은 요즘은 이 쪽이 더 효율적인 면도 분명히 존재함 [본문으로]
  2. 엄밀히는 U+11FF까지인데, 고어 영역을 포함한 것이며, 현대어는 U+11C2 까지임 [본문으로]

공유하기

facebook twitter kakaoTalk kakaostory naver band

댓글

비밀글모드