본문 바로가기

unicode

유니코드 및 KS 코드 간단 정리 출처 : http://jake9999.tistory.com/10 2009년 4월 27일 문영일 프로그래밍을 할 때 운영체재, 프로그래밍 언어에서 저장되는 방법, 웹페이지 통신 방법, DB에 기록되는 방법등이 서로 다른 코드페이지를 사용하게 되어 한글을 처리하는데 많은 불편함이 있습니다. 구조에 대한 복잡함은 설명하지 않을 것이며 코드 집합에 대해 자신이 없는 분들은 알아두시면 좋을 듯 하여 정리하였습니다. 1. 유니코드 1.1 유니코드 개요 - 유니코드(UCS:Unicode Character System)의 탄생 배경 두 단체가 다중 언어 문자셋을 만들려고 시도하였습니다. 국제 표준기구의 IS-10646 프로젝트와 소프트웨어 제조사들의 컨소시움으로 구성된 유니코드 프로젝트 였습니다. 다행히 1991년 두.. 더보기
KSC5601 <-> UNICODE 변환 코드 (테이블 이용) 출처 : http://joyholic.kr/260 참조 : http://www.bumworld.pe.kr/archive/200903 #include "ksc.h" /* KSC5601 -> Unicode 2.0 mapping table, compressed for the 94*94 codeset. */ /* Generated based on KSC5601.txt at ftp://ftp.unicode.org/Public/MAPPINGS/EASTASIA/KSC */ /* * Unlike kuten-table, needed offset is 33 (0x21) instead of * 32 for 7-bit portion of each byte. i.e., a Unicode * codepoint for KSC's .. 더보기
USES_CONVERSION을 사용하장.. 출처 : http://www.devpia.com/MAEUL/Contents/Detail.aspx?BoardID=51&MAEULNo=20&no=3638 조경민 USES_COMVERSION (bro@shinbiro.com) ==================================================== BSTR test( BSTR bstrVal ) { USES_CONVERSION; char* pszVal; W2A(bstrVal,pszVal); 하면 pszVal 안에 BSTR문자열값이 들어간다. BSTR bstrCopy; A2W(pszVal,bstrCopy); 하면 pszVal값이 bstrCopy에 들어간다. SysAlloc된 상태 사용후 SysFreeString(bstrCopy);해야 함 BS.. 더보기
Character set, Character encoding, Code set, Code page 그리고 유니코드 완성형과 조합형 완성형은 글자 자체를 하나의 형태로 보고 코드화한 것이고 조합형은 총 한 글자로 표시되는 바이트(보통 2바이트)를 비트로 나누어 초성, 중성, 종성으로 할당해 글자를 표현하는 방식이다. 완성형은 현재 KSX-1001(옛 표준이름 KSC-5601)이라는 표준이 많이 쓰이고 있으며 조합형은 요즘 거의 쓰이지 않는다. 조합형도 여러 가지가 있어 논란이 되다가 결국엔 1987년에 완성형만이 표준으로 되었다. 후에 상용 조합형도 표준으로 들어갔으나 이미 표준이된 완성형만이 널리 쓰이게 되었고 2350자밖에 표현이 안되는 완성형이 윈도우즈에서 쓰이므로 지금까지도 가장 널리 쓰이는 글자 표현 체계가 되었다. Character set, Character encoding, Code set, Code pa.. 더보기