UTF8 구조 및 유니코드 변환 소스 코드
오늘 포스팅할 주제는 UTF-8입니다. UTF-8은 유니코드를 표현하기 위한 가변 길이 문자 인코딩 방식으로 한 문자를 나타내기 위해서 1byte에서 4byte의 값을 사용합니다. 구조는 어떻게 되어 있으며, 유니코드 변환 방법을 소스 코드를 통해 확인해보겠습니다. UTF8의 구조 UTF-8은 자리수에 따라서 표현되는 문자가 다릅니다. ASCII의 경우 1byte로 표시되고 라틴문자 그리스문자 등은 2byte로 표시되는데, 자리수에 따라 아래와 같이 표현이 됩니다. 1byte 이진법 표현 : 0xxxxxxx(0x000000 ~ 0x00007F)ASCII 영역에서 사용하는 영역과 동일합니다.숫자 1을 표현하게 되면 0000 0031로 나타내게 됩니다. 2byte 이진법 표현: 110xxxxx 10xxxxx..