파이썬(Python)/문법

ASCII vs Unicode(유니코드) vs UTF-8 차이

끄적끄적아무거나 2020. 12. 3. 10:49
반응형

 

처음에 코드에서 문자를 표현하던 방식은 ASCII 인코딩 방식이 었다.

 

ASCII 는 8비트(1바이트) 공간만 차지 한다. 한 비트는 checksum으로 사용하고 2^7 = 128 개는 글자를 표현하는데 사용 되었다.

 

하지만 영어를 표현할 수 있지만 한글같은 문자는 1바이트로 표현이 안되어서 나온 방식이 유니코드 인코딩이다. 2~4바이트의 여유 공간을 가지고 문자를 표현 해준다.

 

유니코드의 문제는 영어는 한바이트로 표현이 가능함에도 2바이트 이상의 공간을 차지하므로 메모리를 불필요하게 사용하게 된것이다.

 

그래서 나온 방식이 UTF-8로 문자 종류에 따라 가변적으로 메모리를 할당해서 효율적으로 사용할 수 있게 해준다.

 

반응형