반응형

ASCII 2

[Python] String 인코딩, 디코딩 함수 (encode, decode)

목차 [Python] String 인코딩, 디코딩 함수 (encode, decode) 이번 포스트에서는 스티링의 문장을 인코딩하거나 디코딩해서 binary(바이너리)로 변경하는 함수에 대해 알아보겠습니다. encode() 와 decode()는 string 내부에 내장된 함수 입니다. encoding에는 많은 종류가 있는데 대표적으로 사용되는 encoding은 아래와 같습니다. utf-8 utf-16 euc-kr ascii Encode, Decode 함수 Syntax Str.encode(encoding='UTF-8',errors='strict') Str.decode(encoding='UTF-8',errors='strict') encoding 속성의 값은 앞서 언급한 encoding 종류를 입력하면 됩니다...

ASCII vs Unicode(유니코드) vs UTF-8 차이

처음에 코드에서 문자를 표현하던 방식은 ASCII 인코딩 방식이 었다. ASCII 는 8비트(1바이트) 공간만 차지 한다. 한 비트는 checksum으로 사용하고 2^7 = 128 개는 글자를 표현하는데 사용 되었다. 하지만 영어를 표현할 수 있지만 한글같은 문자는 1바이트로 표현이 안되어서 나온 방식이 유니코드 인코딩이다. 2~4바이트의 여유 공간을 가지고 문자를 표현 해준다. 유니코드의 문제는 영어는 한바이트로 표현이 가능함에도 2바이트 이상의 공간을 차지하므로 메모리를 불필요하게 사용하게 된것이다. 그래서 나온 방식이 UTF-8로 문자 종류에 따라 가변적으로 메모리를 할당해서 효율적으로 사용할 수 있게 해준다.

반응형