반응형
처음에 코드에서 문자를 표현하던 방식은 ASCII 인코딩 방식이 었다.
ASCII 는 8비트(1바이트) 공간만 차지 한다. 한 비트는 checksum으로 사용하고 2^7 = 128 개는 글자를 표현하는데 사용 되었다.
하지만 영어를 표현할 수 있지만 한글같은 문자는 1바이트로 표현이 안되어서 나온 방식이 유니코드 인코딩이다. 2~4바이트의 여유 공간을 가지고 문자를 표현 해준다.
유니코드의 문제는 영어는 한바이트로 표현이 가능함에도 2바이트 이상의 공간을 차지하므로 메모리를 불필요하게 사용하게 된것이다.
그래서 나온 방식이 UTF-8로 문자 종류에 따라 가변적으로 메모리를 할당해서 효율적으로 사용할 수 있게 해준다.
반응형
'파이썬(Python) > 문법' 카테고리의 다른 글
파이썬 sys.getsizeof 변수 크기/사이즈 확인 (0) | 2020.12.04 |
---|---|
if in 구문, for in 구문 (0) | 2020.12.03 |
sorted 와 key 값, lambda 사용법, 키 값으로 함수사용 (0) | 2020.12.02 |
sort vs sorted 차이 join 함수 (0) | 2020.12.02 |
collections Counter 로 가장 많이 사용한 단어 찾기 (0) | 2020.12.01 |