컴퓨터의 메모리는 0과 1 즉 2진수로만 기록할 수 있게 되어있다.. 1 바이트 내에 저장된 데이터는 0과 1의 조합인 2진수로 표시할 수 있다. 2진수를 가지고 문자를 다루기 위해서는 각 문자에 해당되는 2진수의 값을 정해야 할 필요가 있다.

한 문자에 해당하는 2진수를 정한 코드에는 CDC SCIENTIFIC, ASCII(American Standard Code for Information Interchange), 그리고 EBCDIC(Extended Binary Coded Decimal Interchange Code) 3가지가 있다. 컴퓨터의 기종에 따라 사용하는 문자코드는 다르다. IBM 컴퓨터의 경우 대부분의 기종은 EBCDIC 코드를 사용하지만 IBM PC에서는 ASCII 코드를 사용한다.

일반적으로는 PC에서는 ASCII 코드가 사용되고 있다. 원래 ASCII 코드는 1 바이트내의 7 비트만을 이용해서 10진수 0에서 127까지의 128 개의 문자로 구성되었다. 여기에는 영어 알파벳의 대문자와 소문자, 그리고 보조문자들과 제어문자들을 포함하고 있었다. 후에 IBM에서 마지막 한 비트를 포함하여128부터 256까지 확장시켜 256개 문자로 만들었다. 여기에는 비영어 문자와 그래픽 문자를 포함시켰다. 그리고 컴퓨터에서 잘 사용되지 않았던 0부터 31까지를 그래픽 문자들 로 재정의했다. 이것을 IBM확장 ASCII 코드(IBM Extended ASCII Code)라고 부른다.

ASCII 코드란 문자 ‘A’를 65, ‘B’를 66 등으로 정한 것으로, 각 문자의  ASCII 코드는 printf() 함수를 이용하여 출력할 수 있다. 아스키 코드이후 다른 언어를 사용하는 세계 각국의 문자를 반영하기 위해서 한문자를 2 바이트에 넣어 65,535 개의 문자를 표현할 수 있는 unicode가 제시되어, 앞으로의 문자 체계로 사용될 예정이다. 유니코드는 웹 사이트 "http://unicode.org"에서 검색할 수 있다.

아래의 아스키 코드는 linux에서 제공하는 ASCII Man page에서 쉽게 볼 수가 있다.

$ man ascii




신고

'컴퓨터 언어 > C' 카테고리의 다른 글

Makefile을 작성하자.  (2) 2012.06.10
다수의 소스 컴파일을 도와줄 Make  (2) 2012.06.10
ASCII Code는?  (1) 2012.06.09
자료형  (1) 2012.06.09
어휘적 최소 단위 "토큰"  (1) 2012.06.08
메모리의 구성  (1) 2012.06.08