2.6 문자형

문자형은 문자의 집합으로 각 문자는 1바이트에 저장된다. 1 바이트는 8비트로 구성되며 256개의 문자를 표현할 수 있다.

 

자료형

바이트크기

범위

unsigned char 1

0 ~ 255

char 1

-128 ~ 127

 

문자형 변수는 예약어 char를 사용해서 선언한다. 문자 상수는 작은 다옴표 ('')를 사용하여 나타낸다.

'a'    'K'    '2'    '&'

정수 5와 문자 '2'는 다르며 문자 '2' 는 아스키코드 50을 의미한다.

다음 코드를 작성하고 출력 결과를 확인해 보자

#include <stdio.h>

int main()
{
        char ch = 'a';
        printf("%c\n", ch);
        return 0;
}

실행 결과

 

 char01.jpg

 

<프로그램 설명>

char char = 'a';

변수 ch가 문자형으로 선언되었고 문자 'a' 의 값을 받았다.

printf("%c\n",ch);

%c는 변수 ch의 값을 문자 형식으로 출력시킨다.

2.6.1 아스키 코드

1바이트 내의 7비트 만을 이용해서(양수) 0에서 127까지의 128개의 문자로 구성되어 있다.

후에 한자나 한글 등을 사용하기 위해 1비트를 포함하여 256문자로 확장하였다. 이것을 확장 아스키 코드 라고 한다.

아스키 코드 이후 세계 각국의 문자를 반영하기 위해 한 문자를 2바이트에 넣어 사용하는 unicode 가 나왔다. 유니코드는 65535 개의 문자를 나타낼 수 있으며 "http://unicode.org/charts"홈페이지에서 확인할 수 있다.