부록 A 라이브러리에 있는 C 언어 기능들

C 라이브러리에 의해서 실행되는 기능들 중 어떤 것은 C 언어 그 자체의 일부처럼 생각될 수 있다. 그 기능들은 라이브러리 매뉴얼이 아니라, C 언어 매뉴얼에서 문서화되어야 하지만, 우리는 아직 그 C 언어 매뉴얼을 만들지 않았기 때문에, 그 기능들을 이곳에서 설명할 것이다.


A. 1 내부적 일관성을 명백하게 테스트하기

당신이 프로그램을 만들 때, "불가능한" 에러나 기본 가설의 위반에 대해서 전략적인 위치에서 그들을 체크하는 것은 좋은 생각이다. 그 체크는 프로그램의 다른 부분들 사이에서 불화합으로 일어나는 문제들을 디버깅하는데 유익하다.

헤더파일 `assert. h'에 정의된, assert 매크로는 프로그램의 에러가 검출된 곳에서 에러메세지를 출력하는 동안 프로그램을 중지시키기에 편리한 방법을 제공한다. 당신이 당신의 프로그램을 디버깅하려할 때, 당신은 정의된 매크로 NDEBUG를 사용해서 재컴파일하면 assert 매크로에 의해서 수행됐던 에러 체크는 디버그하지 않을 수 있다. 이것은 기능무효(disable)로 체크된 프로그램 소스 코드는 변경하지 않는다는 것을 의미한다.

그러나 그 체크를 무효화(disabling)하는 것은 그 프로그램을 확연하게 느리게 만들지 않는 한 바람직하지 않다. 또한 누가 그 프로그램을 실행시키던지 발생할 수 있는 가능한 에러에 대해서 대비하도록 좀더 많이 에러를 체크해보는 것이 좋다. 똑똑한 사용자는 어떤 것 이 잘못되었을 때 그것을 지적하지 않고 무의미한 반환값을 갖는 것보다는 차라리 프로그램이 파손되는 것을 원할 것이다.

매크로 : void assert (int expression)

프로그램 안에서 그 expression이 그 순간 0이 아닌 값이 되는지를 검증한다. 만일 NDEBUG 가 정의되지 않으면, assert는 expression의 값을 테스트하는데, 그 값이 0이면, assert는 다음 형식처럼 메시지를 프린트한 후에 프로그램을 중지시킨다 ( 22. 3. 4절 [Aborting a Program] 참조)
`file': linenum: Assertion `expression' failed.
표준 에러 스트림 stderr에 메시지를 프린트한다 ( 7. 2절 [Standard Streams] 참조. ). 파일 이름과 라인 번호는 C 전처리기 매크로 __FILE__ 과 __LINE__ 어로부터 가져오고 그 파일이름과 라인번호는 assert가 쓰여져서 호출된 곳으로 정한다. 만일 전처리기 매크로 NDEBUG가 `assert. h'가 인클루드된 지점에서 정의되었다면, assert 매크로는 완전히 아무 것도 하지 않도록 정의된 것이 된다.
 
주의 : 만일 NDEUG가 영향력을 발휘하는 곳에서는 인수 expression 표현식도 평가되지 않는다. 그러므로 부작용이 있을 법한 인수를 넣고 assert를 사용하지 말아라. 예를 들어, assert(++i>0); 은 만일 NDEBUG가 정의된 곳에서는 i변수가 증가되지 않기 때문에 좋지 않다.
 
사용법 노트: assert 기능은 내부적 모순을 검출하기 위해서 설계되었다; 그러므로 사용자에 의한 부적당한 사용이나 무효한 입력을 보고하는데는 적당하지 않다.

매크로 assert에 의해 프린트된 진단 메시지에 있는 정보는, 당신의 프로그램을 사용하는 사용자에게 왜 입력이 무효한지 또는 왜 명령이 실행되지 않았는지를 알리는데는 유용하지 않지만, 프로그래머나 당신이, 프로그램에서 나타난 버그를 추적하는데 도움이 된다. 그러므로 당신은 예측할 수 없는 사건에 대한 에러메세지를 출력하는데 assert를 사용할 수 없다.

더 말하자면, assert에 무효한 입력이 주어진다면 당신의 프로그램은 중지된다_그것은 에러메세지를 출력한 후에 0이 아닌 상황(22. 3. 2절 [Exit Status] 참조. )으로 종료되거나, 또는 다른 명령을 읽거나 다음 입력 파일로 옮긴다. 프로그램에 나타나지 않은 버그 문제에 에러메세지를 출력하는 것에 대한 정보는 2. 3절 [Error Messages] 참조.


A. 2 가변인자 함수들

ANSI C 는 인수의 타입이나 개수를 다양하게 취할 수 있는 함수를 선언하기 위한 구문을 정의한다. ( 그와같은 함수들은 varargs 함수 또는 variadic 함수라고 부른다. ) 그렇지만, 언어 그 자체는 그와같은 함수들을 위한 메커니즘을 제공하지 않는다; 대신에, `stdarg. h'에 정의된 가변 인수 매크로들을 사용하는 것이다. 이 절은 어떻게 가변인자 함수들을 선언하고, 어떻게 사용하며, 호출할 것인지에 대해서 설명한다.

 
이식성 노트 : 많은 오래된 C 방언들은 `varargs. h'를 사용해서 다양한 개수의 변수를 정의하는 함수 메커니즘으로 유사한 것을 제공하지만, 호환성이 없다.

 

A. 2. 1 왜 가변인자 함수들이 사용되는가?

원래 C 함수들은 고정된 개수의 인수들을 취한다. 당신이 함수를 정의할 때, 당신은 각 인수의 데이터 타입을 정한다. 함수가 호출될때마다 그전에 정해진 예상된 개수의 인수들이 공급되는데, 그 인수들의 타입은 정해진 것으로 변경될 수 있는 것이다. 그래서, 만일 함수 `foo'가 foo(int, char *); 로 선언된다면, 하나는 숫자 다른 하나는 문자열 포인터인 두 개의 인수를 가지고 foo 함수를 호출해야만 한다.

그러나 어떤 함수들은 정해지지 않은 개수의 인수를 받아들일 수 있는 동작을 수행한다. 어떤 경우, 함수는 한 블록에 그들의 모두를 처리함으로써 여러 개수의 값들을 처리할 수 있다. 예를 들어, 정해진 값들의 집합을 저장하기 위해서 malloc으로 일차원 배열을 할당하는 함수를 고려해보자. 이 연산은 숫자에 해당하는 배열의 길이로써 어떤 개수의 값이 있다고 이해한다. 가변 인수 기능이 없다면, 당신은 가능한 배열 크기를 얻어내는 또 다른 한 개의 함수를 정의해야만 한다.

라이브러리 함수 printf ( 7. 9절 [Formatted Output] 참조. )는 가변인수가 유용하게 쓰이는 다른 부류의 함수에 대한 예제가 된다. 이 함수는 규정된 템플리트 문자열의 제어 하에 인수들( 개수뿐만 아니라 다양한 형을 가질 수 있다)을 프린트한다. 가변인자 함수는 많은 인수들을 처리할 수 있다는 점에서 가변인수 함수를 정의하는 이유가 된다.

open과 같은 함수들은 고정된 개수의 인수들을 취하지만, 때때로 마지막 몇 개는 무시된다. ANSI C 는 그 함수를 가변으로 정의하도록 요구하지만; GNU C 컴파일러와 대부분 다른 C 컴파일러들을 고정된 인수를 취하는 함수처럼 정의하도록 허용하고 선언할 때만 가변으로써 그 함수를 선언한다 (또는 그 인수들을 전혀 선언하지 않는다. ).

 

A. 2. 2 어떻게 가변인자 함수를 정의하고 사용하는가?

가변인자 함수를 정의하고 사용하는 세 가지 단계이다.

인수리스트안에 생략표시 (`. . . ')를 사용하고, 가변 인수들을 억세스 하도록 특별한 매크로들을 사용하여서, 가변인수 함수를 정의하라. A. 2. 2. 2절 [Receving Arguments] 참조.

그것을 호출하는 모든 파일에서, 생략표시 (`. . . ')와 함께 프로토타입을 사용해서 가변으로써 함수를 선언하라. A. 2. 2. 1절 [Varidic Prototypes] 참조.

고정된 인수들 뒤에 가변인수들이 뒤에 나오도록 해서 함수를 호출하라. A. 2. 2. 4 [Calling Variadics] 참조.

 

A. 2. 2. 1 가변 인수들을 위한 구문

가변 인수를 받아들이는 함수는 올바른 프로토타입으로 선언되어야만 한다. 당신은 보통 고정된 인수들을 사용하고 가변인수들의 가능성을 지적하기 위해서 `. . . '을 취한다. ANSI C 구문은 `. . . '가 나오기 전에 적어도 한 개의 고정 인수를 필요로 한다. 예를 들어,

int
func (const char *a, int b, . . . )
{
. . .
}

고정된 두 개의 인수로써, const char * 와 int 인수를 취하고 int형의 값을 반환하는 func 함수의 정의이다. 그 두 개의 고정인수 다음에 알려지지 않은 인수들이 몇 개가 따르게 된다.

 
이식성 노트 : 어떤 C 컴파일러에서, 함수 정의에서 가변인수는 형을 선언하여 등록될 수 없다. 좀더 자세히 말하면, 이 인수들의 타입은 자체-진행(self-promoting)이 되어야만 한다: 즉, 디폴트 진행은 그 타입들을 변경하지 않아야 한다. 이것은, float , char(부호가 있던지 없던지), 그리고 short int (부호가 있거나 없거나) 뿐만 아니라 배열과 함수들의 타입을 무시한다.

 

A. 2. 2. 2 인수 값들을 받기

보통 고정된 인수들은 개별적인 이름을 갖고, 당신은 그들의 값을 억세스하기 위해서 그들의 이름을 사용할 수 있다. 그러나 가변 인수들은 아무런 이름을 갖지 않는다. 어떻게 당신이 그들을 억세스 할 것인가? 그들을 억세스하기 위한 유일한 방법은 그들이 기록된 순서대로, 순차적으로 억세스하고 다음 세 가지 단계에서 있는 헤더파일 `stdarg. h'에 선언된 특별한 매크로들을 사용해야만 한다.

1. va_start를 사용해서 va_list 형의 포인터 변수를 인수로써 초기화한다. 초기화된 인수 포인터는 첫 번째 가변인수를 가리킨다.
2. va_arg를 호출함으로써 가변인수들을 억세스 한다. va_arg를 첫 번째 호출하면, 첫 번째 인수를 반환하게 되고, 다음 호출은 두 번째 인수를 반환하고. . . 그렇게 진행이 된다.

당신이 만일 남겨진 가변인수를 무시하기를 원한다면 언제든지 멈출 수 있다. 호출로 공급된 인수들보다는 소수의 인수들을 억세스 하는 함수를 위해서 아주 좋지만, 만일 당신이 너무 많은 인수들을 억세스 하려 시도한다면 당신은 쓰레기 값을 얻게 될 것이다.

3. va_end를 호출해서 포인터 변수인 인수를 끝냈음을 알려라.

(실제로, 대부분 C 컴파일러에서, va_end의 호출은 아무 일도 하지 않고 당신은 그것을 실제로 호출할 필요가 없다. 이것은 GNU C 컴파일러에서는 항상 참이다. 그러나 누군가 당신의 프로그램을 독특한 컴파일러에서 컴파일하는 경우라면 va_end를 호출해야만 할 것이다.

va_start, va_arg 그리고 va_end에 대한 완전한 정의는 A. 2. 2. 5절 [Argument Macros] 를 참조하라. 단계 1과 3은 가변 인수를 받아들이는 함수에서 반드시 수행되어야만 한다. 그렇지만, 당신은 다른 함수에 인수로써 va_list 변수를 줄 수 있고 전부 또는 단계 2를 수행할 수 있다.

당신은 단일한 함수 호출에서 여러 번 세 단계의 전부를 반복해서 수행 할 수 있다. 만일 당신이 가변 인수를 무시하기를 원한다면, 세단계를 하지 않을 수 있다. 만일 당신이 원한다면 포인터 변수인 한 개의 인수보다 더 많은 것을 가질 수 있다. 당신은 당신이 원할 때 va_start로 각 변수를 초기화 할 수 있고, 그러고 나면 당신이 원하는 각각의 포인터 인수를 추출할 수 있다. 각 포인터 변수인 인수는 인수 값들의 같은 집합을 통해서 진행되지만, 그것은 자신만의 페이스(pace)를 갖는다.

 
이식성 노트: 어떤 컴파일러로, 당신이 서브루틴(subroutine)에 인수로써 포인터 변수를 사용한다면, 당신은 서브루틴이 반환한 후에 같은 포인터 변수인 인수를 사용해서 기록하지 않아야만 한다. 완벽한 이식성을 위해서, 당신은 va_end에 그것을 주어야한다. 이것은 실제로 ANSI C의 권장사항이지만, 대부분 ANSI C 컴파일러는 다행이 상관없이 작업한다.

 

A. 2. 2. 3 어떻게 많은 인수들이 공급되는가?

가변 인수들의 타입과 개수를 알 수 있는 일반적인 방법은 없다. 그래서 누구든 그 가변인수가 얼마나 많은 인수들을 가졌고, 그것이 무슨 종류인지를 알아낼 수 있는 특별한 방법의 함수를 고안해야한다. 그것은 가변인수 함수의 호출 관습에 적당하게 정의되어야 하고, 그것에 근거하여 프로그램에서 가변 인수 함수를 호출해야 한다.

호출관습의 한가지는 한 개의 고정된 인수를 사용해서 가변인수의 개수를 공급하는 것이다. 이 방법은 공급된 가변 인수들이 모두 같은 형일 경우에 가능한 방법이다. 그와 유사한 방법으로는 가변인수가 공급될 가능성에 대한 정보를 한 비트에 담은, 비트 마스크가될 고정인수를 인수중에 하나로 갖는 것이다. 당신은 미리 선언된 시퀀스 안에 있는 비트들을 테스트할 수 있다; 만일 그 비트가 설정되면, 다음 인수의 값을 추출하는 것이고, 그렇지 않다면, 디폴트값을 사용하는 것이다. 고정된 인수는 가변 인수들의 개수와 타입, 이 둘을 지정하는 패턴으로써 사용될 수 있다. printf에서 형식화된 문자열 인수는 이것의 한 예가 된다. (7. 9. 7절 [Formatted Output Functions] 참조.)

다른 가능성은 마지막 가변 인수로써 "끝 표시"값을 사용하는 것이다. 예를 들어, 예측할 수 없는 포인터 인수들의 개수를 처리하는 함수가 있다면, 널 포인터는 인수 리스트의 끝을 지적할 것이다. (이것은 널 포인터가 함수에게 의미 있는 값이 아니라고 가정한다. ) execl 함수는 이 방법으로 작업한다; 23. 5절 [Executing a File] 참조.

 

A. 2. 2. 4 가변인수 함수들을 호출하기

당신이 가변인수 함수를 호출할 때 특정한 어떤 것을 써서는 안된다. 단지 괄호안에 보통, 콤마에 의해 분리된 인수들(가변으로써, 요청된 인수)만 사용하라. 그러나 당신은 프로토타입으로 그 함수를 선언함으로써 준비하고, 그 인수의 값들이 어떻게 변환되는지를 알아야만 한다.

원칙적으로, 가변으로써 정의된 함수들은 당신이 그들을 호출할 때마다 함수 프로토타입을 사용해서 가변이 되도록 선언되어야한다. (A. 2. 2. 1 [Variadic Prototypes] 참조. ) 이것은 함수가 가변 인수 또는 고정된 인수를 취하는지의 여부에 의존하여 함수에 인수 값들을 부여하는 다른 호출 관습을 가진 C 컴파일러 때문이다.

실제로, GNU C 컴파일러는 항상 당신이 가변인수 또는 요청된 인수를 사용하는지에 상관없이 같은 방법으로 인수형의 주어진 집합을 부여한다. 그래서, 인수들의 타입이 자체-진행인 동안, 당신은 그들의 선언을 안전하게 생략할 수 있다. 보통 가변함수를 위해서 인수의 형을 선언하는 것은 좋은 방법이고, 모든 함수들을 위해서는 물론 당연한 것이다. 그런데 몇 개의 함수는 그렇지 않은 경우가 있다_예를 들어, open과 printf

함수의 프로토타입이 가변인수들의 타입을 정하지 않았을 때, 가변인수 함수를 호출하면, 함수의 가변 인수 값들은 디폴트 인수 승급이 수행된다. 디폴트 인수 승급이란 char 또는 short int (부호가 있던지 없던지)의 형을 가진 오브젝트들은 int 나 unisgned int로 승급되고; float의 형을 가진 오브젝트들은 double로 승급되는 것을 말한다. 그래서, 가변인수에 char형의 값을 넣으면, 그것은 int로 승급되고, 그 함수는 va_arg(ap, int)과 함께 그것을 얻을 것이다.

고정 인수들은 보통 함수의 원형을 통해서 제어된다: 인수 표현식은 마치 그형의 변수로 할당되었던 것 선언된 인수의 형으로 변환된다.

 

A. 2. 2. 5 인수 억세스 매크로들

다음은 가변 인수들을 가져오기 위해서 사용되는 매크로에 대한 기술이다. 그 매크로들은 헤더파일 `stdarg. h'에 정의되어 있다.

데이터 타입 : va__list

va_list는 포인터 변수들인 인수를 위해서 사용된다.

매크로 : void va__start (va_list ap, last_required)

이 매크로는 현재 함수의 가변 인수들의 첫 번째를 가리키는 포인터 변수 ap를 초기화한다; lastrequired는 함수에 있는 마지막 고정인수가 되어야 한다. `varargs. h'에 있는 va_start의 정의를 변경하려면 A. 2. 3. 1 [Old Varargs] 를 참조하라.

매크로 : type va__arg (va_list ap, type)

va_arg 매크로는 다음 가변 인수의 값을 반환하고, 다음 인수를 가리키도록 ap의 값을 갱신한다. 그래서, va_arg의 성공적인 사용은 가변 인수들을 성공적으로 반환한다. va_arg에 의해 반환된 값의 타입은 호출에서 정했던 타입이다. type은 반드시 실제 인수의 타입과 매치되는 자체-승급 타입 (char나 short int 나 float가 아닌)이 되어야 한다.

매크로 : void va__end (va_list ap)

이것은 ap의 사용을 끝낸다. va_end 호출 후에, 다음에 같은 ap를 사용해서 va_arg를 호출하면 작업하지 않을 것이다. 당신은 같은 ap 인수를 사용하는 va_start를 호출했던 함수를 반환하기 전에 va_end를 호출해야만 한다. GNU C 라이브러리에서, va_end는 아무 일도 하지 않기 때문에 이식성의 이유가 아니라면 va_end를 호출할 필요가 없다.

 

A. 2. 3 가변인수 함수의 예제

다음은 인수들을 가변적인 개수로 받아들이는 함수에 대한 예이다. 함수의 첫 번째 인수는 반환된 결과와 합산된, 남겨진 인수들의 개수이다. 이 함수는 가변 인수 기능을 어떻게 사용하는지 설명하는데 충분하다.

#include <stdarg. h>
#include <stdio. h>
int
add_em_up (int count, . . . )
{
va_list ap;
int i, sum;
va_start (ap, count);
/* 인수 목록을 초기화하라. */
sum = 0;
for (i = 0; i < count; i++)
sum += va_arg (ap, int);
/* 다음 인수값을 얻어라. */
va_end (ap);
/* 정리하라. */
return sum;
}
int
main (void)
{
/* 이 호출은 16을 출력한다. */
printf ("%d\n", add_em_up (3, 5, 5, 6));
/* 이 호출은 55를 출력한다. */
printf ("%d\n", add_em_up (10, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10));
return 0;
}

 

A. 2. 3. 1 오래된-형태의 가변인수 함수들

ANSI C 이전에, 프로그래머들은 가변함수들을 쓰기 위해서 완전히 다른 기능을 사용했었다. GNU C 컴파일러는 여전히 그것을 지원한다; 현재, 그것은 ANSI C가 여전히 일반적이지 않기 때문에, ANSI C 기능보다는 더 이식성이 있다. 오래된-형태의 가변인수 함수를 정의하고 있는 헤더파일은 `varargs. h'라고 불린다.

`varargs. h'를 사용하는 것은 `stdarg. h'를 사용하는것과 거의 같다. 가변인수 함수를 어떻게 호출하는지에 대한 것은 거의 다름이 없다; A. 2. 2. 4절 [Calling Variadics] 참조. 오직 유일한 차이는 그들을 정의하는 방법이다. 무엇보다도, 당신은 오래된 형태의 비- 프로토타입 구문을 사용해야만 한다. 다음처럼:

tree
build (va_alist)
va_dcl
{
두 번째로, va_start에 오직 한 개의 인수만을 넣어야한다. 다음처럼:
va_list p;
va_start (p);

오래된 형태의 가변인수 함수들을 정의하기 위해서는 특정한 매크로가 사용된다:

매크로 : va__alist

이 매크로는 가변인수 함수에 있는 고정 인수이름 목록을 나타낸다.

매크로 : va__decl

이 매크로는 가변인수 함수를 위한 인수들이나 또는 암묵적인 인수를 선언한다.

매크로 : void va__start (va_list ap)

`varargs. h'에 선언된 이 매크로는 현재 함수의 첫 번째 인수를 가리키는 포인터로 포인터 변수인 인수를 초기화한다.

 

다른 인수 매크로, va_arg 와 va_end는 `varargs. h' 와 `stdarg. h'의 것이 서로 같다; A. 2. 2. 5절 [Argument Macros] 참조. 동일한 컴파일 단위에서 `varargs. h'와 `stdarg. h'가 둘다 인클루드 되어서는 안된다; va_start가 서로 충돌하게 된다.


A. 3 널 포인터 상수

널 포인터 상수는 어느 실제 오브젝트를 가리키고 있는 것이 아니라는 것을 말한다. 당신은 void * 형을 가진 포인터 변수로 그것을 할당할 수 있다. 널 포인터 상수를 사용하기 위한 좋은 방법은 NULL을 사용하는 것이다.

매크로 : void * NULL

이것은 널 포인터 상수이다.
널 포인터 상수로써 0 또는 (void *)0을 사용할 수 있지만, NULL을 사용하는 것이 상수를 사용하는 목적으로 좀더 분명하게 만들어졌기 때문에 더 깨끗하다. 만일 당신이 함수 인수로써 널 포인터 상수를 사용한다면, 그 함수가 가진 프로토타입 선언과 완전히 맞도록 널 포인터 상수를 사용해야한다. 그렇지 않다면, 만일 목표 머쉰(machin)이 두 개의 다른 포인터 표현을 가진다면, 컴파일러는 그 인수를 위해 사용할 표현이 무엇인지 알지 못한다.
당신은 적당한 포인터 타입으로 상수를 캐스트(cast)함으로써 그 문제를 피할 수 있지만, 우리는 그보다는 당신이 호출할 함수를 위해서 프로토타입에 더할 것을 권장한다.


A. 4 중요한 데이터 타입들

C에서 두 개의 포인터를 뺀 결과는 항상 정수이지만, 정밀한 데이터 타입은 C 컴파일러에 따라 다르다. . 그처럼 데이터 타입에 따라서, sizeof의 결과 또한 컴파일러에 따라서 다르다. ANSI 는 그 두 개의 데이터 타입을 위해서 표준 이름을 정의하기 때문에, 당신은 이식성을 위해서 그 데이터 타입을 사용할 수 있다. 그들은 헤더파일 `stddef. h'에 정의되어 있다.

데이터 타입 : ptrdiff__t

이것은 두 개 포인터를 빼서 나온 결과의 부호화된 정수 타입이다. 예를 들어, char *p1, *p2; 이렇게 선언되었다면; 표현식 p2 - p1은 ptrdiff_t 형의 결과값을 갖는다. 이것은 아마도 표준 부호형 정수 타입들(short int, int 또는 long int)중의 하나가 될 것이지만, 표준 부호형 정수 타입들이 이러한 목적으로 존재한다면 비표준 타입이 되어버릴 것이다.

데이터 타입 : size__t

이것은 오브젝트(objects)의 크기를 나타내는데 사용하는 비부호형 정수 타입이다. sizeof 연산의 결과가 이 타입을 갖고, malloc( 3. 3절 [Unconstrained Allocation] 참조. ) 그리고 memcpy(5. 4절 [Copying and Concatenation] 참조. )와 같은 함수들은 오브젝트의 크기를 정하는데 이 타입의 인수를 받아들인다.
사용법 노트: size_t는 오브젝트의 크기를 저장하는 인수나 변수를 선언하는데 좋은 방법을 제공한다.

GNU 시스템에서 size_t는 unsigned int 또는 unsigned long int 와 동일하다. 그 타입들은 GNU 시스템상에서 동일한 특성을 갖고 있고, 그들을 사용할 때 대부분은 그들 사이를 서로 변경시키지 않고도 사용할 수 있다. 그렇지만, 그들은 어떤 구문들에서는 차이를 갖기 때문에 다른 데이터타입으로 구분된 것이다.

예를 들어, 함수의 원형으로 함수 인수의 타입을 정할 때, 당신이 사용하는 것은 차이가 있다. 만일 시스템 헤더파일이 size_t 타입의 인수를 갖는 malloc 함수를 선언하고, 당신이 unisgned int의 타입을 갖는 malloc를 선언했을 때, 만일 size_t가 당신의 시스템에서 unisgned long int형으로 발생한다면, 당신은 컴파일 에러를 얻을 것이다. 이러한 문제의 가능성을 피하기 위해서, 함수의 인수나 값은 다른 방법으로 그 형을 선언하기보다는 size_t의 타입을 갖도록 선언하라.

 
호환성 노트 : ANSI C가 나타나기 전에 C는 포인터 뺄셈의 결과를 나타내기 위해서 int를 사용하고 오브젝트의 크기를 표현하기 위해서 unsigned int를 사용했었다. 그들은 size_t나 ptrdiff_t를 정의할 필요가 없었다. 유닉스 시스템들은 `sys/types. h'에 size_t를 정의해놓았지만, 그 정의는 보통 signed 형을 말한다.


A. 5 데이터 타입 측정

당신이 당신의 프로그램에서 사용되는 오브젝트의 적당한 C 데이터 타입을 선정할 때 대부분 그것이 얼마나 많은 비트들을 사용하고 그 오브젝트가 어떻게 표현되는지에 관심을 가질 필요가 없다. 당신이 그와같은 정보를 필요로 할 때, C 언어 자체는 그것을 얻을 수 있는 방법을 제공하지 않는다.

헤더파일 `limits. h'와 `float. h'에 포함된 매크로들은 당신에게 그것에 관한 세심한 정보를 줄 것이다.

 

A. 5. 1 정수 데이터 타입의 너비 계산하기

정수 타입이 얼마나 많은 비트로 구성되었는지 알 필요가 있는 프로그램은 비트 벡터(bit vector)로써 lont int의 배열을 사용하는 경우가 일반적이다.

당신은 vector[n / LONGBITS] & (1 << (n % LONGBITS)) 로 인덱스 N을 구성하는 비트를 억세스할 수 있다. LONGBITS는 long int를 구성하는 비트의 개수로 당신이 정의해서 공급하라.

C 언어에서 정수 데이터 타입에 있는 비트의 수에 대한 정보를 당신에게 줄 수 있는 연산자는 없다. 그렇지만 헤더파일 `limits. h'에 정의된 매크로 CHAR_BIT를 사용해서 그것을 계산할 수 있다.

CHAR_BIT

이것은 한 개의 char안에 있는 비트의 개수를 말하는데, 대부분의 시스템에서 그 값은 8이다. 그 값은 int형을 갖는다. 당신은 다음처럼 어느 데이터 타입 type안의 비트의 개수를 계산할 수 있다

 

A. 5. 2 정수 타입의 범위

당신이 0에서 일 백만 사이에 있는 정수의 값을 저장할 필요가 있다고 가정해보자. 당신이 사용할 수 있는 가장 작은 타입은 무엇인가? 그것을 정하는데 일반적인 규칙은 없다; 그것은 C 컴파일러와 목표 머쉰(machine)에 의존한다. 당신은 타입을 결정하기 위해서 `limits. h'에 있는 매크로 `MIN'과 `MAX'를 사용할 수 있다.

각각의 부호가 있는 정수 타입은 그것이 저장할 수 있는 가장 작은 값과 가장 큰 값을 나타내는 한 쌍의 매크로를 갖는다. 부호가 없는 정수 타입은 최대의 값을 나타내는 한 개의 매크로를 갖는다; 최소값은 물론 0이다. 그 매크로들의 값은 모두 정수 상수 표현이다. 다른 타입들을 위한 `MAX' 와 `MIN' 매크로들은 매크로에 의해 설명된 같은 타입의 값을 갖는다_그래서 ULONG_MAX는 unisgned long int 의 타입을 갖는다.

SCHAR_MIN

signed char에 의해 표현될 수 있는 최소값.

SCHAR_MAX, UCHAR_MAX

signed char 와 unsigned char에 의해 표현될 수 있는 최댓값.

CHAR_MIN

char 에 의해 표현될 수 있는 최소값. 여기서 만일 char에 부호가 있는 것이라면 SCHAR_MIN과 같고, 그렇지 않다면 0이다.

CHAR_MAX

char 에 의해 표현될 수 있는 최댓값. char가 부호가 있는 것이라면 SCHAR_MAX와 같고, 그렇지 않다면 UCHAR_MAX와 같다.

SHRT_MIN

signed short int에 의해 표현될 수 있는 최소값. GNU C 라이브러리가 실행되는 대부분의 컴퓨터에서, short int 는 16-비트로 동일하다.

SHRT_MAX, USHRT_MAX

signed short int 와 unsigned short int에 의해 표현될 수 있는 최댓값.

INT_MIN

signed int 에 의해 표현될 수 있는 최소값. GNU C 시스템이 실행되는 대부분의 컴퓨터에서, int 32-비트로 동일하다.

INT_MAX, UINT_MAX

signed int 와 unsigned int 에 의해 각각 표현될 수 있는 최댓값들.

LONG_MIN

signed long int 에 의해 표현될 수 있는 최댓값. GNU C 시스템이 실행중인 대부분의 컴퓨터에서, long 정수들은 int와 동일한 크기를 갖고 32-비트로 동일하다.

LONG_MAX, ULONG_MAX

signed long int 와 unsigned long int에 의해 표현될 수 있는 최댓값.

LONG_LONG_MIN

signed long int에 의해서 표현될 수 있는 최소값. GNU C 시스템이 실행되는 대부분의 컴퓨터에서, long long 정수들은 64-비트로 동일하다.

LONG_LONG_MAX, ULONG_LONG_MAX

signed long long int 와 unsigned long long int에 의해 표현될 수 있는 최댓값.

WCHAR_MAX

wchar_t에 의해 표현될 수 있는 최댓값. 18. 4절 [Wide Char Intro] 참조.

헤더파일 `limits. h'는 또한 다양한 운영체제와 파일 시스템 제한들을 파라미터 화한 부가적인 상수들을 정의하고 있다. 그 상수들은 27장[System Configuration] 에 설명되어 있다.

 

A. 5. 3 부동형 매크로들

플로팅 포인트 수의 구체적인 표현 방법은 기계마다 다르다. 플로팅 포인트 수들은 내부적으로 근사치로써 표현되기 때문에, 플로팅 포인트 데이터를 다루기 위한 알고리즘은, 때때로 기계의 플로팅 포인트 표현에 대한 자세한 정밀도를 참작하는데 사용된다.

C 라이브러리에서 어떤 함수들은 이러한 정보를 필요로 한다; 예를 들어, 플로팅 포인트 숫자들을 읽거나 출력하는 알고리즘 (7장 [I/O on Stream] 참조) 과 삼각함수를 계산하기 위한 알고리즘 그리고 무리수 함수들을 위한 알고리즘들은 정확성의 상실이나 반올림-에러를 피하기 위해서 그 정보를 사용한다. 수학적인 분석 기술을 다루는 프로그램들은 에러 경계를 계산하거나 최소화하기 위해서 이 정보를 필요로 한다. 헤더파일 `float. h'는 당신의 기계에 의해서 사용되는 형식을 설명한다.

 

A. 5. 3. 1 플로팅 포인트 표기 개념

이 절은 플로팅 포인트 표현법을 설명하기 위한 용어들을 설명한다. 당신은 플로팅 포인트 숫자들을 표현하는 과학적인 표기 또는 지수적인 표기의 개념에 대해서 이미 친숙할 것이다. 예를 들어, 숫자 123456. 0은 가수가 1. 23456이고 베이스가 10으로 5승임을 가리키는, 1. 234546e+05의 지수적 표기로써 표현될 수 있다. 더 형식적으로, 플로팅 포인트 수의 내부적 표현은 다음의 파라미터로써 특징을 나타낼 수 있다.

부호는 -1 또는 1 이다.

지수를 위한 베이스(base) 또는 기수(radix)는 1보다 큰 정수이다. 이것은 특정 표기에 따라서 다른 상수이다.

베이스에 몇 승인지를 나타내는 수가 지수이다. 지수의 상한과 하한은 특정한 표기에 따라서 다른 상수이다.

때때로, 플로팅 포인트 수를 표현하고 있는 실제 비트들에서, 지수를 항상 unsigned로 표현되도록 만들기 위해서 그것에 상수를 더하여 부호의 의미를 부여한다. 이것은 만일 당신이 직접 플로팅 포인트 수를 구성하고 있는 비트 영역들의 어떤 부분을 사용할 필요가 있는 경우에만 중요하다. GNU 라이브러리는 이러한 것을 지원하지 않는다. 그러므로 다음부터는 이것에 대한 논의는 무시될 것이다.

가수부(mantissa) 또는 유효수(significand)는 플로팅 포인트 숫자를 이루는 한 부분으로써 부호가 없는 정수이다.

가수부의 정밀도. 만일 어떤 플로팅 표현에서 베이스(base)가 b라고 했을 때, 정밀도는 베이스-b를 기반으로 가수부 안에 들어가 있는 숫자들의 개수이다. (즉. . 가수부가 몇 개의 비트로써 표현되느냐를 정밀도라고 한다. ) 이것은 특정한 표현에 따라 다른 상수이다.

많은 플로팅 포인트 표현들은 가수부 안에 암묵적으로 숨겨진 비트를 가지고 있다. 이것은 가수부 안에서 실질적으로는 표현되지만 그 값이 항상 1로 되어있기 때문에 메모리에는 저장되지 않는다. 정밀도 형태는(위를 보라) 숨겨진 비트들도 표함 한다. 다시, GNU 라이브러리는 플로팅 포인트 표현을 위해서 그와같은 저수준의 관점을 다루는 기능을 제공하지 않는다.

플로팅 포인트 수의 가수부는 지수의 몇 승을 가진 함축적인 소수부로써 표현된다. 그래서 가장 크게 표현할 수 있는 가수부가 이 정밀도보다 적은 것이면, 소수의 값은 항상 1보다 적다. 플로팅 포인트 수의 수학적인 값은 소수, 부호 그리고 베이스의 몇 승임을 나타내는 지수로써 만들어진다.

b가 베이스라고 했을 때, 소수가 적어도 1/b라면, 플로팅 포인트 수가 일반화되었다고 말한다. 바꾸어 말하면, 가수부에 지수승이 곱해지면 맞추기에 너무 크게 될 것이다. 비-일반화된 수들은 디노멀(denomal)이라고 부른다; 그들은 플로팅 포인트 수가 일반적으로 저장될 수 있는 정밀도 보다도 작은 정밀도를 갖고 있다.

만일 그 수가 일반화되지 않았다면, 가수부를 base로 나눈 다음 나온 지수로부터 1을 뺄 수 있고, 그러면 같은값을 가진 다른 표기형식의 플로팅 포인트를 얻게 된다. 그 수가 일반화될 때까지 반복적으로 위와 같은 일을 하면 일반화된 플로팅 포인트 수가 나오게 된다. 두 개의 다른 일반화된 플로팅 포인트 수들은 값이 같을 수 없다.

( 이 규칙에는 예외가 있다: 만일 가수부가 0이라면, 그것은 일반화된 것으로 간주된다. 특정한 기계에서 발생할 수 있는 예외상황이란, 지수부가 그 표기법으로 저장할 수 있기에는 너무 작은 경우이다. 그러면 지수부로부터 1을 빼는 것이 불가능하기 때문에 , 소수가 1/b보다 적은 소수부라면 일반화될 수 있을 것이다. )

 

A. 5. 3. 2 플로팅 포인트 파라미터들

다음 매크로 정의들은 헤더파일 `float. h'에 있다. `FLT_'로 시작하는 매크로들은 float 타입에 관한 것이고, `DBL_'로 시작되는 매크로들은 double 타입에 와 `LDBL_'로 시작되는 매크로들은 long double 타입에 관한 것이다. (현재 GCC 는 분리된 데이터형으로써 long double를 지원하지 않기 때문에, `LDBL_'상수들을 위한 값들은 double형을 위한 상수에 해당되는 값과 같다. )

그 매크로들 중에서, 오직 FLT_RADIX는 상수 표현식이 되도록 보증된다. 이곳에 설명된 다른 매크로들은 상수 표현식, `#if'와 같은 전처리 지시자 또는 정적 배열 안의 차원을 요구하는 곳에서 사용될 수 없다.

ANSI C 표준이 대부분의 파라미터들을 위한 최소값과 최댓값 정했다고 하더라도, GNU C는 목표 기계의 플로팅 포인트 표현에 따른 값을 사용한다. 그래서 GNU C는 목표 기계가 안정적이라면 ANSI C 요구를 만족시키게 되는 것이다. 실제로, 현재 지원되는 모든 기계들은 안정적이다.

FLT_ROUNDS

이 값은 반올림 형식을 지정하는 값이다. 다음 값은 표준 반올림 모드를 나타낸다.
-1 반올림하지 않는다.
0 소수점 뒤를 0으로 만든다.
1 가장 가까운 수로 반올림한다.
2 무한대로 양의 값을 향한다.
3 무한대로 음의 값을 향한다.
이 이외의 값은 기계_의존적인 비표준 반올림 모드를 나타낸다. 대부분의 기계에서, 그 값은 IEEE 표준에 따라서 1로 되어있다.
다음은 FLT_ROUNDS의 값에 따라서 값들이 어떻게 변하는지를 보여주는 테이블이다,
0 1 2 3
1. 00000003 1. 0 1. 0 1. 00000012 1. 0
1. 00000007 1. 0 1. 00000012 1. 00000012 1. 0
-1. 00000003 -1. 0 -1. 0 -1. 0 -1. 00000012
-1. 00000007 -1. 0 -1. 00000012 -1. 0 -1. 00000012

FLT_RADIX

이것은 지수부의 베이스(base) 또는 기수(radix)의 값이다. 이것은 이 절에 설명된 다른 매크로와는 달리 상수 표현식임이 보장된다. IBM 360과 그곳에서 파생된 제품을 제외하고는 모든 기계에서 2로 되어있다.

FLT_MANT_DIG

float형에서 가수부를 표현하는데 사용되는 비트수. 다음 표현식은 가수부 숫자들의 제한된 수 때문에 1. 0이 나온다(수학적으로는 그것이 될 수 없을 지라도):
float radix = FLT_RADIX;
1. 0f + 1. 0f / radix / radix / . . . / radix
여기서 radix는 FLT_MANT_DIG 번 나타난다.

DBL_MANT_DIG

LDBL_MANT_DIG

이것은 각각 double 과 long double형 각각이 가수부를 표현하는데 사용되는 비트수이다.

FLT_DIG

This is the number of decimal digits of precision for the float data type. Technically, if p and b are the precision and base (respectively) for the representation, then the decimal precision q is the maximum number of decimal digits such that any floating point number with q base 10 digits can be rounded to a floating point number with p base b digits and back again, without change to the q decimal digits.
float형에서 유효숫자의 최소개수.
이 매크로의 값은 ANSI C에서, 적어도 6으로 지원되고 있다.

DBL_DIG, LDBL_DIG

FLT_DIG와 유사하지만, double와 long double형을 위한 것이다. 그 매크로의 값은 적어도 10이 되도록 지원된다.

FLT_MIN_EXP

이것은 float형을 위해서 가능한 지수값으로 가장 작은 값이다. 더 자세하게는, FLT_RADIX에서 1을 뺀 값이 float형으로써 일반화된 플로팅 포인트 수로써 표현될 수 있는 최소 음의 정수이다.

DBL_MIN_EXP, LDBL_MIN_EXP

FLT_MIN_EXP와 유사하지만, double 와 long double를 위한 것이다.

FLT_MIN_10_EXP

This is the minimum negative integer such that 10 raised to this power minus 1 can be representedas a normalized floating point number of type float. This is supposed to be -37 or even less.
지수부의 최소범위. -37이거나 그보다 적다.

DBL_MIN_10_EXP, LDBL_MIN_10_EXP

double와 long double형 각각을 위한 것으로, 지수가 나타낼 수 있는 최소범위.

FLT_MAX_EXP

This is the largest possible exponent value for type float. More precisely, this is the maximum positive integer such that value FLT_RADIX raised to this power minus 1 can be represented as a floating point number of type float.
float이 표현할 수 있는 지수의 최댓값.

DBL_MAX_EXP, LDBL_MAX_EXP

double 와 long double형이 각각 표현할 수 있는 지수의 최댓값.

FLT_MAX_10_EXP

This is the maximum positive integer such that 10 raised to this power minus 1 can be represented as a normalized floating point number of type float. This is supposed to be at least 37.
float형에서 베이스가 10일 때 표현할 수 있는 지수의 최댓값. 이것은 적어도 37이다.

DBL_MAX_10_EXP, LDBL_MAX_10_EXP

double 와 long double형엣 베이스가 10일 때 각각이 표현할 수 있는 지수의 최댓값.

FLT_MAX

이 매크로의 값은 float형이 표현할 수 있는 최대 수를 의미한다. 이것은 적어도 1E+37이 된다. 값 자체도 float형을 갖는다. 표현 가능한 가장 작은 수는 -FLT_MAX가 된다.

DBL_MAX, LDBL_MAX

doble 와 long double 형 각각이 표현할 수 있는 최대 수를 의미한다. 이 매크로 값이 가지는 형은 그것을 설명하는 형과 동일하다.

FLT_MIN

이 매크로의 값은 float형이 표현할 수 있는 표준화된 양의 플로팅 포인트 수의 최소값. 그 값은 1E-37보다 크지 않다.

DBL_MIN, LDBL_MIN

double 과 long double형 각각을 위한 것으로 표준화된 양의 플로팅 포인트수의 최소값. 매크로의 값 자체가 가지는 형은 그것이 설명하는 형과 동일하다.

FLT_EPSILON

1. 0 + FLT_EPSILON != 1. 0이 참인 float형의 플로팅 포인트 수의 최소 양의 수이다. 1E-5보다 크지 않다.

DBL_EPSILON, LDBL_EPSILON

double 와 long double를 위한 것으로 의미는 FLT_EPSILON과 같다. 이 매크로 값 자체가 가지는 형은 그것이 설명하는 형과 동일하다. 그 값은 1E-9보다 크지 않다.

 

A. 5. 3. 3 IEEE 플로팅 포인트

다음은 이진 플로팅 포인트 연산을 위해서 IEEE 표준에서(ANSI/IEEE Std 754-1985) 정한, 대부분의 일반 플로팅 포인트 표기에서 산출된 float형의 대부분의 매크로 값을 보여주고 있다. 1980년대 이후에 디자인된 대부분의 컴퓨터는 이 형식을 사용한다.

IEEE 단정도(single-precision) float 표기법은 베이스로 2를 사용한다. 그것은 23비트에 한 개의 숨겨진 비트를 더해서(그래서 총 정밀도는 베이스를 2로 했을 때 24가 된다. ) 부호 비트와 가수부를 나타내고, 8-비트 지수부는 -125에서 128까지의 범위에 있는 값을 표현할 수 있다. 다음은, float형 데이터를 이 표기법을 사용할 경우, 그것에 연관된 파라미터의 적당한 값을 나타내고 있다.

FLT_RADIX 2
FLT_MANT_DIG 24
FLT_DIG 6
FLT_MIN_EXP -125
FLT_MIN_10_EXP -37
FLT_MAX_EXP 128
FLT_MAX_10_EXP +38
FLT_MIN 1. 17549435E-38F
FLT_MAX 3. 40282347E+38F
FLT_EPSILON 1. 19209290E-07F

다음은 double 데이터 타입을 위한 값들이다.

DBL_MANT_DIG 53
DBL_DIG 15
DBL_MIN_EXP -1021
DBL_MIN_10_EXP -307
DBL_MAX_EXP 1024
DBL_MAX_10_EXP 308
DBL_MAX 1. 7976931348623157E+308
DBL_MIN 2. 2250738585072014E-308
DBL_EPSILON 2. 2204460492503131E-016

A. 5. 4 구조체 필드 옵셋 ( offset ) 측정

구조체 형안에서 특정한 구조체멤버의 위치를 계산하기 위해서는 offsetof를 사용할 수 있다.

매크로 : size_t offsetof (type, member)

이것은 구조체형을 가진 type안에 있는 member라는 이름을 가진 구조체 멤버의 옵셋(offset)을 구하는 정수 상수 표현식이다. 예를 들어, offsetof(struct s, elem)은 struct s라는 구조체 안에 있는 멤버 elem의 오프셋(offset)이 된다. 이 매크로는 만일 멤버가 비트 필드가 아니면 작업하지 않는다; 당신은 그 경우에 컴파일러로부터 에러를 얻게 될 것이다.