컴파일러는 프로그래밍 언어로 작성된 소스 코드를 기계어로 변환하는 프로그램이다.
📌 어휘 분석
컴파일러의 첫 번째 단계를 어휘 분석 또는 스캐닝이라 한다.
어휘 분석이란 소스 프로그램을 읽어들여 토큰이라는 의미 있는 문법적 단위로 분리하고 토큰 스트림을 생성하는 것이다.
이러한 어휘 분석을 담당하는 도구를 '어휘분석기' 또는 '스캐너'라고 한다.
언어마다 사용하는 토큰이 다르지만 일반적인 프로그래밍 언어에서 사용하는 토큰은 if, for, while과 같은 예약어, 3, 2.5와 같은 상수, +, -, *, /, =와 같은 연산자, 프로그래머가 정의한 식별자, 그리고 괄호나 쉼표(,), 세미클론(;)과 같은 구분자 등이 있다.
이러한 토큰은 다음 단계인 구문 분석에서 효율을 높이기 위해 순서쌍( 토큰 번호, 속성 값 )의 형태로 전달한다.
- 토큰 번호는 모든 토큰을 구별하기 위한 유일한 번호를 말한다.
- 속성 값은 기호표에 저장된 항목을 가리킨다.
'CS > 컴파일러의이해' 카테고리의 다른 글
[CS][컴파일러의 이해] 컴파일러 - 구문 분석 (0) | 2025.02.27 |
---|---|
[CS][컴파일러의 이해] 형식 언어( formal language ) (0) | 2025.02.25 |