프로그래밍(programming), 혹은 간단히 코딩(coding)은 컴퓨터가 수행할 작업들의 집합체인 프로그램을 설계 및 작성하는 행위를 가리킨다. 프로그램 개발에 활용될 수 있는 프로그래밍 언어는 다양하며, 각자 추구하려는 목적과 철학에 따라 설계되었기 때문에 언어마다 제각각 장단점을 지닌다. 프로그램을 생성하거나 실행하는 방식 또한 서로 다르기 때문에, 본문은 크게 두 가지 부류의 프로그래밍 언어를 소개한다.
기계어(maachine code)는 컴퓨터 프로세서(일명 CPU)의 연산 및 동작을 직접 제어할 수 있는 0과 1만으로 구성된 이진 코드이다. 비록 프로그래밍 언어는 영문으로 작성되지만, 컴퓨터가 작업을 수행하기 위해서는 결국 기계어로 변환되어야 한다. 만일 어셈블리에 능통하면 기계어로 직접 프로그래밍이 가능하다. CPU에는 x86, ARM 등 다양한 아키텍처가 있는데, 각각 연산 및 동작을 수행하기 위한 이진 코드가 설계상 이유로 서로 다르다. 예를 들어, 동일한 윈도우 OS라도 x86-64의 인텔 코어 및 AMD 라이젠에서 문제가 없던 프로그램이 ARM64의 퀄컴 스냅드래곤에서는 실행 불가하다.
바이트코드(bytecode)는 소스 코드에서 기계어로 변환하는데 징검다리 역할을 하는 중간 언어이다. 수행할 연산 혹은 동작을 나타내는 명령 코드(opcode)가 한 바이트(byte) 내에서 표현되기 때문에 바이트코드("바이트" + 명령"코드")라는 명칭에서 유래되었다. 기계어와 유사하지만 바이트코드는 CPU 아키텍처에 의존하지 않고 소프트웨어에서 처리된다.
바이트코드도 전부 동일한 건 아니다: 파이썬과 자바는 바이트코드를 생성하는 대표적인 언어이지만, 명령 코드와 인자 여부 등이 달라 서로 호환되지 않는다. 즉, 바이트코드는 이를 처리하는 소프트웨어에 의존한다.
컴파일러(compiler)는 하나의 프로그래밍 언어를 다른 언어로 변환(일명 컴파일; compile)하는 언어 처리 소프트웨어이다.
컴파일러를 사용하는 대표적인 C/C++ 프로그래밍 언어는 CPU가 직접적으로 수행할 수 있는 기계어로 컴파일되다 보니, 흔히 고급 프로그래밍 언어를 저급 프로그래밍 언어로 변환하는 국한적인 작업으로 오해한다. 하지만 파이썬 및 자바 프로그래밍 언어는 바이트코드라는 중간 언어로 변환하는 컴파일러가 존재하며, 심지어 타입스크립트 프로그래밍 언어의 컴파일러는 자바스크립트라는 또 다른 고급 프로그래밍 언어로 변환한다.
프로그래밍 언어는 설계된 당시의 철학과 기술적 한계를 효율적으로 극복하기 위해 여러 기술들을 복합적으로 작용하면서 컴파일 언어와 인터프리트 언어의 경계를 허물고 있다.
아래는 C++ 프로그래밍 언어의 .cpp 확장자 소스 코드(左)가 MSVC 컴파일러에 의해 기계어로 구성된 .exe 실행 파일(右)로 컴파일 된 예시이다.
AOT 컴파일(Ahead-of-time compilation)은 프로그램을 실행하기 전에 미리 다른 언어로 변환하는 컴파일 작업이다. 컴파일을 마친 프로그램은 추가 작업이 필요없이 실행되므로 속도가 매우 빠르다는 장점을 가진다. 다만, 변경된 소스 코드를 시험하기 위해서는 새로 컴파일해야 하는 불편함이 다소 존재한다.
AOT 컴파일을 활용하는 대표적인 프로그래밍 언어로 C/C++가 있다: .c 혹은 .cpp 확장자의 각 소스 코드마다 컴파일러에 의해 기계어로 구성된 .obj (유닉스 기반의 경우 .o) 확장자의 오브젝트 파일로 컴파일된다. 파편적인 오브젝트 파일들은 링커에 의해 연동되어 최종적으로 완전한 .exe 실행 파일, .lib 정적 혹은 .dll 동적 라이브러리(유닉스 기반의 경우 .a 혹은 .so)로 빌드된다.
본 내용은 인터프리터에 관한 내용이 상당히 포함되어 있어, 해당 문서를 우선 읽어보는 것을 권장한다.
JIT 컴파일(Just-in-time compilation)은 프로그램을 실행하는 런타임 도중에 다른 언어로 변환하는 컴파일 작업이다. JIT 컴파일은 전통적인 AOT 컴파일의 빠른 실행 속도와 인터프리터의 유연함을 모두 지니지만, 동시에 두 기술의 오버헤드가 중첩(즉, 컴파일 타임 + 링크 타임 + 인터프리트 오버헤드)되는 단점도 공존한다.
일반적으로 AOT 컴파일러의 부산물인 바이트코드를 런타임 도중에 기계어로 JIT 컴파일하여 실시간으로 실행한다. 개발한 프로그램을 최초로 실행할 때는 JIT 컴파일에 소비된 시간으로 지연이 불가피하지만, 자츰 컴파일 정보가 캐싱되면서 성능 향상을 위한 런타임 최적화에 활용된다. 이와 같이 JIT 컴파일은 실행되는 코드를 지속적으로 분석하여 컴파일로 취할 수 있는 이점과 실점을 저울질한다.
대표적인 JIT 컴파일 예시로 .NET 기반의 프로그래밍 언어가 있다. 자바 플랫폼과 자바스크립트 엔진의 경우, 본래 인터프리터를 사용하였으나 성능 향상이 중시된 현재에는 JIT 컴파일로 대체되었다.
인터프리터(interpreter)는 소스 코드를 CPU가 직접 수행할 수 있는 기계어로 컴파일하지 않고서도 곧바로 실행할 수 있도록 하는 소프트웨어이다. 이러한 특성은 소스 코드가 어떤 시스템에서도 동일하게 실행될 수 있는 크로스 플랫폼 성질을 보여준다. 소스 코드로부터 수행되어야 할 동작을 인터프리터가 대신 실행하기 때문에 기계어로의 컴파일이 불필요하다.
소스 코드는 크로스 플랫폼이겠지만, 이를 실행하는 인터프리터는 시스템 아키텍처에 따라 별도로 빌드되어야 한다.
아래는 일부 프로그래밍 언어의 인터프리터가 무엇으로부터 빌드되었는지 나열한다.
프로그래밍 언어 | 인터프리터 | 인터프리터 빌드 언어 |
---|---|---|
자바 | Java Virtual Machine | C++ |
파이썬 | CPython | C |
파이썬 | Jython | 자바 |
런타임 도중에 인터프리터는 실행할 코드를 분석하여 해당하는 동작을 수행하는데, 이 과정에서 발생하는 오버헤드는 컴파일러로 빌드된 실행 파일보다 저하된 실행 속도를 보여준다. 하지만 컴파일 타임까지 모두 고려하면 오히려 컴파일러보다 소모되는 시간이 더 짧으므로, 인터프리터의 전체적인 시간 효율은 소스 코드가 자주 변경되는 개발 단계에서 유리하게 작용한다.
인터프리터는 소스 코드를 실행하는 세 가지 전략 중 하나를 구사한다:
- 소스 코드의 문장을 있는 그대로 하나씩 분석하고 수행한다.
- 소스 코드를 보다 효율적인 중간 언어 혹은 오브젝트 코드로 변환(혹은 컴파일)을 마친 즉시 이를 실행한다.
- 컴파일러로부터 미리 생성된 바이트코드를 이에 부합하는 인터프리터 가상 머신을 통해 실행합니다.
아래는 인터프리트의 2번 전략을 활용하는 파이썬 프로그래밍 언어의 .py 확장자 스크립트 파일(左)에 작성된 소스 코드(右上)와 인터프리터로 실행된 프로세스(右下) 예시이다.
프로세스 가상 머신(process virtual machine; 프로세스 VM)은 비록 명칭이 가상 "머신(장치)"이지만 시스템 운영체제에서 단일 프로세스 실행을 지원하는 어플리케이션이다. 하드웨어나 운영체제 상관없이 플랫폼 독립적인 프로그래밍 환경을 제공하여 프로세스가 동일하게 실행될 수 있도록 보장하는 게 목적이다. 흔히 인터프리터와 성질이 비슷하여 혼용되어 일컫는 경우가 자자하지만, 프로세스를 실행하는 인터프리터는 프로세스 실행 환경을 제공하는 프로세스 VM의 구성요소 중 하나로 간주된다.
대표적인 프로세스 VM으로 자바 플랫폼의 자바 가상 머신(Java virtual machine; JVM) 그리고 .NET의 공통 언어 런타임(Common Language Runtime; CLR)이 있다. 이들은 한 프로그래밍 언어에 국한되지 않고 다양한 언어를 지원할 수 있다.
- JVM: 자바, 코틀린, 그루비 등
- CLR: C#, F#, VB.NET 등
위의 프로세스 VM들은 인터프리터 뿐만 아니라 지원하는 각 프로그래밍 언어의 소스 코드를 중간 언어로 변환하는 컴파일러를 가지고 있기 때문에 포괄적인 "가상 머신"이라고 언급된다. 파이썬 프로그래밍 언어도 마찬가지로 프로세스 VM이 존재하지만 한 가지 언어만을 지원하고 인터프리터의 성질이 상당히 부각되는 점에서 오히려 "인터프리터"라고 불린다.