본문 바로가기
백엔드(Back-End)/Java

[Java] - 자바 가상 머신, JVM(Java Virtual Machine)

by TwoJun 2023. 10. 19.

JVM(Java Virtual Machine) - 자바 가상 머신

Java, Kotlin 기반의 애플리케이션이 실행된다면 반드시 JVM 위에서 실행된다. 이러한 자바 가상 머신이 어떻게 동작하는지, 어떤 구성 요소로 이루어졌는지 정리해 보려고 한다.

 

 

 

 

1. JVM(Java Virtual Machine), 자바 가상 머신

1-1. JVM이란?

- 자바 가상 머신은 Java로 개발한 애플리케이션을 컴파일하여 생성되는 바이트 코드를 실행시키기 위한 가상 머신이다. 이러한 JVM의 역할은 자바 애플리케이션을 클래스 로더를 통해 읽어 들인 후 Java API와 함께 실행하는 역할을 수행한다. Java와 운영체제 사이에서 중계자 역할을 수행함에 따라 운영체제와 프로세서 환경에 독립적으로 자바 애플리케이션이 실행될 수 있도록 해 준다.

 

 

 

 

1-2. JVM의 여러 가지 특징

(1) 플랫폼 독립성

- JVM은 자바 소스코드를 컴파일하여 생성된 바이트 코드를 실행하는 환경으로 각 운영체제에 맞는 JVM만 설치되어 있다면 하나의 소스 코드 파일로 어디에서든지 해당 프로그램을 실행할 수 있다.

 

(2) Gabage Collection

- JVM은 Gabage Collection(GC)을 통해 메모리를 자동으로 관리한다. 개발자가 직접 메모리의 할당과 해제에 관여하지 않아도 되기 때문에 다른 언어보다 핵심 로직 구현에 집중할 수 있다.

 

(3) 스택 기반 가상 머신

- JVM은 스택 기반 가상 머신이고 메모리를 스택 형식으로 사용하여 메서드 호출 및 로컬 변수에 대한 연산을 처리할 수 있다.

 

(4) 다중 스레드 지원

- JVM은 멀티 스레드 프로그래밍을 지원하며 스레드 간 동기화를 통해 병렬 처리와 동시성 문제를 다룰 수 있다.

 

 

(5) 런타임 시점 동적 로딩 

- JVM은 필요한 클래스 파일들을 애플리케이션 런타임 시점에 동적으로 로딩할 수 있다. 따라서 프로그램이 실행되는 도중에 필요한 클래스들을 동적으로 로딩하여 사용할 수 있다.

 

- 이외에도 자바 가상 머신이 갖는 특징은 여러 가지가 더 존재한다.

 

 

 

 

 

2. 일반적인 Java Application 실행 과정 

https://www.happykoo.net/@happykoo/posts/242

(1) 자바 컴파일러(javac)가 자바 소스 코드(.java)를 읽어 들여 자바 바이트 코드(.class)로 변환한다.

 

(2) Class loader를 통해 클래스 파일(.class)들을 JVM으로 로딩시킨다.

 

(3)  로딩된 클래스 파일들은 Runtime Data Area이라는 JVM 메모리 영역에 배치된다.

 

(4) Runtime Data Area에서 다양한 작업이 수행된다. 이러한 실행 과정 속에서 JVM은 필요에 따라 Thread Synchronization, Gabage collection과 같은 관리 작업을 수행한다.

 

(5) 마자막으로 바이트 코드들은 Execution Engine으로 이동되어 기계가 해석할 수 있는 기계어의 형태로 변환되고 실질적인 명령어 실행이 이루어진다.

 

 

 

 

 

3. JVM(Java Virtual Machine) 구성 요소

JVM(Java Virtual Machine) - 자바 가상 머신

3-1. Class Loader(클래스 로더)

(1) JVM 내부로 클래스 파일들을 로드하고 링크 기능을 통해 배치하는 작업을 수행하는 모듈이다. 런타임 시, 동적으로 클래스를 로드하게 된다.

 

(2) jar 파일 내부에 저장된 클래스들을  JVM 위에 올리고 사용하지 않는 클래스들은 메모리 상에서 제거한다.

 

(3) 클래스를 처음으로 참조할 때 컴파일 타임이 아닌 런타임 시점에 참조하게 된다.

 

 

 

3-2. Execution Engine(실행 엔진)

(1) 클래스를 실행하는 역할을 수행한다. Class Loader가 JVM 내의 Runtime Data Area에 바이트 코드를 배치시키고 이것은 Execution Engine에 의해 실행된다. 

 

(2) 자바 바이트 코드의 경우 기계가 바로 해석할 수 있는 로우 레벨 수준의 언어보다 비교적 인간이 보기 편한 형태로 기술된 코드라고 보면 된다. 이러한 이유 때문에 Execution Engine은 이와 같은 바이트 코드를 실제로 JVM 내부에서 기계가 실행할 수 있는 기계어 형태로 변환하는 데 두 가지 방식을 사용하게 된다.

 

 

 

3-3. Interpreter 방식

(1) Execution Engine은 자바 바이트 코드를 명령어 단위로 읽어서 실행한다. 하지만 단점이 명확하게 드러난다. 한 줄씩 수행하기 때문에 속도가 느리다.

 

 

 

3-4. JIT(Just - In- Time) 방식

(1) Interpreter 방식의 한계를 극복하기 위해 도입된 JIT 컴파일러이다.

 

(2) Interpreter 방식으로 실행하다가 적절한 시점에 바이트 코드를 전체 컴파일하여 네이티브 코드로 변경하고, 이후에 더 이상 Interpreting 하지 않고 네이티브 코드로 직접 실행하는 방식이다. 이러한 네이티브 코드는 캐시에 보관하기 때문에 한 번 컴파일된 코드는 빠르게 수행할 수 있다는 특징을 가진다.

 

(3) 물론 JIT 컴파일러가 컴파일하는 과정은 바이트 코드를 Interpreting 하는 과정보다 많은 시간이 소요되므로 한 번만 실행되는 코드라면 컴파일하지 않고 Interpreting 하는 것이 유리하다. 따라서 JIT 컴파일러를 사용하는 자바 가상 머신들은 내부적으로 해당 메서드가 얼마나 자주 수행되는지 체크하고 일정 정도를 넘길 때만 컴파일을 수행한다.

 

* 네이티브 코드(Native code) : 특정 컴퓨터 아키텍처에서 직접 실행할 수 있는 기계어 코드

 

 

 

3-5. Gabage Collector

- GC를 수행하는 모듈(스레드)이 존재한다.

 

 

 

 

 

 

4. JVM 구성 요소 : Runtime Data Area

Runtime Data Area

(1) 애플리케이션을 실행하기 위해 운영체제로부터 할당받은 메모리 공간이다.

 

 

4-1.  PC Register

(1) 스레드가 시작할 때마다 생성되는 공간으로 스레드마다 하나씩 존재한다. 스레드가 어떤 부분을 어떤 명령으로 처리할지에 대한 기록을 수행하는 부분으로 현재 수행 중인 JVM 명령의 주소값을 보유하고 있다.

 

 

 

4-2.  JVM Stack

(1) 애플리케이션 실행 과정에서 임시로 할당되었다가, 메서드를 빠져나가면 바로 소멸되는 특성의 데이터를 저장하기 위한 영역이다.

 

(2) 각종 형태의 변수, 임시 데이터, 스레드, 메서드의 정보를 저장한다. 메서드 호출 시 각각의 Stack frame(해당 메서드만을 위한 공간)이 생성된다. 메서드 수행이 완료되면 Stack frame별로 삭제를 진행한다. 메서드 내부에서 사용되는 값인 로컬 변수를 저장한다.

 

(3) 또한 호출된 메서드의 매개변수, 지역변수, 반환값 및 연산 시 발생하는 값들을 임시적으로 저장한다.

 

 

 

4-3. Native Method Stack

(1) 자바 애플리케이션이 컴파일되어 생성되는 바이트 코드가 아닌, 실제 실행할 수 있는 기계어로 작성된 프로그램을 실행시키는 영역

 

(2) 자바가 아닌 다른 언어로 작성된 코드를 위한 공간으로 Java Native Interface를 통해 바이트 코드로 전환하여 저장하게 된다. 일반 프로그램처럼 Kernel이 Stack을 잡아 독자적으로 프로그램을 실행시키는 영역이다. 

 

(3) Native Method Stack을 통해 Kernel에 접근할 수 있다.

 

 

 

4-4. Method Area(Class Area or Static Area)

(1) 클래스 정보를 처음 메모리 공간에 올릴 때 초기화되는 대상을 저장하기 위한 공간이다.

 

(2) 올라가게 되는 메서드의 바이트 코드는 프로그램 흐름을 구성하는 바이트 코드이다. 자바 애플리케이션은 main() 메서드의 호출에서부터 계속된 메서드의 호출로 흐름을 이어가기 때문이다.

 

(3) 대부분 인스턴스의 생성도 메서드 내부에서 명령하고 호출한다. 사실상 컴파일된 바이트 코드의 대부분이 메서드 바이트 코드이기 때문에 거의 모든 바이트 코드가 올라간다고 봐도 무방하다. 해당 공간에는 Runtime Constant Pool이라는 별도의 영역도 존재한다. Runtime Constant Pool에서는 상수형 자료를 저장하여 참조하고 중복을 방지하는 역할을 수행한다.

 

(4) 이러한 Method Area는 클래스 데이터를 위한 공간이라면 Heap 영역이 클래스의 인스턴스인 객체를 위한 공간이다. Heap 영역과 마찬가지로 Gabage Collection의 대상이 된다.

 

 

 

4-5. Method Area에 올라가는 정보의 종류

(1) Field Information : 멤버변수의 이름, 데이터 타입, 접근 제어자에 대한 정보

(2) Method Information : 메서드의 이름, 반환 타입, 매개변수, 접근 제어자에 대한 정보

(3) Type Information : 클래스인지 인터페이스인지 여부를 저장하고 타입의 속성, 전체 이름, Super class의 전체 이름(인터페이스이거나 Object인 경우 제외)

 

 

 

 

 

5. JVM 구성 요소 : Runtime Data Area 내부의 Heap

Runtime Data Area 내부의 Heap 영역

(1) Heap 영역은 객체를 저장하는 가상 메모리 공간이다. new 연산자로 생성된 객체와 배열을 저장한다. 물론 Class Area 영역에 올라온 클래스들만 객체로 생성할 수 있으며 Heap은 아래와 같이 세 가지 영역으로 구분될 수 있다.

 

 

5-1. Permanent Generation 

(1) 생성된 객체 정보의 주소값이 저장된 공간이다.

 

(2) Class Loader에 의해 로드되는 클래스, 메서드 등에 대한 메타 정보가 저장되는 영역이고 JVM에 의해 사용된다.

 

(3) Reflection을 사용하여 동적으로 클래스가 로딩되는 경우에 사용된다. 내부적으로 Reflection 기능을 자주 사용하는 Spring을 사용하는 경우에 해당 영역에 대한 고려가 필요하다.

 

* Reflection : 구체적인 클래스 타입을 알지 못하더라도 해당 클래스의 메서드, 타입, 변수에 접근할 수 있도록 도와주는 Java API

 

 

 

5-2. New / Young Generation

(1) Eden : 객체들이 최초로 생성되는 공간

 

(2) Survivor 0 / 1 : Eden에서 참조되는 객체들이 저장되는 공간

 

 

 

5-3. Old 영역(Tenured Generation)

(1) New Area에서 일정 시간 참조되고 있는 살아남은 객체들이 저장되는 공간이다.

 

(2) Eden 영역에 객체가 가득 차게 되면 첫 번째 Gabage Collection이 발생한다. Eden 영역에 존재하는 값들을 Survivor 1 영역에 복사하고 이 영역을 제외한 나머지 영역의 객체를 삭제한다.

 

(3) 인스턴스는 소멸 방법과 시점이 지역 변수와는 상이하기 때문에 Heap이라는 별도의 영역에 할당된다. JVM은 매우 합리적으로 인스턴스를 소멸시키고 더 이상 인스턴스의 존재 이유가 없을 때 소멸시킨다.

 

 

 

 

  내용 오류로 수정 

- 2023.10.25 (JVM 부분)

 

※ 해당 포스팅에 대해 내용 추가가 필요하다고 생각되면 기존 포스팅 내용에 다른 내용이 추가될 수 있습니다.

개인적으로 공부하며 정리한 내용이기에 오타나 틀린 부분이 있을 수 있으며, 이에 대해 댓글로 알려주시면 감사하겠습니다!

댓글