[작성일: 2023. 11. 27]
웹 서버와 웹 애플리케이션 서버
웹 서버(Web Server)
- HTTP 기반으로 동작하며 정적 리소스, 기타 부가기능을 제공한다.
- 정적(파일) HTML, CSS, JS, 이미지, 영상 등
- NGINX, APACHE
웹 애플리케이션 서버(WAS - Web Applicaion Server)
- HTTP 기반으로 동작하며 웹 서버 기능을 포함하여 정적 리소스 제공이 가능하다.
- 프로그램 코드를 실행해서 애플리케이션 로직을 수행한다.
- 동적 HTML, HTTP API(JSON)
- 서블릿, JSP, 스프링 MVC
- 톰캣(Tomcat), Jetty, Undertow
웹 시스템 구성 - WEB, WAS, DB
- 정적 리소스는 웹 서버가 처리한다.
- 웹 서버는 애플리케이션 로직같은 동적인 처리가 필요하면 WAS에 요청을 위임한다.
- WAS는 중요한 애플리케이션 로직 처리를 전담한다.
- 이러한 웹 시스템 구성은 효율적인 리소스 관리가 가능하다.
- 정적 리소스가 많이 사용되면 Web 서버를 증설하고, 애플리케이션 리소스가 많이 사용되면 WAS를 증설한다.
- 정적 리소스만 제공하면 웹 서버는 잘 죽지 않지만 애플리케이션 로직이 동작하는 WAS 서버는 잘 죽는다.
- WAS, DB 장애 시 WEB 서버가 오류화면을 제공해줄 수 있다.
서블릿
@WebServlet(name = "helloServlet", urlPatterns = "/hello")
public class HelloServlet extends HttpServlet {
@Override
protected void service(HttpServletRequest request, HttpServletResponse response) {
// ... 생략
}
}
- urlPatterns의 URL이 호출되면 서블릿 코드가 실행한다.
- HttpServletRequest : HTTP 요청 정보를 편리하게 사용할 수 있다.
- HrrpServletResponse : HTTP 응답 정보를 편리하게 제공할 수 있다.
서블릿의 HTTP 요청, 응답 흐름
- HTTP 요청 시
- WAS는 Request, Response 객체를 새로 만들어서 서블릿 객체를 호출한다.
- 개발자는 Request 객체에서 HTTP 요청 정보를 편리하게 꺼내서 사용할 수 있다.
- 개발자는 Response 객체에 HTTP 응답 정보를 편리하게 입력한다.
- WAS는 Response 객체에 담겨있는 내용으로 HTTP 응답 정보를 생성한다.
서블릿 컨테이너
- 톰캣처럼 서블릿을 지원하는 WAS를 서블릿 컨테이너라고 한다.
- 서블릿 컨테이너는 서블릿 객체를 생성, 초기화, 호출, 종료하는 생명주기를 관리한다.
- 서블릿 객체는 싱글톤으로 관리된다.
- 고객의 요청이 올 때마다 계속 객체를 생성하는 것은 비효율 적이므로 최초 로딩 시점에 서블릿 객체를 미리 만들어두고 재활용 한다.
- 모든 고객 요청은 동일한 서블릿 객체 인스턴스에 접근이 가능하며 멤버 변수 사용에 주의해야 한다.
- 서블릿 컨테이너 종료시 함께 종료된다.
- JSP도 서블릿으로 변환 되어서 사용된다.
- 동시 요청을 위한 멀티 쓰레드 처리를 지원한다.
동시 요청 - 멀티 쓰레드
쓰레드
- 쓰레드는 애플리케이션 코드를 하나하나 순차적으로 실행한다.
- 자바 메인 메서드를 처음 실행하면 main이라는 이름의 쓰레드가 실행된다.
- 쓰레드가 없다면 자바 애플리케이션 실행이 불가능하다.
- 쓰레드는 한 번에 하나의 코드 라인만 수행한다.
- 동시 처리가 필요하다면 쓰레드를 추가로 생성한다.
요청마다 쓰레드 생성하기
- 장점
- 동시 요청을 처리할 수 있다.
- 리소스(CPU, 메모리)가 허용할 때까지 처리가 가능하다.
- 하나의 쓰레드가 지연되어도 나머지 쓰레드는 정상으로 동작한다.
- 단점
- 쓰레드 생성 비용이 매우 비싸며, 고객의 요청이 올 때마다 쓰레드를 생성하면 응답 속도가 늦어진다.
- 쓰레드는 컨텍스트 스위칭 비용이 발생한다.
- 쓰레드 생성은 제한이 없어서 고객 요청이 너무 많이 오면 CPU나 메모리 임계점을 넘어 서버가 죽을 수 있다.
쓰레드 풀
- 필요한 쓰레드를 쓰레드 풀에 보관하고 관리한다.
- 쓰레드 풀에 생성 가능한 쓰레드의 최대치를 관리한다.
- 쓰레드가 필요하면 이미 생성되어 있는 쓰레드를 쓰레드 풀에서 꺼내서 사용한다.
- 사용을 종료하면 쓰레드 풀에 해당 쓰레드를 반납한다.
- 최대 쓰레드가 모두 사용 중이라면 기다리는 요청은 거절하거나 특정 숫자만큼 대기하도록 설정할 수 있다.
- 쓰레드가 미리 생성되어 있으므로 쓰레드를 생성하고 종료하는 비용(CPU)이 절약되고 응답시간이 빨라진다.
- 생성 가능한 쓰레드의 최대치가 있으므로 너무 많은 요청이 들어와도 기존 요청은 안전하게 처리할 수 있다.
쓰레드 풀 실무 팁
- WAS의 주요 튜닝 포인트는 최대 쓰레드(max thread) 수이다.
- 이 값을 너무 낮게 설정할 경우, 동시 요청이 많으면 서버 리소스는 여유롭지만 클라이언트는 응답 지연을 보내게 된다.
- 이 값을 너무 높게 설정할 경우, 동시 요청이 많으면 CPU, 메모리 시소스 임계점 초과로 서버가 다운된다.
- 장애가 발생할 경우, 클라우드면 일단 서버부터 늘리고 이후에 튜닝을 한다. 클라우드가 아니면 튜닝을 한다.
WAS의 멀티 쓰레드 지원 핵심
- 멀티 쓰레드에 대한 부분은 WAS가 처리한다.
- 개발자가 멀티 쓰레드 관련 코드를 신경쓰지 않아도 된다.
- 개발자는 마치 싱글 쓰레드 프로그래밍을 하듯 편리하게 소스 코드를 개발할 수 있다.
- 멀티 쓰레드 환경이므로 싱글톤 객체(서블릿, 스프링 빈)는 주의해서 사용해야 한다.
🐣 출처: 인프런 김영한님 강의
이 글은 인프런의 김영한님 스프링 강의를 보고 작성한 글입니다.
강의를 들으면서 정리한 글이므로 틀린 내용이나 오타가 있을 수 있습니다.