시냅스

HTTP HyperText Transfer Protocol 정리 본문

네트워크

HTTP HyperText Transfer Protocol 정리

ted k 2022. 8. 8. 21:11

HTTP 란?

  • HTML, TEXT
  • IMAGE, 음성, 영상, 파일
  • JSON, XML (API)
  • 거의 모든 형태의 데이터 전송 가능
  • 서버간에 데이터를 주고 받을 때도 대부분 HTTP 사용
  • HTTP/0.9 1991년: GET 메서드만 지원, HTTP 헤더X
  • HTTP/1.0 1996년: 메서드, 헤더 추가
  • HTTP/1.1 1997년: 가장 많이 사용, 우리에게 가장 중요한 버전
  • HTTP/2 2015년: 성능 개선
  • HTTP/3 진행중: TCP 대신에 UDP 사용, 성능 개선

 

HTTP 특징

  • 클라이언트 서버 구조
    • Request, Response 구조
    • 클라이언트는 서버에 요청을 보내고, 응답을 대기
    • 서버가 요청에 대한 결과를 만들어서 응답
  • 무상태 프로토콜(Stateless)
    • 서버가 클라이언트의 상태를 보존X
    • 장점: 서버 확장성 높음(스케일 아웃)
    • 단점: 클라이언트가 추가 데이터 전송
    • Cf) stateful
      • 상태 유지: 중간에 다른 점원으로 바뀌면 안된다. 
        • 중간에 다른 점원으로 바뀔 때 상태 정보를 다른 점원에게 미리 알려줘야 한다.
      • 무상태: 중간에 다른 점원으로 바뀌어도 된다.
        • 갑자기 고객이 증가해도 점원을 대거 투입할 수 있다.
        • 갑자기 클라이언트 요청이 증가해도 서버를 대거 투입할 수 있다.
      • 무상태는 응답 서버를 쉽게 바꿀 수 있다. -> 무한한 서버 증설 가능
    • 로그인의 경우 상태 유지가 필요하다.
      • 쿠키, 서버 세션
      • 최소한만 사용해야 한다.

 

지속 연결

  • 비연결성 
    • HTTP는 기본이 연결을 유지하지 않는 모델
    • 일반적으로 초 단위 이하의 빠른 속도로 응답
    • 서버 자원을 매우 효율적으로 사용할 수 있음
    • 단, TCP/IP 연결을 새로 맺어야 함
      • 3 way handshake 시간 추가
    • 웹 브라우저로 사이트를 요청하면 HTML 뿐만 아니라 자바스크립트, CSS, 이미지 등 수 많은 자원이 함께 다운로드
      • 리소스를 요청할 때마다 연결을 맺어야 한다.
      • 현재는 지속연결 (Persistent Connections)를 통해 문제 해결
  • HTTP 메세지
  • 단순함, 확장 가능

 

웹 브라우저 요청 흐름

  • www.google.com 을 DNS를 통해 조회한다.
  • HTTPS port는 well-known port로 생략할 수 있다.

 

GET /search?q=hello&hl=ko HTTP/1.1
Host: www.google.com
  • 요청 메세지는 위와 같다.

 

  • 2-A 에서 3 way handshake가 이뤄진다.

 

  • 서버에 요청 패킷이 도착하면 TCP/IP패킷을 버리고 HTTP 메시지만 해석하게 된다.
  • 응답을 보낼 때는 아래의 예시와 같이 보낼 수 있다.
HTTP/1.1 200 OK
Content-Type: text/html;charset-UTF-8
Content-Length: 3424

<html>
	<body>...<body>
</html>

 

HTTP 메세지 구조

메세지 구조

 

 

 

Header

  • Request
    • start-line = request-line 
    • request-line = method SP(공백) request-tartget SP HTTP-version CRLF(엔터)
  • Response
    • start-line = status-line
    • status-line = HTTP-version SP status-code SP reason-phrase CRLF

Body

  • 실제 전송할 데이터
  • HTML 문서, 이미지, 영상, JSON 등등 byte로 표현할 수 있는 모든 데이터 전송 가능

 

HTTP 메서드

  • GET
    • 리소스 조회
    • 서버에 전달하고 싶은 데이터는 query(쿼리 파라미터, 쿼리 스트링)을 통해 전달
    • 메세지 바디를 사용해서 데이터를 전달할 수 있지만, 지원하지 않는 곳이 많아서 권장하지 않음
  • POST
    • 요청 데이터 처리
    • 메세지 바디를 통해 서버로 요청 데이터 전달
    • 서버는 요청 데이터를 처리
      • 메세지 바디를 통해 들어온 데이터를 처리하는 모든 기능을 수행한다.
    • 주로 전달된 데이터로 신규 리소스 등록, 프로세스 처리에 사용
  • PUT
    • 리소스를 대체
      • 리소스가 있으면 대체
      • 리소스가 없으면 생성
  • PATCH
    • 리소스 부분 변경
  • DELETE
    • 리소스 제거

 

HTTP 메서드의 속성

  • 안전 Safe Methods
    • 호출해도 리소스를 변경하지 않는다.
  • 멱등 Idempotent Methods
    • 몇 번을 호출해도 결과가 같다
    • GET
    • PUT : 결과를 대체한다. 따라서 같은 요청을 여러번 해도 최종 결과가 같다
    • DELETE : 결과를 삭제한다.
    • POST : 2 번 호출하면 같은 결제가 중복해서 발생할 수 있기 때문에 멱등이 아님
  • 캐시 가능 Cacheable Methods
    • GET, HEAD 정도만 캐시로 사용

 

HTTP 상태 코드

  • 1XX (Informational) : 요청이 수신되어 처리 중
    • 거의 사용하지 않음
  • 2XX (Successful) : 요청 정상 처리
    • 200 OK
    • 201 Created
    • 202 Accepted
      • 요청이 접수되었으나 처리가 완료되지 않았음 -> 배치
    • 204 No Content
      • 요청을 성공적으로 수행했지만, 응답 페이로드 본문에 보낼 데이터가 없음
  • 3XX (Redirection) : 요청을 완료하려면 추가 행동이 필요
    • 웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 자동 이동 
    • 영구 리다이렉션
      • 특정 리소스의 URI가 영구적으로 이동
      • 원래의 URL 사용 X, 검색 엔진 등에서도 변경 인지
      • 301 Moved Permanently
        • 리다이렉트시 요청 메소드가 GET으로 변하고 본문이 제거될 수 있음
      • 308 Permanent Redirect
        • 301과 기능은 같다
    • 일시 리다이렉션 - 일시적인 변경
      • e.g. 주문 완료 후 주문 내역 화면으로 이동
      • PRG : Post/Redirect/Get
      • 리소스의 URI가 일시적으로 변경
      • 따라서 검색 엔진 등에서 URL을 변경하면 안됨
      • 302 Found -> 기본값으로 사용
        • 리다이렉트시 요청 메서드가 GET으로 변하고, 본문이 제거될 수 있음
      • 307 Temporary Redirect
        • 302와 기능은 같음
        • 리다이렉트시 요청 메서드와 본문 유지(요청 메서드를 변경하면 안된다)
      • 303 See Other
        • 302와 기능은 같음
        • 리다이렉트시 요청 메서드가 GET으로 변경
    • 특수 리다이렉션
      • 결과 대신 캐시를 사용
      • 300 Multiple Choices -> 안쓴다.
      • 304 Not Modified
        • 캐시를 목적으로 사용
        • 리소스가 수정되지 않았음을 알려준다.
        • 로컬PC에 있는 캐시를 재사용한다.
        • 304 응답은 응답에 메세지 바디를 포함하면 안 된다.
  • 4XX (Client Error) : 클라이언트 오류, 잘못된 문법등으로 서버가 요청을 수행할 수 없음
    • 400 Bad Request
      • 클라이언트가 잘못된 용청을 해서 서버가 요청을 처리할 수 없다.
      • 요청 구문, 메세지 등
    • 401 Unauthorized
      • 인증 (Authentication) 되지 않음
      • 참고
        • 인증 (Authentication) : 본인이 누구인지 확인 (로그인)
        • 인가 (Authorization : 권한 부여 (ADMIN)
    • 403 Forbidden
      • 서버가 요청을 이해했지만 승인을 거부함
      • 주로 인증 자격 증명은 있지만 접근 권한이 불충분한 경우
    • 404 Not Found
      • 요청 리소스를 찾을 수 없음
  • 5XX (Server Error) : 서버 오류, 서버가 정상 요청을 처리하지 못함
    • 500 Internal Server Error
      • 서버 내부 문제
    • 503 Service Unavailable
      • 서비스 이용 불가
      • 서버 과부하 혹은 예정된 작업

 

HTTP 헤더

  • General 헤더
    • 메세지 전체에 적용되는 정보
  • Request 헤더
    • 요청 정보
  • Response 헤더
    • 응답 정보
  • Entity 헤더 -> 표현 Representation 헤더
    • 표현 = 표현 메타데이터 + 표현 데이터 
    • 메세지 본문 정보 (message body)
    • 메세지 본문 = 페이로드 (payload)
    • 표현 헤더는 표현 데이터를 해석할 수 있는 정보 제공
      • 데이터 유형(html, json), 데이터 길이, 압축 정보 등등

 

표현

  • Content-Type
    • 표현 데이터의 형식
    • 미디어 타입, 문자 인코딩
    • text/html;charset=utf-8
    • application/json
  • Content-Encoding
    • 표현 데이터의 압축 방식
    • 데이터를 전달하는 곳에서 압축 후 인코딩 헤더 추가
    • 데이터를 읽는 쪽에서 인코딩 헤더의 정보로 압축 해제
    • gzip
    • deflate
    • identity
  • Content-Language
    • 표현 데이터의 자연 언어
    • ko, en, en-US...
  • Content-Length
    • 표현 데이터의 길이
    • 바이트 단위

 

협상

  • Accept
    • 클라이언트가 선호하는 미디어 타입 전달
  • Accept-Charset
    • 클라이언트가 선호하는 문자 인코딩
  • Accept-Encoding
    • 클라이언트가 선호하는 압축 인코딩
  • Accept-Language
    • 클라이언트가 선호하는 자연 언어
    • Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7
      • 1. ko-KR;q=1
      • 2. ko;q=0.9
      • 3. en-US;q=0.8
      • 4. en:q=0.7
    • 구체적인 것이 우선한다.
      • Accept: text/*, text/plain, text/plain;format=flowed, */*
        • 1. text/plain;format=flowed
        • 2. text/plain
        • test/*
        • */*

 

전송 방식

  • 단순 전송
  • 압축 전송
  • 분할 전송
  • 범위 전송

 

일반 정보

  • From
    • 유저 에이전트의 이메일 정보
    • 일반적으로 잘 사용되지 않음
  • Refere
    • 현재 요청된 페이지의 이전 웹 페이지 주소
    • A -> B 로 이동하는 경우 Referer: A가 됨
    • 유입 경로 분석 가능
    • 요청에서 사용
  • User-Agent
    • 유저 에이전트 애플리케이션 정보
    • user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/ 537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36
    • 통계 정보
    • 어떤 종류의 브라우저에서 장애가 발생하는지 파악 가능
    • 요청에서 사용
  • Server
    • 요청 처리하는 오리진 서버의 소프트웨어 정보
    • Server: Apache/2.2.22 (Debian)
    • 응답에서 사용
  • Date
    • 메세지가 생성된 날짜
    • 응답에서 사용

 

특별한 정보

  • Host
    • 요청한 호스트 정보
    • 필수
    • 하나의 서버가 여러 도메인을 처리해야 할 때
    • 하나의 IP 주소에 여러 도메인이 적용되어 있을 때
  • Location
    • 페이지 리다이렉션 
    • 웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면 자동 이동
  • Allow
    • 허용 가능한 HTTP 메서드 
    • 405 (Method Not Allowd)에서 응답에 포함해야 함
  • Retry-After
    • 유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간 
    • 503 (Service Unavailable) 서비스가 언제까지 불능인지 알려줄 수 있음

 

인증

  • Authorization
    • 클라이언트 인증 정보를 서버에 전달
    • Authorization: Basic xxxxxxxxxxxxxxxx
  • WWW-Authenticate
    • 리소스 접근시 필요한 인증 방법 정의
    • 401 Unauthorized 응답과 함께 사용

'네트워크' 카테고리의 다른 글

Blocking vs Non-blocking , Synchronous vs Asynchronous  (0) 2022.08.13
TIL : 라우팅 프로토콜  (0) 2021.12.23
TIL : 라우팅  (0) 2021.12.19
TIL : 디폴트 게이트웨이  (0) 2021.12.19
TIL : 라우터  (0) 2021.12.18
Comments