TCP/IP 4계층 모델
인터넷 프로토콜 스위트(internet protocol suite)는 인터넷에서 컴퓨터들이 서로 정보를 주고받는 데 쓰이는 프로토콜의 집합이며, 이를 TCP/IP 4계층 모델로
설명하거나 OSI 7계층 모델로 설명하기도 한다. 우선, TCP/IP 4계층 모델을 중심으로 쓸 예정이며, 이 계층 모델은 네트워크에서 사용되는 통신 프로토콜의 집합으로 계층들은 프로토콜의 네트워킹 범위에 따라 네 개의 추상화 계층으로 구성된다.
계층 구조
TCP/IP 계층은 네 개의 계층을 가지고 있으며 OSI 7계층과 많이 비교한다.
위의 그림 처럼 TCP/IP 계층과 달리 OSI 계층 은 애플리케이션 계층을 세 개로 쪼개고 링크 계층을 데이터 링크 계층, 물리 계층으로 나눠서 표현하는 점과 인터넷 계층을 네트워크 계층으로 부른다는 점이 다르다.
이 계층들은 특정 계층이 변경되었을 때 다른 계층이 영향을 받지 않도록 설계 되었다. ex) 전송 계층에서 TCP를 UDP로 변경 했다고 해서 인터넷 웹 브라우저를 다시 설치 해야 하는 것은 아니듯 유연 하게 설계되었다.
각 계층을 대표 하는 스택을 정리 한 그림은 아래와 같다.
우선, 애플리케이션 계층 부터 하나씩 살펴 볼것이다.
애플리케이션 계층
애플리케이션(application) 계층은 FTP, HTTP, SSH, SMTP, DNS 등 응용 프로그램이 사용되는 프로토콜 계층이며, 웹 서비스, 이메일 등 서비스를 실질적으로 사람들에게 제공 하는 층이다.
FTP
- 장치 와 장치 간의 파일을 전송하는데 사용 되는 표준 통신 프로토콜 이다.
- 포트 번호: 20번
- TCP: TCP
- 설명: FTP(파일 전송 프로토콜) - 데이터 포트
- 상태:공식
- 포트 번호: 21번
- TCP: TCP
- 설명: FTP - 제어 포트(연결 시 인증과 컨트롤을 위한 포트)
- 상태:공식
SSH
- 보안되지 않은 네트워크에서 네트워크 서비스를 안전하게 운영하기 위한 암호화 네트워크 프로토콜 이다.
- 포트 번호: 22번
- TCP: TCP
- 설명: SSH (Secure Shell) - ssh scp, sftp같은 프로토콜 및 포트 포워딩
- 상태:공식
HTTP
- World Wide Web을 위한 데이터 통신의 기초이자 웹 사이트를 이용하는데 쓰는 프로토콜
- 포트 번호: 80번
- TCP: TCP
- UDP:UDP
- 설명: HTTP - 웹 페이지 전송
- 상태:공식
SMTP
- SMTP (Simple Mail Transfer Protocol) - 전자 메일 전송을 위한 인터넷 표준 통신 프로토콜
- 포트 번호: 25번
- TCP: TCP
- UDP:UDP
- 설명: SMTP (Simple Mail Transfer Protocol) - 이메일 전송에 사용
- 상태:공식
DNS
- SMTP (Simple Mail Transfer Protocol) - 도메인 이름과 IP주소를 매핑 해주는 서버, ex) www.google.com에 DNS 쿼리가 오면 [Root DNS] -> [.com DNS] -> [.google DNS] -> [.www DNS] 과정을 거쳐 완벽한 주소를 찾아 IP 주소를 매핑한다. 이를 통해 IP 주소가 바뀌어도 사용자들에게 똑같은 도메인 주소로 서비스 할수 있다. ex) www.naver.com 의 ip 주소가 222.111.222.111 에서 222.111.222.122로 변경 되었음에도 똑같은 www.naver.com이라는 주소로 서비스가 가능하다.
- 포트 번호: 53번
- TCP: TCP
- UDP:UDP
- 설명: DNS
- 상태:공식
전송 계층
전송(transport) 계층은 송신자와 수신자를 연결하는 통신 서비스를 제공하며 연결 지향 데이터 스트림 지원, 신뢰성, 흐름 제어 제공하며, 애플리케이션과 인터넷 계층 사이의 데이터가 전달될 때의 중계 역할을 한다. ex)TCP, UDP 등이 있으며 대표적으로 TCP 와 UDP가 있다.
TCP 는 패킷 사이의 순서를 보장 하며 연결지향 프로토콜을 사용하여 연결을 한 후 신뢰성을 구축해서 수신 여부를 확인 하며, 가상회선 패킷 교환 방식을 사용한다.
UDP는 순서를 보장하지 않고 수신 여부를 확인 하지 않으며 단순히 데이터만 주는 '데이터그램 패킷 교환 방식' 사용한다.
가상회선 패킷 교환 방식
가상회선 패킷 교환 방식은 각 패킷에 가상회선 식별자가 포함되 있으며 모든 패킷을 전송하면 가상회선이 해제되고 패킷들은 전송된 순서대로 도착하는 방식을 말한다.
위의 그림을 보면 3, 2, 1로 이루어진 패킷이 어떠한 회선을 따라 순서대로 도착하는 것을 알수 있다.
데이터그램 패킷 교환 방식
데이터그램 패킷 교환 방식 은 패킷이 독립적으로 이동하며 최적의 경로를 선택하여 가는데, 하나의 메시지에서 분할된 여러 패킷은 서로 다른 경로로 전송 될수 있으며 도착한 '순서가 다를 수' 있는 방식을 말한다.
위의 그림을 보면 3, 2, 1로 이루어진 패킷이 순서도 다르고 어떠한 회선을 중심으로 가는 것이 아니라 따로따로 이동하여 순서도 다르게 도착하는 것을 알수 있다.
TCP 연결 성립 과정
TCP는 신뢰성을 확보 할때 3-way handshake 작업을 진행 한다.
위의 그림처럼 클라이언트 와 서버가 통신할 때 다음과 같이 세 단계의 과정을 거친다.
- SYN 단계: 클라이언트는 서버에게 클라이언트의 ISN을 담아 SYN을 보낸다. ISN은 새로운 TCP 연결의 첫 번째 패킷에 할당된 임의의 시퀀스 번호를 말한다. ex)12010 값 이는 장치마다 다를 수있다.
- SYN + ACK 단계: 서버는 클라이언트의 SYN를 수신하고 서버의 ISN을 보내며 승인번호로 클라이언트의 ISN + 1 값을 보낸다.
- ACK 단계: 클라이언트는 서버의 ISN + 1 한 값인 승인번호를 담아 ACK를 서버에 보낸다.
이렇게 3-way handshake 과정 이후 신뢰성이 구축되고 데이터 전송을 시작한다. 참고로 TCP는 이 과정이 있기 때문에 신뢰성이 있는 계층 이라고 하며
UDP는 이 과정이 없기 때문에 신뢰성이 없는 계층이라 한다.
SYN
SYNchronization의 약자, 연결 요청 플래그
ACK
ACKnowledfement의 약자, 응답 플래그
ISN
Initial Sequence Numbers의 약어, 초기 네트워크 연결을 할 때 할당된 32비트 고유 시퀀스 번호이다.
TCP 연결 해제 과정
TCP가 연결을 해제 할 때는 4-way handshake 과정이 발생한다.
- 먼저 클라이언트가 연결을 닫으려고 할때 FIN으로 설정된 세그먼트를 보낸다. 그리고 클라이언트는 FIN_WAIT_1 상태로 들어가고 서버의 응답을 기다린다.
- 서버는 클라이언트로 ACK라는 승인 세그먼트를 보낸다. 그리고 CLOSE_WAIT 상태에 들어간다. 클라이언트가 세그먼트를 받으면 FIN_WAIT_2상태에 들어간다.
- 서버는 ACK를 보내고 일정 시간 이후에 클라이언트에 FIN 이라는 세그먼트를 보낸다.
- 클라이언트는 TIME_WAIT 상태가 되고 다시 서버로 ACK를 보내서 서버는 CLOSED 상태가 된다. 이후 클라이언트는 어느 정도의 시간(3 ~ 4분)을 대기한 후 연결이 닫히고 클라이언트와 서버의 모든 자원의 연결이 해제 된다.
이 과정 중 가장 눈여겨봐야 할 것은 TIME_WAIT 이다. 그냥 연결을 닫으면 되는 것을 왜 굳이 일정 시간 뒤에 닫을까??? 라는 의문이 든다.
이러한 의문에 대한 답변을 하고자 한다.
- 지연 패킷이 발생할 경우를 대비 하기 위함이다. 패킷이 뒤 늦게 도달하고 이를 처리하지 못한다면 데이터 무결성 문제가 발생한다.
- 두 장치가 연결이 닫혔는지 확인 하기 위함이다. 만약 LAST_ACK 상태에서 닫히게 될 경우 다시 새로운 연결을 하려고 할 때 장치는 줄 곧 LAST_ACK로 되어 있기 때문에 접속 오류가 발생 할 것이다.
- 이러한 이유로 TIME_WAIT 라는 잠시 기다릴 시간이 필요한 것이다.
TIME_WAIT
소켓이 바로 소멸되지 않고 일정 시간 유지 되는 상태를 말하며, 지연 패킷 등의 문제점을 해결 하는데 쓰인다.
CentOs6, 우분투에는 60초로 설정 되어 있으며 윈도우는 4분으로 설정 되어 있다. 즉 OS 마다 조금씩 다를수 있다.
데이터 무결성
데이터의 정확성과 일관성을 유지하고 보증하는 것
인터넷 계층
인터넷(Internet) 계층은 장치로 부터 받은 네트워크 패킷을 IP 주소로 지정된 목적지로 전송하기 위해 사용되는 계층이다. IP, ARP, ICMP 등이 있으며 패킷을 수신 해야 할 상대의 주소를 지정하여 데이터를 전달한다. 상대방이 제대로 받았는지에 대해 보장 하지 않는 비 연결형적인 특징을 가지고 있다.
IP
IP(Internet Protocol): 비 신뢰적인 비 연결형 데이터그램 프로토콜
추후에 IP프로토콜에 대해 더 자세히 다룰 예정이다.
ICMP
ICMP(Internet Control Message Protocol): 에러 및 상태진단 메시지 프로토콜
IGMP
IGMP(Internet Group Management Protocol): 멀티 캐스트용 프로토콜
ARP
ARP(Internet Control Message Protocol): 주소변환(논리 주소(IP) -> 물리 주소(MAC)) 프로토콜
RARP
RARP(Rerverse Internet Control Message Protocol): 역주소변환(물리 주소(MAC)-> 논리 주소(IP)) 프로토콜
링크 계층
링크 계층은 전선, 광섬유, 무선 등으로 실질적으로 데이터를 전달하며 장치 간에 신호를 주고 받는 규칙을 정하는 계층이다. 참고로 네트워크 접근 계층이라고도 한 다.
이를 물리 계층과 데이터 링크 계층으로 나누기도 하는데 물리 계층은 무선 LAN 과 유선 LAN을 통해 0과 1 로 이루어진 데이터를 보내는 계층을 말한다.
데이터 링크 계층 은 이더넷 프레임을 통해 에러 확인, 흐름 제어, 접근 제어를 담당하는 계층을 말한다.
유선 LAN(IEEE802.3)
유선 LAN을 이루는 이더넷은 IEEE802.3 이라는 프로토콜을 따르며 전 이중화 통신을 쓴다.
전이중화 통신
전이중화 통신(Full duplex)통신은 양쪽 장치가 동시에 송수신할 수 있는 방식을 말한다. 이는 송신로 와 수신로로 나눠서 데이터를 주고 받으며 현대의 고속 이더넷은 이 방식을 기반으로 통신한다.
CSMA/CD
참고로 이전에는 유선 LAN에 ‘반이중화 통신’ 중 하나인 CSMA/CD(Carrier Sense Multiple Access with Collision Detection) 방식을 썻다. 이 방식은 데이터를 ‘보낸 이후’ 충돌이 발생한다면 일정 시간 이후 재전송하는 방식을 말한다. 이는 수신로와 송신로를 각각 둔 것이 아니고 한 경로를 기반으로 데이터를 보내기 때문에 데이터를 보낼 때 충돌에 대해 대비해야 했기 때문이다.
유선 LAN을 이루는 케이블
유선 LAN을 이루는 케이블로는 TP 케이블이라고 하는 트위스트 페어 케이블과 광섬유 케이블이 대표적이다.
트위스트 페어 케이블
트위스트 페어 케이블(twisted pair cable)은 하나의 케이블처럼 보이지만 실제로는 여덟 개의 구리선을 두 개씩 꼬아서 묶은 케이블을 지칭한다.
위의 그림처럼 여러개의 구리선으로 이루어져 있는 것을 볼수 있다.
케이블은 구리선을 실드 처리하지 않고 덮은 UTP 케이블과 실드 처리하고 덮은 STP로 나눠진다. 여기서 우리가 많이 볼 수 있는 케이블은 UTP 케이블로 흔히 LAN 케이블이라 한다.
참고로 이 LAN 케이블을 꽂을 수있는 케넉터를 RJ-45 케넥터 라고한다.
광섬유 케이블
광섬유 케이블은 광섬유로 만든 케이블이다. 레이저를 이용해서 통신하기 때문에 구리선과는 비교할 수 없을 만큼의 장거리 및 고속 통신이 가능하고, 보통 100Gbps의 데이터를 전송하며 아래 그림처럼 광섬유 내부와 외부를 다른 밀도를 가지는 유리나 플라스틱 섬유로 제작해서 한 번 들어간 빛이 내부에서 계속적으로 반사하며 전진하여 반대편 끝까지 가는 원리를 이용한 것이다.
참고로 빛의 굴절률이 높은 부분을 코어(core)라고 하며 낮은 부분을 클래딩(cladding)이라고 합니다.
무선 LAN(IEEE802.11)
무선 LAN 장치는 수신과 송신에 같은 채널을 사용 하기 때문에 반이중화 통신을 사용한다.
반이중화 통신
반이중화 통신(half duplex)은 양쪽 장치는 서로 통신할 수 있지만, 동시에는 통신할 수 없으며 한 번에 한 방향만 통신할 수 있는 방식을 말한다.
ex)무전기
일반적으로 장치가 신호를 수신하기 시작하면 응답하기 전에 전송이 완료 될때 까지 기다려야 한다.
또한, 둘 이상의 장치가 동시에 전송하면 충돌이 발생하여 메시지가 손실 되거나 왜곡 될수 있기 때문에 충돌 방지 시스템이 필요하다
CSMA/CA
CSMA/CA 는 반이중화 통신 중 하나로 장치에서 데이터를 보내기 전에 캐리어 감지 등으로 사전에 가능한 한 충돌을 방지 하는 사용하며 과정은 다음과 같이 이루어진다.
- 데이터를 송신하기전에 무선 매체를 살핀다.
- 캐리어 감지: 회선이 비어 있는지 판단
- IFS(Inter FrameSpace):랜덤 값을 기반으로 정해진 시간만큼 기다리며, 만약 무선 매체가 사용중 이면 점차 그 간격이 늘려 가면서 기다린다.
- 이후 데이터를 송신
참고로 이와 반대되는 전 이중화 통신은 양방향 통신이 가능하므로 충돌 가능성이 없기 때문에 충돌을 감지하거나 방지하는 메커니즘이 필요하지 않다.!!
무선 LAN을 이루는 주파수
무선 LAN(WLAN, Wireless Local Area Network)은 무선 신호 전달 방식을 이용하여 2대 이상의 장치를 연결 하는 기술이다.
비유도 매체인 공기에 주파수를 쏘아 무선 통신망을 구축하는데, 주파수 대역은 2.4GHz 대역 또는 5GHz 대역 중 하나를 써서 구축한다. 2.4GHz는 장애물에 강한 특성을 가지고 있지만 전자레인지, 무선 등 전파 간섭이 일어나는 경우가 많고 5GHz 대역은 사용할 수 있는 채널 수도 많고 동시에 사용할 수 있기 때문에 상대적으로 깨끗한 전파 환경을 구축할 수 있다. 그렇기 때문에 보통은 5GHz 대역을 사용하는 것이 좋다.
와이파이
와이파이(wifi)는 전자기기들이 무선 LAN 신호에 연결할 수 있게 하는 기술로, 이를 사용하려면 무선 접속 장치(AP, Access Point)가 있어야 한다. 흔히 이를 공유기라고 하며, 이를 통해 유선 LAN에 흐르는 신호를 무선 LAN 신호로 바꿔주어 신호가 닿는 범위 내에서 무선 인터넷을 사용할 수 있게 된다. 참고로 무선 LAN을 이용한 기술로는 와이파이만 있는 것이 아니고 지그비, 블루투스 등이 있다.
BSS
BSS(Basic Service Set)는 기본 서비스 집합을 의미하며, 단순 공유기를 통해 네트워크에 접속하는 것이 아닌 동일 BSS 내에 있는 AP들과 장치들이 서로 통신이 가능한 구조를 말한다. 근거리 무선 통신을 제공하고, 하나의 AP만을 기반으로 구축이 되어 있어 사용자가 한 곳에서 다른 곳으로 자유롭게 이동하며 네트워크에 접속하는 것은 불가능하다.
ESS
ESS(Extended Service Set)는 하나 이상의 연결된 BSS 그룹입니다. 장거리 무선 통신을 제공하며 BSS보다 더 많은 가용성과 이동성을 지원한다. 즉, 사용자는 한 장소에서 다른 장소로 이동하며 중단 없이 네트워크에 계속 연결할 수 있다.
아래 그림은 BSS, ESS를 설명한 그림이다.
이더넷 프레임
참고로 데이터 링크 계층은 이더넷 프레임을 통해 전달 받은 데이터의 에러를 검출하고 캡슐화 하여 다음과 같은 구조를 가진다.
• Preamble: 이더넷 프레임이 시작임을 알리는 것.
• SFD(Start Frame Delimiter): 다음 바이트부터 MAC 주소 필드가 시작됨을 알린다.
• DMAC, SMAC: 수신, 송신 MAC 주소를 말한다.
• EtherType: 데이터 계층 위의 계층인 IP 프로토콜을 정의. ex) IPv4 또는 IPv6가 된다.
• Payload: 전달받은 데이터
• CRC: 에러 확인 비트
MAC 주소
컴퓨터나 노트북 등 각 장치에는 네트워크에 연결하기 위한 장치가 있는데, 이를 구별하기 위한 식별변호를 말한다. 48비트로 구성!
계층 간 데이터 송수신 과정
필자가 컴퓨터를 통해 다른 컴퓨터로 데이터를 요청한다면 어떠한 일이 일어날까?? ex) HTTP를 통해 웹 서버에 있는 데이터를 요청한다면?? 다음과 같은 일이 일어난다.
애플리케이션 계층에서 전송 계층으로 필자가 보내는 요청(request) 값들이 캡슐화 과정을 거쳐 전달되고, 다시 링크 계층을 통해 해당 서버와 통신을 하고, 해당 서버의 링크 계층으로부터 애플리케이션까지 비캡슐화 과정을 거쳐 데이터가 전송된다.
캡슐화 과정
캡슐화 과정은 상위 계층의 헤더 와 데이터를 하위 계층의 데이터 부분에 포함 시키고 해당 계층의 헤더를 삽입 하는 과정을 말한다.
애플리케이션 계층의 데이터가 전송 계층으로 전달되면서 ‘세그먼트’ 또는 ‘데이터그램’화되며 TCP(L4) 헤더가 붙여지게 됩니다. 그리고 이후 인터넷 계층으로 가면서 IP(L3) 헤더가 붙여지게 되며 ‘패킷’화가 되고, 이후 링크 계층으로 전달되면서 프레임 헤더와 프레임 트레일러가 붙어 ‘프레임’화가 됩니다.
비캡슐화 과정
비캡슐화 과정은 하위 계층에서 상위 계층으로 가며 각 계층의 헤더 부분을 제거하는 과정을 말한다.
이렇게 캡슐화된 데이터를 받게 되면 링크 계층에서부터 타고 올라오면서 프레임화된 데이터는 다시 패킷화를 거쳐 세그먼트, 데이터그램화를 거쳐 메시지화가 되는 비캡슐화 과정이 일어난다. 그 이후 최종적으로 사용자에게 애플리케이션의 PDU인 메시지로 전달된다.
PDU
네트워크의 어떠한 계층에서 계층으로 데이터가 전달될 때 한 덩어리의 단위를 PDU (Protocol Data Unit)라고 한다.
PDU는 제어 관련 정보들이 포함된 ‘헤더’, 데이터를 의미하는 ‘페이로드’로 구성되어 있으며 계층마다 부르는 명칭이 다르다.
• 애플리케이션 계층: 메시지
• 전송 계층: 세그먼트(TCP), 데이터그램(UDP)
• 인터넷 계층: 패킷
• 링크 계층: 프레임(데이터 링크 계층), 비트(물리 계층)
ex) 애플리케이션 계층은 ‘메시지’를 기반으로 데이터를 전달하는데, HTTP의 헤더가 문자열인 것을 예로 들 수 있습니다.
잠시 curl 명령어를 이용하여 www.naver.com으로 HTTP 요청을 해서 PDU 테스팅을 해보겠습니다.
참고로 다음 사이트를 통해 쉽게 curl 명령어로 다른 사이트에 요청할 수 있습니다.
위의 그림처럼 ‘curl www.naver.com’이란 명령어를 통해 요청했고 다음과 같은 응답(response) 헤더 값이 나오는데, 이는 모두 문자열인 것을 알 수 있다.
출력
Server: NWS
Content-Type: text/html; charset=UTF-8
Cache-Control: no-cache, no-store, must-revalidate
Pragma: no-cache
P3P: CP="CAO DSP CURa ADMa TAIa PSAa OUR LAW STP PHY ONL UNI PUR FIN COM NAV INT DEM STA PRE"
X-Frame-Options: DENY
X-XSS-Protection: 1; mode=block
Strict-Transport-Security: max-age=63072000; includeSubdomains
Referrer-Policy: unsafe-url
Content-Encoding: gzip
Content-Length: 59601
Date: Wed, 26 Jan 2022 05:14:10 GMT
Connection: keep-alive
Vary: Accept-Encoding
참고로 PDU 중 아래 계층인 비트로 송수신하는 것이 모든 PDU 중 가장 빠르고 효율성이 높다. 하지만 애플리케이션 계층에서는 문자열을 기반으로 송수신을 하는데, 그 이유는 헤더에 authorization 값 등 다른 값들을 넣는 확장이 쉽기 때문이다.
참조: 면접을 위한 CS 전공지식 노트