[네트워크] HTTPS와 SSL
이번 시간에는 HTTPS와 SSL에 대해 공부해 보겠습니다.
요즘 브라우저에서는 대부분 HTTPS를 사용하고 있습니다. 만약 HTTP 프로토콜을 사용하는 경우 크롬에서는 "주의요함" 이라는 경고문을 보여주고 있는데요, 그렇다면 HTTPS가 무엇이기에 HTTP보다 더 안전하다고 말하는 걸까요 ?
들어가기 전에
HTTP는 네트워크 패킷이 도청 가능하다고 했습니다. 그렇다면 네트워크 상의 패킷을 특정 규칙(?)으로 암호화 하면 안될까요 ?
송신자는 데이터를 암호화하고 수신자는 그 데이터를 복화하 하는 방법을 알고 있다면 누군가가 도중에 가로채로 그 데이터를 복화화할 수 있는 방법을 모르기 때문에 안전해 보입니다.
하지만, 만약 누군가가 복호화 방법을 어떻게 알아낸다면 어떻게 될까요 ? 또 데이터를 복호화하는 방법은 송신자는 수신자에게 어떻게 안전하게 전달할까요 ? 해커가 복호화 하는 방법에 대해 알고 있거나 그 방법을 도중에 가로챈다면 암호화를 하는 이유가 없을 뿐더러 도중에 데이터를 조작한다면 수신자는 그 데이터가 "진짜" 데이터인지 정확히 알 방법이 없습니다.
그렇다면 만약 서버와 클라이언트 사이에서 암호화된 데이터가 100% 안전하다는 것을 보증해줄 수 있는 A라는 사람이 나타나면 어떻게 될까요 ?
A는 절대 거짓말을 하지 않으며 A를 거쳐가는 데이터는 모두 안전하다는 것이 보장되는 상황이라면 어떻게 될까요 ?
이런 경우라면 클라이언트와 서버는 패킷의 신뢰성을 걱정하지 않고 네트워크 통신을 할 수 있을 것 같습니다.
위의 예시로 HTTPS를 대략적으로 설명하였으며 HTTPS를 이해하는 것은 곧 SSL, TSL, 대칭키, 공개키, CA 등을 이해하는 것입니다. 각 개념들은 모두 톱니바퀴처럼 어울려 하나의 HTTP 라는 개념을 설명하고 있기 때문에 한번에 이해하기 어려울 수 있습니다. 하나씩 차근하게 이해해가다 보면 HTTPS가 어떤 것이고 어떤 식으로 동작하는지 이해할 수 있을 것입니다.
먼저 비둘기로 설명하는 HTTPS 를 읽는다면 개념을 잡는데 큰 도움이 될 것입니다.
HTTPS와 SSL
사실 저는 SSL을 이해하는 것이 HTTPS를 이해하는 것이라고 생각합니다.
생활코딩에서 설명한 내용을 빌리자면,
HTTP는 패킷을 도청할 수 있다
HTTP 프로콜을 사용하여 통신할 때 클라이언트 - 서버간에 오가는 패킷들은 모두 도청이 가능합니다. 한마디로 어떤 데이터들이 오고가는지 다 볼 수 있다는 것이죠. 만약 단순한 이미지같은 경우는 도청을 해도 상관이 없지만 아이디, 비밀번호 같은 중요한 정보들을 도청하는 경우 문제가 생기겠죠.
그럼 실제로도청이 가능한지 와이어샤크로 확인해 봅시다.
먼저 위의 사이트는 https가 아닌 http를 사용하고 있으며 단순히 html, img를 보여주고 있습니다. 와이어 샤크에서는 어떻게 보일까요 ?
이미지 데이터의 패킷을 볼 수 있으며, 실제로 와이어 샤크에서 제공해주는 기능을 사용하여 html와 이미지 파일을 저장할 수 있습니다.
결론적으로 HTTP를 사용할 경우 클라이언트 - 서버간의 통신하는 데이터 패킷을 도청할 수 있다는 것입니다.
SSL
SSL(Secure Socket Layer)은 HTTPS의 마지막 S를 의미하며 HTTP에서 SSL을 추가하여 HTTP의 보안이 더 강화되었습니다. 엄밀히 말하면 HTTPS는 SSL위에서 동작하는 프로토콜 입니다.
SSL은 Netscape사에서 웹 서버와 브라우저 사이의 보안을 위해 만들었습니다. SSL이 점차 폭넓게 사용되다 표준화 기구인 IETF의 관리로 변경되면서 TLS라는 이름으로 바뀌었으며 TLS 1.0은 SSL 3.0을 계승합니다. 하지만 TLS라는 이름 보다는 SSL이름이 훨씬 많이 사용되고 있습니다.
대칭키, 공개키, CA, SSL 인증서를 이해하는 것이 SSL을 이해하는 것이며 SSL을 이해하는 것이 HTTPS를 이해하는 것입니다.
대칭키
대칭키는 동일한 키로 데이터를 암호/복화화를 할 수 있는 암호화 기법입니다. 예를 들어 "Q#*%D"라는 A키로 데이터를 암호 하였다면 복화화 할 때 똑같은 비밀번호로 복호화를 해야 합니다.
이해를 돕기 위해 openssl을 사용하여 대칭키 방식으로 암호화/복호화 하는 방법을 살펴 보겠습니다.
1. "this is the plain text" 내용으로 plaintext.txt파일을 만듦
2. enc -e -des3 : des3 방식으로 암호화,
plaintext.txt 파일을 암호화 한 결과를 ciphertext.bin 파일에 저장
암호화 키를 입력
3. plaintext.txt의 내용이 암호화 되었음
4. enc -d 옵션으로 인해서 ciphertext.bin 파일을 plaintext2.txt 파일로 복호화
암호화 하는데 사용한 키(공개키)를 입력
기존의 데이터를 출력
공개키
대칭키 방식은 단점이 있습니다. 암호를 주고 받는 사람들 사이에 대칭키를 전달하는 것이 어렵다는 점입니다. 대칭키가 유출되면 키를 획득한 공격자는 암호의 내용을 복호화 할 수 있기 때문에 암호가 무용지물이 되기 때문입니다. 이런 배경에서 나온 암호화 방식이 공개키방식입니다.
공개키 방식은 두개의 키를 가지는데 A라는 키로 암호화 했으면 B키로 복호화가 가능하며, B라는 키로 암호화를 하였으면 A라는 키로 복호화가 가능합니다. 여기서 하나의 키를 비공개키(private key, 비밀키) 나머지 키를 공개키(public key)라고 합니다.
비공개키는 자신만이 가지고 있고 공개키를 타인에게 제공합니다. 공개키를 제공 받은 타인은 공개키를 이용해서 정보를 암호화 합니다. 암호화한 정보를 비공개키를 가지고 있는 사람에게 전송하면 비공개키의 소유자는 이 키를 이용해서 암호호된 정보를 복호화 합니다. 이 과정에서 공개키가 유츌된다고 해도 비공개키를 모르면 정보를 복호화할 수 없기 때문에 안전합니다. 공개키로는 암호화는 할 수 있지만 복호화는 할 수 없기 때문입니다.
이 방식은 다른 방식으로 응용할 수 있는데, 비공개키의 소유자는 비공개키를 이용해서 정보를 암호화 한 후에 공개키와 함께 암호화된 정보를 전송합니다. 정보와 공개키를 획득한 사람은 공개키를 이용해서 암호화된 정보를 복호화 합니다. 이 과정에서 공개키가 유출된다면 의도하지 않는 공격자에 의해서 데이터가 복호화될 위험이 있습니다.
하지만 이런 위험에도 불구하고 비공개키를 이용해서 암호화하는 이유는 무엇일까요 ?
그 이유는 데이터를 보호하는 것이 목적이 아니기 때문입니다. 암호화된 데이터를 공개키를 가지고 복호화할 수 있다는 것은 그 데이터가 공개키와 쌍을 이루는 비공개키로 암호화 되었다는 것을 의미합니다. 즉 공개키가 데이터를 제공한 사람의 신원을 보장해주게 되는 것이며 이러한 것을 전자 서명이라고 부릅니다.
마찬가지로 openssl을 사용하여 공개키 방식을 설명하겠습니다.
1. RSA라는 방식으로 private.pem이라는 이름의 키를 생성
이 키는 1024bit 길이을 가지며 이 숫자가 높을 수록 안전
2. 다음 명령은 private.pem이라는 이름의 비공개키에 대한 public.pem이라는 이름의 공개키를 생성
이 공개키를 정보를 제공할 사람에게 전송
3. "coding everybody"라는 문장을 가지는 file.txt를 만듦
이 데이터를 비공개키 소유자에게 전송하기 위해 공개키로 암호화 필요
4. file.txt를 암호화
file.txt의 내용을 RSA방식으로 암호화한 file.ssl이라는 이름의 파일이 생성
이때 사용한 공개키는 publie.pem
이제 안심하고 file.txt를 암호화한 결과인 file.ssl을 비공개키의 소유자에게 전송가능
5. file.ssl을 수신받은 비공개키 사용자는 비공개키 pviate.pem을 사용하여 복호화
SSL 인증서
클라이언트가 어떻게 내가 암호화된 데이터를 보내고/받는 서버를 100% 신뢰할 수 있을까요 ?
예를 들어 내가 소유하고 있는 www.mydomain.com에 접속하여 서버와 네트워크 통신을 한다면 전혀 의심할 필요가 없습니다. 내것이기 때문에 의심할 필요가 없죠.
하지만 다른 도메인에 접근한다면, 즉 다른 서버와 네트워크 통신을 한다면 서버를 100% 믿을 수 없습니다.
여기서 SSL 인증서는 서버의 신뢰성을 확인하는데 사용하며 "저(서버)는 안전합니다 클라이언트님!" 라고 말하는 인증서 입니다. 클라이언트가 서버에 접속한 직후에 서버는 클라이언트에게 이 인증서 정보를 전달 합니다. 클라이언트는 이 인증서 정보가 신뢰할 수 있는 것인지를 검증 한 후에 다음 절차를 수행하게 된다.
인증서의 크게 다음 두가지 역할을 합니다.
1. 클라이언트가 접속한 서버가 신뢰할 수 있는 서버임을 보장함
2. SSL 통신에 사용할 공개키를 클라이언트에게 제공함(여기서 공개키는 대칭키를 의미)
브라우저 주소옆 자물쇠를 클릭하면 클라이언트가 서버로 부터 받은 인증서가 누구로부터 공인, 인증을 받았는지 확인할 수 있습니다.
CA
위에서 SSL 인증서에 대해 공부했는데, 이는 클라이언트가 접속한 서버가 클라이언트가 진짜 의도한 서버, 통신하고 싶어하는 서버가 맞는지 보장하는 역할을 합니다.
이 역할을 하는 민간기업들이 있는데 이런 기업들을 CA(Certificate Authority) 혹은 Root Certificate라고 합니다. CA는 아무 기업이나 할 수 있는 것이 아니고 신뢰성이 엄격하게 공인된 기업들만이 참여할 수 있습니다.
기업(서버)는 자신의 서버가 아무런 문제가 없고, 어떠한 불법적인 일을 저지르지 않는 다는것을 증명할 수 있는 서류와 함께 자신이 생성한 공개키를 CA에게 보내고 CA는 아무런 문제가 없음을 확인하면 해당 기업(서버는) SSL 인증서를 사용할 수 있습니다.
이렇게 CA로 부터 승인받은 SSL 인증서는 클라이언트가 서버에 접근하면 "나는 믿을만한 서버야 !" 라는 의미로 SSL 인증서를 클라이언트로 보냅니다. 이후 클라이언트는 신뢰성을 검사하고 이후의 네트워크 통신을 하는거죠.
아래는 몇가지 CA 기업을 나열했습니다.
현재 제가 글을 작성하고 있는 티스토리 도메인의 CA는 DigiCert입니다. 이는 "DigiCert"라는 회사가 tistory는 믿을만한 회사(서버)야!" 라고 말해주고 있는것과 같습니다.
SSL 인증서의 내용
SSL 인증서에는 다음과 같은 정보가 포함되어 있습니다.
1.서비스의 정보 : 인증서를 발급한 CA, 서비스의 도메인 등등
2. 서버 측 공개키 : 공개키의 내용, 공개키의 암호화 방법
1번은 클라이언트가 접속한 서버가 클라이언트가 의도한 서버가 맞는지에 대한 내용을 담고 있고,
2번은 서버와 통신을할 때 사용할 공개키와 그 공캐기의 암호환 방법들의 정보를 담고 있습니다.
여기서 HTTPS가 적용된 서버에 접속하게 되면 내부적으로 클라이언트에세 SSL인증서를 보내주게 됩니다.
서비스의 도메인 공개키와 같은 정보는 서비스가 CA로부터 인증서를 구입할 때 제출해야 합니다. 위와 같은 내용은 CA에 의해서 암호화 됩니다. 이때 사용하는 암호화 기법이 공개키 방식입니다.
CA는 자신의 CA 비공개키를 이용해서 서버가 제출한 인증서를 암호화하는 것입니다. CA의 비공개키는 절대로 유출되어서는 안됩니다. 이것이 노출되는 바람에 디지노타라는 회사는파산된 사례도 있습니다.
CA를 브라우저는 이미 알고 있다
브라우저는 CA를 이미 알고 있습니다. 브라우저를 개발할 때, 개발회사의 정책에 따라 CA의 리스트를 파악하고 이를 브라우저의 소스코드안에 미리 넣어 놓았습니다. 이러한 리스트는 브라우저가 업데이트 될때마다 내부 정책에 따라 수정 되며 브라우저가 미리 파악하고 있는 CA의 리스트에 포함되어야만 공인된 CA가 될 수 있습니다. 그리고 CA의 리스트와 함께 CA의 공개키 또한 브라우저는 이미 알고 있습니다.
SSL 인증서가 서비스를 보증하는 방법
1. 브라우저가 서버에 접속할 때 서버는 제일 먼저 인증서를 제공합니다.
2. 브라우저는 이 인증서를 발급한 CA가 자신이 가지고있는 CA 리스트에 있는지 확인합니다.
3. 확인 결과 브라우저의 CA 리스트에 포함되어 있다면 해당 CA의 공개키(인증서 내부에 포함되어 있음)를 이용해서 인증서를 복호화 합니다.
4. CA의 공개키를 이용해서 인증서를 복호화할 수 있다는 것은 이 인증서가 CA의 비공개키에 의해서 암호화 된 것을 의미합니다.
5. 해당 CA의 비공개 키를 가지고 있는 CA는 해당 CA 밖에는 없기 때문에 서버가 제공한 인증서가 CA에 의해서 발급된 것이라는 것을 의미합니다.
6. CA에 의해서 발급된 인증서라는 것은 접속한 사이트가 CA에 의해서 검토되었다는 것을 의미합니다.
7. CA의 검토를 통과했다는 것은 해당 서비스가 신뢰할 수 있다는 것을 의미합니다.
8. 이것이 CA와 브라우저가 특성 서버를 인증하는 과정입니다.
→ 그렇다면 인증서에 포함된 서버의 공개키는 어떤 용도에 사용될까요 ?
SSL의 동작 방법
앞서 배운 내용들은 모두 해당 챕터를 공부하기 위한 사전 공부였습니다. 지금껏 배운 공개키, 대칭키, SSL 인증서, CA 모두 SSL의 동작 원리를 이해하기 위해 공부하였으며 이러한 내용 모두 얽혀 SSL을 설명할 수 있기 때문입니다.
먼저 클라이언트와 서버가 통신하는 가장 이상적인 방법은 공개키 방식으로 통신하는 것입니다. 서버는 클라이언트에게, 클라이언트는 서버에게 공개키를 제공하고 데이터를 공개키로 암호화 합니다. 나중에 복호화 할때는 비밀키로만 복호화 할 수 있기 때문에 통신 도중에 패킷을 도청했다 하더라도 비밀키를 소유자를 제외하고는 해당 패킷을 복호화할 수 없다는 장점이 있습니다.
하지만 이러한 공개키 방식은 컴퓨팅 파워를 많이 사용하기 때문에 실제로 사용하고 있지는 않습니다.
대신에 대칭키와 공개키 방식을 혼합하여 사용하고 있습니다. 실제 데이터는 대칭키 방식으로 암호화 합니다. 여기서 대칭키는 각 서버/클라이언트에서 같은 키를 사용하는데 여기서 대칭키를 공유하는데 사용하는 암호화 기법으로 공개키를 사용합니다.
- 실제 데이터 : 대칭키 방식
- 대칭키의 키 : 공개키 방식
컴퓨터와 컴퓨터 사이의 네트워크는 아래의 3단계 과정을 거칩니다.
악수 ㅡ> 데이터 전송 ㅡ> 세션종료
1. 악수(handshake)
서버와 네트워크는 서로 데이터를 주고 받기 전에 서로의 상태에 대한 공유 작업을 하는데 이를 handshake라고 합니다. SSL 방식을 이용해서 통신을 하는 브라우저와 서버 역시 핸드쉐이크를 하는데, 이 때 SSL 인증서를 주고 받습니다.
1. 클라이언트가 서버에 접속하며 이 단계를 client hello라고 합니다.
- 클라이언트 측에서 생성한 랜덤 데이터를 서버로 전송
- 클라이언트가 지원하는 암호화 방식을 서버로 전송 : 클라이언트와 서버가 지원하는 암호화 방식이 서로 다를 수 있기 때문에 상호간에 어떤 암호화 방식을 사용할 것인지에 대한 협상을 해야 합니다. 이 협상을 위해서 클라이언트 측에서는 자신이 사용할 수 있는 암호화 방식을 전송합니다.
- 세션 아이디 : 이미 SSL 핸드쉐이킹을 했다면 비용과 시간을 절약하기 위해서 기존의 세션을 재활용하게 되는데 이 때 사용할 연결에 대한 식별자를 서버 측으로 전송합니다.
2. 서버는 Client Hello에 대한 응답으로 Server Hello를 하게 됩니다.
- 서버 측에서 생성한 랜덤 데이터을 클라이언트로 전송
- 서버가 선택한 클라이언트의 암호화 방식을 클라이언트로 전송 : 클라이언트가 전달한 암호화 방식 중에서 서버 쪽에서도 사용할 수 있는 암호화 방식을 선택해서 클라이언트로 전달합니다. 이로써 암호화 방식에 대한 협상이 종료되고 서버와 클라이언트는 이 암호화 방식을 이용해서 정보를 교환하게 됩니다.
- 인증서 전송
3. 클라이언트는 서버로부터 받은 SSL 인증서로 해당 SSL인증서가 어떤 CA가 발급한 인증서인 지 확인하고 해당 CA가 브라우저의 리스트에 포함된 CA인지 검사합니다. 만약 CA가 리스트에 있다면 해당 CA의 공개키로(이미 브라우저에는 해당 CA의 공개키를 가지고 있음) SSL 인증서를 복호화 합니다. 만약 SSL 인증서가 공개키로 복호화가 된다면 이것은 SSL 인증서가 해당 CA로 부터 발급된 인증서라는 것을 알 수 있고, 자신이 접속한 서버가 CA에 의해 보장되어 있음을 확신할 수 있습니다. 또한 이 단계에서 클라이언트는 SSL 인증서 내부의 공개키(서버로 부터 생산된)를 가지게 됩니다.
클라이언트 랜덤 데이터 / 서버 랜덤 데이터
1. 서버/클라이언트 측에서 생성된 랜덤 데이터를 사용하여 클라이언트는 pre master secret를 만들게 됩니다.
그러면 클라이언트는 어떻게 pre master secret를 서버에 전송할까요 ?
바로 공개키 방식을 사용하는데, 2. 클라이언트는 pre master secret를 서버로부터 받은 SSL 인증서내의 공개키로 암호화 하게 됩니다.
그리고 이렇게 암호화된 3. pre master secret를 서버에게 전송하면 서버는 자신이 가지고 있는 비밀키를 사용하여 pre master secret를 복호화 합니다. 공개키 방식을 사용했기 때문에 도중에 pre master secret를 가로채도 비밀키가 없으면 복호화하 수 없게 됩니다.
4. 이후 클라이언트와 서버는 모두 pre master secret를 소유하게 되며 5. 각 일련의 과정을 거쳐 pre master secret를 master secret값으로 만들며 이 값은 session secret가 됩니다. 6. 이후 실제 데이터를 전송하는 단계에서 클라이언트와 서버는 데이터를 session secret를 암호화/복호화 하는데 사용하며 이는 곧 대칭키 방식이 됩니다.
2. 데이터 전송
이 단계에서 핵심은 정보를 상대방에서 전송하기 전에 session secret 값을 이용해서 대칭키 방식으로 암호화하 한다는 점입니다. 암호화된 정보는 상대방에서 전송될 것이고, 상대방도 세션키 값을 알고 있기 때문에 암호를 복호화할 수 있습니다.
위에서도 언급 하였지만 그냥 공개키를 사용하면 될 것을 굳이 대칭키와 공개키를 조합해서 사용하는 이유는 무엇일까요 ?
그것은 공개키 방식이 많은 컴퓨팅 파워를 사용하기 때문 입니다. 만약 공개키를 그대로 사용하면 많은 접속이 몰리는 서버는 매우 큰 비용을 지불해야 할 것입니다. 반대로 대칭키는 암호를 푸는 열쇠인 대칭키를 상대방에서 전송해야 하는데, 암호화가 되지 않은 인터넷을 통해서 키를 전송하는 것을 위험하기 때문입니다. 그래서 속도는 느리지만 데이터를 안전하게 주고 받을 수 있는 공개키 방식으로 대칭키를 암호화 합니다.
3. 세션종료
데이터 전송이 끝나면 SSL 통신이 끝났음을 서로에게 알려주며 이때 통신에서 사용한 대칭키인 session key를 폐기합니다.
출처 : https://opentutorials.org/course/228/4894