위코드-TIL-18-인증/인가 세션-06.16

jin_sk·2020년 6월 16일
0

위코드

목록 보기
41/49

인증(Authentication) & 인가(Authorization)

  • 인증, 인가는 API에서 가장 자주 구현되는 기능 중 하나이다

  • Private API, Public API 둘 다 기본적인 인증, 인가를 요구한다


인증 (Authentication)

  • 인증(authentication)은 유저의 신원(identification)을 확인하는 절차
    (쉽게 설명하면, 유저의 아이디와 비밀번호를 확인하는 절차)

  • 인증을 하기 위해선 먼저 유저의 아이디, 비밀번호를 생성할 수 있는 기능이 필요

  • 우리 서비스를 누가 쓰는지, 어떻게 사용하는지, 추적이 가능하도록 하기 위해 필요

  • 인증에 필요한 것은 아이디, 이메일주소, 비밀번호 등이 있는데 비밀번호가 가장 중요!

로그인 절차

  1. 유저 아이디, 비밀번호 생성

  2. 유저 비밀번호 암호화해서 DB에 저장

  3. 유저 로그인 -> 아이디, 비밀번호 입력

  4. 유저가 입력한 비밀번호를 암호화 한 후 DB에 저장된 유저 비밀번호와 비교

  5. 일치하면 로그인 성공

  6. 로그인에 성공하면 access token을 클라이언트에게 전송

  7. 유저 로그인 성공 후 다음부터는 access token을 첨부해서 request를 서버에 전송함으로서 매번 로그인을 해도 되지 않도록 한다

유저 비밀번호 암호화

  • 법규상의 강제 있음 (필수적) (보안 추가 : HTTPS / 통신시 개인정보를 주고받을때 SSL을 적용하여 암호화)

  • 유저의 비밀번호는 절대 그 비밀번호 그대로 DB에 저장하지 않는다

    • DB가 해킹을 당하면 유저의 비밀번호도 그대로 노출된다

    • 외부 해킹이 아니더라도 내부 개발자나 인력이 유저들의 비밀번호를 볼 수 있다

  • 유저의 비밀번호는 꼭 암호화해서 저장해야 한다

    • 그래야 DB가 해킹을 당하더라고 비밀번호가 그대로 노출되지 않으며 내부 인력도 비밀번호를 알 수 없다
  • 비밀번호 암호에는 단방향 해쉬 함수(one-way hash function)가 일반적으로 쓰인다

    • 단방향 해시 함수는 원본 메시지를 변환 -> 암호화된 메시지인 다이제스트(digest)를 생성
      원본 메시지을 알면 암호화된 메시지를 구하기는 쉽지만
      암호화된 메시지로 원본 메시지를 구할 수 없어 단방향성(one-way) 이라고 한다

    • "tast password"를 hash256이라는 해쉬 함수를 사용하면
      0b47c69b1033498d5f33f5f7d97bb6a3126134751629f4d0185c115db44c094e 값이 나온다

    • 또다른 예로 "tast password2"를 hash256이라는 해쉬 함수를 사용하면
      d34b32af5c7bc7f54153e2fdddf251550e7011e846b465e64207e8ccda4c1aeb 값이 나온다
      실제 비밀번호는 비슷하지만 해쉬 함수의 값은 완전히 다른것을 볼 수 있다
      이러한 효과를 avalance라고 하는데 비밀번호 해쉬 값은 해킹을 어렵게 만드는 하나의 요소이다

예제 코드

In [21]: import hashlib

In [22]: m = hashlib.sha256()

In [23]: m.update(b"test password")

In [24]: m.hexdigest()
Out[24]: '0b47c69b1033498d5f33f5f7d97bb6a3126134751629f4d0185c115db44c094e'    

In [25]: m = hashlib.sha256()

In [26]: m.update(b"test password2")

In [27]: m.hexdigest()
Out[27]: 'd34b32af5c7bc7f54153e2fdddf251550e7011e846b465e64207e8ccda4c1aeb'

Bcrypt

  • 라이브러리다

  • 어떻게 비밀번호를 확인할 수 있느지 확인해보기 (비밀번호는 재확인 가능해야)

  • 단방향 해쉬 함수의 취약점

    • Rainbow table attack (미리 해쉬값들을 계산해놓은 테이블이 공격당하는 것)

    • 해시 함수는 원래 패스워드를 저장하기 위해서 설계된 것이 아니라 짧은 시간에 데이터를 검색하기 위해 설계된 것이다
      그렇기 때문에 해시 함수는 본래 처리 속도가 최대한 빠르도록 설계되어 있어서
      이러한 속성 때문에 공격자는 매우 빠른 속도로 임의의 문자열의 다이제스트와 해킹할 대상의 다이제스트를 비교할 수 있다
      (MD5를 사용한 경우 일반적인 장비를 이용하여 1초당 56억 개의 다이제스트를 대입할 수 있다)
      이런 방식으로 패스워드를 추측하면 패스워드가 충분히 길거나 복잡하지 않은 경우에는 그리 긴 시간이 걸리지 않는다
      (이래서 특수문자, 동일한 패턴을 사용하지 말라나보다...)

  • 단방향 해쉬 함수의 취약부분 보완점

    • Salting
      실제 비밀번호 이외에 추가적으로 랜덤 데이터를 더해서 해쉬값을 계산하는 방법

    • Key Stretching
      단방향 해쉬값을 계산한 후 그 해쉬값을 또 해쉬하고, 이를 또 반복 한다
      최근에는 일반적인 장비로 1초에 50억 개 이상의 다이제스트를 비교할 수 있지만,
      키 스트레칭을 적용하여 동일한 장비에서 1초에 5번 정도만 비교할 수 있게 한다
      GPU(Graphics Processing Unit)를 사용하더라도 수백에서 수천 번 정도만 비교할 수 있다
      50억 번과는 비교할 수도 없을 정도로 적은 횟수다
      앞으로 컴퓨터 성능이 더 향상되면 몇 번의 반복을 추가하여 보완할 수 있다

    • Salting과 Key Stretching을 구현한 해쉬 함수중 가장 널리 사용되는 것이 bcrypt
      bcrypt는 처음부터 비밀번호를 단방향 암호화 하기 위해 만들이전 해쉬함수

bcrypt 예제 코드

In [40]: import bcrypt

In [41]: bcrypt.hashpw(b"secrete password", bcrypt.gensalt())
Out[41]: b'$2b$12$.XIJKgAepSrI5ghrJUaJa.ogLHJHLyY8ikIC.7gDoUMkaMfzNhGo6'

In [42]: bcrypt.hashpw(b"secrete password", bcrypt.gensalt()).hex()
Out[42]: '243262243132242e6b426f39757a69666e344f563852694a43666b5165445469397448446c4d366635613542396847366d5132446d62744b70357353'

JWT(JSON Web Tokens)

유저가 로그인에 성공한 후에는 access token이라는 암호화된 유저 정보를 첨부해서 request를 보내게 된다

  • 유저 로그인:
POST /auth HTTP/1.1
Host: localhost:5000
Content-Type: application/json

{
    "username": "joe",
    "password": "pass"
}
  • access token:
HTTP/1.1 200 OK
Content-Type: application/json

{
    "access_token": "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZGVudGl0eSI6MSwiaWF0IjoxNDQ0OTE3NjQwLCJuYmYiOjE0NDQ5MTc2NDAsImV4cCI6MTQ0NDkxNzk0MH0.KPmI6WSjRjlpzecPvs3q_T3cJQvAgJvaQAPtk1abC_E"
}

그러면 서버에서는 access token을 복호화 해서 해당 유저 정보를 얻게 된다

예를들어 access token
eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZGVudGl0eSI6MSwiaWF0IjoxNDQ0OTE3NjQwLCJuYmYiOjE0NDQ5MTc2NDAsImV4cCI6MTQ0NDkxNzk0MH0.KPmI6WSjRjlpzecPvs3q_T3cJQvAgJvaQAPtk1abC_E 를 복호화 하면 다음과 같은 정보를 얻는다

{
    user_id = 1 
}

복호화해서 얻은 유저 아이디를 통해 해당 유저가 누군지 알 수 있다

이런 절차의 목적은 해당 유저가 매번 로그인 해도 되지 않도록 하는 것이다
(로그인 비밀번호를 저장하시겠습니까? 해서 예 누르면 실행된다...)

access token을 생성하는 방법은 여러가지가 있는데, 그 중 가장 널리 사용되는 기술중 하가 바로 JWT(JSON Web Tokens)이다

JWT는 말 그대로 유저 정보를 담음 JSON 데이터를 암호화 해서 클라이언트와 서버간에 주고 받는 것이다


Why Use Access Token VS ID and Password?

  • Performance

    • No heavy bcrypt call, just a simple hash
  • Client-side storage

    • No actual ID and password stored in the client such as cookie.
    • Also, token is very server specific - not reused in any other site.

인가(Authorization)

  • 인가(Authorization)은 유저가 요청하는 request를 실행할 수 있는 권한이 있는 유저인가를 확인하는 절차

  • 예를 들어, 해당 유저는 고객 정보를 볼 수 있는 있지만 수정 할 수는 없다 등

  • 인가(Authroization)도 JWT(Jason Web Token)를 통해서 구현 될 수 있다.

    • access token을 통해 해당 유저 정보를 얻을 수 있음으로 해당 유저가 가지고 있는 권한(permission)도 확인 할 수 있다

Authorization 절차

  1. 인가(Authentication) 절차를 통해 access token을 생성한다
    access token에는 유저 정보를 확인할 수 있는 정보가 들어가 있어야 한다 (예를 들어 user id).

  2. 유저가 request를 보낼때 access token을 첨부해서 보낸다 (프라이머리 키 보내기)

  3. 서버에서는 유저가 보낸 access token을 복호화 한다

  4. 복호화된 데이터를 통해 user id를 얻는다

  5. user id를 사용해서 database에서 해당 유저의 권한(permission)을 확인한다

  6. 유저가 충분한 권한을 가지고 있으면 해당 요청을 처리한다

  7. 유저가 권한을 가지고 있지 않으면 Unauthorized Response(401) 혹은 다른 에러 코드를 보낸다

0개의 댓글