터치 습관으로 비대면 금융을 더 안전하게

Dophi·2023년 2월 3일

if(kakao) 2022 컨퍼런스

컨퍼런스

목록 보기

11/14

소개글

각종 컨퍼런스에 나온 강연들을 정리해보면서 공부해보고 있습니다.
이번 포스팅은 if(kakao) 2022에서 신동화님께서 강연해주신 내용을 정리했습니다.
제목은 "터치 습관으로 비대면 금융을 더 안전하게"이며 터치 습관을 통한 인증 모델 개발에 대한 내용입니다.
말투는 편한 말투로 작성하니 양해 부탁드립니다.

영상 다시보기
문서 자료

발표내용

터치 습관을 이용한 인증

기존 인증 방식

지식 기반: 패스워드, PIN, 패턴
- 누가 홈쳐 보거나 스마트폰 화면의 자국으로 공격 위험성 존재
소유 기반: OTP, 인증서
- 매번 소유해야한다는 점때문에 불편함
생체 기반: 지문, 얼굴, 홍채, 터치 습관

무자각 인증이란

사용자의 무의식적인 행동패턴과 생체정보를 활용하여 명시적인 인증절차 없이 신원을 검증하는 기술
터치 습관을 이용하여 무자각 인증 방식을 개발하기로 함

터치 습관이란

인증 비밀번호 6자리를 입력한다고 가정했을 때, 각 사용자들이 가진 고유한 입력 리듬이나 패턴을 의미
터치 압력, 좌표, 스마트폰 센서 값 등도 함께 고려

터치 습관을 인증에 이용하겠다는 발상이 정말 기발한 것 같습니다.

만들게 된 계기

인증 결과도 중요하지만 과정도 중요함

카카오 뱅크 특성상 신분증과 스마트폰만 있다면 비대면 업무를 쉽게 할 수 있음
전체 사기 사건중 회원가입 직후 위와 같은 사기가 일어나는 비율 - 41.35%
그 중에서도 50대 이상 비율 - 86.86%

만약 터치 습관을 통해 추론한 고객의 연령대와 신분증 상의 연령대의 일치 여부를 확인할 수 있다면 사기를 막을 수 있을 것임

요즘 스마트폰 앱이 발달하면서 비대면 업무가 쉽게 이루어지고, 그만큼 사기 사건도 많이 일어난다고 합니다.

분석

인증 비밀번호에 우선 적용

금융활동시 가장 많이 접하는 화면 중 하나
회원가입 시 필수적으로 인증 비밀번호를 등록
추후 다른 화면들에도 적용 예정

분석에 사용한 데이터

터치 시간, 터치 좌표, OS, 화면 크기, 성별, 연령대 등

분석 결과

터치 리듬 유사도

터치 시간 간격 리듬이 어느 정도 존재한다는 것을 파악할 수 있음
유사도 매트릭스를 보면 같은 사용자의 입력끼리는 유사 점수가 높음

남성/여성 터치 영역

남성은 버튼의 좌측하단, 여성은 버튼의 우측하단을 주로 입력하는 것을 확인할 수 있음
다만 이 차이가 성별때문이 아닐 수 있기 때문에 해석에 주의해야함 (왼손잡이 남성이 많았다면?)

터치 시간차

연령대 별 터치 시간차를 보면 고연령대가 확실히 높음
다만 10대의 시간차도 비교적 높은 편임

고연령/비고연령 터치 영역

고연령일 수록 중앙을 많이 터치하는 것을 확인

실데이터 터치 시간차 리듬

아이폰을 사용하는 20대 남성들의 데이터로서, 성별, 연령대, 스마트폰의 OS가 모두 같음에도 각각 리듬이 다름
비슷한 리듬에 대해서는 터치 좌표 확인 필요

실데이터 터치 좌표

3, 6, 9에 대해서는 유저 A의 입력 좌표가 좀 더 오른쪽에 치우쳐져 있는 것을 확인 가능

개발

모형 개발을 위한 데이터 구성

터치 시간과 좌표 값으로 부터 총 75개의 파생 변수 생성
고연령 분류(50대 이상) 및 사용자 인증 모형에 사용

고연령 분류 모형

일반적인 binary classification 문제로 해결 가능

사용자 인증 모형

사용자별로 훈련 데이터가 많지 않음
전체 사용자의 89%가 5개 이내의 인증 수를 가짐
따라서 Metric learning 방법론을 사용하기로 함
Siamese Neural Network와 LSTM 모델을 사용

Siamese Neural Network

동일한 사용자의 인증 페어와 서로 다른 사용자의 인증 페어를 인풋으로 넣어서 훈련

인증에 사용할 때는, 새롭게 들어온 터치 데이터를 사용자 본인의 데이터와 페어를 만들고 유사도 값을 계산
그 후 유사도 값의 평균을 구해서 특정 임계치보다 높으면 본인이라고 판단

LSTM

각 사용자의 인증과 라벨을 인풋으로 넣고 훈련

인증에 사용하기 위해, 우선 사용자의 인증 데이터를 모형에 넣고 embedding vector를 추출함
이후 인증 훈련셋끼리 코사인 유사도를 계산하고, 평균값이 가장 높은 벡터를 대표 인증 벡터로 추출

인증을 위해, 새롭게 들어온 터치 데이터를 모형에 넣어서 embedding vector를 추출하고, 사용자 본인의 대표 인증 벡터와 코사인 유사도를 계산함
유사도가 특정 임계치보다 높다면 본인이라고 판단

Classification vs Metric Learning

일반적인 Classification에서는 분류를 위한 경계선을 찾게 됨

Metric Learning에서는 같은 클래스의 객체들끼리는 더 가깝게, 서로 다른 클래스 객체들끼리는 더 멀어지게 하는 embedding space를 학습함
결국 서로 같다라는 정보 외에도 서로 다르다라는 정보를 이용하는 것

성능 지표

성능 지표로는 EER을 사용
EER은 타인이 허용되는 비율을 의미하는 FAR과 본인이 거절되는 비율인 FRR이 같아지는 지점
EER 값이 낮을 수록 성능이 좋은 것임

실험 결과

많은 양의 데이터로 먼저 학습시키고 객체를 분류하는 classification과는 달리, 데이터가 많이 없다면 Metric Learning을 사용할 수 있다고 합니다.

개발을 하며 경험한 것들을 이것저것 작성해보고 있습니다!

이전 포스트

초거대모델 학습을 위한 이미지-텍스트 데이터셋

다음 포스트

셀피인증: 안면인식 기술을 이용한 비대면 실명확인 시스템 개발 이야기

0개의 댓글