이루다라는 채팅 인공지능에 대한 여러가지 이야기가 난무하는데, 가장 중요한 포인트가 빠진것 같아서... 몇가지 끄적거려 봅니다.
사실, 스캐터랩이 채팅데이터를 획득하고 이에 대한 문제를 개인적으로 지적한것이 2019년 10월에 페북에서 공개적으로 문제를 제기했었고, 이에 대한 응답을 받은적 있습니다.
상세한 채팅내용은 공개하기 그렇지만... 개인정보 이슈에 대해서 당사자들이 직접 업로드하고, 개인정보 식별정보와 민감정보 제거나 비식별화 조치를 취해서 이 문제를 해소한다고 했었다.
하지만, 결론적으로 기술적인 해소를 하지 못하고, 개보법의 규정에 대한 이슈등에 대해서 주변의 전문가들의 의견이 많이 제시되는 상황까지 현재 전개되고 있다.
그냥, 개인적으로 몇가지 끄적거려 봅니다.
하나. 법이나 규제를 떠나서 '회사'에서 최대한 개인정보를 보호하려는 수단을 찾고, 이를 통하여 문제를 해소했어야 했는데, 이 문제를 해소 못한 것 같다.
둘. 실제 개인 데이터를 다루는 회사 내부의 프로세스도 문제였던 것 같다. 내부의 이야기가 밖으로 나온것을 보면, 개인이 업로드된 자료들을 보고 '내부 직원끼리 돌려본' 이야기가 들린다. 이 부분도 '윤리'적인 이슈다.
셋. '내부직원끼리 돌려본'기사를 살펴보면, 내부 개발자들에게는 '1차 필터링'상태의 정보에 접근하는 위험한 상황들이 보여지는데, 이 글이 사실이 아니기를 바란다.
넷. 사실, 이 정도 채팅을 만드는 것은 이제 어려운 것도 아니고, 더 괜찮은 방법들도 많다. 데이터 획득도 그러하고, 하지만... 논란만 만든 상황인것 보면, 노이즈 마케팅을 노린것 아닌가 하는 생각도 살짝 들지만, 그런것은 아니기를 기원한다. 순수한 스타트업의 실수 정도로 생각하고 싶다.
다섯. 공개된 오픈소스의 샘플데이터에도 문제가 있었다. 안타깝지만... 이미 노출된것이 문제...
하지만, 정말 중요한 점이 하나 있다.
스캐터랩이 사용한 개인간의 채팅데이터는 카카오톡에서 사용한 내용들이며, 이 내용들은 대화에 참여한 쌍방동의가 아닌, 한명의 일방적인 동의에 의해서 사용되어진 데이터라는 논란도 있지만, 정말 중요한 것은 그것이 아니다.
너무 쉽게, 개인의 채팅데이터가 제3자에게 제공되는 것이 너무 쉬운 카카오톡의 프레임웍이 문제라고 생각합니다. 그 이유를 몇가기 끄적거려보면.
연애의 과학이라는 별도의 서비스를 통해서 수집된 데이터를 너무도 쉽게 재활용하고 있는 것을 보면, 살짝 공포스러운 느낌이 들며, 언제나 이야기하지만 개인적으로 저는 '카카오톡'을 사용하지 않습니다.
가족들과는 텔레그램을 사용하고 있고, 꼭 필요한 비즈니스 관련 내용들은 SMS나 이메일의 전통적인 수단을 사용합니다.
매번 이야기하지만...
이것은 한 스타트업의 문제라기 보다는... 플랫폼을 제공하는 기업이 그에 대한 충분한 책임과 방어수단, GDPR에 해당되는 방어 프로세스가 없다면, 이런 식으로 서비스를 무차별적으로 확대하는 것에 대해서는 기업 내부에서 민감하게 고려하였으면 하는 생각이 듭니다.
추가적으로 스태터랩의 입장문을 한번 보면 개인정보 활용에 대해서 책임을 통감하고 진심으로 사과한다고 이야기하고 있다.
다만, 이런 문제는 스캐터랩 혼자만의 문제가 아닐 것이다. 카카오톡과 같은 플랫폼 사업자가 더 진지하게 제3자 회사들에게 제공되는 기능들에도 충분하게 이를 대응할 수 있게 해야할것이다.