해당 게시글은 LG Aimers Phase1의 수업 내용을 정리한 글로, 모든 내용의 출처는 https://www.lgaimers.ai/ 입니다.
AI 윤리
-
데이터 분석과 AI 학습에서 유의할 점
- 상관관계와 인과관계를 헷갈리면 안된다.
- 데이터 시각화
- 데이터 EDA 필수적으로 진행하여 깨끗한 데이터 만들기
- 데이터 양
- 최소 100만 데이터가 있어야 충분한 학습 가능
- 모델의 복잡도
- 너무 단순한 모델일 경우 : under fitting 발생
- 너무 복잡한 모델일 경우 : over fitting 발생
- Black Box 모델
- 기존 decistion tree처럼 알고리즘의 결정 요인을 설명하기 어려움
- 성능만이 중요한 것이 아니라 설명력 또한 고려한 모델링 필요
- Saliency map, SHAP와 같이 post-hoc explainability를 제공하는 기술
- 노이즈에 덜 민감할 수 있도록 모델 강건성에 대한 고려 필요
- Web Data 다루기
- Spiral of silence : 누군가가 강한 의견을 낸다면 다른 의견을 가진 사람이 침묵하게 된다.
- 인터넷 상의 다수 의견이 대표성 있는 의견이 아닐 수 있음을 인지하기
- 오정보의 빠른 확산 → 인포데믹 현상 발생
- 사실 정보는 다양한 정보와 연결되며 확산되나 오정보의 경우 산발적으로 확산되는 경향을 가지기에 매우 빠르게 확산됨
- 윤리에 대한 법적 제도
- GDPR : 개인정보를 보호, 혐오 표현을 규제하며 플랫폼을 보호하는 제도
- 인공지능 알고리즘으로 인한 부작용
- 미래 재범률에 대한 예측 알고리즘 : 인종차별에 기반한 편향 발생
- 채용 과정에 대한 알고리즘 : 성차별에 기반한 편향 발생
-
인공지능 알고리즘과 윤리 이슈
- 인공지능과 창작
- 적대적 생성 신경망 (GAN)의 등장으로 단순한 모방, 변형을 넘어서 새로운 창작이 가능해짐
- AI 예술
- 인공지능 제작 작품에게 저작권을 제공할 수 있는가
- 인공지능과 로봇에 대한 법 인격이 존재하지 않음 … 저작권을 가질 수 있는 존재가 아님
- AI에 대한 경계와 규제의 선택은 인류에 대한 재정의라고 할 수 있음
- 자율주행 시 누구를 살리는 선택을 할 것인가
- 인공지능에 대한 폭력행사는 옳지 않다
-
데이터 사이언티스트의 소양
- 데이터에 대한 호기심 : 이종 데이터의 결합 능력
- 서울 야간버스 노선 개발 시 통신 데이터를 활용하여 수요 예측
- 기존의 산업을 새롭게 재정의하기