0\. 주제 및 목표1\. 기획의도 및 배경2\. 데이터 수집 및 특성3\. 모델4\. 참고 문헌 자연어 처리를 활용한 유사 화장품 추천 시스템 구축감성품질(자연어)과 성분 간의 매핑 \- 추후 시스템의 고도화를 위한 사전 작업📌 배경 시장 안정성 및 사업 성장
대한화장품협회 - 성분사전INCI Decoder - Product ListINCI Decoder - Product & Ingredientshttps://kcia.or.kr/cid/search/ingd_list.php약 20,000개의 성분코드, 성분명, 영문명
모듈 준비 및 데이터 불러오기Domain KnowledgeEDA3-1. 이상치 및 결측치 확인3-2. 성분 별 카운트3-3. 제품 별 특징3-4. 효과 별 성분 랭크결과 정리ModuleData product_df 테이블 product name: 제품명ingredient
유사 화장품 추천 프로젝트 > ### 03. 유사도 측정 ver.1 📊📄 📝 목차 > 1. 카운트 기반의 단어 표현 > 2. DTM > 3. 유사도 측정 > 3-1. Shuffle & Sampling > 3-2. Euc Distance > 3-3. Cos Si
중간 결과 보고데이터 소개데이터 수집EDA유사도 측정5-1. 행렬 변환 및 모델 실행 준비5-2. 측정 결과 정확도 확인한계 및 다음 단계📌 프로젝트의 전체적인 흐름먼저, Input Data로 화장품과 해당 화장품의 전성분표가 필요파이썬을 활용하여 KCA, INCI-
자카드 계수 소개1-1. 기대효과유사도 측정결과자카드 지수(Jaccard index)는 두 집합 사이의 유사도를 측정하는 방법 중 하나이다. 자카드 계수(Jaccard coefficient) 또는 자카드 유사도(Jaccard similarity)라고도 한다. 자카드 지
역수 벡터화1-1. 역수 벡터화 방법1-2. 기대효과1-3. 역수 벡터 매트릭스PCA2-1. PCA란?2-2. n_components 결정2-3. 최종 매트릭스기존 Count-Based 에서는성분이 함유되었으면 1성분이 함유되지 않았으면 0으로 단순히 이진화하였음.이번
유사도 측정1-1. Using Faiss1-2. vs Count-Based평가 및 결론2-1. 평가 기준2-2. 평가 방법2-3. 평가 결과2-4. 결론 📌 Faiss Faiss는 Facebook에서 고차원 벡터의 유사도 측정, 클러스터링을 위해 고안한 라이브러리다.