저번 포스트에 이어 LANISTR에 대해 공부한 내용을 공유해보고자 합니다~!!
논문 리뷰를 통해 LANISTR에 대해 공부하고 GitHub에 공유된 코드를 리뷰하면서 학습하고자 합니다.
우선, LANISTR 설치를 해야합니다. Jupyter Lab이 깔려있다면, 새로운 노트북에서 설치 및 학습을 진행하면 됩니다.
conda create -n lanistr python=3.8 -y
conda activate lanistr
git clone https://github.com/google-research/lanistr.git
cd lanistr
pip install -e .

torch==1.11.0+cu113 버전이 현재 Conda 환경에서 설치할 수 없는 버전이기에 발생한 오류라고 한다..conda install pytorch==1.11.0 torchvision==0.12.0 torchaudio==0.11.0 cudatoolkit=11.3 -c pytorch
⇒ 해결하기 위해 setup.py 파일을 수정하는 방법으로 차선책…
import setuptools
base_requires = [
'omegaconf==2.3.0',
'transformers==4.26.0',
'torch==1.11.0', #+cu113 수정
'torchmetrics==0.9.3',
'torchvision==0.12.0', #+cu113 수정
'pytz==2021.3',
'pandas==1.3.5',
'scikit-learn==1.3.2',
]
setuptools.setup(
name='lanistr',
version='0.1.0',
install_requires=base_requires,
packages=setuptools.find_packages(),
python_requires='>=3.8',
)
저는 추천시스템과 관련하여 공부하고 싶어 데이터셋은 Amazon Product Review만 다운로드 받아 학습시켰습니다. MIMIC-IV 의료용 데이터도 있으니 관련 분야에 관심이 있으면 해당 데이터로 학습시켜도 좋을 것 같습니다~!!
사전 학습 Pre-training
bash scripts/amazon_pretrain.sh
./lanistr 디렉토리에서 명령어를 실행하여 모델을 Office 카테고리에서 사전 학습 실시미세 조정 Fine-tuning
bash scripts/amazon_finetune_beauty.sh
bash scripts/amazon_finetune_fashion.sh
bash scripts/amazon_eval_beauty.sh
bash scripts/amazon_eval_fashion.sh
다음 코드에서 조금 더 자세한 LANISTR 코드 리뷰를 해보겠습니다!!