1. Jupyter 노트북 인스턴스 정리 방법
문제: 데이터 과학자가 Jupyter 노트북 인스턴스를 정리하려면 어떤 단계를 수행해야 하나요?
정답: B. 이전 커널을 사용하는 앱을 종료하면, 이전 커널을 사용하는 모든 노트북이 중지됩니다. 새 커널로 새 노트북을 시작합니다.
설명: 이 방법이 가장 효과적으로 이전 커널을 사용하는 모든 노트북을 중지하고 새 커널로 전환할 수 있습니다.
Amazon SageMaker 처리 작업과 훈련 작업의 차이점
문제: Amazon SageMaker 처리 작업과 Amazon SageMaker 훈련 작업의 차이점을 가장 잘 설명하는 것은 무엇인가요?
정답: C. Amazon SageMaker 처리 작업과 Amazon SageMaker 훈련 작업은 Amazon S3에서 직접 데이터를 스트리밍할 수 있습니다.
설명: 이 기능은 두 작업 유형 모두에 공통적으로 적용되며, 데이터 처리의 효율성을 높입니다.
자체 컨테이너 사용 시 필요한 구성 옵션
문제: 훈련에 자체 컨테이너를 사용하려면 어떤 구성 옵션을 사용해야 하나요?
정답: C. Image_uri="your_container"
설명: 이 옵션을 사용하여 사용자 정의 컨테이너의 이미지 URI를 지정할 수 있습니다.
SageMaker Debugger에서 제공되지 않는 프레임워크/알고리즘
문제: SageMaker Debugger에서 제공되는 프레임워크 및 알고리즘이 아닌 것은?
정답: A. Terraform
설명: Terraform은 인프라 관리 도구로, SageMaker Debugger와 관련이 없습니다.
SageMaker Studio 노트북 인스턴스 비용 절감 방법
문제: 데이터 과학자가 이 문제를 해결하고 비용을 절감하려면 어떤 단계를 수행해야 하나요?
정답: B. 노트북을 자주 저장하도록 지시하고, 자동 종료 확장 프로그램을 배포합니다.
설명: 이 방법은 데이터 손실을 방지하면서 유휴 인스턴스를 자동으로 종료하여 비용을 절감합니다.
신용 리스크 예측 모델의 편향성 해결 도구
문제: 모델이 잘못 예측하는 이유를 해결하는 데 도움이 되는 Amazon SageMaker Data Wrangler 도구는 무엇인가요?
정답: A. 편향성 감지 기능을 사용하여 데이터를 확인합니다.
설명: 이 기능은 데이터셋의 편향성을 식별하고 분석하는 데 도움이 됩니다.
tuner = HyperparameterTuner(
estimator = rcf,
objective_metric_name = 'validation:recall",
objective_type ='Maximize'
hyperparameter_ranges = hyp_range,
max_jobs=100,
max_parallel_jobs=1,
early_stopping_type='Disabled'
)
데이터 과학자가 학습 작업을 실행하고 있는데, 작업이 매우 오래 걸리는 것 같습니다. 데이터 과학자가 모델 성능을 저하시키지 않고 튜닝 작업을 가속화하려면 어떻게 해야 할까요?
정답: C. max_parallel_jobs 설정을 10으로 변경합니다.
설명: 병렬 작업 수를 늘리면 전체 튜닝 프로세스 속도가 빨라집니다.
SageMaker Clarity의 바이어스 보고서 생성용 추론 엔드포인트
문제: Amazon SageMaker Clarity를 모델 모니터링에 사용할 때 바이어스 보고서를 생성하는 데 사용되는 추론 엔드포인트는 무엇입니까?
정답: C. 프로덕션 워크로드에 사용되는 것과 동일한 엔드포인트입니다.
설명: 별도의 엔드포인트를 만들 필요 없이 기존 프로덕션 엔드포인트를 사용합니다.
배포된 모델 목록 검색 방법
문제: 데이터 과학자가 배포된 모델 목록을 검색하려면 어떤 작업을 수행해야 합니까?
정답: B. SageMaker Studio에서 SageMaker 엔드포인트를 선택합니다.
설명: 이 방법이 가장 직관적이고 사용하기 쉬운 방법입니다.
Feature Store에서 'array' 유형 열의 변환
문제: Amazon SageMaker Feature Store에 기능을 추가할 때 'array' 유형 열은 어떤 데이터 유형으로 변환되나요?
정답: D. 문자열 데이터 유형으로 변환됩니다.
설명: Feature Store는 배열을 문자열로 저장하여 호환성을 보장합니다.
편향성 사전 교육 보고서 추적을 위한 중앙 리포지토리
문제: 모든 모델 버전에 대한 편향성 사전 교육 보고서를 한곳에서 추적하는 SageMaker 기능은 무엇인가요?
정답: A. SageMaker Model Registry
설명: Model Registry는 모델 버전 관리와 메타데이터 추적에 적합합니다.
SageMaker Studio 버전 업데이트 방법
문제: 데이터 과학자가 버전 업데이트를 수행하려면 어떤 단계를 수행해야 하나요?
정답: A. 모든 것을 종료하고, 앱을 삭제한 후 새 Studio 앱을 실행합니다.
설명: 이 방법은 모든 리소스를 정리하고 새 버전으로 완전히 전환합니다.
데이터 품질 드리프트 모니터링을 위한 데이터 캡처 설정
문제: 배포된 모델을 모니터링할 수 있도록 데이터 품질 드리프트와 관련된 데이터 캡처를 어떻게 설정합니까?
정답: D. 배포 중 데이터 캡처 파라미터 설정합니다.
설명: 이 방법을 통해 모델 배포 시 데이터 캡처를 활성화할 수 있습니다.
SageMaker Model Monitor가 감지할 수 있는 드리프트 유형
문제: Amazon SageMaker Model Monitor는 어떤 유형의 드리프트를 감지할 수 있나요? (세 가지를 선택하세요.)
정답: A. Data quality drift, B. Model quality drift, D. Feature attribution drift
설명: 이 세 가지 유형의 드리프트는 Model Monitor의 주요 기능입니다.
간헐적 트래픽에 대응하는 ML 챗봇 모델 배포 옵션
문제: 간헐적인 트래픽에 대응하기 위해 확장해야 하는 ML 챗봇 모델을 배포할 때, 어떤 SageMaker 추론 옵션이 가장 적합한가요?
정답: B. Serverless inference
설명: Serverless inference는 트래픽에 따라 자동으로 확장되므로 간헐적 트래픽에 적합합니다.
SageMaker Model Registry의 기능
문제: Amazon SageMaker Model Registry의 기능은 무엇인가요? (세 가지를 선택하세요.)
정답: C. 모델 승인 상태 관리, E. 모델 메타데이터 추적, F. 모델 버전 관리
설명: 이 기능들은 Model Registry의 핵심 기능으로, 모델 라이프사이클 관리에 중요합니다.
온프레미스 ML 모델의 AWS 전환 옵션
문제: 온프레미스에서 실행 중인 사용자 지정 ML 모델을 AWS로 전환할 때, 재작업이 가장 적게 필요한 SageMaker 모델 개발 옵션은 무엇인가요? (두 가지를 선택하세요.)
정답: B. Bring your own script, C. Bring your own container
설명: 이 두 옵션은 기존 모델과 스크립트를 최소한의 수정으로 AWS에서 사용할 수 있게 합니다.
SageMaker Debugger의 구성 요소
문제: SageMaker Debugger의 구성 요소는 무엇인가요? (두 가지를 선택하세요.)
정답: A. 자동화된 로그 및 메트릭, D. 자동화된 규칙 모니터링
설명: 이 두 기능은 Debugger의 핵심 구성 요소로, 모델 훈련 과정을 모니터링하고 디버깅하는 데 사용됩니다.
튜닝 작업 설정 시 지정해야 하는 항목
문제: 튜닝 작업을 설정할 때 지정해야 하는 항목은 무엇인가요? (두 가지를 선택하세요.)
정답: C. 하이퍼파라미터 범위, D. 목표 지표
설명: 이 두 항목은 효과적인 하이퍼파라미터 튜닝을 위해 필수적입니다.
모델 훈련의 다양한 반복에 대한 추적 기능
문제: 모델 훈련의 다양한 반복에 대한 지표, 파라미터, 아티팩트 및 메타데이터를 추적하는 기능은 무엇인가요?
정답: A. Experiments and trials
설명: Experiments and trials 기능은 모델 훈련의 여러 반복을 체계적으로 추적하고 관리하는 데 사용됩니다.