Parameters.
- iris_data: 문제지. feature. X.
- iris_label: 정답. label. Y.
- _train: 학습용 데이터
- _test: 테스트용 데이터
- test_size: test dataset의 크기. ex) 0.2: 전체의 20%를 사용함.
- random_state: train 데이터와 test 데이터를 분리하는데 적용되는 무작위성 결정.
- train_test_split: 함수가 train 데이터와 test 데이터에 각 품종 카테고리가 균일하게 잘 섞일수 있도록 데이터셋을 만들어냄.
링크
- 의사결정 나무: https://ratsgo.github.io/machine%20learning/2017/03/26/tree/
- 랜덤 포레스트: https://blog.tensorflow.org/2021/05/introducing-tensorflow-decision-forests.html
- 오차행렬: https://manisha-sirsat.blogspot.com/2019/04/confusion-matrix.html
- toy dataset: https://scikit-learn.org/stable/datasets/toy_dataset.html
- 손글씨: https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_digits.html#sklearn.datasets.load_digits
- 와인: https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_wine.html#sklearn.datasets.load_wine
- 유방암: https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_breast_cancer.html#sklearn.datasets.load_breast_cancer