행렬의 값이 대부분 0인 경우를 가리키는 표현.
데이터 마이닝 시, 주로 사용되며 배열의 0의 값까지 모두 반영하게 되면 수행시간이 오래 걸릴 수 있으므로 주로 comp matrix
로 정제하여 사용한다. 특히, 인공지능 및 빅데이터에서 사용되는 언어는 python
인 경우가 많은데, 해당 언어는 컴파일링 언어에 속하지 않으므로, 정제하지 않으면 더욱 비효율적인 메모리 낭비가 일어날 수 있기에 조심해야 한다.
추가적으로
python
의numpy
라이브러리의 행렬 연산과 scipy 라이브러리의sparse matrix format
을 사용하면서,reshape
와broadcasting
기법을 이용하면 해당 문제를python
에서도 해결할 수 있다고 한다.