# clustering

투수의 디셉션을 정량적 평가하기(2)
이전 칼럼 '투수의 디셉션을 정량적 평가하기(1)'에서는 Jon Anderson의 방법을 통해 투수의 패스트볼 디셉션을 정량화하는 방법을 살펴보았습니다. 이번 칼럼에서는 2023년 MLB 데이터를 사용하여 투수들의 디셉션을 더 깊이 분석해보겠습니다.

투수의 디셉션을 정량적 평가하기(1)
Photo by Keith Johnston on Unsplash투수의 패스트볼 디셉션을 정량화하는 방법에 대해 이야기해보겠습니다.Jon Anderson의 블로그 글 "Quantifying Pitcher Fastball Deception"은 야구 통계학 분야에서 투수의

2023 이노씽크 메이커톤 (기획)
우연한 계기로 학교에서 주최하는 좋은 대회를 알게 되었고 실제 킥보드를 많이 사용했던 유저로서 굉장히 흥미로운 주제였기에 바로 참여를 하게 되었다.
계층적 클러스터링 응용
저번에 K-Mean 클러스터링을 구현하려고 고생하던 와중에 K값을 카메라 distance값에 따라 찾아 나가는 방식을 고민했는데그냥 그대로 클러스터링 해버리면 안되나...? 라는 생각이 들어 찾아보니 비슷한 방법이 이 계층적 클러스터링 (Hiarachical Clust
Mapkit과 Clustering
가까운 위치에 뜬 Annotation들이 너무 많으면 오히려 가독성이 떨어지는 문제가 있었다.그래서 Map Annotation들을 묶어서 그 Center location에 Annotation갯수를 보여주는 새로운 Clustered Annotation을 만들고 싶어서 공

유데미 큐레이션 자동 추천 검색어 AI 개발 (프로젝트 발표)
클러스터링(Clustering)은 데이터를 비슷한 특성을 가진 여러 그룹으로 나누는 머신러닝의 비지도 학습 기법이다. 이 방법은 데이터 내 숨겨진 패턴을 발견하거나 데이터 구조를 이해하는 데 유용하게 사용된다. 클러스터링 알고리즘은 다양한 기준과 방법론을 가지고 있으며

[ML] K-Means Clustering & Mixture of Gaussian Clustering
K-means & MoG Clustering

About Clustering (k-means, hierarchical clustering, DBSCAN)
클러스터링 기법에 관하여 : K-means, 계층적 클러스터링, DBSCAN

[Data Science] Clustering (2) Partitioning Method; K-Means, PAM(K-Medoids), K-modes, CLARA
☑️ what) N개의 데이터를 K개의 클러스터로 나눈다.클러스터의 representative (e.g. centroid, medoid)를 정하고, 다음 식의 클러스터별 총합이 최소가 되도록 나눈다.🥲 pb) $K$가 hyper-parameter이다, non-con

[TIL | 230614] 군집화 - k-means, GMM, DBSCAN
참고도서 : 파이썬 머신러닝 완벽가이드 개정 2판: 군집 중심점(centroid)이라는 특정한 임의의 지점을 선택해 해당 중심에 가장 가까운 포인트들을 선택하는 군집화 기법일반적인 군집화에서 가장 많이 활용되는 알고리즘알고리즘이 쉽고 간결거리 기반 알고리즘으로 속성의

제로베이스 데이터취업스쿨 DAY58 머신러닝21~23
PCA 함수 만들기 iris 데이터 분석 wine 데이터 분석 주성분 2개 주성분 3개  고객 세분화, 소셜 네트워크 분류, 기사 그룹 분류, ..데이터를 k 개를 클러스터(그룹)

TFT 데이터분석 - 메인 덱 클러스터링 (2)
이전 포스트에서 이어지는 포스트이다.이전 포스트에서 EDA를 통해 얻은 특징을 바탕으로 모델링을 시작했다.
2023.03.22.WED
[ 메인 프로젝트 ] DB clustering (수평 구조) DB 서버를 여러 개 두고 서버 한 대가 죽었을 때 대비하는 것 동일한 DB를 여러 개의 서버가 관리. 로드밸런싱 가능 Active-Active 방식, Active-StandBy 방식 여러 대의 서버가 동일한 DB를 공유하므로 병목 현상 발생 가능 https://mangkyu.t...

[ML] 군집분석
9. 군집 분석 9-1. 군집 분석 군집 : 데이터 집합 내에 존재하는 의미 있거나 유용성 있는, 또는 의미도 있고 유용성도 있는 그룹 군집 분석 : 레코드들로 이루어진 데이터 집합을 그 레코드를 구성하는 속성 정보만 사용해 그룹으로 나누는 기법 클러스터링 (Clu
Sensitive Properties Key [nifi.sensitive.props.key] not found Error
Sensitive Properties Key
sklearn - Loading data
sklearn을 이용하여 data 로딩하기. classification과 clustering을 위한 데이터 로딩. 기본적인 데이터 로딩, 데이터 split, 학습, 예측, 정확도 측정 코드가 있습니다.