PYTHON/머신러닝9 [PYTHON] 군집분석 Clustering 비지도학습(Unsupervised Learning) 중 군집 분석(Clustering Analysis)은 데이터를 비슷한 특성 또는 패턴을 가진 그룹으로 묶는 기법을 의미합니다. 군집 분석은 데이터 간의 내재적인 구조를 파악하고 이해하기 위해 사용됩니다. 주어진 데이터에 대한 명시적인 레이블이나 타깃 변수가 없는 상황에서 유용하게 활용됩니다. 알고리즘 동작 방식:군집 중심 초기화: 먼저, 군집 중심을 초기화합니다. 초기화 방법은 알고리즘에 따라 다를 수 있으며, 무작위 초기화, 또는 데이터 포인트를 기반으로 초기화하는 등의 방법이 사용될 수 있습니다.군집 할당: 각 데이터 포인트는 가장 가까운 군집 중심에 할당됩니다. 이 때 거리 측정 방법으로는 유클리드 거리나 맨해튼 거리 등이 주로 사용됩니다.군집 .. 2024. 4. 28. [PYTHON] 랜덤 포레스트(Random Forest) 랜덤 포레스트(Random Forest)는 머신러닝에서 강력한 앙상블 학습 기법 중 하나로, 의사 결정 트리(Decision Tree)를 기반으로 합니다. 여러 개의 의사 결정 트리를 생성하고 각각의 트리가 개별적으로 예측한 결과를 결합하여 보다 정확한 예측을 수행합니다. 랜덤 포레스트는 분류(Classification)와 회귀(Regression) 문제에 모두 사용될 수 있습니다. 알고리즘 동작 방식:부트스트랩 샘플링: 먼저, 원본 데이터셋에서 중복을 허용하여 샘플링을 수행합니다. 이 과정을 통해 여러 개의 부트스트랩 샘플(Bootstrap Sample)을 생성합니다.트리 생성: 각각의 부트스트랩 샘플을 사용하여 의사 결정 트리를 생성합니다. 이 때, 무작위로 선택된 특성 집합을 사용하여 트리를 분할합.. 2024. 4. 28. [PYTHON] 앙상블(Ensemble) 앙상블(Ensemble)은 여러 개별 모델의 예측을 결합하여 더 나은 전체적인 예측을 수행하는 기법을 의미합니다. 앙상블은 다양한 모델을 결합하여 각 모델의 약점을 상쇄하고 강점을 극대화하여 더 강력하고 안정적인 예측을 제공합니다. 알고리즘 동작 방식:개별 모델 학습: 먼저, 여러 개별 모델을 다양한 학습 알고리즘을 사용하여 학습합니다. 예를 들어, 결정 트리, 랜덤 포레스트, 그래디언트 부스팅 등의 다양한 모델을 학습할 수 있습니다.예측 결합: 학습된 개별 모델들은 각각의 예측을 수행합니다. 앙상블은 이러한 예측을 결합하여 최종 예측을 만듭니다. 이 과정에서 다양한 결합 방법이 사용될 수 있습니다. 예를 들어, 분류 문제의 경우 다수결 투표(voting), 회귀 문제의 경우 평균 등의 방법이 사용될 .. 2024. 4. 28. [PYTHON] 그리드 탐색(Grid Search) 그리드 탐색(Grid Search)은 머신 러닝 모델의 최적 하이퍼파라미터를 찾기 위해 사용되는 기법 중 하나입니다. 하이퍼파라미터는 모델의 학습 과정에 영향을 주는 매개변수로, 사용자가 직접 설정해야 하는 값입니다. 그리드 탐색은 가능한 모든 하이퍼파라미터 조합에 대해 모델을 평가하고 최적 조합을 찾아내는 방법입니다.알고리즘 동작 방식:하이퍼파라미터 그리드 생성: 먼저 그리드 탐색을 수행할 하이퍼파라미터들과 그들의 후보값들을 지정합니다. 이렇게 하이퍼파라미터들과 후보값들을 조합하여 하이퍼파라미터 그리드를 생성합니다.그리드 탐색 수행: 생성된 하이퍼파라미터 그리드에 대해 교차 검증(cross-validation) 또는 홀드아웃 검증(hold-out validation)을 사용하여 각 하이퍼파라미터 조합에.. 2024. 4. 28. 이전 1 2 3 다음