 |  |  |  |  | | | | |
|  | |
|  | |  |
 Magda Syrek, ID wpisu: 1526 / 602

Ogólny problem badaczy wielu dyscyplin polega na organizowaniu obserwowanych danych w sensowne struktury lub grupowaniu danych. Na przykład biologowie zanim będą mogli sensownie opisywać różnice między zwierzętami, muszą klasyfikować je.
 Pojęcie analizy skupień obejmuje faktycznie kilka różnych algorytmów klasyfikacji. Ogólny problem badaczy wielu dyscyplin polega na organizowaniu obserwowanych danych w sensowne struktury lub grupowaniu danych. Na przykład biologowie zanim będą mogli sensownie opisywać różnice między zwierzętami, muszą klasyfikować je ze względu na gatunki.
Głównym celem algorytmu aglomeracji jest łączenie obiektów (np. zwierząt) w coraz to większe spójne grupy (skupienia), z zastosowaniem pewnej miary podobieństwa lub odległości. Wyodrębnienie jednorodnych, ze względu na przyjętą miarę, podzbiorów obiektów dostarcza informacji o strukturze i związkach między zmiennymi. Z tego względu metody analizy skupień stosuje się najczęściej w eksploracyjnej fazie badań, przed sformułowaniem hipotez a priori (statystyka).
Podstawowym elementem poszczególnych metod jest zdefiniowanie miary podobieństwa i odległości. Wybór odpowiedniej miary odległości jest decyzją badacza, z punktu widzenia algorytmu łączenia nie jest istotne czy będą to rzeczywiste odległości, czy też pewne ich pochodne, które z uwagi na cel prowadzonego badania mają dla badacza większe znaczenie.
Obecnie metody grupowania są stosowane w wielu dziedzinach nauki niezależnie. Podstawowym założeniem stosowalności metody jest ilościowy charakter danych (cech) dla poszczególnych obiektów. Coraz częściej sięga się po badania taksonomiczne w naukach medycznych (analiza danych). Innym popularnym przykładem zastosowania jest grupowanie krajów np. Unii Europejskiej wg wielu cech. Mając np. dane dotyczące służby zdrowia dla każdego z krajów UE w postaci następujących cech: liczba łóżek szpitalnych na tysiąc mieszkańców, liczba lekarzy, liczba szpitali ogólnych, liczba szpitali specjalistycznych, liczba pielęgniarek, liczba karetek, liczba dentystów itp. można, stosując metody analizy skupień, pogrupować kraje i stwierdzić które kraje są najbardziej do siebie podobne ze względu na wymienione cechy (w tym przypadku: pod kątem jakości, ilości, dostępności służby zdrowia). |
|
|  | | Słowa kluczowe: skupień, miary, badacza, zwierzętami, algorytmu, podobieństwa, szpitali, opisywać, klasyfikować |  | |
|  | |
|
| |
|