Zaloguj się lub zarejestruj konto, notatnik
StartDodaj artykułMoje artykułyMoje kontoSzukajPomocKontakt

Kategorie

Strona PDFStrona HTMLPobierzDodaj do notatnika

Analiza skupień



Magda Syrek, ID wpisu: 1526 / 602

Ogólny problem badaczy wielu dyscyplin polega na organizowaniu obserwowanych danych w sensowne struktury lub grupowaniu danych. Na przykład biologowie zanim będą mogli sensownie opisywać różnice między zwierzętami, muszą klasyfikować je.



Pojęcie analizy skupień obejmuje faktycznie kilka różnych algorytmów klasyfikacji. Ogólny problem badaczy wielu dyscyplin polega na organizowaniu obserwowanych danych w sensowne struktury lub grupowaniu danych. Na przykład biologowie zanim będą mogli sensownie opisywać różnice między zwierzętami, muszą klasyfikować je ze względu na gatunki.  

Głównym celem algorytmu aglomeracji jest  łączenie obiektów (np. zwierząt) w coraz to większe spójne grupy (skupienia), z zastosowaniem pewnej miary podobieństwa lub odległości. Wyodrębnienie jednorodnych, ze względu na przyjętą miarę, podzbiorów obiektów dostarcza informacji o strukturze i związkach między zmiennymi. Z tego względu metody analizy skupień stosuje się najczęściej w eksploracyjnej fazie badań, przed sformułowaniem hipotez a priori (statystyka).

Podstawowym elementem poszczególnych metod jest zdefiniowanie miary podobieństwa i odległości. Wybór odpowiedniej miary odległości jest decyzją badacza, z punktu widzenia algorytmu łączenia nie jest istotne czy będą to rzeczywiste odległości, czy też pewne ich pochodne, które z uwagi na cel prowadzonego badania mają dla badacza większe znaczenie.    

Obecnie metody grupowania są stosowane w wielu dziedzinach nauki niezależnie. Podstawowym założeniem stosowalności metody jest ilościowy charakter danych (cech) dla poszczególnych obiektów. Coraz częściej sięga się po badania taksonomiczne w naukach medycznych (analiza danych). Innym popularnym przykładem zastosowania jest grupowanie krajów np. Unii Europejskiej wg wielu cech. Mając np. dane dotyczące służby zdrowia dla każdego z krajów UE w postaci następujących cech: liczba łóżek szpitalnych na tysiąc mieszkańców, liczba lekarzy, liczba szpitali ogólnych, liczba szpitali specjalistycznych, liczba pielęgniarek, liczba karetek, liczba dentystów itp. można, stosując metody analizy skupień, pogrupować kraje i stwierdzić które kraje są najbardziej do siebie podobne ze względu na wymienione cechy (w tym przypadku: pod kątem  jakości, ilości, dostępności służby zdrowia).

 Opcje
Wyślij wiadomość do użytkownika.
Zgłoś naruszenie lub poleć innym ten wpis.
Zobacz wszystkie wpisy tego użytkownika.
Edytuj lub usuń ten wpis.
Podbij lub wyróżnij ten wpis.
Dodanie: 01/10/2009 14:00, odsłony: 134
Słowa kluczowe: skupień, miary, badacza, zwierzętami, algorytmu, podobieństwa, szpitali, opisywać, klasyfikować