|
Definicja
|
|
Grupowanie (analiza skupień) jest to pojęcie z zakresu eksploracji danych oraz uczenia maszynowego, wywodzące się z szerszego pojęcia, jakim jest klasyfikacja bezwzorcowa. Analiza skupień jest metodą tzw. klasyfikacji bez nadzoru dokonująca grupowania elementów we względnie jednorodne klasy. Podstawą grupowania w większości algorytmów jest podobieństwo pomiędzy elementami – wyrażone przy pomocy funkcji podobieństwa.
|
|
|
Grupowanie danych w tabeli
|
|
Standardowa funkcja grupowania pozwala na grupowanie danych wg każdej, dowolnej kolumny tabeli, można to wykorzystać do łączenia wierszy szczegółów tabeli w zbiory danych powiażane wspólną unikalną informacją danej kolumny.
|
|
|
Sumy cząstkowe
|
|
Pogrupowane dane moga zawierać kolumny wartościowe np. ilość sztuk, wagę itp. Dane te można sumować nie tylko dla całej tabeli, ale także przy każdej zmianie grupy. Wartości sum częściowych stanowią agregację pól liczbowych w wierszach szczegółów. Pojęcie Sumy Cząstkowe dotcyzy nie tylko procedury tworzenia sum , ale można także obliczać wartości minimalne, maksymalne lub średnią dla danych danej kolumny.
|
|