Problem klastrowania


Cel

Celem ćwiczenia jest poznanie możliwości sieci neuronowych jako narzędzi klastrowania.


Klastrowanie i sieci

Problemy klastrowania występują powszechnie w zarządzaniu, jednak szczególne znaczenie mają w marketingu. Pomocne mogą być tutaj sieci typu SOM (samoorganizująace się mapy Kohonena). Celem SOM jest odkrywanie istotnych wzorców czy cech w danych wejściowych bez udziału nauczyciela. Zmiany wag są lokalne - ograniczone do bezpośredniego sąsiedztwa neuronu. W trakcie procesu uczenia neurony starają się przesunąć w kierunku zagęszczeń danych i wytworzyć swoje strefy wpływów (dominacji). Uczenie odbywa się na zasadzie konkurencji, tzn. neurony rywalizują ze sobą o możliwość zagarnięcia indywidualnych punktów danych. Na koniec procesu uczenia cała przestrzeń cech zostaje podzielona na rozdzielne i spójne strefy wpływów poszczególnych neuronów, co odpowiada pogrupowaniu danych wejściowych; skupienia reprezentowane są przez poszczególne neurony (prototypy) tworzące centra tych skupień.


Zagadnienia

  1. ściągnąć do swojego katalogu skoroszyt NNclust.xls,
  2. zapoznać się z instrukcją,
  3. ściągnąć do swojego katalogu skoroszyt World.xls, który zawiera dane demograficzne świata z 1994 roku,
  4. zbudować sieć dla problemu grupowania krajów pod względem rozwoju demograficzno-społecznego (spróbować różne rozmiary warstwy wyjściowej, być może trzeba przeprowadzić wstępną obróbkę danych); czy da się wyciągnąć jakieś wnioski dotyczące podobieństwa poszczególnych krajów, czy można je jakoś uzasadnić.