Sztuczne sieci neuronowe


Klasyfikacja klientów ze względu na ryzyko kredytowe

Cel

Opracować model do celów klasyfikacji klientów na 2 grupy:

  • klasa 1 - dobre kredyty,
  • klasa 2 - złe kredyty.

Opis sytuacji

Plik tekstowy KREDYTY.TXT zawiera dane historyczne o 1000 kredytach udzielonych przez pewien niemiecki bank, z czego 700 przypadków to dobre kredyty, a 300 - złe.

Zadania

  1. plik tekstowy przekonwertować do formatu EXCELa,
  2. wybrać ostanie 10 przypadków jako dane testowe,
  3. resztę danych podzielić na dane treningowe i walidacyjne (dla SSN),
  4. zbudować model korelacji wielorakiej,
  5. zbudować model przy użyciu sieci neuronowej,
  6. czy są, a jeśli tak - to dlaczego, różnice między tymi dwoma modelami.

Opis atrybutów

Większość atrybutów ma wartości skokowe, część - ciągłe.
Atrybut 1 - stan konta rozrachunkowego:
 1 : ... < 0 DM,
 2 : 0 <= ... < 200 DM,
 3 : ... >= 200 DM/przelewy zarobków od co najmniej roku,
 4 : brak konta;
Atrybut 2 - klient banku od (miesiące)
Atrybut 3 - historia kredytów:
 0 : bez kredytów,
 1 : wszystkie kredyty w tym banku spłacone terminowo
 2 : wszystkie kredyty spłacane terminowo,
 3 : były opóźnienia w spłacaniu kredytów,
 4 : krytyczny rachunek/klient ma kredyty w innych bankach;
Atrybut 4 - cel:
  0 : nowy samochód
  1 : używany samochód,
  2 : meble/wyposażenie,
  3 : RTV,
  4 : AGD,
  5 : remonty,
  6 : edukacja,
  7 : wypoczynek (brak?),
  8 : podnoszenie kwalifikacji (kursy, szkolenia),
  9 : biznes,
 10 : inne;
Atrybut 5 - wielkość kredytu (DM)
Atrybut 6 - lokaty:
 1 : ... < 100 DM,
 2 : 100 <= ... < 500 DM,
 3 : 500 <= ... < 1000 DM,
 4 .. >= 1000 DM,
 5 : brak lokat;
Atrybut 7 - zatrudniony od:
 1 : bezrobotny,
 2 : ... < 1 rok,
 3 : 1 <= ... < 4 lata,
 4 : 4 <= ... < 7 lat,
 5 : .. >= 7 lat;
Atrybut 8 - wartość spłaty kredytu jako procent miesięcznych dochodów
Atrybut 9 - dane osobiste i płeć:
 1 : mężczyzna : rozwiedziony/w separacji,
 2 : kobieta : rozwiedziona/w separacji/zamężna,
 3 : mężczyzna : kawaler,
 4 : mężczyzna : żonaty/wdowiec,
 5 : kobieta : panna;
Atrybut 10 - współpożyczkobiorcy/żyranci:
 1 : brak,
 2 : współpożyczkobiorcy,
 3 : żyranci;
Atrybut 11 - stały mieszkaniec od (lata)
Atrybut 12 - majątek:
 1 : nieruchomości,
 2 : jeśli nie 1 : wkład mieszkaniowy/polisa ubezpieczeniowa,
 3 : jeśli nie 1/2 : samochód lub inne (ale nie atrybut 6),
 4 : brak danych/brak majątku;
Atrybut 13 - wiek (lata))
Atrybut 14 - inne spłaty:
 1 : bank,
 2 : sklepy,
 3 : brak;
Atrybut 15 - mieszkanie:
 1 : wynajmowane,
 2 : własne,
 3 : darmowe;
Atrybut 16 - liczba kredytów w tym banku
Atrybut 17 - zatrudnienie:
 1 : bezrobotny/niewykwalifikowany - praca czasowa,
 2 : niewykwalifikowany - stała praca,
 3 : wykwalifikowany/urzędnik,
 4 : kadra zarządzająca/samozatrudnienie/wysokowykwalifikowany urzędnik;
Atrybut 18 - liczba osób żyjących we wspólnocie majątkowej
Atrybut 19 - telefon:
 1 : brak,
 2 : zarejestrowany na kredytobiorcę;
Atrybut 20 (wyjściowy) - klasa klienta:
 1 : dobry kredytobiorca,
 2 : zły kredytobiorca.