Sztuczne sieci neuronowe
Klasyfikacja klientów ze względu na ryzyko kredytowe
Cel
Opracować model do celów klasyfikacji klientów na 2 grupy:
- klasa 1 - dobre kredyty,
- klasa 2 - złe kredyty.
Opis sytuacji
Plik tekstowy KREDYTY.TXT zawiera dane historyczne o 1000 kredytach udzielonych przez pewien niemiecki bank, z czego 700 przypadków to dobre kredyty, a 300 - złe.
Zadania
- plik tekstowy przekonwertować do formatu EXCELa,
- wybrać ostanie 10 przypadków jako dane testowe,
- resztę danych podzielić na dane treningowe i walidacyjne (dla SSN),
- zbudować model korelacji wielorakiej,
- zbudować model przy użyciu sieci neuronowej,
- czy są, a jeśli tak - to dlaczego, różnice między tymi dwoma modelami.
Opis atrybutów
Większość atrybutów ma wartości skokowe, część - ciągłe.
Atrybut 1 - stan konta rozrachunkowego:
1 : ... < 0 DM,
2 : 0 <= ... < 200 DM,
3 : ... >= 200 DM/przelewy zarobków od co najmniej roku,
4 : brak konta;
Atrybut 2 - klient banku od (miesiące)
Atrybut 3 - historia kredytów:
0 : bez kredytów,
1 : wszystkie kredyty w tym banku spłacone terminowo
2 : wszystkie kredyty spłacane terminowo,
3 : były opóźnienia w spłacaniu kredytów,
4 : krytyczny rachunek/klient ma kredyty w innych bankach;
Atrybut 4 - cel:
0 : nowy samochód
1 : używany samochód,
2 : meble/wyposażenie,
3 : RTV,
4 : AGD,
5 : remonty,
6 : edukacja,
7 : wypoczynek (brak?),
8 : podnoszenie kwalifikacji (kursy, szkolenia),
9 : biznes,
10 : inne;
Atrybut 5 - wielkość kredytu (DM)
Atrybut 6 - lokaty:
1 : ... < 100 DM,
2 : 100 <= ... < 500 DM,
3 : 500 <= ... < 1000 DM,
4 .. >= 1000 DM,
5 : brak lokat;
Atrybut 7 - zatrudniony od:
1 : bezrobotny,
2 : ... < 1 rok,
3 : 1 <= ... < 4 lata,
4 : 4 <= ... < 7 lat,
5 : .. >= 7 lat;
Atrybut 8 - wartość spłaty kredytu jako procent miesięcznych dochodów
Atrybut 9 - dane osobiste i płeć:
1 : mężczyzna : rozwiedziony/w separacji,
2 : kobieta : rozwiedziona/w separacji/zamężna,
3 : mężczyzna : kawaler,
4 : mężczyzna : żonaty/wdowiec,
5 : kobieta : panna;
Atrybut 10 - współpożyczkobiorcy/żyranci:
1 : brak,
2 : współpożyczkobiorcy,
3 : żyranci;
Atrybut 11 - stały mieszkaniec od (lata)
Atrybut 12 - majątek:
1 : nieruchomości,
2 : jeśli nie 1 : wkład mieszkaniowy/polisa ubezpieczeniowa,
3 : jeśli nie 1/2 : samochód lub inne (ale nie atrybut 6),
4 : brak danych/brak majątku;
Atrybut 13 - wiek (lata))
Atrybut 14 - inne spłaty:
1 : bank,
2 : sklepy,
3 : brak;
Atrybut 15 - mieszkanie:
1 : wynajmowane,
2 : własne,
3 : darmowe;
Atrybut 16 - liczba kredytów w tym banku
Atrybut 17 - zatrudnienie:
1 : bezrobotny/niewykwalifikowany - praca czasowa,
2 : niewykwalifikowany - stała praca,
3 : wykwalifikowany/urzędnik,
4 : kadra zarządzająca/samozatrudnienie/wysokowykwalifikowany urzędnik;
Atrybut 18 - liczba osób żyjących we wspólnocie majątkowej
Atrybut 19 - telefon:
1 : brak,
2 : zarejestrowany na kredytobiorcę;
Atrybut 20 (wyjściowy) - klasa klienta:
1 : dobry kredytobiorca,
2 : zły kredytobiorca.