Inhaltsübersicht
I. Ziel
der Insolvenzanalyse
II. Probleme
der traditionellen Analyse zur Insolvenzfrüherkennung
III. Moderne
Verfahren zur Insolvenzfrüherkennung
IV. Möglichkeiten
zur Messung der Güte von Systemen zur Insolvenzfrüherkennung
V. Ermittlung
von Insolvenzwahrscheinlichkeiten
VI. Einsatzmöglichkeiten
und Grenzen von Systemen zur Insolvenzfrüherkennung
I. Ziel der
Insolvenzanalyse
Die Insolvenzanalyse dient dazu, möglichst frühzeitig zu
erkennen, ob ein Unternehmen insolvenz- bzw. bestandsgefährdet ist oder nicht.
Vor allem sind Fremdkapitalgeber an einer Insolvenzanalyse interessiert. Vom
Ergebnis dieser Analyse hängt ab, ob sie dem betreffenden Unternehmen einen
Kredit gewähren oder nicht und wie sie die Preise dafür gestalten. Auch
Lieferanten und Kunden interessieren sich dafür, wie bestandsfest oder
bestandsgefährdet das Unternehmen ist, das sie beliefern bzw. dessen Leistungen
sie in Anspruch nehmen – Lieferanten, da sie gegenüber dem Unternehmen eine
Gläubigerstellung einnehmen – Kunden, wenn langfristige Lieferbeziehungen
angestrebt werden und Gewährleistungspflichten zu erfüllen sind. Auch für
Wirtschaftsprüfer (WP) ist eine Insolvenzanalyse insbesondere vor dem
Hintergrund der Pflichten nach dem KonTraG von großer Bedeutung. Weitere
Interessenten sind Gesellschafter, Unternehmensleitung, Beteiligungscontroller
und Arbeitnehmer (Baetge, J.
1998a).
Hinweise auf eine Insolvenzgefahr gibt die wirtschaftliche
Lage des Unternehmens. Die wirtschaftliche Lage eines Unternehmens lässt sich
z.B. aus qualitativen Faktoren wie der Managementqualität, der
Branchenentwicklung, der Entwicklung der Absatzmärkte und dem Jahresabschluss
ableiten. Dem Jahresabschluss kommt bei der Beurteilung der wirtschaftlichen
Lage eine zentrale Bedeutung zu, da er für viele Interessengruppen das einzige
verfügbare Informationsinstrument ist und er zudem nach einheitlichen – wenn
auch auslegbaren – Grundsätzen
ordnungsmäßiger Buchführung aufgestellt wird.
Mit Hilfe der Jahresabschlussanalyse, auch Bilanzanalyse
genannt, soll ein Gesamturteil über die wirtschaftliche Lage des analysierten
Unternehmens getroffen werden. Bei der Insolvenzanalyse wird aus diesem
Gesamturteil abgeleitet, wie hoch die Insolvenzgefährdung des analysierten
Unternehmens ist. Dies geschieht durch Angabe einer Insolvenzwahrscheinlichkeit
für das analysierte Unternehmen. Je nachdem, ob diese über oder unter dem
Durchschnitt in Deutschland liegt, kann die Aussage getroffen werden, dass das
analysierte Unternehmen eine über- oder unterdurchschnittliche
Insolvenzgefährdung aufweist.
II. Probleme
der traditionellen Analyse zur Insolvenzfrüherkennung
Die wirtschaftliche Lage eines Unternehmens, die bei der
Insolvenzanalyse untersucht werden muss, setzt sich aus den drei Teillagen Vermögenslage;
Finanzlage und Ertragslage
zusammen (Leffson, 1984).
Jede dieser Lagen ist in verschiedene Informationsbereiche gegliedert, z.B.
gehören zur Vermögenslage
die Informationsbereiche Kapitalbindung und Kapitalstruktur. Für jeden
Informationsbereich können mit verschiedenen Kennzahlen die Informationen des
Jahresabschlusses auf einer ersten Aggregationsstufe verdichtet werden. Jede
Kennzahl gibt einen bestimmten Sachverhalt komprimiert wieder (Staehle, 1969).
Bei der Kennzahlenbildung sollten einige Grundsätze beachtet werden:
(a)
Es sollten nur Verhältniszahlen gebildet werden.
(b)
Für jede Kennzahl sollte eine Arbeitshypothese
gebildet werden können (Insolvente > Solvente oder Insolvente <
Solvente), d.h. Bildung einer Hypothese, ob diese Kennzahl durchschnittlich
bei insolventen Unternehmen größer ausfällt als bei solventen oder umgekehrt.
(c)
Der Nenner einer Kennzahl sollte nicht Null werden
können.
(d)
Zähler und Nenner einer Kennzahl sollten nicht
gleichzeitig negativ werden können.
(e)
Die Kennzahlen sollten betriebswirtschaftlich
plausibel sein.
Bei der traditionellen Analyse zur Insolvenzfrüherkennung hat
der Analytiker die Aufgabe, die für die Insolvenzfrüherkennung relevanten
Kennzahlen auszuwählen, diese Kennzahlen zu gewichten und so zu einem
Gesamturteil zusammenzufassen, dass das Ziel der Insolvenzanalyse, eine
zuverlässige Insolvenzfrüherkennung, möglichst gut erreicht wird. Dabei ist der
Analytiker auf seine subjektiven Erfahrungen angewiesen. Mit einer subjektiven
Kennzahlenauswahl ist indes weder sichergestellt, dass gerade die für die
Insolvenzfrüherkennung relevanten Kennzahlen noch dass alle relevanten
Kennzahlen herangezogen werden, d.h. es ist nicht gewährleistet, dass das
Ganzheitlichkeitsprinzip befolgt wird (Baetge, J.
1998a). Das Ganzheitlichkeitsprinzip sollte bei der Analyse zur
Insolvenzfrüherkennung indes immer befolgt werden, damit alle wesentlichen
Informationen beachtet werden, so dass die Qualität des Gesamturteils nicht
gemindert wird.
Eine ganzheitliche Kennzahlenauswahl unterstützt auch das
Neutralisierungsprinzip (Baetge, J.
1998a), das besagt, dass die Kennzahlen so gewählt und verdichtet werden
sollten, dass das Gesamturteil von wahrgenommenen Ausweiswahlrechten,
Sachverhaltsgestaltungen und bilanzpolitischen Maßnahmen unbeeinflusst ist.
Dies kann zum einen dadurch erreicht werden, dass die Kennzahlen ganzheitlich
ausgewählt werden, da in diesem Fall eine bilanzpolitische Maßnahme neben der
vom Bilanzierenden gewünschten Kennzahl evtl. auch weitere Kennzahlen
gegenläufig beeinflussen wird. Der vom Bilanzierenden gewünschte Effekt auf das
Gesamturteil könnte somit aufgehoben bzw. neutralisiert werden. Zum anderen
wird dem Neutralisierungsprinzip Genüge getan, wenn „ intelligente “ Kennzahlen
gebildet werden, die jene Unternehmen, die Wahlrechte unterschiedlich ausüben,
gleiche Sachverhalte unterschiedlich gestalten oder bilanzpolitische Maßnahmen
getroffen haben, vergleichbar machen, d.h. die jeweiligen Maßnahmen
neutralisieren. Allerdings sollten nur jene „ intelligenten “ Kennzahlen
herangezogen werden, die genau die Ausweiswahlrechte, Sachverhaltsgestaltungen
und bilanzpolitischen Maßnahmen neutralisieren, die von den Unternehmen
wahrgenommen werden und die somit einen wirklichen Vorteil für die
Urteilsbildung gegenüber herkömmlichen Kennzahlen bedeuten.
Das Objektivierungsprinzip gewährleistet, dass nur die für
die Beurteilung der wirtschaftlichen Lage relevanten Kennzahlen zur
Gesamturteilsbildung herangezogen werden (Baetge, J.
1998a). Dies bedeutet, dass die Kennzahlen so ausgewählt und zusammengefasst
werden, dass eine Falschbeurteilung äußerst selten vorkommt. Anhand von
Beispielfällen von sehr vielen Jahresabschlüssen solventer und später insolvent
gewordener Unternehmen wird dies empirisch mit Hilfe von statistischen
Verfahren und Verfahren der Künstlichen Intelligenz trainiert und gemessen. Zum
einen wird das Gesamturteil über die Insolvenzgefährdung eines Unternehmens so
intersubjektiv nachprüfbar, d.h. verschiedene Analytiker kommen mit dieser
Methode zu dem gleichen Urteil über ein Unternehmen. Zum anderen kann empirisch
nachweisbar eine Minimierung von Fehlurteilen gewährleistet werden. Würden
dagegen nur subjektive Erfahrungen bei der Auswahl und Gewichtung der
Kennzahlen verwendet, könnte dasselbe Unternehmen von verschiedenen Analytikern
unterschiedlich beurteilt werden. Dies tritt insbesondere dann auf, wenn der
Analytiker einzelne Kennzahlenwerte zusammenfassen muss, wobei einige
Kennzahlenwerte das Unternehmen als solvent und andere Kennzahlenwerte das
Unternehmen als insolvenzgefährdet darstellen.
Die dargestellten Schwierigkeiten bei der Kennzahlenauswahl,
-gewichtung und -zusammenfassung treten nicht nur bei der traditionellen
Analyse zur Insolvenzfrüherkennung, sondern auch bei so genannten
Scoring-Verfahren auf. Bei einem Scoring-Modell zur Unternehmensbeurteilung,
das hier als Nutzwertanalyse oder Punktbewertungsmodell verstanden wird (Adam, 1996),
müssen in einem ersten Schritt die zu verwendenden Kennzahlen und deren
Gewichtung durch die Ersteller des Modells, bei denen es sich oft um eine
Expertengruppe handelt, anhand subjektiver Erfahrungen bestimmt werden.
Kennzahlen sind metrisch skalierbar und können direkt in einen
Beurteilungsindex eingehen. Beim Scoring werden die möglichen
Kennzahlenausprägungen i.d.R. in bestimmte Intervalle aufgeteilt, und diesen
werden Punktwerte bzw. Nutzenwerte zugewiesen, die wiederum subjektiv bestimmt
werden. Dadurch wird das Gesamturteil noch subjektiver und es gehen
Informationen verloren. Scoring-Verfahren haben indes gegenüber der
traditionellen Vorgehensweise den Vorteil, dass mit einem einmal erstellten
Scoring-Modell jeder Analytiker dem gleichen Unternehmen auch die gleiche
Insolvenzgefährdung zuweist und die Urteilsfindung daher intersubjektiv
nachprüfbar ist. Das Gesamturteil ist allerdings nicht objektiv richtig (Weber,
M./Krahnen, /Weber, A. 1995), sondern nur quasi-objektiv, da die
Kennzahlen, wie auch bei der traditionellen Insolvenzanalyse subjektiv
ausgewählt, gewichtet und zusammengefasst werden. Mit modernen Verfahren der
Insolvenzanalyse wie der Multivariaten Diskriminanzanalyse und der Künstlichen
Neuronalen Netzanalyse ist hingegen eine Gesamturteilsbildung möglich, die dem
Ganzheitlichkeitsprinzip, dem Neutralisierungsprinzip und dem
Objektivierungsprinzip entspricht.
III. Moderne
Verfahren zur Insolvenzfrüherkennung
1. Multivariate
Diskriminanzanalyse
Mit der linearen Multivariaten Diskriminanzanalyse kann
analysiert werden, welche Variablen besonders gut dazu geeignet sind, bestimmte
Gruppen zu unterscheiden (Backhaus,
/Erichson, /Plinke, et al.1996). Für den Fall der
Insolvenzfrüherkennung von Unternehmen kann mit der linearen Multivariaten
Diskriminanzanalyse ermittelt werden, welche Kennzahlen besonders zur Trennung
solventer und insolvenzgefährdeter Unternehmen geeignet sind. Multivariat
bedeutet, dass die Gruppen anhand von mehreren Variablen bzw. Kennzahlen
getrennt werden. Die Multivariate Diskriminanzanalyse läuft in drei Schritten
ab:
1.
Ermittlung der Diskriminanzfunktion;
2.
Festlegung des Trennwerts;
3.
Prüfung der Klassifikationsleistung der Funktion.
Im ersten Schritt der Multivariaten Diskriminanzanalyse
werden die Kennzahlen ausgewählt, in einer Diskriminanzfunktion gewichtet und
linear zusammengefasst:
Dies kann z.B. mit dem Verfahren der schrittweisen
Diskriminanzanalyse geschehen. Dazu wird zuerst die Kennzahl in die
Diskriminanzfunktion aufgenommen, deren Ausprägungen in den für die
Untersuchung zur Verfügung stehenden Jahresabschlüssen den größten Unterschied
zwischen solventen und insolvenzgefährdeten Unternehmen aufweisen. Danach wird
die Kennzahl in die Diskriminanzfunktion gewählt, die zusammen mit der bereits
ausgesuchten Kennzahl solvente und insolvenzgefährdete Unternehmen am besten
trennt. Dies wird fortgeführt, bis keine signifikante Verbesserung mehr
erreicht werden kann, wenn eine neue Kennzahl aufgenommen wird.
Im Idealfall sollten die relevanten Kennzahlen anhand einer
großen Menge von Jahresabschlüssen bzw. zugehörigen Kennzahlenwerten solventer
und Jahre später insolvent gewordener Unternehmen aus einem großen, auch
„ intelligente “ Kennzahlen umfassenden Kennzahlenkatalog optimal ausgewählt und
gewichtet werden, so dass das Neutralisierungsprinzip, das
Ganzheitlichkeitsprinzip und das Objektivierungsprinzip befolgt werden können.
Für solche empirischen Analysen muss ein Kriterium bestimmt
werden, anhand dessen die Insolvenz erkannt werden kann, d.h. festgestellt
werden kann, ob ein empirischer Datensatz als zu einem insolventen Unternehmen gehörig
bezeichnet werden kann. Dabei kann kaum auf die gesetzlichen Kriterien wie Überschuldung
oder Zahlungsunfähigkeit
zurückgegriffen werden, da diese Information i.d.R. nicht vorliegt. Daher sind
für jedes Unternehmen bekannte andere, möglichst objektive Kriterien
heranzuziehen, wie die juristischen Kriterien Konkurs, Moratorium oder Scheck-
bzw. Wechselprotest, die oft im Zusammenhang mit der Überschuldung
oder Zahlungsunfähigkeit
stehen.
Die zur Verfügung stehenden Daten werden für die Multivariate
Diskriminanzanalyse in eine Analysestichprobe und eine Kontrollstichprobe
aufgeteilt. Die Analysestichprobe dient der Ermittlung der
Diskriminanzfunktion. Anhand der Kontrollstichprobe wird im dritten Schritt der
Multivariaten Diskriminanzanalyse die Klassifikationsleistung der
Diskriminanzfunktion geprüft. Im zweiten Schritt der Multivariaten
Diskriminanzanalyse wird ein kritischer Diskriminanzwert für die Trennung in
solvente und insolvenzgefährdete Unternehmen bestimmt. Dieser Trennwert teilt
die Skala der Diskriminanzwerte (D-Werte = Rating-Urteile). Alle Unternehmen
mit einem D-Wert über dem Trennwert werden als „ solvent “ und alle Unternehmen
mit einem D-Wert unter dem Trennwert werden als „ insolvenzgefährdet “
klassifiziert (oder umgekehrt, je nach Transformation der Skala). Von der Wahl
des Trennwerts hängt ab, wie viele Unternehmen falsch klassifiziert werden. Die
Wahl des Trennwerts lässt sich anhand von ökonomischen Kriterien, z.B.
Fehlerkosten und Beurteilungskosten, optimieren.
2. Künstliche
Neuronale Netzanalyse
a) Informationsverarbeitung
in einem Künstlichen Neuronalen Netz
Ein Künstliches Neuronales Netz besteht ähnlich einem
biologischen neuronalen Netz (z.B. dem menschlichen Gehirn) aus miteinander
verbundenen Zellen, den so genannten Neuronen (Rojas, 1996).
Die Neuronen eines Künstlichen Neuronalen Netzes sind meist in Schichten
angeordnet. Die Neuronen aufeinander folgender Schichten sind miteinander
verbunden (vgl. Abb. 1). Die Neuronen der Eingabeschicht nehmen
Informationen in das Netz auf, die Neuronen der versteckten Schicht(en)
verarbeiten die Informationen für den Anwender unsichtbar im Netzinnern. Von
dort werden sie an das (die) Neuron(en) der Ausgabeschicht geleitet. In der
Ausgabeschicht wird die Netzausgabe berechnet und an die Außenwelt gegeben (Zell, 1996).
Abb. 1: Struktur eines Künstlichen Neuronalen Netzes
Die Verbindungen zwischen den Neuronen aufeinander folgender
Schichten repräsentieren Gewichte. Die Eingabe in ein künstliches Neuron wird
meist als die Summe aus den mit den Verbindungsgewichten multiplizierten
Ausgaben der Vorgängerneuronen berechnet (Propagierungsfunktion). Bei Neuronen
der Eingabeschicht wird die von außen erfolgende Netzeingabe direkt, i.d.R.
noch transformiert, übernommen.
Die Aktivierung des Neurons wird aus der Eingabe mit Hilfe
einer Aktivierungsfunktion berechnet. Mögliche Aktivierungsfunktionen sind die
sigmoiden, d.h. s-förmigen Funktionen, die logistische Funktion und der Tangens
hyperbolicus, mit denen der Einfluss von Ausreißern gemildert wird. Weitere
Aktivierungsfunktionen sind die lineare Funktion und die Schwellwertfunktion,
bei der die Eingabe in das Neuron einen bestimmten Schwellwert überschreiten
muss, damit ein Aktivierungszustand ungleich Null erreicht wird.
Die Ausgabe des Neurons wird mittels einer Ausgabefunktion
(i.d.R. die Identitätsfunktion) aus der Aktivierung des Neurons berechnet. Aus
den Ausgaben dieses Neurons, der weiteren Neuronen der gleichen Schicht und
ihren jeweiligen Verbindungsgewichten zu den Neuronen der nachfolgenden Schicht
werden wieder die Eingaben in die Neuronen der nachfolgenden Schicht berechnet.
Diese Informationsverarbeitung setzt sich bis zu den Neuronen der
Ausgabeschicht fort. In Abb. 2 ist die Informationsverarbeitung in einem
künstlichen Neuron schematisch dargestellt.
Abb. 2: Informationsverarbeitung in einem künstlichen Neuron
Die Netzausgabe (der N-Wert) resultiert aus einer Kette von
Funktionen, deren Variablen die Netzeingaben und die Verbindungsgewichte sind.
Die Netzeingaben sind für den Fall der Insolvenzanalyse i.d.R.
Jahresabschlusskennzahlen. Diese Kennzahlen werden, wie oben beschrieben, durch
das Netz bis zur Netzausgabe, dem Gesamturteil über das Unternehmen,
verarbeitet. Die Verbindungsgewichte müssen dabei so gewählt werden, dass das
Gesamturteil möglichst zutrifft. Der optimale Gewichtsvektor kann bei der
Künstlichen Neuronalen Netzanalyse über so genannte Lernalgorithmen gefunden
werden, mit denen die Verbindungsgewichte nach und nach angepasst werden (Zell, 1996).
Wie schon bei der Multivariaten Diskriminanzanalyse sollte auch ein Künstliches
Neuronales Netz an möglichst vielen Beispieldatensätzen, d.h.
Kennzahlenvektoren solventer und später insolventer Unternehmen, lernen. Ein
besonders zur Lösung von Klassifikationsproblemen geeigneter Lernalgorithmus
ist der Backpropagation-Algorithmus (Krause, 1993).
Mit diesem Algorithmus wird zunächst für einen Beispieldatensatz die
Netzausgabe, d.h. das Urteil des Netzes, ob das Unternehmen solvent oder
insolvenzgefährdet ist, berechnet. Diese Ist-Ausgabe wird dann mit der
Soll-Ausgabe verglichen, nämlich mit der Information, ob es sich tatsächlich um
ein solventes oder ein später insolventes Unternehmen handelt (kodiert z.B. mit
0 und 1). Anschließend werden die Verbindungsgewichte rückwärts gerichtet
(backpropagation) durch das Netz so angepasst, dass die Abweichung zwischen
Soll-Ausgabe und Ist-Ausgabe (Netzfehler) minimiert wird (Rumelhart,
/Hinton, /Williams, 1986). So wird mit jedem Beispieldatensatz
verfahren. Die Verbindungsgewichte können nach jeder Berechnung eines
vorläufigen Ausgabewerts für jeden Beispieldatensatz angepasst werden
(Onlineverfahren) oder einmal nach allen Datensätzen (Offline- oder
Batch-Verfahren) (Zell, 1996).
Mit der Künstlichen Neuronalen Netzanalyse ist eine nicht-lineare Trennung
zwischen solventen und insolvenzgefährdeten Unternehmen möglich. Damit können
die Ergebnisse der multivariaten linearen Klassifikation noch verbessert
werden.
b) Stichprobenaufteilung
bei der Künstlichen Neuronalen Netzanalyse
Die Datensätze für die Entwicklung eines Künstlichen
Neuronalen Netzes müssen statt wie bei der Multivariaten Diskriminanzanalyse
auf zwei bei der Künstlichen Neuronalen Netzanalyse auf drei Stichproben
aufgeteilt werden: die Analysestichprobe, die Teststichprobe und die
Validierungsstichprobe. An den Datensätzen der Analysestichprobe lernt das
Netz. Sie werden dem Netz immer wieder präsentiert, damit seine
Verbindungsgewichte optimal eingestellt werden können. Das Netz darf die
Strukturen der Analysestichprobe aber nicht „ auswendig “ lernen, damit es seine
Generalisierungsfähigkeit, d.h. die Fähigkeit, auch fremde Datensätze sicher zu
beurteilen, nicht verliert. Dieses so genannte overlearning oder overtraining
muss verhindert werden, da das Netz bei der praktischen Anwendung Unternehmen
beurteilen soll, deren Jahresabschlüsse nicht für die Entwicklung verwendet
wurden. Dafür wird die Methode des stopped-training
angewendet, wobei die Klassifikationsleistung des Netzes während der
Entwicklung ständig auch an den Datensätzen der Teststichprobe geprüft wird.
Diese Datensätze werden nicht zum Lernen verwendet. Wenn der
Klassifikationsfehler des Netzes an der Teststichprobe sein Minimum erreicht
hat (bei Zopt in Abb. 3), wird das Netztraining abgebrochen,
auch wenn der Klassifikationsfehler an der Analysestichprobe weiter sinkt, wie
in Abb. 3 zu sehen ist (Zimmermann,
H. G. 1994).
Abb. 3: stopped-training
Die Teststichprobe wird außerdem benötigt, um die für die
Insolvenzanalyse relevanten Kennzahlen auszuwählen. Vor der Künstlichen
Neuronalen Netzanalyse wird ein großer Katalog betriebswirtschaftlich
plausibler Kennzahlen gebildet. Da aufgrund ihrer großen Zahl nicht sämtliche
Kennzahlenkombinationen getestet werden können, werden zur Kennzahlenauswahl
Heuristiken angewendet, sog. Pruning- und Insertion-Verfahren. Beim Pruning
sind das gewichtsorientierte und das relevanzorientierte Pruning zu
unterscheiden (Uthoff, 1997).
Beim gewichtsorientierten Pruning werden die Neuronenverbindungen mit den
kleinsten Gewichten „ abgeschnitten “ . Dahinter steht die Vermutung, dass kleine
Verbindungsgewichte nur einen geringen Einfluss auf die Klassifikationsleistung
des Netzes haben. Beim relevanzorientierten Pruning werden Neuronen mit einer
negativen Relevanz (Relevanz = Differenz der Netzfehler mit und ohne das
betreffende Neuron, gemessen an der Teststichprobe) entfernt, d.h. alle
Verbindungen dieses Neurons werden getrennt. Beim Insertion-Verfahren werden ausgehend
von einem Netz mit wenigen in Voranalysen als wichtig identifizierten
Kennzahlen weitere Kennzahlen hinzugefügt, wenn die Klassifikationsleistung des
Netzes an der Teststichprobe mit der jeweiligen Kennzahl besser ist als ohne
die Kennzahl.
Die Klassifikationsleistung des fertig entwickelten Netzes
ist abschließend an den bisher nicht verwendeten Datensätzen der
Validierungsstichprobe zu prüfen. Die Datensätze der Validierungsstichprobe
sind dem Netz genauso fremd wie die Unternehmen, die es in der praktischen
Anwendung beurteilen soll. Nur so kann die Klassifikationsleistung eines Netzes
objektiv gemessen werden. Schließlich wird anhand der Validierungsstichprobe
das beste Künstliche Neuronale Netz ausgewählt und der Anwendung bei der
Insolvenzanalyse zugrunde gelegt. Da das Netz bei der Anwendung praktischer
Fälle nicht mehr weiter lernt, spricht man hier von einem geronnenen Netz.
IV. Möglichkeiten
zur Messung der Güte von Systemen zur Insolvenzfrüherkennung
Die Klassifikationsleistung eines Systems zur
Insolvenzfrüherkennung, z.B. einer Multivariaten Diskriminanzfunktion oder
eines Künstlichen Neuronalen Netzes, wird daran gemessen, wie viele Unternehmen
das System falsch beurteilt. Das System kann zum einen einen so genannten
Alpha-Fehler begehen. Der Alpha-Fehler ist der Anteil der fälschlich als
„ solvent “ klassifizierten, tatsächlich später insolventen Unternehmen an allen
später insolventen Unternehmen. Zum anderen kann das System einen so genannten
Beta-Fehler begehen. Der Beta-Fehler ist der Anteil der fälschlich als
„ insolvenzgefährdet “ klassifizierten, tatsächlich solventen Unternehmen an
allen solventen Unternehmen. Der Trennwert ist der Wert auf der Skala des
Gesamturteils, der als „ solvent “ beurteilte Unternehmen von als „ insolvenzgefährdet “
beurteilten Unternehmen trennt. Sind z.B. hohe Gesamturteilswerte gut und
niedrige schlecht zu beurteilen, werden alle Unternehmen mit einem Gesamturteil
über dem Trennwert als „ solvent “ und alle Unternehmen mit einem Gesamturteil
unter dem Trennwert als „ insolvenzgefährdet “ klassifiziert. Da Alpha- und
Beta-Fehler vom gewählten Trennwert abhängig sind, sind mit einem System zur
Insolvenzfrüherkennung so viele verschiedene Alpha-Beta-Fehlerkombinationen wie
Trennwerte möglich. Beide Fehler stehen in einem Austauschverhältnis
zueinander, d.h. eine Verminderung des einen Fehlers durch eine Verschiebung
des Trennwerts hat immer eine Erhöhung des anderen Fehlers zur Folge.
In der linken Grafik sind in Abb. 4 die Dichtefunktionen der
Gesamturteilswerte der solventen und der später insolventen Unternehmen, wie
sie mit einem Künstlichen Neuronalen Netz errechnet worden sein könnten, mit
einem Trennwert NT und dem sich aus diesem Trennwert ergebenden
Alpha-Fehler und Beta-Fehler dargestellt.
Abb. 4: Dichtefunktionen der solventen und insolventen
Unternehmen
In der rechten Grafik in Abb. 4 ist zu sehen, dass sich der
Alpha-Fehler verringert und der Beta-Fehler erhöht, wenn der Trennwert in
Richtung höherer Gesamturteilswerte verschoben wird. Wird der Trennwert in
Richtung niedrigerer Gesamturteilswerte verschoben, erhöht sich der
Alpha-Fehler und verringert sich der Beta-Fehler.
Alle Alpha-Beta-Fehlerkombinationen, die bei alternativen
Trennwerten mit einem System zur Insolvenzfrüherkennung erreicht werden können,
lassen sich mit einer Alpha-Beta-Fehlerfunktion darstellen, wie sie in
Abb. 5 zu sehen ist. An der Abszisse des Koordinatensystems für die
Alpha-Beta-Fehlerfunktion ist der Alpha-Fehler abgetragen, an der Ordinate der
Beta-Fehler. Die beiden äußersten Punkte der Kurve sind (0%/100%) und
(100%/0%). Dazwischen verläuft die Kurve vom Ursprung aus betrachtet i.d.R.
konvex. Die Fläche unter dieser Kurve ist die so genannte Fehlerfläche (Uthoff, 1997).
Sie ist umso größer, je weiter entfernt die Kurve vom Ursprung ist, und umso
geringer, je näher die Alpha-Beta-Fehlerkurve am Ursprung liegt, d.h. je geringere
Beta-Fehler über alle Alpha-Fehler bzw. umgekehrt erreicht werden. Die
Fehlerfläche lässt sich als durchschnittlicher Beta-Fehler über alle
Alpha-Fehler oder als durchschnittlicher Alpha-Fehler über alle Beta-Fehler
interpretieren (Jerschensky, 1998).
Ein System zur Insolvenzfrüherkennung klassifiziert also durchschnittlich über
alle Alpha-Fehler bzw. Beta-Fehler umso besser, je geringer seine Fehlerfläche
ist. Abb. 5 zeigt beispielhaft die Alpha-Beta-Fehlerfunktion eines
Beurteilungssystems K mit der
darunter liegenden Fehlerfläche.
Abb. 5: Alpha-Beta-Fehlerfunktion und Fehlerfläche eines Systems
zur Unternehmensbeurteilung K
Ein weiteres Maß für die Klassifikationsleistung eines
Systems zur Insolvenzfrüherkennung ist z.B. der Gesamtfehler, d.h. der
Prozentsatz aller Fehlklassifikationen. Dieses Fehlermaß hat den Nachteil, dass
es vom gewählten Trennwert abhängig ist. Oft wird der Trennwert für die
Bestimmung des Gesamtfehlers so gewählt, dass die geringsten
Fehlklassifikationen auftreten. Dabei wird indes nicht zwischen Alpha-Fehler
und Beta-Fehler differenziert, und somit werden die mit beiden Fehlern
verbundenen unterschiedlichen Kosten nicht berücksichtigt. Auch der Beta-Fehler
bei einem bestimmten Alpha-Fehler ist ein Maß für die Klassifikationsleistung
eines Systems zur Insolvenzfrüherkennung. Auch hier besteht indes der Nachteil,
dass das Fehlermaß vom Trennwert abhängt. Das Fehlerflächenkonzept ist daher
u.E. das am besten geeignete Maß für die Klassifikationsleistung eines
Beurteilungssystems.
V. Ermittlung
von Insolvenzwahrscheinlichkeiten
Mit modernen Systemen zur Insolvenzfrüherkennung werden
Unternehmen in die beiden Gruppen solvent und insolvenzgefährdet klassifiziert.
Indes erlaubt der D-Wert bzw. N-Wert (Bonitätsindex) eines Unternehmens
weitergehende Aussagen als nur eine Aussage über diese Gruppenzugehörigkeit.
Der Bonitätsindex eines Unternehmens kann nicht nur die zwei Werte solvent oder
insolvenzgefährdet annehmen, sondern er kann zwischen dem oberen und dem
unteren Ende einer Skala beliebige Werte annehmen. Unternehmen können somit
anhand des Bonitätsindexes in eine Rangfolge bzgl. ihrer Bonität gebracht
werden. Die Skala des Bonitätsindexes kann in Bonitätsklassen unterteilt und
die Unternehmen können anhand ihres Bonitätsindexes den Bonitätsklassen
zugeordnet werden. Für jede Bonitätsklasse lässt sich eine Solvenzwahrscheinlichkeit
und eine Insolvenzwahrscheinlichkeit für die Unternehmen in dieser Klasse nach
dem Bayes-Theorem wie folgt berechnen (Bleymüller,
/Gehlert, /Gülicher, 1998):
Die a-posteriori Insolvenzwahrscheinlichkeit einer Klasse
gibt also das Risiko an, dass ein Unternehmen in dieser Klasse insolvent wird.
Die a-posteriori Solvenzwahrscheinlichkeit ist dazu die
Gegenwahrscheinlichkeit. Die a-posteriori Wahrscheinlichkeiten sind von den
a-priori Wahrscheinlichkeiten für Solvenz und Insolvenz und von den bedingten
Wahrscheinlichkeiten abhängig, dass ein solventes bzw. später insolventes
Unternehmen in eine bestimmte Klasse klassifiziert wird.
Die a-priori Wahrscheinlichkeit gibt den Anteil der solventen
bzw. später insolventen Unternehmen an allen der Analyse zugrunde liegenden
Unternehmen an. Je größer der Anteil der später insolventen Unternehmen an allen
Unternehmen ist, desto höher wird das Niveau der a-posteriori
Insolvenzwahrscheinlichkeiten in den Bonitätsklassen. Denn je mehr später
insolvente Unternehmen klassifiziert werden, desto höher ist ihr Anteil in den
Bonitätsklassen.
Indes ist bei einem gut trennenden Klassifikator zu erwarten,
dass eher die a-posteriori Insolvenzwahrscheinlichkeiten in den unteren Klassen
steigen werden. Ob dies so ist, hängt von den bedingten Wahrscheinlichkeiten
ab, dass ein solventes bzw. später insolventes Unternehmen in eine bestimmte
Klasse klassifiziert wird. Die bedingten Wahrscheinlichkeiten für die einzelnen
Klassen können empirisch ermittelt werden, indem der Anteil der in die
jeweilige Klasse klassifizierten solventen bzw. später insolventen Unternehmen
an allen solventen bzw. später insolventen Unternehmen berechnet wird.
Hierdurch geht die Verteilung des Bonitätsindexes, die ein bestimmter
Klassifikator erzeugt, in die Berechnung der a-posteriori Wahrscheinlichkeiten
ein. Werden später insolvente Unternehmen eher in die unteren Klassen
eingeteilt, sind auch die a-posteriori Insolvenzwahrscheinlichkeiten in den
unteren Klassen höher. Werden die bedingten Wahrscheinlichkeiten empirisch
ermittelt, ist zu beachten, dass der Anteil der später insolventen Unternehmen
an allen zu klassifizierenden Unternehmen der gewünschten a-priori
Insolvenzwahrscheinlichkeit entsprechen muss. Ist dies nicht der Fall, da der
zur Verfügung stehende Datenbestand anders verteilt ist, sind die Unternehmen
in den einzelnen Bonitätsklassen entsprechend zu gewichten.
VI. Einsatzmöglichkeiten
und Grenzen von Systemen zur Insolvenzfrüherkennung
Systeme zur Insolvenzfrüherkennung werden vor allem von
Kreditinstituten bei der Prüfung von Kreditanträgen eingesetzt. Mit modernen
Systemen zur Insolvenzfrüherkennung können im Vergleich zur traditionellen
Kreditprüfung erhebliche Kosten eingespart werden. Lässt man z.B. auf einer
ersten Stufe der Kreditprüfung ein modernes System zur Insolvenzfrüherkennung
alle Kreditanträge vorprüfen und werden auf einer zweiten Stufe nur noch alle
als insolvenzgefährdet beurteilten Kunden intensiv durch Kreditsachbearbeiter
geprüft, während die vom System als solvent beurteilten Kunden ohne weitere
Prüfung oder nur nach einer verkürzten Prüfung angenommen werden, können zum
einen Bearbeitungskosten gespart werden. Denn nicht mehr alle Anträge müssen
intensiv geprüft werden. Zum anderen können Opportunitätskosten und
Ausfallkosten gespart werden, wenn das moderne System zur
Insolvenzfrüherkennung eine entsprechende Güte aufweist und somit durch die
zuverlässige Vorauswahl in Verbindung mit der gezielten Nachprüfung weniger
solvente Kunden fälschlich abgelehnt und weniger insolvente Kunden fälschlich
angenommen werden (Baetge, J.
1998b).
Ein weiteres großes Einsatzgebiet von modernen Systemen zur
Insolvenzfrüherkennung ist die Wirtschaftsprüfung. Da mit modernen Systemen zur
Insolvenzfrüherkennung Fortbestandsrisiken quantifiziert werden können, sind
solche Systeme zum einen ein wertvolles Hilfsmittel bei der Realisierung des
risikoorientierten Prüfungsansatzes zur Bestimmung des inhärenten Risikos. Zum
anderen leisten solche Systeme wertvolle Unterstützung bei der Erfüllung der
Pflichten des Wirtschaftsprüfers nach dem Gesetz zur Kontrolle und Transparenz
im Unternehmensbereich (KonTraG) (Baetge,
J./Baetge, K./Kruse, 1999b).
Wie bereits beschrieben, urteilen moderne Systeme zur
Insolvenzfrüherkennung nicht fehlerfrei. Denn wenn ihr Urteil ausschließlich
auf Bilanzdaten beruht, werden Informationen außerhalb der Bilanz,
die vielleicht die Lage des Unternehmens anders aussehen lassen, nicht
berücksichtigt. Aber selbst wenn auch qualitative Informationen berücksichtigt
werden, umfassen diese Informationen ein großes Maß an Subjektivität. Denn
bevor z.B. Merkmale, wie Managementqualität oder die Aussichten einer Branche, in
das Gesamturteil über ein Unternehmen eingehen können, müssen sie beurteilt
werden, so dass Subjektivität nicht vermieden werden kann.
Daher sollte sich der Anwender über die Folgen eines
Fehlurteils klar werden und den Prozess, in dem das System eingesetzt wird,
entsprechend gestalten. Für die Kreditwürdigkeitsprüfung mit modernen Systemen
zur Insolvenzfrüherkennung bedeutet dies, dass der Trennwert auf der Skala der
Bonitätsurteile so gewählt werden sollte, dass die Kosten des Kreditprüfungsprozesses
minimal bzw. der Erfolg maximal wird. Für den Einsatz solcher Systeme in der
Wirtschaftsprüfung bedeutet dies, dass ein solches System zwar ein wertvolles
Hilfsmittel bei der einheitlichen Gesamturteilsbildung und Quantifizierung des
Fortbestandsrisikos ist, der Wirtschaftsprüfer sich aber stets ein eigenes Bild
von der Lage machen sollte, wobei er alle ihm zur Verfügung stehenden
Informationen heranziehen muss.
Literatur:
Adam, D. : Planung und
Entscheidung, 4. A., Wiesbaden 1996
Backhaus, K./Erichson,
B./Plinke, W. : Multivariate Analysemethoden, 8. A., Berlin u.a. 1996
Baetge, J. :
Bilanzanalyse, Düsseldorf 1998a
Baetge, J. : Stabilität
eines Bilanzbonitätsindikators und seine Einsatzmöglichkeiten im
Kreditgeschäft, 2. Teil: Zum praktischen Einsatz in der Bonitätsprüfung, in:
Der Schweizer Treuhänder, 1998b, S. 751 – 758
Baetge, J./Baetge,
K./Kruse, A. : Grundlagen moderner Verfahren der Jahresabschlußanalyse, in:
DStR 1999a, S. 1371 – 1376
Baetge, J./Baetge,
K./Kruse, A. : Einsatzmöglichkeiten eines modernen Bilanz-Ratings in der
Wirtschaftsprüfer- und Steuerberaterpraxis, in: DStR 1999b, S. 1919 – 1924
Bleymüller, J./Gehlert,
G./Gülicher, H. : Statistik für Wirtschaftswissenschaftler, 11. A., München
1998
Jerschensky, A. :
Messung des Bonitätsrisikos von Unternehmen, Krisendiagnose mit Künstlichen
Neuronalen Netzen, Düsseldorf 1998
Krause, C. :
Kreditwürdigkeitsprüfung mit Neuronalen Netzen, Düsseldorf 1993
Leffson, U. :
Bilanzanalyse, 3. A., Stuttgart 1984
Rojas, R. : Theorie der
neuronalen Netze, Eine systematische Einführung, 4. korrigierter Nachdruck,
Berlin et al. 1996
Rumelhart, D. E./Hinton,
G. E./Williams, R. J. : Learning Internal Representations by Error Propagation,
in: Parallel Distributed Processing, Explorations in the Microstructure of Cognition,
Volume 1: Foundations, hrsg. v. Rumelhart, D. E./McClelland, J. L./PDP Research
Group, , Cambridge, Massachusetts 1986, S. 318 – 362
Staehle, W. H. :
Kennzahlen und Kennzahlensysteme als Mittel der Organisation und Führung von
Unternehmen, Wiesbaden 1969
Uthoff, C. :
Erfolgsoptimale Kreditwürdigkeitsprüfung auf der Basis von Jahresabschlüssen
und Wirtschaftsauskünften mit Künstlichen Neuronalen Netzen, Stuttgart 1997
Weber, M./Krahnen,
J./Weber, A. : Scoring-Verfahren – häufige Anwendungsfehler und ihre
Vermeidung, in: DB 1995, S. 1621 – 1626
Zell, A. : Simulation
Neuronaler Netze, 1. unveränderter Nachdruck, Bonn et al. 1996
Zimmermann, H. G. :
Neuronale Netze als Enscheidungskalkül, in: Neuronale Netze in der Ökonomie,
hrsg. v. Rehkugler, H./Zimmermann, H. G., München 1994, S. 1 – 87
|