Modèles de prévision de défaillance d’entreprise et sélection de variables explicatives : le cas de la France
- Par Madiha Zammel
- et Xavier Brédart
Pages 67 à 90
Citer cet article
- ZAMMEL, Madiha
- et BRÉDART, Xavier,
- Zammel, Madiha.
- et al.
- Zammel, M.
- et Brédart, X.
https://doi.org/10.3917/g2000.373.0067
Citer cet article
- Zammel, M.
- et Brédart, X.
- Zammel, Madiha.
- et al.
- ZAMMEL, Madiha
- et BRÉDART, Xavier,
https://doi.org/10.3917/g2000.373.0067
Notes
-
[1]
Banque de France : Les défaillances d’entreprises, STAT INFO, Mai 2019.
-
[2]
Il s’agit du cumule des douze derniers mois.
-
[3]
Selon l’INSEE un PME est une entreprise dont le nombre de salariés est moins de 250 personnes et le chiffre d’affaire annuel est inférieur à 50 million euro.
-
[4]
Bien que, dans la réalité, il existe beaucoup plus d’entreprises saines que de défaillantes, nous avons opté pour un échantillon comprenant autant d’entreprises saines que de défaillantes afin que les modèles ne se spécialisent pas dans le bon classement des entreprises saines. Cette technique est utilisée dans la majorité des modèles académiques.
Introduction
1L’environnement économique actuel est caractérisé par une forte incertitude. En outre, la globalisation et le progrès technologique ont accentué la concurrence à l’échelle nationale et internationale. Face à ces conditions, plusieurs entreprises se trouvent incapables de résister ce qui entraine des défaillances fréquentes. Selon les statistiques publiées par la Banque de France [1] (Tableau1), le nombre d’entreprises françaises défaillantes est en croissance continue.
Evolution des défaillances d’entreprisesa,b,c
| Avril 2018 | Avril 2019 | |
|---|---|---|
| Nombre total des entreprises défaillantes | 53 252 | 54 223 |
| Nombre des PMEa | 53 199 | 54 186 |
| Nombre des ETIb et GEc | 53 | 37 |
Evolution des défaillances d’entreprisesa,b,c
a. Petite et moyenne entrepriseb. Entreprise de Taille Intermédiaire
c. Grande Entreprise
2En effet ce nombre [2] passe de 53 252 en Avril 2018 à 54 223 à la même période de 2019. Le mouvement de défaillance concerne essentiellement les petites et moyennes entreprises [3]. De ce fait, parmi les 54 223 entreprises défaillantes en Avril 2019, 54186 sont des PME.
3Le phénomène de la défaillance intéresse un grand nombre d’acteurs (les prêteurs de fonds, les investisseurs, les actionnaires, les employés…). Dans ces conditions, il est indispensable de veiller à la protection des intérêts des différentes parties prenantes, et ainsi à la pérennité des entreprises, en prévenant les difficultés économiques et financières qu’elles peuvent rencontrer, ce qui implique notamment la mise en œuvre de modèles économétriques (Beaver, 1966 ; Altman, 1968 ; Tian et al., 2015) visant à étudier la probabilité de défaillance et à comprendre sa trajectoire (Crutzen et Van Caillie, 2007). L’approche la plus fréquente consiste à recourir à l’analyse financière afin de déterminer les variables, principalement comptables, qui différencient au mieux les entreprises défaillantes de celles qui ne le sont pas (Refait, 2004).
4L’objectif de ce papier consiste en l’élaboration d’un modèle de prévision de la défaillance utilisant la sélection de variables la plus pertinente et d’analyser l’évolution des ratios retenus sur un horizon temporel de trois années avant la défaillance afin d’en retracer la trajectoire de défaillance.
5Dans cet objectif, nous élaborons, dans ce papier, plusieurs modèles de prévision de défaillance d’entreprises à partir de données comptables sélectionnées (à partir d’une liste initiale de 30 ratios) en ayant recours à trois techniques que sont l’Analyse en Composante Principale (ACP), la technique LASSO (the least absolute shrinkage and selection operator) et l’Analyse Discriminante Linéaire (ADL). L’analyse de nos résultats rapporte que la technique LASSO permet d’obtenir les meilleurs résultats en termes de taux de bonne classification.
6D’après Crutzen et Van Caillie (2007), la défaillance est un processus de détérioration progressive des ressources pouvant la mener jusqu’à la faillite. L’analyse de l’évolution des valeurs prises par les ratios financiers sur une période de trois années permet de rapprocher nos résultats de la notion de « spirale » de la défaillance de ces auteurs.
7La suite de cet article se présente comme suite. La section suivante consiste en une revue de la littérature relative à la prévision de la défaillance. La deuxième section présente les données utilisées, les variables considérées ainsi que les méthodologies utilisées pour la sélection de variables et pour la construction des modèles. La troisième section présente et discute les résultats de l’analyse.
1 – Revue de la littérature
8Le sujet de la défaillance d’entreprise est au cœur de plusieurs débats théoriques et empiriques dans la littérature financière. Un examen détaillé des études menées sur ce thème fait état d’une diversité importante des notions retenues pour qualifier l’entreprise de défaillante. A titre d’exemple, Beaver (1966) considère comme défaillante toute entreprise incapable d’honorer ses engagements. Varetto (1998), Pindado et Rodrigues (2001), Atiya (2001) et Souleymanou et al. (2019) ont lié la notion de défaillance au risque de crédit. Selon d’autres chercheurs, tels que Liang et Wu (2003), une entreprise est dite défaillante si les cash-flows qu’elle génère ne suffisent pas à honorer ses engagements envers ses partenaires. Toutefois, certaines études, telle que celle de Refait (2004), considèrent la défaillance comme l’ouverture d’une procédure judiciaire suite à une situation de cessation de paiement. Dans ce sens, Crutzen et Van Caillie (2007) rapportent que la défaillance est un processus de détérioration progressive des ressources qui peut amener l’entreprise en justice et l’emmener jusqu’à la faillite en cas d’absence de tentatives de correction.
9Afin d’apporter des actions correctives à temps, la prévision de la défaillance est primordiale. La prévision de la défaillance présente aujourd’hui un grand intérêt aussi bien théorique qu’empirique. L’approche la plus fréquente consiste à déterminer les variables, principalement comptables, qui différencient au mieux les entreprises défaillantes et les entreprises saines et de construire un modèle explicatif de la défaillance. Une étape préalable à l’analyse des modèles de prévision consiste à sélectionner les variables les plus pertinentes afin de classer au mieux les entreprises. Cette étape peut être réalisée par le biais de différentes techniques telles que l’Analyse en Composante Principale (ACP), la technique LASSO (the least absolute shrinkage and selection operator) et l’Analyse Discriminante Linéaire (ADL).
10En termes de modèles de prévision, différents modèles sont utilisés dans la littérature comme l’approche univariée (Beaver, 1966), l’analyse discriminante multiple linéaire (Altman, 1968), la régression logistique (Ohlson, 1980), les modèles fondés sur l’intelligence artificielle tels que les réseaux de neurones (Anandarajan et Anandarajan, 2001).
2 – Méthodologie
2.1 – Données
11Nous avons utilisé la base de données Amadeus Bureau Van Dijk, qui présente les informations financières de plus de 22 millions d’entreprises à travers l’Europe, afin d’y extraire les informations issues des bilans et des comptes de résultats d’un échantillon final composé de 4400 petites et moyennes entreprises françaises non financières, divisées en deux sous-échantillons : 2200 entreprises saines et 2200 entreprises défaillantes [4].
12Une entreprise est considérée défaillante dès lors qu’elle a fait l’objet d’une première déclaration d’évènement judiciaire auprès du tribunal de commerce durant l’année 2014. Partant de l’hypothèse selon laquelle la défaillance s’inscrit dans un processus dont on peut trouver des traces plusieurs années à l’avance, nous avons collecté les données comptables sur un horizon temporel de trois ans (sur la période 2011-2013).
13En outre, lors de la constitution de l’échantillon, nous avons respecté certains critères d’homogénéité. Premièrement, nous nous sommes limités aux seules entreprises non financières. Deuxièmement, les firmes qui composent notre échantillon sont des petites et moyennes entreprises (PME). Troisièmement, l’homogénéité des groupes d’entreprises est respectée en utilisant la technique d’échantillonnage jumelé. En effet, cette technique consiste à associer à chaque entreprise défaillante une entreprise saine de même taille et de même secteur d’activité.
2.2 – Sélection des variables
14La variable dépendante dans notre étude est une variable binaire qui reflète la situation de l’entreprise. Elle prend la valeur 1 si l’entreprise est défaillante (si elle a fait l’objet d’une première déclaration d’évènement judiciaire auprès du tribunal de commerce durant l’année 2014) et 0 sinon.
15Les variables indépendantes introduites dans nos modèles de prévision de la défaillance consistent en des ratios financiers construits sur base des états comptables des entreprises. Afin d’obtenir une liste exhaustive de variables susceptibles d’impacter la défaillance d’entreprise, nous avons repris les études antérieures relatives à la prévision de la défaillance des entreprises aussi bien françaises (Bardos, 2005, 2001 ; Bardos et Zhu, 1997 et Ben Jabeur et Fahmi, 2013) qu’à l’échelle international (Beaver, 1966 ; Chava et Jarrow, 2004 ; Beaver et al., 2005 ; Härdle et al., 2009 ; Bharath et Shumway, 2008 ; Ding et al., 2012 ; Tian et al., 2015 ; Amendola et al., 2017) afin d’identifier les ratios les plus utilisés. Nous obtenons de la sorte une liste de 30 ratios financiers liés à la rentabilité, la liquidité et la gestion opérationnelle et la structure financière des entreprises. Le tableau 1 reprend la liste des ratios sélectionnés, leur mode de calcul ainsi que la catégorie à laquelle ils appartiennent.
Liste initiale des ratios financiers utilisés*
| Ratio | Calcul | Catégorie * |
|---|---|---|
| R1 | Actif courant / passif courant (ratio de liquidité générale) | LGO |
| R2 | (Actif courant – stock) / passif courant (ratio de liquidité réduite) | LGO |
| R3 | Trésorerie et équivalents de trésorerie / passif courant (ratio de liquidité immédiate) | LGO |
| R4 | Total passif / total actif (ratio d’endettement) | S |
| R5 | Capitaux propres / total bilan (ratio d’autonomie financière générale) | S |
| R6 | Capitaux propres / total passif (ratio d’autonomie financière à court terme) | S |
| R7 | Capitaux propres / (capitaux propres + passif non courant) (ratio d’autonomie financière à LT) | S |
| R8 | (Passif courant – Trésorerie et équivalents de trésorerie) / total actif | LGO |
| R9 | Passif courant / total actif | LGO |
| R10 | Total passif / capitaux propres (structure de financement) | S |
| R11 | (Capitaux propres + passif non courant) / total actif non courant | S |
| R12 | Fond de roulement / chiffre d’affaires (ratio d’évolution du FR) | LGO |
| R13 | (Client et compte rattaché *360)/ CA (recouvrement du compte client) | LGO |
| R14 | (Fournisseur et compte rattaché *360)/ total achats (recouvrement du compte fournisseur) | LGO |
| R15 | Capitaux propres / (PNC + PC) (ratio de solvabilité) | S |
| R16 | (PNC + emprunts) / CP (Gearing) | S |
| R17 | EBITDA / CP | R |
| R18 | CA / Total actif (ratio de rotation de l’actif) | LGO |
| R19 | CA / total des actifs immobilisés (ratio de rotation des immobilisations) | LGO |
| R20 | Revenu opérationnel / stock (ratio de rotation de stock) | LGO |
| R21 | Trésorerie et équivalents de trésorerie / total actif | LGO |
| R22 | (EBIT + dotation aux amortissements et dépréciation) /total actif | R |
| R23 | EBIT / total actif (ROTA) | R |
| R24 | EBIT / CA | R |
| R25 | Résultat net / CP (ratio de rentabilité financière) | R |
| R26 | Résultat net / CA (taux de rentabilité nette) | R |
| R27 | Revenue net / CA (profit margin) | R |
| R28 | Revenue net / total actif | R |
| R29 | FR / total actif (ratio d’équilibre financier) | S |
| R30 | Résultat net / total actif (ROA : Return On Assets) | R |
Liste initiale des ratios financiers utilisés*
* R : Rentabilité, LGO : Liquidité et Gestion Opérationnelle, S : Structure16Face au nombre élevé de ratios financiers pouvant être utilisés comme indicateurs de défaillance, une sélection appropriée des variables est nécessaire pour un meilleur développement du modèle. Koller et Sahami (1996) considèrent le choix des variables explicatives comme une tâche importante dans la modélisation et ce pour diverses raisons. Premièrement, lorsque le nombre de variables augmente, la recherche d’informations ainsi que le temps de calcul deviennent de plus en plus longs. Deuxièmement, lorsqu’on utilise un nombre élevé de variables avec une petite base de données, des problèmes de surajustement risquent de se produire. De ce fait, comme le soulignent Lili et Prakash (2007), un nombre réduit de variables est préféré à une large liste contenant des variables redondantes et non pertinentes. Pour ces raisons, les statisticiens ont développé plusieurs méthodes de sélection de sous-ensembles de variables à partir d’une liste initiale des variables explicatives en vue d’identifier les variables prédictives les plus pertinentes (Fan et Li, 2001).
17Dans notre étude, nous avons choisi de tester trois techniques de sélection de variables, dont la capacité à réduire l’ensemble des variables exogènes a été prouvée dans la littérature financière, puis, de procéder à la suppression des variables fortement corrélées (corrélation > 0.7) afin d’éviter le problème de redondance par l’introduction, dans nos modèles, des ratio contenant une information fortement similaire. Ces techniques, fréquemment utilisées dans les travaux académiques antérieurs, sont : l’analyse discriminante linéaire (Chralambous et al., 2000 ; Yim et Mitchell, 2002 ; Hardle et al., 2005 ; Tang et Chi, 2005 ; Pompe et Bilderbeek, 2005 A ; Min et al., 2006 ; Smith et Liou, 2007 ; Hamza et Bagdadi, 2008 ; …), l’analyse en composantes principales (Sharma et Iselin, 2003 ; Wang, 2004 ; Tang et Chi, 2005 ; Pompe et Bilderbeek, 2005 B ; Min et Lee, 2005 ; …) et la technique LASSO (the least absolute shrinkage and selection operator) (Tibshirani, 1996, 2011 ; Zou, 2006 ; Meir et al., 2008 ; Tian et al., 2015 ; …). Les principes de ces techniques sont relativement différents et sont présentés ci-après.
18Premièrement, l’Analyse Discriminante Linéaire (ADL) permet d’apprécier la situation financière de l’entreprise à travers une batterie de ratios. Cette technique permet d’élaborer une combinaison linéaire des variables explicatives (les ratios financiers) aboutissant à un score « Z » représentant l’appartenance d’une entreprise au groupe des entreprises défaillantes ou à celui des saines.
20Avec :
- Z : Score de l’entreprise ;
- β0 : Constante ;
- βi : Coefficients de la combinaison linéaire des variables explicatives Xi.
21La technique consiste à inclure de nombreuses variables explicatives afin de déterminer celles qui discriminent au mieux l’appartenance à l’un ou l’autre de ces groupes en analysant le Lambda de Wilks. Il s’agit d’une approche paramétrique permettant de tester si plusieurs variables continues distinctes X= (X1,…,Xp) sont liées à une variable qualitative Y. De ce fait, l’hypothèse H0 testée est relative à la dépendance entre les variables X et la variable Y. Plus le λ de Wilks est proche de zéro, plus nous avons de chance d’accepter H0, ce qui revient à dire que le ratio financier X participe fortement à l’explication de la situation financière de l’entreprise.
22Deuxièmement, l’Analyse en Composantes Principales (ACP) est une technique de réduction des données, souvent considérée comme la méthode de base de l’analyse factorielle des données. Elle consiste, suite à la projection d’un nuage de points dans un espace à dimension réduite, à sélectionner, parmi les ratios financiers initialement utilisés comme variables explicatives, ceux qui interviennent le plus dans l’explication de la situation financière de l’entreprise (défaillante ou saine). Elle permet d’obtenir des variables composites (facteurs) au sein desquelles ne sont conservées que les variables fortement corrélées avec les facteurs les plus importants. Il s’agit donc d’obtenir le résumé le plus pertinent possible des données initiales.
23Troisièmement, LASSO (Least Absolute Shrinkage and Selection Operator) est une méthode de pénalisation et de sélection de variables proposée par Tibshirani, 1996. La défaillance d’entreprise (Y) peut être modélisée de la manière suivante :
25Avec :
- n : nombre d’observations ;
- X : les variables explicatives (les ratios financiers)
- β : vecteur de coefficients LASSO
- εn = (ε1+…+εn) T : terme d’erreur (qui contient toutes les variables explicatives non prises en compte dans le modèle).
26Dans notre étude, la finalité du LASSO est de pénaliser et éliminer les ratios financiers ayant le rôle le plus faible dans l’explication de la situation financière de l’entreprise. Le pouvoir explicatif diffère d’une variable à l’autre, l’objectif est alors d’éliminer uniquement les variables inutiles. L’idée de la pénalisation exercée par le LASSO est donc de réaliser une régression régularisée qui annule certains coefficients de l’estimation de β aboutissant ainsi à des modèles parcimonieux ne contenant que les ratios financiers (variables explicatives) les plus pertinents.
2.3 – Modèles
27Dans ce papier, nous avons choisi d’établir deux modèles de prévision de défaillance d’entreprises fréquemment utilisés dans la littérature financière : la régression logistique et le réseau de neurone artificiel et de comparer leurs performances. Premièrement, le modèle de régression logistique est généralement utilisé parce qu’il est moins contraignant que l’analyse discriminante quant à la distribution des variables (Ohlson, 1980) et (Zavgren, 1985). L’avantage majeur que présente ce modèle est d’être une méthode statistique capable de combiner plusieurs variables indépendantes, sans que l’hypothèse de normalité soit une condition nécessaire, et de fournir directement la probabilité de la réalisation de l’événement, permettant de ce fait une interprétation aisée des résultats (Ben Jabeur, 2011).
28La régression logistique consiste à déterminer la probabilité qu’un événement se réalise pour un individu, connaissant les valeurs prises par les variables explicatives (X1, X2,…Xn).
29Dans notre cas d’étude, il s’agit de connaître la probabilité de défaillance d’une entreprise, d’après ses caractéristiques comptables et financières.
30Sachant que la variable dépendante (situation financière de l’entreprise) est une variable binaire qui prend la valeur 1 si l’entreprise est défaillante et la valeur 0 si elle est saine, la probabilité de défaillance peut s’écrire sous la forme de Pi = P (Yi =1) et la probabilité d’être saine est 1 – Pi. Le modèle Logit suppose que la variable endogène est une combinaison non linéaire des variables exogènes plus l’erreur qui est supposée suivre une loi logistique. Ce qui peut s’écrire sous la forme :
32Avec
- βi : vecteur des coefficients estimés généralement par la méthode de maximum de vraisemblance.
- Xi : vecteur des variables explicatives : les ratios financiers.
33De nombreux travaux sur la prévision de la défaillance se sont appuyés sur la régression logistique. Dans le cas de la France, citons les travaux de Boisselier et Dufour, 2003 et Ben Jabeur et Youssef, 2014 qui ont prouvé l’efficacité de cette technique à l’aide des taux de bons classements respectifs de 80% et 98%.
34Deuxièmement, le modèle neuronal est retenu en tant que spécimen des modèles de l’intelligence artificielle. Il présente en effet, plusieurs avantages tels que la robustesse, la capacité de traiter des problèmes avec des données manquantes, la capacité de traiter des problèmes non linéaires parfaitement complexes ou encore l’efficacité dans le traitement des problèmes sur lesquels on ne dispose d’aucune information à priori.
35Cette méthode de classification, qui s’inspire du système neuronal biologique, consiste à développer un algorithme d’apprentissage qui traite un ensemble d’informations pour obtenir un résultat. Elle est composée d’opérateurs mathématiques simples appelés « neurones formels ». Le neurone formel est une fonction algébrique non linéaire, paramétrée de variables réelles qui servent à mettre en relation non linéaire les inputs (les ratios financiers) et les outputs (situation de l’entreprise saine ou défaillante) à l’aide d’une fonction d’activation (voir figure 1).
Modèle d’un neurone artificiel
Modèle d’un neurone artificiel
Avec :- Yi : Variables d’entrée ;
- Wij : Poids relatif de la variable i au niveau du neurone j ;
- A=∑i=1…nWi,j Yi ;
- S=F(A)= la situation financière de l’entreprise.
36Le modèle neuronal réalise un produit scalaire « A » entre son vecteur d’entrée « Y » (les ratios financiers) et le vecteur poids « W » et utilise une fonction d’activation « F » pour déterminer le groupe d’appartenance de l’entreprise (la sortie « S »). Différentes fonctions de transfert peuvent être utilisées dans ce type du réseau telles que la fonction linéaire, la fonction sigmoïde standard et la fonction tangente hyperbolique.
37De multiples études et travaux de recherches sur la défaillance des entreprises ont prouvé l’efficacité de cette technique en aboutissant à des taux de bons classements supérieurs à 75% (Anandarajan et al., 2001 ; Atia, 2001 ; Bardos et Zhu,1997 ; Baek et Cho, 2003 ; Brabazon et Keenan, 2004 ; Charitou et al., 2004 ; Kotsiantis et al., 2005 ; Yim et Mitchel, 2005).
3 – Résultats et discussion
38Le tableau 2 reprend, de manière globale mais également par catégorie d’entreprises (défaillantes et saines) les moyennes ainsi que les tests de différences de moyennes réalisés sur les 30 ratios issus de notre liste initiale. Comme attendu, nous pouvons remarquer que beaucoup de ces ratios affichent une différence de moyenne significative entre les deux catégories d’entreprises. Remarquons également que de meilleures valeurs sont globalement enregistrées pour les entreprises saines. A titre exemplatif, nous pouvons remarquer que R1 (représentant le ratio de liquidité générale) est plus élevé, en moyenne, pour les entreprises saines que pour les entreprises défaillantes (1.35 versus 1.19), que R15 (représentant la solvabilité structurelle) est plus élevé, en moyenne, pour les entreprises saines que pour les entreprises défaillantes (0.41 versus 0.35) ou encore que R30 (représentant le return on assets) est également plus élevé, en moyenne, pour les entreprises saines que pour les entreprises défaillantes (0.00 versus 0.04). Inversement les entreprises défaillantes possèdent, par exemple, un niveau d’endettement (R4) plus élevé que celui des entreprises saines (0.76 versus 0.73).
Statistiques descriptives
Statistiques descriptives
39Le tableau 2 présente également le résultat de la sélection des variables exogènes par les trois techniques ADL, ACP et LASSO (les résultats détaillés des trois techniques sont présentés en annexe 1). Afin d’évaluer la capacité de chaque technique à sélectionner les variables les plus explicatives de la situation financière de l’entreprise nous avons utilisé leurs sélections comme variables exogènes et donc comme input pour un modèle Logit et un modèle neuronal afin d’en analyser les taux de bons classements.
40Le tableau 3 reprend les taux de bons classements (TBC) des entreprises pour les trois années d’étude, précise les taux d’erreur de type 1 E1 (classer une entreprise comme saine alors qu’elle est défaillante) et de type 2 E2 (classer une entreprise comme défaillante alors qu’elle est saine) ainsi que la proportion de ratios retenus par catégories (LGO : liquidité et de gestion opérationnelle, R : rentabilité, S : structure).
Modèle neuronal (RN) et modèle Logit
Modèle neuronal (RN) et modèle Logit
41Nous pouvons constater que la technique LASSO rapporte les meilleurs résultats en termes de classification (voir annexe 2). En effet, que le modèle de prévision de la défaillance utilisé soit le réseau de neurone ou la régression logistique, le taux de bons classements (TBC) obtenu avec la sélection de variables retenues par la technique LASSO est systématiquement supérieur aux taux obtenus via l’ACP ou l’ADL, que ce taux soit calculé un, deux ou trois ans avant la défaillance. La sélection de variables optimale permet donc de classer correctement plus de 70% (avec le réseau neuronal) des entreprises de notre échantillon un an avant la défaillance.
42Plus précisément, la classification par l’approche neuronale a abouti aux résultats suivants. En T-1, le modèle a classé correctement 70.6% des entreprises de notre échantillon avec une erreur type 1 (pourcentage des entreprises défaillantes considérées saines) de 18.6% et une erreur type 2 (pourcentage des entreprises saines considérées défaillantes) de 10.8%. Deux ans de la défaillance, le taux de bons classements est de 67.4% avec une erreur type 1 de 18.8% et erreur type 2 de 13.8%. Trois ans avant la défaillance, le modèle n’arrive à classer correctement que 64.2% des entreprises avec une erreur type 1 de 21.8% et une erreur type 2 de 13.9%.
43La classification par le modèle Logit rapporte qu’un an avant la défaillance ce modèle est capable de classer correctement 64.4% des entreprises avec une erreur type 1 qui s’élève à 39.3% et une erreur type 2 de 31.8%. Deux ans avant la défaillance, le TBC se réduit à 60.8% et l’erreur type 1 augmente à 21.2%, l’erreur type 2 à 36%. A trois ans avant la défaillance, le TBC continue à baisser pour atteindre 59.7% et les erreurs de type 1 et 2 continuent à augmenter pour atteindre respectivement les valeurs de 37.9% et 42.7%.
44La comparaison de la performance globale des deux modèles montre que le TBC de l’approche neuronale calculé à différents intervalles temporels (T-1, T-2 et T-3) est supérieur à celui du modèle Logit. Un an avant la défaillance, l’approche neuronale aboutit à un TBC de 70.6% contre 64.4% pour le modèle Logit. Deux ans avant la défaillance, les TBC sont de 67.4% pour l’approche neuronale et de 60.8% pour le modèle Logit. Enfin, trois ans avant la défaillance, le réseau de neurones arrive à classer correctement 64.2% des entreprises contre seulement 59.7% pour la régression logistique. De ce fait, nous pouvons affirmer la supériorité du modèle neuronal par rapport au modèle Logit pour la prévision de la défaillance de notre échantillon d’entreprises. Ces résultats sont en ligne avec ceux d’études antérieures telle que celle de De Almeida et Dumontier (1993) qui ont montré, à partir d’un échantillon d’entreprises françaises du secteur du transport, qu’un modèle neuronal domine généralement un modèle de régression de type Logit.
45En ce qui concerne le pouvoir prédictif des deux modèles au fil du temps en passant de un à deux et à trois ans avant la défaillance, nous avons constaté une chute des taux de bons classements aussi bien pour le modèle neuronal que le modèle Logit.
46Pour le modèle neuronal, le TBC passe de 70.6% un an avant la défaillance à 67.4% deux ans avant la défaillance, pour arriver à 64.2% trois ans avant cette date critique. Le modèle de régression logistique aboutit à un TBC de 64.4% un an avant la défaillance puis, 60.8% deux ans avant la défaillance et enfin 59.7% à un horizon de trois ans avant la défaillance.
47Par conséquent, nous pouvons conclure que plus on élargit l’horizon d’analyse, plus la qualité de prédiction se réduit. En d’autres termes, plus l’horizon de prévision est éloigné, plus la capacité prévisionnelle des modèles se réduit. Ce résultat est confirmé par plusieurs travaux académiques antérieurs dont on peut citer à titre d’exemple Atia, 2001 (le TBC à un an avant la défaillance est égal à 87.04% et à deux ans il s’élève à 57.14%), Brabazon et Keenan, 2004 (le TBC à un an avant la défaillance est égal à 80.67% et il se réduit à deux ans avant cette date pour arriver à 72%), Kotsiantis et al., 2005 (le TBC passe de 71.17%, un an avant la défaillance, à 57.14% deux ans en avant). Ce résultat peut être expliqué par le fait que, lorsque l’horizon prévisionnel s’éloigne à deux ans ou trois ans avant la défaillance, les modèles perdent leur capacité de discrimination. En effet, Le groupe des entreprises saines perd de son homogénéité ; une partie possède le profil d’entreprises en bonne situation financière et une autre partie présente des déficiences financière mais qui sont insuffisantes pour être radicalement différentes des premières. C’est le cas aussi des entreprises défaillantes à cause des facteurs accidentels tels qu’une catastrophe naturelle ou la mort de son propriétaire ou un actionnaire majoritaire. A deux ans et trois ans avant la défaillance, l’entreprise peut alors être considérée saine alors qu’elle est défaillante à la date T. Le tableau 3 rapporte également les proportions de catégories de ratios retenus en fonction de la technique de sélection de variables. Nous pouvons remarquer que la technique LASSO intègre une proportion de ratios de liquidité et de gestion opérationnelle sensiblement supérieure aux techniques concurrentes (56%), viennent ensuite les ratios de structure (31%) et enfin les ratios de rentabilité (13%).
48L’évolution des ratios financiers au fil du temps est présentée à la figure 2.
Evolution des catégories de ratios sélectionnés
Evolution des catégories de ratios sélectionnés
49L’analyse des résultats présentés au tableau 3 et sur la figure 1 nous permet de conclure que le processus de défaillance se déroule comme suit. A cause de certains facteurs, qui peuvent être externes ou internes, la position de l’entreprise sur son marché s’affaiblit. Elle perd des parts de marché et son chiffre d’affaire se détériore, ce qui conduit à une baisse de sa compétitivité et de sa rentabilité (Marcot, 1989). A titre exemplatif, on constate une baisse de R26 (taux de rentabilité nette= résultat net / chiffre d’affaire) et de R28 (Revenu net / total actif)) à mesure que la défaillance se rapproche. La diminution de la rentabilité de l’entreprise entraine un manque d’autofinancement. Notons que R10 (structure de financement = total passif / capitaux propre diminue) qui à son tour engendre des problèmes de trésoreries, de liquidité (R2 (ratio de liquidité réduite = (Actif courant – stock) / actif courant) diminue), de gestion opérationnelle et un affaiblissement des ressources de l’entreprise : la motivation du personnel diminue (augmentation des taux d’absentéisme et des erreurs…), les ressources techniques sont difficilement renouvelées… (Crutzen et Van Caillie, 2007). Avec la carence de ses ressources financières propres, l’entreprise se trouve obligée de recourir de plus en plus à l’endettement pour financer ses activités (R16 (passif non courant + emprunt) / capitaux propres) diminue) ce qui affaiblit son autonomie financière (R5 (ratio d’autonomie financière générale = capitaux propres / total bilan) diminue) et perturbe son équilibre financier (R29 (ratio d’équilibre financier = fond de roulement / total actif) diminue). Le recours excessif à l’endettement aboutit à l’augmentation des charges financières (Marco 1989) qui, associées au recul de son activité, amène l’entreprise à une situation d’insolvabilité. Dans ces conditions et en l’absence de mesures correctives, l’entreprise se trouve incapable d’honorer ses engagements envers ses différents partenaires (banques, clients, fournisseurs, salariés…) et peut devoir se résoudre à la faillite.
Conclusion
50Cette étude apporte une contribution à la littérature relative à la défaillance d’entreprises. Sur base d’un échantillon de 4400 entreprises françaises, nous avons réalisé deux modèles de prédiction de la défaillance, l’un statistique et l’autre issus des techniques de l’intelligence artificielle. Partant d’une batterie de 30 ratios financiers, nous avons également testé trois techniques de sélection de variables ; à savoir, l’ACP, l’ADL et le LASSO. Nos résultats rapportent la supériorité des modèles utilisant la sélection de variables issue de la technique LASSO qui permettent de classer correctement les entreprises avec un taux de bons classements de 70 pourcents environ (avec un RN à T-1). De plus, l’analyse des résultats d’un modèle neuronal et d’un modèle Logit sur une période d’un an, deux ans et trois ans avant la défaillance nous permet de conclure d’une part, en la supériorité du modèle neuronal en matière de prévision (TBC de RN =70.6% > TBC du modèle Logit = 64.4%) et, d’autre part, que plus on éloigne l’horizon temporel de l’étude plus la capacité prévisionnelle du modèle se réduit. En outre, l’analyse de la nature des ratios retenus peut être rapprochée de la théorie de la spirale de défaillance développée par Crutzen et Van Caillie (2007). En effet, le poids des différentes catégories de ratios retenus reflète l’enchaînement des symptômes de la défaillance.
51Outre l’intérêt académique, cette recherche peut également être d’utilité pour les différents acteurs préalablement cités tels que les actionnaires, les créanciers, les fournisseurs ou encore les instances politiques qui sont intéressés par la pérennité des entreprises. En effet, la défaillance n’est généralement pas un évènement soudain mais est le résultat d’un processus. L’étude du cheminement qui mène l’entreprise à cette situation critique à travers l’évolution de ses indicateurs économiques et financiers au fil du temps, a prouvé que la défaillance commence par la détérioration de la position de l’entreprise sur son marché, la baisse de son chiffre d’affaire, et les problèmes de liquidité qui en découlent, puis, passe par le recours excessif à l’endettement qui affaiblit son autonomie financière et perturbe son équilibre menaçant ainsi sa solvabilité. Les résultats de nos analyses apportent aux responsables (dirigeants, actionnaires…) des clés afin de prendre les mesures propices et nécessaires dès l’apparition des premiers signes des difficultés afin de garantir la pérennité de l’entreprise. Cette étude est également d’un intérêt évident pour les analystes financiers ainsi que les agences de notation dont un des rôles majeurs consiste à appréhender la probabilité de défaillance des entreprises.
52Cette étude comporte plusieurs limites qui ouvrent la voie à des pistes de recherche complémentaires. Par exemple, notre base de données utilise uniquement des données financières sur des sociétés françaises. La France possédant ses propres caractéristiques (notamment en termes de lois sur les faillites), il serait pertinent de réaliser une étude incluant les données relatives à des entreprises issues de pays différents à des fins de généralisation et des données extrafinancières (Takoudjou Nimpa et al., 2019). En outre, d’autres techniques de sélection de variables ou de modélisation pourraient être testées.
Résultats de sélection des variables par ADL, ACP et LASSO
✓ ADL
✓ ADL
✓ ACP
✓ ACP
✓ LASSO
✓ LASSO
Résultats des modèles RN et Logit utilisant les variables sélectionnées par Lasso à N-1
Références
- Altman, E. I. (1968). Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. The Journal of Finance, 23(4), 589-609.
- Amendola, A., Francesco, G., Parrella, M.L., et Restaino, M. (2017). Variable selection in high ?dimensional regression : a nonparametric procedure for business failure prediction. Applied Stochastic Models in Business and Industry, 33, 355-368.
- Anandarajan, M., Lee, P. et Anandarajan, A. (2001). Bankruptcy Prediction of Financially Stressed firms : An Examination of the Predictive Accuracy of Artificial Neural Networks. International Journal of Intelligent Systems in Accounting, Finance and Management, 10 (2), 69-81.
- Atiya, A. F. (2001). Bankruptcy Prediction for Credit Risk Using Neural Networks : A Survey and New Results. IEEE Transactions on Neural Networks, 12 (4), 929-935.
- Baek, J. et Cho, S. (2003, Mars). Bankruptcy Prediction for Credit Risk Using an Auto-Associative Neural Network in Korean Firms. Proceedings of the IEEE International Conference on Computational Intelligence for Financial Engineering, Hong Kong, 20-23 March, 25-29.
- Banque de France, 2019. Les défaillances d’entreprises, STAT INFO, Repéré à https://www.banque-france.fr/statistiques/chiffres-cles-france-etetranger/défaillances-d’entreprises.
- Bardos, M. (2005). Les scores de la Banque de France : leur développement, leurs applications, leur maintenance. Bulletin de la Banque de France, 144 Repéré à http://www.banquefrance.fr/fr/publications/telechar/bulletin/etu144_6.pdf
- Bardos, M. (2001). Développements récents de la méthode des scores de la Banque de France. Bulletin de la Banque de France, 90. http://www.banque-france.fr/fr/publications/telechar/bulletin/etud90_4.pdf
- Bardos, M. et Zhu, W. (1997). Comparaison de l’analyse discriminante linéaire et réseaux de neurones, applications à la détection de défaillance des entreprises. Revue de statistitique appliquée, 10 (4), 65-92.
- Beaver, W.H. (1966). Financial ratios as predictors of failure. Journal of Accounting Research, 4, 71-111.
- Beaver, W.H., Mc Nichols, M.F. et Rhie, J. (2005). Have financial statements become less informative ? Evidence from the ability of financial ratios to predict bankruptcy. Review of Accounting Studies, 10, 93-122.
- Ben Jabeur, S. (2011). Statut de la faillite en théorie financière : approches théoriques et validations empiriques dans le contexte français, thèse de doctorat. Université Toulon et Université de Sousse.
- Ben Jabeur, S. et Youssef, F. (2013). Prévision de la défaillance des entreprises : une approche de classification par les méthodes de data-mining. Gestion 2000, 30(4), 31-45.
- Ben Jabeur, S. et Youssef, F. (2014). Les modèles de prévision de la défaillance des entreprises françaises : une approche comparative. IPAG Business School, working papers series
- Bharath, S. et Shumway, T. (2008). Forecasting default with the merton distance to default model. Review of Financial Studies, 21, 1339-1369.
- Boisselier, P. et Dufour, D. (2003). Scoring et anticipation de défaillance des entreprises : une approche par la régression logistique. Archive ouverte HAL (2003) Id : halshs-00582740 https://halshs.archives-ouvertes.fr/halshs-00582740/document.
- Brabazon, A. et Keenan, P. B. (2004). A Hybrid Genetic Model for the Prediction of Corporate Failure. Computational Management Science, 1(3), 293-310.
- Charalambous, C., Charitou, A. et Kaourou, F. (2000, July). Application of Feature Extractive Algorithm to Bankruptcy Prediction. Proceedings of the IEEE-INNS-ENNS International Joint Conference on Neural Networks, Como, Italy, 303-308.
- Charitou, A., Neophytou, E. et Charalambous, C. (2004). Predicting Corporate Failure : Empirical Evidence for the UK. European Accounting Review, 13 (3), 465-497.
- Chava, S. et Jarrow, R.A. (2004). Bankruptcy prediction with industry effects. Review of Finance, 8, 537-569.
- Crutzen, C. et Van Caillie, D. (2007). L’enchaînement des facteurs de défaillance de l’entreprise : Une réconciliation des approches organisationnelles et financières. Comptabilité et environnement, CD-Rom.
- De Almeida,F. C. et Dumontier, P. (1993). Réseaux de neurones, information comptable et détection du risque de défaillance. Actes de 17 eme Congré de l’Association Francaise de Comptabilité, 1, 269-286.
- Ding, A.A., Tian, S., Yu, Y. et Guo, H. (2012). A class of discrete transformation survival models with application to default probability prediction. Journal of the American Statistical Association, 107, 990-1003.
- Fan, J. et Li, R. (2001). Variable selection via non concave penalized likelihood and its oracle properties. Journal of the American Statistical Association, 96, 1348-1360.
- Hamza, T. et Bagdadi, K. (2008). Profil et déterminants financiers de la défaillance des PME tunisiennes. Banque et Marchés, 93, 45-62.
- Härdle, W., Lee, Y.J., Schäfer, D. et Yeh, Y.R. (2009). Variable selection and oversampling in the use of smooth support vector machines for predicting the default risk of companies. Journal of Forecasting, 28, 512-534.
- Härdle, W., Moro, R. A. et Schafer, D. (2005). Predicting Bankruptcy with Support Vector Machines. Humboldt-University, Collaborative Research Center SFB, Economic Risk, Discussion Paper.
- Koller, D. et Sahami, M. (1996). Toward Optimal Feature Selection. Communication présentée en 30eme International Conference on Machine Learning (ICML), 284-292.
- Kotsiantis, S., Tzelepis, D., Koumanakos, E. et Tampakas, V. (2005). Efficiency of Machine Learning Techniques in Bankruptcy Prediction, 2d International Conference on Enterprise Systems and Accounting, 11-12 July, Thessaloniki, Greece.
- Liang, L. et Wu, D. (2003). An application of pattern recognition on scoring Chinese corporations financial conditions based on back propagation neural network. Computers and Operations Research, 32,115-132.
- Lili, S. et Prakash, P.S. (2007). Using Bayesian Networks for Bankruptcy Prediction Some Methodological Issues. European Journal of Operational Research, 180,738-753.
- Marco, L. (1989). La montée des faillites en France : 19ème et 20ème siècle (1ère ed). Paris, France : Editions, L’Harmattan.
- Meier, L., Geer, S. et Bühlmann, P. (2008). The group lasso for logistic regression. Journal of the Royal Statistical Society, 70 (1), 53-71.
- Min, J. H. et Lee, Y. C. (2005). Bankruptcy Prediction Using Support Vector Machine with Optimal Choice of Kernel Function Parameters. Expert Systems with Applications, 28 (4), 603-614.
- Min, S. H., Lee, J. et Han, I. (2006). Hybrid Genetic Algorithms and Support Vector Machines for Bankruptcy Prediction. Expert Systems with Applications, 31, 652-660.
- Ohlson, J. (1980). Financial ratios and the probabilistic prediction of bankruptcy. Journal of Accounting Research, 18, 109-131.
- Patrick, B., et Dominique, D. (2003). Scoring et anticipation de défaillance des entreprises : une approche par la régression logistique. Identification et maîtrise des risques : enjeux pour l’audit, la comptabilité et le contrôle de gestion Belgique.
- Pindado, J. et Rodrigues, L.F. (2001). Parsimonious models of financial insolvency in small companies. Working Paper, SSRN Working Paper Series.
- Pompe, P.P.M. et Bilderbeek, J. (2005 A). Bankruptcy Prediction : The Influence of the Year Prior to Failure Selected for Model Building and the Effects in a Period of Economic Decline. International Journal of Intelligent Systems in Accounting, Finance and Management, 13, 95-112.
- Pompe, P.P.M. et Bilderbeek, J. (2005 B). The Prediction of Bankruptcy of Small- and Medium-Sized Industrial Firms. Journal of Business Venturing, 20,847-868.
- Refait, C. (2004). La prévision de la faillite fondée sur l’analyse financière de l’entreprise : un état des lieux. Economie et Prévision, 162, 129-147.
- Sharma, D. S. et Iselin, E. R. (2003). The Relative Relevance of Cash-Flow and Accrual Information for Solvency Assessments : A Multi-Method Approach. Journal of Business Finance and Accounting, 30 (8), 1115-1140.
- Smith, M. et Liou D.K., (2007). Industrial sector and financial distress. Managerial Auditing Journal, 22(4), 376 – 391.
- Souleymanou, K., Mbeya Senam, B., Braune, É. & Hikkerova, L. (2019). Les dispositions d’octroi de crédit dans les pays émergents : l’appréciation subjective des dirigeants de PME en République Centrafricaine. Gestion 2000, 36(2), 111-132.
- Tang, T.C. et Chi, L.C. (2005). Neural Networks Analysis in Business Failure Prediction of Chinese Importers : A Between-Countries Approach. Expert Systems with Applications, 29, 244-255.
- Tian, S., Yan, Y. et Hui, G. (2015). Variable selection and corporate bankruptcy forecasts. Journal of Banking and Finance, 52, 89-100.
- Tibshirani, R. (1996). Regression shrinkage and selection via the lasso. Journal of the Royal Statistical Society : Series B, 58, 267-288.
- Tibshirani, R. (2011). Regression shrinkage and selection via the lasso : a retrospective. Journal of the Royal Statistical Society : Series B, 73 (3), 273-282.
- Takoudjou Nimpa, A., Braune, É. & Teulon, F. (2019). Capital social de l’entrepreneur et pérennité de sa PME. Gestion 2000, volume 36(6), 145-160.
- Varetto, F. (1998). Genetic Algorithms Applications in the Analysis of Insolvency Risk. Journal of Banking and Finance, 22, 1421-1439.
- Wang, Z. (2004). Financial Ratio Selection for Default-Rating Modeling : A Model-Free Approach and Its Empirical Performance. Journal of Applied Finance, 14 (1), 20-35.
- Yim, J. et Mitchell, H. (2002). A Comparison of Corporate Failure Models in Australia : Hybrid Neural Networks, Logit Models and Discriminant Analysis. RMIT Business School of Economics and Finance, Working Paper, n°10-2002.
- YIM, J. et MitchellI, H. (2005). A Comparison of Corporate Distress Prediction Models in Brazil : Hybrid Neural Networks, Logit Models and Discriminant Analysis, Universidade Federal de Minas Gerais, Economics Department, Nova Economia, 43.
- Zavgren, C.V. (1985). Assessing the vulnerability to failure of American industrial firms : a logistic analysis. Journal of Business Finance and Accounting, 12(1), 19-45.
- Zou, H., 2006. The adaptive lasso and its oracle properties. Journal of the American Statistical Association, 101, 1418-1429.
Mots-clés éditeurs : ACP, ADL, défaillance d’entreprise, LASSO, prévision, sélection de variables
Date de mise en ligne : 13/11/2020
https://doi.org/10.3917/g2000.373.0067