Modèles de prévision de défaillance d’entreprise et sélection de variables explicatives : le cas de la France

Madiha Zammel; Xavier Brédart

doi:10.3917/g2000.373.0067

Management & Prospective 2020/3 Volume 37

Article de revue

Modèles de prévision de défaillance d’entreprise et sélection de variables explicatives : le cas de la France

Par Madiha Zammel
et Xavier Brédart

Pages 67 à 90

ZAMMEL, Madiha
et BRÉDART, Xavier,

2020. Modèles de prévision de défaillance d’entreprise et sélection de variables explicatives : le cas de la France. Management & Prospective, 2020/3 Volume 37, p.67-90. DOI : 10.3917/g2000.373.0067. URL : https://shs.cairn.info/revue-gestion-2000-2020-3-page-67?lang=fr.

Zammel, Madiha.
et al.

« Modèles de prévision de défaillance d’entreprise et sélection de variables explicatives : le cas de la France ». Management & Prospective, 2020/3 Volume 37, 2020. p.67-90. CAIRN.INFO, shs.cairn.info/revue-gestion-2000-2020-3-page-67?lang=fr.

Zammel, M.
et Brédart, X.

(2020). Modèles de prévision de défaillance d’entreprise et sélection de variables explicatives : le cas de la France. Management & Prospective, 37(3), 67-90. https://doi.org/10.3917/g2000.373.0067.

https://doi.org/10.3917/g2000.373.0067

Notes

[1]
Banque de France : Les défaillances d’entreprises, STAT INFO, Mai 2019.
[2]
Il s’agit du cumule des douze derniers mois.
[3]
Selon l’INSEE un PME est une entreprise dont le nombre de salariés est moins de 250 personnes et le chiffre d’affaire annuel est inférieur à 50 million euro.
[4]
Bien que, dans la réalité, il existe beaucoup plus d’entreprises saines que de défaillantes, nous avons opté pour un échantillon comprenant autant d’entreprises saines que de défaillantes afin que les modèles ne se spécialisent pas dans le bon classement des entreprises saines. Cette technique est utilisée dans la majorité des modèles académiques.

Citer cet article

Zammel, M.
et Brédart, X.

(2020). Modèles de prévision de défaillance d’entreprise et sélection de variables explicatives : le cas de la France. Management & Prospective, 37(3), 67-90. https://doi.org/10.3917/g2000.373.0067.

Zammel, Madiha.
et al.

« Modèles de prévision de défaillance d’entreprise et sélection de variables explicatives : le cas de la France ». Management & Prospective, 2020/3 Volume 37, 2020. p.67-90. CAIRN.INFO, shs.cairn.info/revue-gestion-2000-2020-3-page-67?lang=fr.

ZAMMEL, Madiha
et BRÉDART, Xavier,

2020. Modèles de prévision de défaillance d’entreprise et sélection de variables explicatives : le cas de la France. Management & Prospective, 2020/3 Volume 37, p.67-90. DOI : 10.3917/g2000.373.0067. URL : https://shs.cairn.info/revue-gestion-2000-2020-3-page-67?lang=fr.

https://doi.org/10.3917/g2000.373.0067

Notes

[1]
Banque de France : Les défaillances d’entreprises, STAT INFO, Mai 2019.
[2]
Il s’agit du cumule des douze derniers mois.
[3]
Selon l’INSEE un PME est une entreprise dont le nombre de salariés est moins de 250 personnes et le chiffre d’affaire annuel est inférieur à 50 million euro.
[4]
Bien que, dans la réalité, il existe beaucoup plus d’entreprises saines que de défaillantes, nous avons opté pour un échantillon comprenant autant d’entreprises saines que de défaillantes afin que les modèles ne se spécialisent pas dans le bon classement des entreprises saines. Cette technique est utilisée dans la majorité des modèles académiques.

Introduction

1L’environnement économique actuel est caractérisé par une forte incertitude. En outre, la globalisation et le progrès technologique ont accentué la concurrence à l’échelle nationale et internationale. Face à ces conditions, plusieurs entreprises se trouvent incapables de résister ce qui entraine des défaillances fréquentes. Selon les statistiques publiées par la Banque de France [1] (Tableau1), le nombre d’entreprises françaises défaillantes est en croissance continue.

Tableau 1

Evolution des défaillances d’entreprises^a,b,c

	Avril 2018	Avril 2019
Nombre total des entreprises défaillantes	53 252	54 223
Nombre des PME^a	53 199	54 186
Nombre des ETI^b et GE^c	53	37

Evolution des défaillances d’entreprises^a,b,c

a. Petite et moyenne entreprise
b. Entreprise de Taille Intermédiaire
c. Grande Entreprise

2En effet ce nombre [2] passe de 53 252 en Avril 2018 à 54 223 à la même période de 2019. Le mouvement de défaillance concerne essentiellement les petites et moyennes entreprises [3]. De ce fait, parmi les 54 223 entreprises défaillantes en Avril 2019, 54186 sont des PME.

3Le phénomène de la défaillance intéresse un grand nombre d’acteurs (les prêteurs de fonds, les investisseurs, les actionnaires, les employés…). Dans ces conditions, il est indispensable de veiller à la protection des intérêts des différentes parties prenantes, et ainsi à la pérennité des entreprises, en prévenant les difficultés économiques et financières qu’elles peuvent rencontrer, ce qui implique notamment la mise en œuvre de modèles économétriques (Beaver, 1966 ; Altman, 1968 ; Tian et al., 2015) visant à étudier la probabilité de défaillance et à comprendre sa trajectoire (Crutzen et Van Caillie, 2007). L’approche la plus fréquente consiste à recourir à l’analyse financière afin de déterminer les variables, principalement comptables, qui différencient au mieux les entreprises défaillantes de celles qui ne le sont pas (Refait, 2004).

4L’objectif de ce papier consiste en l’élaboration d’un modèle de prévision de la défaillance utilisant la sélection de variables la plus pertinente et d’analyser l’évolution des ratios retenus sur un horizon temporel de trois années avant la défaillance afin d’en retracer la trajectoire de défaillance.

5Dans cet objectif, nous élaborons, dans ce papier, plusieurs modèles de prévision de défaillance d’entreprises à partir de données comptables sélectionnées (à partir d’une liste initiale de 30 ratios) en ayant recours à trois techniques que sont l’Analyse en Composante Principale (ACP), la technique LASSO (the least absolute shrinkage and selection operator) et l’Analyse Discriminante Linéaire (ADL). L’analyse de nos résultats rapporte que la technique LASSO permet d’obtenir les meilleurs résultats en termes de taux de bonne classification.

6D’après Crutzen et Van Caillie (2007), la défaillance est un processus de détérioration progressive des ressources pouvant la mener jusqu’à la faillite. L’analyse de l’évolution des valeurs prises par les ratios financiers sur une période de trois années permet de rapprocher nos résultats de la notion de « spirale » de la défaillance de ces auteurs.

7La suite de cet article se présente comme suite. La section suivante consiste en une revue de la littérature relative à la prévision de la défaillance. La deuxième section présente les données utilisées, les variables considérées ainsi que les méthodologies utilisées pour la sélection de variables et pour la construction des modèles. La troisième section présente et discute les résultats de l’analyse.

1 – Revue de la littérature

8Le sujet de la défaillance d’entreprise est au cœur de plusieurs débats théoriques et empiriques dans la littérature financière. Un examen détaillé des études menées sur ce thème fait état d’une diversité importante des notions retenues pour qualifier l’entreprise de défaillante. A titre d’exemple, Beaver (1966) considère comme défaillante toute entreprise incapable d’honorer ses engagements. Varetto (1998), Pindado et Rodrigues (2001), Atiya (2001) et Souleymanou et al. (2019) ont lié la notion de défaillance au risque de crédit. Selon d’autres chercheurs, tels que Liang et Wu (2003), une entreprise est dite défaillante si les cash-flows qu’elle génère ne suffisent pas à honorer ses engagements envers ses partenaires. Toutefois, certaines études, telle que celle de Refait (2004), considèrent la défaillance comme l’ouverture d’une procédure judiciaire suite à une situation de cessation de paiement. Dans ce sens, Crutzen et Van Caillie (2007) rapportent que la défaillance est un processus de détérioration progressive des ressources qui peut amener l’entreprise en justice et l’emmener jusqu’à la faillite en cas d’absence de tentatives de correction.

9Afin d’apporter des actions correctives à temps, la prévision de la défaillance est primordiale. La prévision de la défaillance présente aujourd’hui un grand intérêt aussi bien théorique qu’empirique. L’approche la plus fréquente consiste à déterminer les variables, principalement comptables, qui différencient au mieux les entreprises défaillantes et les entreprises saines et de construire un modèle explicatif de la défaillance. Une étape préalable à l’analyse des modèles de prévision consiste à sélectionner les variables les plus pertinentes afin de classer au mieux les entreprises. Cette étape peut être réalisée par le biais de différentes techniques telles que l’Analyse en Composante Principale (ACP), la technique LASSO (the least absolute shrinkage and selection operator) et l’Analyse Discriminante Linéaire (ADL).

10En termes de modèles de prévision, différents modèles sont utilisés dans la littérature comme l’approche univariée (Beaver, 1966), l’analyse discriminante multiple linéaire (Altman, 1968), la régression logistique (Ohlson, 1980), les modèles fondés sur l’intelligence artificielle tels que les réseaux de neurones (Anandarajan et Anandarajan, 2001).

2 – Méthodologie

2.1 – Données

11Nous avons utilisé la base de données Amadeus Bureau Van Dijk, qui présente les informations financières de plus de 22 millions d’entreprises à travers l’Europe, afin d’y extraire les informations issues des bilans et des comptes de résultats d’un échantillon final composé de 4400 petites et moyennes entreprises françaises non financières, divisées en deux sous-échantillons : 2200 entreprises saines et 2200 entreprises défaillantes [4].

12Une entreprise est considérée défaillante dès lors qu’elle a fait l’objet d’une première déclaration d’évènement judiciaire auprès du tribunal de commerce durant l’année 2014. Partant de l’hypothèse selon laquelle la défaillance s’inscrit dans un processus dont on peut trouver des traces plusieurs années à l’avance, nous avons collecté les données comptables sur un horizon temporel de trois ans (sur la période 2011-2013).

13En outre, lors de la constitution de l’échantillon, nous avons respecté certains critères d’homogénéité. Premièrement, nous nous sommes limités aux seules entreprises non financières. Deuxièmement, les firmes qui composent notre échantillon sont des petites et moyennes entreprises (PME). Troisièmement, l’homogénéité des groupes d’entreprises est respectée en utilisant la technique d’échantillonnage jumelé. En effet, cette technique consiste à associer à chaque entreprise défaillante une entreprise saine de même taille et de même secteur d’activité.

2.2 – Sélection des variables

14La variable dépendante dans notre étude est une variable binaire qui reflète la situation de l’entreprise. Elle prend la valeur 1 si l’entreprise est défaillante (si elle a fait l’objet d’une première déclaration d’évènement judiciaire auprès du tribunal de commerce durant l’année 2014) et 0 sinon.

15Les variables indépendantes introduites dans nos modèles de prévision de la défaillance consistent en des ratios financiers construits sur base des états comptables des entreprises. Afin d’obtenir une liste exhaustive de variables susceptibles d’impacter la défaillance d’entreprise, nous avons repris les études antérieures relatives à la prévision de la défaillance des entreprises aussi bien françaises (Bardos, 2005, 2001 ; Bardos et Zhu, 1997 et Ben Jabeur et Fahmi, 2013) qu’à l’échelle international (Beaver, 1966 ; Chava et Jarrow, 2004 ; Beaver et al., 2005 ; Härdle et al., 2009 ; Bharath et Shumway, 2008 ; Ding et al., 2012 ; Tian et al., 2015 ; Amendola et al., 2017) afin d’identifier les ratios les plus utilisés. Nous obtenons de la sorte une liste de 30 ratios financiers liés à la rentabilité, la liquidité et la gestion opérationnelle et la structure financière des entreprises. Le tableau 1 reprend la liste des ratios sélectionnés, leur mode de calcul ainsi que la catégorie à laquelle ils appartiennent.

Tableau 1

Liste initiale des ratios financiers utilisés^*

Ratio	Calcul	Catégorie *
R1	Actif courant / passif courant (ratio de liquidité générale)	LGO
R2	(Actif courant – stock) / passif courant (ratio de liquidité réduite)	LGO
R3	Trésorerie et équivalents de trésorerie / passif courant (ratio de liquidité immédiate)	LGO
R4	Total passif / total actif (ratio d’endettement)	S
R5	Capitaux propres / total bilan (ratio d’autonomie financière générale)	S
R6	Capitaux propres / total passif (ratio d’autonomie financière à court terme)	S
R7	Capitaux propres / (capitaux propres + passif non courant) (ratio d’autonomie financière à LT)	S
R8	(Passif courant – Trésorerie et équivalents de trésorerie) / total actif	LGO
R9	Passif courant / total actif	LGO
R10	Total passif / capitaux propres (structure de financement)	S
R11	(Capitaux propres + passif non courant) / total actif non courant	S
R12	Fond de roulement / chiffre d’affaires (ratio d’évolution du FR)	LGO
R13	(Client et compte rattaché *360)/ CA (recouvrement du compte client)	LGO
R14	(Fournisseur et compte rattaché *360)/ total achats (recouvrement du compte fournisseur)	LGO
R15	Capitaux propres / (PNC + PC) (ratio de solvabilité)	S
R16	(PNC + emprunts) / CP (Gearing)	S
R17	EBITDA / CP	R
R18	CA / Total actif (ratio de rotation de l’actif)	LGO
R19	CA / total des actifs immobilisés (ratio de rotation des immobilisations)	LGO
R20	Revenu opérationnel / stock (ratio de rotation de stock)	LGO
R21	Trésorerie et équivalents de trésorerie / total actif	LGO
R22	(EBIT + dotation aux amortissements et dépréciation) /total actif	R
R23	EBIT / total actif (ROTA)	R
R24	EBIT / CA	R
R25	Résultat net / CP (ratio de rentabilité financière)	R
R26	Résultat net / CA (taux de rentabilité nette)	R
R27	Revenue net / CA (profit margin)	R
R28	Revenue net / total actif	R
R29	FR / total actif (ratio d’équilibre financier)	S
R30	Résultat net / total actif (ROA : Return On Assets)	R

Liste initiale des ratios financiers utilisés^*

* R : Rentabilité, LGO : Liquidité et Gestion Opérationnelle, S : Structure

16Face au nombre élevé de ratios financiers pouvant être utilisés comme indicateurs de défaillance, une sélection appropriée des variables est nécessaire pour un meilleur développement du modèle. Koller et Sahami (1996) considèrent le choix des variables explicatives comme une tâche importante dans la modélisation et ce pour diverses raisons. Premièrement, lorsque le nombre de variables augmente, la recherche d’informations ainsi que le temps de calcul deviennent de plus en plus longs. Deuxièmement, lorsqu’on utilise un nombre élevé de variables avec une petite base de données, des problèmes de surajustement risquent de se produire. De ce fait, comme le soulignent Lili et Prakash (2007), un nombre réduit de variables est préféré à une large liste contenant des variables redondantes et non pertinentes. Pour ces raisons, les statisticiens ont développé plusieurs méthodes de sélection de sous-ensembles de variables à partir d’une liste initiale des variables explicatives en vue d’identifier les variables prédictives les plus pertinentes (Fan et Li, 2001).

17Dans notre étude, nous avons choisi de tester trois techniques de sélection de variables, dont la capacité à réduire l’ensemble des variables exogènes a été prouvée dans la littérature financière, puis, de procéder à la suppression des variables fortement corrélées (corrélation > 0.7) afin d’éviter le problème de redondance par l’introduction, dans nos modèles, des ratio contenant une information fortement similaire. Ces techniques, fréquemment utilisées dans les travaux académiques antérieurs, sont : l’analyse discriminante linéaire (Chralambous et al., 2000 ; Yim et Mitchell, 2002 ; Hardle et al., 2005 ; Tang et Chi, 2005 ; Pompe et Bilderbeek, 2005 A ; Min et al., 2006 ; Smith et Liou, 2007 ; Hamza et Bagdadi, 2008 ; …), l’analyse en composantes principales (Sharma et Iselin, 2003 ; Wang, 2004 ; Tang et Chi, 2005 ; Pompe et Bilderbeek, 2005 B ; Min et Lee, 2005 ; …) et la technique LASSO (the least absolute shrinkage and selection operator) (Tibshirani, 1996, 2011 ; Zou, 2006 ; Meir et al., 2008 ; Tian et al., 2015 ; …). Les principes de ces techniques sont relativement différents et sont présentés ci-après.

18Premièrement, l’Analyse Discriminante Linéaire (ADL) permet d’apprécier la situation financière de l’entreprise à travers une batterie de ratios. Cette technique permet d’élaborer une combinaison linéaire des variables explicatives (les ratios financiers) aboutissant à un score « Z » représentant l’appartenance d’une entreprise au groupe des entreprises défaillantes ou à celui des saines.

19

Z = β₀ + β₁ X₁ + β₂ X₂ +……+ β_n X_n

20Avec :

Z : Score de l’entreprise ;
β_0 : Constante ;
β_i : Coefficients de la combinaison linéaire des variables explicatives X_i.

21La technique consiste à inclure de nombreuses variables explicatives afin de déterminer celles qui discriminent au mieux l’appartenance à l’un ou l’autre de ces groupes en analysant le Lambda de Wilks. Il s’agit d’une approche paramétrique permettant de tester si plusieurs variables continues distinctes X= (X¹,…,X^p) sont liées à une variable qualitative Y. De ce fait, l’hypothèse H₀ testée est relative à la dépendance entre les variables X et la variable Y. Plus le λ de Wilks est proche de zéro, plus nous avons de chance d’accepter H₀, ce qui revient à dire que le ratio financier X participe fortement à l’explication de la situation financière de l’entreprise.

22Deuxièmement, l’Analyse en Composantes Principales (ACP) est une technique de réduction des données, souvent considérée comme la méthode de base de l’analyse factorielle des données. Elle consiste, suite à la projection d’un nuage de points dans un espace à dimension réduite, à sélectionner, parmi les ratios financiers initialement utilisés comme variables explicatives, ceux qui interviennent le plus dans l’explication de la situation financière de l’entreprise (défaillante ou saine). Elle permet d’obtenir des variables composites (facteurs) au sein desquelles ne sont conservées que les variables fortement corrélées avec les facteurs les plus importants. Il s’agit donc d’obtenir le résumé le plus pertinent possible des données initiales.

23Troisièmement, LASSO (Least Absolute Shrinkage and Selection Operator) est une méthode de pénalisation et de sélection de variables proposée par Tibshirani, 1996. La défaillance d’entreprise (Y) peut être modélisée de la manière suivante :

24

Yⁿ = βⁿXⁿ +εⁿ

25Avec :

n : nombre d’observations ;
X : les variables explicatives (les ratios financiers)
β : vecteur de coefficients LASSO
εⁿ = (ε₁+…+ε_n) ^T : terme d’erreur (qui contient toutes les variables explicatives non prises en compte dans le modèle).

26Dans notre étude, la finalité du LASSO est de pénaliser et éliminer les ratios financiers ayant le rôle le plus faible dans l’explication de la situation financière de l’entreprise. Le pouvoir explicatif diffère d’une variable à l’autre, l’objectif est alors d’éliminer uniquement les variables inutiles. L’idée de la pénalisation exercée par le LASSO est donc de réaliser une régression régularisée qui annule certains coefficients de l’estimation de β aboutissant ainsi à des modèles parcimonieux ne contenant que les ratios financiers (variables explicatives) les plus pertinents.

2.3 – Modèles

27Dans ce papier, nous avons choisi d’établir deux modèles de prévision de défaillance d’entreprises fréquemment utilisés dans la littérature financière : la régression logistique et le réseau de neurone artificiel et de comparer leurs performances. Premièrement, le modèle de régression logistique est généralement utilisé parce qu’il est moins contraignant que l’analyse discriminante quant à la distribution des variables (Ohlson, 1980) et (Zavgren, 1985). L’avantage majeur que présente ce modèle est d’être une méthode statistique capable de combiner plusieurs variables indépendantes, sans que l’hypothèse de normalité soit une condition nécessaire, et de fournir directement la probabilité de la réalisation de l’événement, permettant de ce fait une interprétation aisée des résultats (Ben Jabeur, 2011).

28La régression logistique consiste à déterminer la probabilité qu’un événement se réalise pour un individu, connaissant les valeurs prises par les variables explicatives (X1, X2,…Xn).

29Dans notre cas d’étude, il s’agit de connaître la probabilité de défaillance d’une entreprise, d’après ses caractéristiques comptables et financières.

30Sachant que la variable dépendante (situation financière de l’entreprise) est une variable binaire qui prend la valeur 1 si l’entreprise est défaillante et la valeur 0 si elle est saine, la probabilité de défaillance peut s’écrire sous la forme de P_i = P (Y_i =1) et la probabilité d’être saine est 1 – P_i_. Le modèle Logit suppose que la variable endogène est une combinaison non linéaire des variables exogènes plus l’erreur qui est supposée suivre une loi logistique. Ce qui peut s’écrire sous la forme :

31

$Description de l'image par IA : L majuscule N majuscule de ronde parenthèse gauche début fraction P majuscule parenthèse gauche Y majuscule indice i position de base égale 1 parenthèse droite sur P majuscule parenthèse gauche Y majuscule indice i position de base égale 0 parenthèse droite fin fraction parenthèse droite égale bêta indice 0 position de base bêta indice 1 position de base X majuscule indice 1 position de base points de suspension bêta indice p position de base X majuscule indice p position de base$

32Avec

β_i : vecteur des coefficients estimés généralement par la méthode de maximum de vraisemblance.
X_i : vecteur des variables explicatives : les ratios financiers.

33De nombreux travaux sur la prévision de la défaillance se sont appuyés sur la régression logistique. Dans le cas de la France, citons les travaux de Boisselier et Dufour, 2003 et Ben Jabeur et Youssef, 2014 qui ont prouvé l’efficacité de cette technique à l’aide des taux de bons classements respectifs de 80% et 98%.

34Deuxièmement, le modèle neuronal est retenu en tant que spécimen des modèles de l’intelligence artificielle. Il présente en effet, plusieurs avantages tels que la robustesse, la capacité de traiter des problèmes avec des données manquantes, la capacité de traiter des problèmes non linéaires parfaitement complexes ou encore l’efficacité dans le traitement des problèmes sur lesquels on ne dispose d’aucune information à priori.

35Cette méthode de classification, qui s’inspire du système neuronal biologique, consiste à développer un algorithme d’apprentissage qui traite un ensemble d’informations pour obtenir un résultat. Elle est composée d’opérateurs mathématiques simples appelés « neurones formels ». Le neurone formel est une fonction algébrique non linéaire, paramétrée de variables réelles qui servent à mettre en relation non linéaire les inputs (les ratios financiers) et les outputs (situation de l’entreprise saine ou défaillante) à l’aide d’une fonction d’activation (voir figure 1).

Figure 1

Modèle d’un neurone artificiel

Avec :

Y_i : Variables d’entrée ;
W_ij : Poids relatif de la variable i au niveau du neurone j ;
A=∑_i=1…nW_i,j Y_i ;
S=F(A)= la situation financière de l’entreprise.

36Le modèle neuronal réalise un produit scalaire « A » entre son vecteur d’entrée « Y » (les ratios financiers) et le vecteur poids « W » et utilise une fonction d’activation « F » pour déterminer le groupe d’appartenance de l’entreprise (la sortie « S »). Différentes fonctions de transfert peuvent être utilisées dans ce type du réseau telles que la fonction linéaire, la fonction sigmoïde standard et la fonction tangente hyperbolique.

37De multiples études et travaux de recherches sur la défaillance des entreprises ont prouvé l’efficacité de cette technique en aboutissant à des taux de bons classements supérieurs à 75% (Anandarajan et al., 2001 ; Atia, 2001 ; Bardos et Zhu,1997 ; Baek et Cho, 2003 ; Brabazon et Keenan, 2004 ; Charitou et al., 2004 ; Kotsiantis et al., 2005 ; Yim et Mitchel, 2005).

3 – Résultats et discussion

38Le tableau 2 reprend, de manière globale mais également par catégorie d’entreprises (défaillantes et saines) les moyennes ainsi que les tests de différences de moyennes réalisés sur les 30 ratios issus de notre liste initiale. Comme attendu, nous pouvons remarquer que beaucoup de ces ratios affichent une différence de moyenne significative entre les deux catégories d’entreprises. Remarquons également que de meilleures valeurs sont globalement enregistrées pour les entreprises saines. A titre exemplatif, nous pouvons remarquer que R1 (représentant le ratio de liquidité générale) est plus élevé, en moyenne, pour les entreprises saines que pour les entreprises défaillantes (1.35 versus 1.19), que R15 (représentant la solvabilité structurelle) est plus élevé, en moyenne, pour les entreprises saines que pour les entreprises défaillantes (0.41 versus 0.35) ou encore que R30 (représentant le return on assets) est également plus élevé, en moyenne, pour les entreprises saines que pour les entreprises défaillantes (0.00 versus 0.04). Inversement les entreprises défaillantes possèdent, par exemple, un niveau d’endettement (R4) plus élevé que celui des entreprises saines (0.76 versus 0.73).

Tableau 2

Statistiques descriptives

Ratio	Test de difference de moyenne			Moyenne			Technique de selection			gorie Catego
Ratio		Sig	Difference de moyenne	Echantillon global	Entreprises defaillantes	Entreprises saines	ACP	LASSO	ADL	gorie Catego
R1	-7,22	0,00	-0,15	1,27	1,19	1,35				LGO
R2	-2,86	0,00	-0,05	0,84	0,82	0,87		X		LGO
R3	1,69	0,09	0,02	0,2	0,2	0,19				LGO
R4	9,90	0,00	0,04	0,74	0,76	0,73				S
R5	28'6-	0,00	-0,03	0,26	0,24	0,27		X		S
R6	-5,26	0,00	60'0	0,53	0,48	0,57			X	S
R7	-2,57	0,01	-0,02	0,73	0,72	0,74		X	X	S
R8	2,95	0,00	0,02	0,52	0,53	0,51				LGO
R9	5,24	0,00	0,03	0,62	0,63	0,61			X	LGO
R10	7,48	0,00	1,52	4,79	5,55	4,03	X	X		S
R11	1,02	0,31	7,85	9,59	13,52	5,67	X			S
R12	-7,30	0,00	-0,06	0,06	0,03	0,09	X	X		LGO
R13	-0,76	0,45	-1,02	49,22	48,71	49,73	X	X	X	LGO
R14	0,97	0,33	1,56	50,12	50,9	49,35		X		LGO
R15	-8,92	0,00	-0,06	0,38	0,35	0,41	X		X	S

Test de différence de moyenne Moyenne Technique de sélection Ratio Différence t Sigde moyenne Echantillon global Entreprises défaillantes Entreprises saines ACP LASSO ADL R1 -7,22 0,00 -0,15 1,27 1,19 1,35 LGO R2 -2,86 0,00 -0,05 0,84 0,82 0,87 X X LGO R3 1,69 0,09 0,02 0,2 0,2 0,19 LGO R4 9,90 0,00 0,04 0,74 0,76 0,73 S R5 -9,87 0,00 -0,03 0,26 0,24 0,27 X S R6 -5,26 0,00 -0,09 0,53 0,48 0,57 X S R7 -2,57 0,01 -0,02 0,73 0,72 0,74 X X S R8 2,95 0,00 0,02 0,52 0,53 0,51 LGO R9 5,24 0,00 0,03 0,62 0,63 0,61 X X LGO R10 7,48 0,00 1,52 4,79 5,55 4,03 X X S R11 1,02 0,31 7,85 9,59 13,52 5,67 X S R12 -7,30 0,00 -0,06 0,06 0,03 0,09 X X LGO R13 -0,76 0,45 -1,02 49,22 48,71 49,73 X X X LGO R14 0,97 0,33 1,56 50,12 50,9 49,35 X LGO R15 -8,92 0,00 -0,06 0,38 0,35 0,41 X X S

Statistiques descriptives

Tableau de données avec des ratios financiers et des techniques de sélection pour des entreprises.

	Test de difference de moyenne			Moyenne			Technique de selection			Categ
	+	Sig	Difference de moyenne	Echantillon global	Entreprises defaillantes	Entreprises saines		LASSO	ADL	Categ
R16	4,87	0,00	0,21	1,11	1,22	1,01		X	X	S
R17	-8,59	0,00	-0,29	0,23	0,08	0,37				R
R18	-7,48	0,00	-0,35	2,49	2,32	2,67	X	X	X	LGO
R19	0,98	0,33	52,34	77,32	103,49	51,15		X		LGO
R20	1,18	0,24	3,40	44,91	46,61	43,21		X		LGO
R21	2,18	0,03	0,01	0,1	0,11	0,1		X	X	LGO
R22	-12,15	0,00	-0,04	0,07	0,05	0,09			X	R
R23	-13,73	0,00	-0,04	0,03	0,01	0,05				R
R24	-10,99	0,00	-0,02	0,02	0,01	0,03				R
R25	-11,01	0,00	-0,38	-0,04	-0,22	0,15			X	R
R26	-10,52	0,00	-0,02	0,01	0	0,02	X	X		R
R27	-9,06	0,00	-0,02	0,01	0	0,02			X	R
R28	-12,95	0,00	-0,03	0,02	0,01	0,04	X	X		R
R29	-11,64	0,00	-0,08	0,11	0,07	0,15	X	X	X	S
R30	-13,06	0,00	-0,04	0,02	0	0,04				R

Test de différence de moyenne Moyenne Technique de sélection Ratio t Différence Sig de moyenne Echantillon global Entreprises défaillantes Entreprises saines ACP LASSO ADL R16 4,87 0,00 0,21 1,11 1,22 1,01 X X S R17 -8,59 0,00 -0,29 0,23 0,08 0,37 R R18 -7,48 0,00 -0,35 2,49 2,32 2,67 X X X LGO R19 0,98 0,33 52,34 77,32 103,49 51,15 X LGO R20 1,18 0,24 3,40 44,91 46,61 43,21 X LGO R21 2,18 0,03 0,01 0,1 0,11 0,1 X X LGO R22 -12,15 0,00 -0,04 0,07 0,05 0,09 X R R23 -13,73 0,00 -0,04 0,03 0,01 0,05 R R24 -10,99 0,00 -0,02 0,02 0,01 0,03 R R25 -11,01 0,00 -0,38 -0,04 -0,22 0,15 X R R26 -10,52 0,00 -0,02 0,01 0 0,02 X X R R27 -9,06 0,00 -0,02 0,01 0 0,02 X R R28 -12,95 0,00 -0,03 0,02 0,01 0,04 X X R R29 -11,64 0,00 -0,08 0,11 0,07 0,15 X X X S R30 -13,06 0,00 -0,04 0,02 0 0,04 R

* R : Rentabilité, LGO : Liquidité et Gestion Opérationnelle, S : Structure

39Le tableau 2 présente également le résultat de la sélection des variables exogènes par les trois techniques ADL, ACP et LASSO (les résultats détaillés des trois techniques sont présentés en annexe 1). Afin d’évaluer la capacité de chaque technique à sélectionner les variables les plus explicatives de la situation financière de l’entreprise nous avons utilisé leurs sélections comme variables exogènes et donc comme input pour un modèle Logit et un modèle neuronal afin d’en analyser les taux de bons classements.

40Le tableau 3 reprend les taux de bons classements (TBC) des entreprises pour les trois années d’étude, précise les taux d’erreur de type 1 E1 (classer une entreprise comme saine alors qu’elle est défaillante) et de type 2 E2 (classer une entreprise comme défaillante alors qu’elle est saine) ainsi que la proportion de ratios retenus par catégories (LGO : liquidité et de gestion opérationnelle, R : rentabilité, S : structure).

Tableau 3

Modèle neuronal (RN) et modèle Logit

Tableau comparatif de modèles neuronaux (RN) et Logit avec différentes techniques de sélection et catégories de ratio.

Modele	Technique de selection	T-1			T-2			T-3			Categorie de ratio (proportion)
Modele	Technique de selection	TBC	E1	E2	TBC	E1	E2	TBC	E1	E2	LGO	R	S
RN	ADL	66.1	21.8	12.1	60.7	22.8	16.4	60.7	23.1	16.2	0.38	0.24	0.38
	ACP	67.2	21.8	11.0	66.7	33.7	30.1	63.7	19.3	16.9	0.33	0.22	0.45
	LASSO	70.6	18.6	10.8	67.4	18.8	13.8	64.2	21.8	13.9	0.56	0.13	0.31
LOGIT	ADL	63.6	41.1	31.7	60.2	42.1	37.4	59.1	43.9	37.9	0.38	0.24	0.38
	ACP	62.6	41.9	33	58.3	44.5	38.9	57.6	58.3	42.9	0.33	0.22	0.45
	LASSO	64.4	39.3	31.8	60.8	21.2	36	59.7	37.9	42.7	0.56	0.13	0.31

Modèle Technique de sélection T-1 T-2 T-3 Catégorie de ratio (proportion) TBC E1 E2 TBC E1 E2 TBC E1 E2 LGO R S RN ADL 66.1 21.8 12.1 60.7 22.8 16.4 60.7 23.1 16.2 0.38 0.24 0.38 ACP 67.2 21.8 11.0 66.7 33.7 30.1 63.7 19.3 16.9 0.33 0.22 0.45 LASSO 70.6 18.6 10.8 67.4 18.8 13.8 64.2 21.8 13.9 0.56 0.13 0.31 LOGIT ADL 63.6 41.1 31.7 60.2 42.1 37.4 59.1 43.9 37.9 0.38 0.24 0.38 ACP 62.6 41.9 33 58.3 44.5 38.9 57.6 58.3 42.9 0.33 0.22 0.45 LASSO 64.4 39.3 31.8 60.8 21.2 36 59.7 37.9 42.7 0.56 0.13 0.31

Modèle neuronal (RN) et modèle Logit

41Nous pouvons constater que la technique LASSO rapporte les meilleurs résultats en termes de classification (voir annexe 2). En effet, que le modèle de prévision de la défaillance utilisé soit le réseau de neurone ou la régression logistique, le taux de bons classements (TBC) obtenu avec la sélection de variables retenues par la technique LASSO est systématiquement supérieur aux taux obtenus via l’ACP ou l’ADL, que ce taux soit calculé un, deux ou trois ans avant la défaillance. La sélection de variables optimale permet donc de classer correctement plus de 70% (avec le réseau neuronal) des entreprises de notre échantillon un an avant la défaillance.

42Plus précisément, la classification par l’approche neuronale a abouti aux résultats suivants. En T-1, le modèle a classé correctement 70.6% des entreprises de notre échantillon avec une erreur type 1 (pourcentage des entreprises défaillantes considérées saines) de 18.6% et une erreur type 2 (pourcentage des entreprises saines considérées défaillantes) de 10.8%. Deux ans de la défaillance, le taux de bons classements est de 67.4% avec une erreur type 1 de 18.8% et erreur type 2 de 13.8%. Trois ans avant la défaillance, le modèle n’arrive à classer correctement que 64.2% des entreprises avec une erreur type 1 de 21.8% et une erreur type 2 de 13.9%.

43La classification par le modèle Logit rapporte qu’un an avant la défaillance ce modèle est capable de classer correctement 64.4% des entreprises avec une erreur type 1 qui s’élève à 39.3% et une erreur type 2 de 31.8%. Deux ans avant la défaillance, le TBC se réduit à 60.8% et l’erreur type 1 augmente à 21.2%, l’erreur type 2 à 36%. A trois ans avant la défaillance, le TBC continue à baisser pour atteindre 59.7% et les erreurs de type 1 et 2 continuent à augmenter pour atteindre respectivement les valeurs de 37.9% et 42.7%.

44La comparaison de la performance globale des deux modèles montre que le TBC de l’approche neuronale calculé à différents intervalles temporels (T-1, T-2 et T-3) est supérieur à celui du modèle Logit. Un an avant la défaillance, l’approche neuronale aboutit à un TBC de 70.6% contre 64.4% pour le modèle Logit. Deux ans avant la défaillance, les TBC sont de 67.4% pour l’approche neuronale et de 60.8% pour le modèle Logit. Enfin, trois ans avant la défaillance, le réseau de neurones arrive à classer correctement 64.2% des entreprises contre seulement 59.7% pour la régression logistique. De ce fait, nous pouvons affirmer la supériorité du modèle neuronal par rapport au modèle Logit pour la prévision de la défaillance de notre échantillon d’entreprises. Ces résultats sont en ligne avec ceux d’études antérieures telle que celle de De Almeida et Dumontier (1993) qui ont montré, à partir d’un échantillon d’entreprises françaises du secteur du transport, qu’un modèle neuronal domine généralement un modèle de régression de type Logit.

45En ce qui concerne le pouvoir prédictif des deux modèles au fil du temps en passant de un à deux et à trois ans avant la défaillance, nous avons constaté une chute des taux de bons classements aussi bien pour le modèle neuronal que le modèle Logit.

46Pour le modèle neuronal, le TBC passe de 70.6% un an avant la défaillance à 67.4% deux ans avant la défaillance, pour arriver à 64.2% trois ans avant cette date critique. Le modèle de régression logistique aboutit à un TBC de 64.4% un an avant la défaillance puis, 60.8% deux ans avant la défaillance et enfin 59.7% à un horizon de trois ans avant la défaillance.

47Par conséquent, nous pouvons conclure que plus on élargit l’horizon d’analyse, plus la qualité de prédiction se réduit. En d’autres termes, plus l’horizon de prévision est éloigné, plus la capacité prévisionnelle des modèles se réduit. Ce résultat est confirmé par plusieurs travaux académiques antérieurs dont on peut citer à titre d’exemple Atia, 2001 (le TBC à un an avant la défaillance est égal à 87.04% et à deux ans il s’élève à 57.14%), Brabazon et Keenan, 2004 (le TBC à un an avant la défaillance est égal à 80.67% et il se réduit à deux ans avant cette date pour arriver à 72%), Kotsiantis et al., 2005 (le TBC passe de 71.17%, un an avant la défaillance, à 57.14% deux ans en avant). Ce résultat peut être expliqué par le fait que, lorsque l’horizon prévisionnel s’éloigne à deux ans ou trois ans avant la défaillance, les modèles perdent leur capacité de discrimination. En effet, Le groupe des entreprises saines perd de son homogénéité ; une partie possède le profil d’entreprises en bonne situation financière et une autre partie présente des déficiences financière mais qui sont insuffisantes pour être radicalement différentes des premières. C’est le cas aussi des entreprises défaillantes à cause des facteurs accidentels tels qu’une catastrophe naturelle ou la mort de son propriétaire ou un actionnaire majoritaire. A deux ans et trois ans avant la défaillance, l’entreprise peut alors être considérée saine alors qu’elle est défaillante à la date T. Le tableau 3 rapporte également les proportions de catégories de ratios retenus en fonction de la technique de sélection de variables. Nous pouvons remarquer que la technique LASSO intègre une proportion de ratios de liquidité et de gestion opérationnelle sensiblement supérieure aux techniques concurrentes (56%), viennent ensuite les ratios de structure (31%) et enfin les ratios de rentabilité (13%).

48L’évolution des ratios financiers au fil du temps est présentée à la figure 2.

Figure 2

Evolution des catégories de ratios sélectionnés

Description de l'image par IA : Trois graphiques montrant l'évolution des ratios financiers de 2011 à 2013.

L'image contient trois graphiques représentant l'évolution de différentes catégories de ratios sur les années 2011, 2012 et 2013. Le premier graphique, intitulé "Ratios de liquidité et gestion opérationnelle", montre trois séries de données : - R2 (losanges noirs) reste relativement stable autour de 8000. - R9 (carrés gris) est stable autour de 6000. - R21 (triangles gris) est stable autour de 1000. Le deuxième graphique, intitulé "Ratios de rentabilité", montre deux séries de données : - R28 (carrés gris) diminue de manière significative de 0,45 en 2011 à environ -0,1 en 2013. - R26 (losanges noirs) diminue également de manière significative de 0,1 en 2011 à environ -0,1 en 2013. Le troisième graphique, intitulé "Ratios de structure", montre quatre séries de données : - R5 (losanges noirs) reste stable autour de 12000. - R16 (carrés gris) reste stable autour de 10000. - R29 (triangles gris) reste stable autour de 6000. - R7 (croix noires) reste stable autour de 2000. Ces graphiques illustrent les tendances des ratios de liquidité, de rentabilité et de structure sur une période de trois ans.

Evolution des catégories de ratios sélectionnés

49L’analyse des résultats présentés au tableau 3 et sur la figure 1 nous permet de conclure que le processus de défaillance se déroule comme suit. A cause de certains facteurs, qui peuvent être externes ou internes, la position de l’entreprise sur son marché s’affaiblit. Elle perd des parts de marché et son chiffre d’affaire se détériore, ce qui conduit à une baisse de sa compétitivité et de sa rentabilité (Marcot, 1989). A titre exemplatif, on constate une baisse de R26 (taux de rentabilité nette= résultat net / chiffre d’affaire) et de R28 (Revenu net / total actif)) à mesure que la défaillance se rapproche. La diminution de la rentabilité de l’entreprise entraine un manque d’autofinancement. Notons que R10 (structure de financement = total passif / capitaux propre diminue) qui à son tour engendre des problèmes de trésoreries, de liquidité (R2 (ratio de liquidité réduite = (Actif courant – stock) / actif courant) diminue), de gestion opérationnelle et un affaiblissement des ressources de l’entreprise : la motivation du personnel diminue (augmentation des taux d’absentéisme et des erreurs…), les ressources techniques sont difficilement renouvelées… (Crutzen et Van Caillie, 2007). Avec la carence de ses ressources financières propres, l’entreprise se trouve obligée de recourir de plus en plus à l’endettement pour financer ses activités (R16 (passif non courant + emprunt) / capitaux propres) diminue) ce qui affaiblit son autonomie financière (R5 (ratio d’autonomie financière générale = capitaux propres / total bilan) diminue) et perturbe son équilibre financier (R29 (ratio d’équilibre financier = fond de roulement / total actif) diminue). Le recours excessif à l’endettement aboutit à l’augmentation des charges financières (Marco 1989) qui, associées au recul de son activité, amène l’entreprise à une situation d’insolvabilité. Dans ces conditions et en l’absence de mesures correctives, l’entreprise se trouve incapable d’honorer ses engagements envers ses différents partenaires (banques, clients, fournisseurs, salariés…) et peut devoir se résoudre à la faillite.

Conclusion

50Cette étude apporte une contribution à la littérature relative à la défaillance d’entreprises. Sur base d’un échantillon de 4400 entreprises françaises, nous avons réalisé deux modèles de prédiction de la défaillance, l’un statistique et l’autre issus des techniques de l’intelligence artificielle. Partant d’une batterie de 30 ratios financiers, nous avons également testé trois techniques de sélection de variables ; à savoir, l’ACP, l’ADL et le LASSO. Nos résultats rapportent la supériorité des modèles utilisant la sélection de variables issue de la technique LASSO qui permettent de classer correctement les entreprises avec un taux de bons classements de 70 pourcents environ (avec un RN à T-1). De plus, l’analyse des résultats d’un modèle neuronal et d’un modèle Logit sur une période d’un an, deux ans et trois ans avant la défaillance nous permet de conclure d’une part, en la supériorité du modèle neuronal en matière de prévision (TBC de RN =70.6% > TBC du modèle Logit = 64.4%) et, d’autre part, que plus on éloigne l’horizon temporel de l’étude plus la capacité prévisionnelle du modèle se réduit. En outre, l’analyse de la nature des ratios retenus peut être rapprochée de la théorie de la spirale de défaillance développée par Crutzen et Van Caillie (2007). En effet, le poids des différentes catégories de ratios retenus reflète l’enchaînement des symptômes de la défaillance.

51Outre l’intérêt académique, cette recherche peut également être d’utilité pour les différents acteurs préalablement cités tels que les actionnaires, les créanciers, les fournisseurs ou encore les instances politiques qui sont intéressés par la pérennité des entreprises. En effet, la défaillance n’est généralement pas un évènement soudain mais est le résultat d’un processus. L’étude du cheminement qui mène l’entreprise à cette situation critique à travers l’évolution de ses indicateurs économiques et financiers au fil du temps, a prouvé que la défaillance commence par la détérioration de la position de l’entreprise sur son marché, la baisse de son chiffre d’affaire, et les problèmes de liquidité qui en découlent, puis, passe par le recours excessif à l’endettement qui affaiblit son autonomie financière et perturbe son équilibre menaçant ainsi sa solvabilité. Les résultats de nos analyses apportent aux responsables (dirigeants, actionnaires…) des clés afin de prendre les mesures propices et nécessaires dès l’apparition des premiers signes des difficultés afin de garantir la pérennité de l’entreprise. Cette étude est également d’un intérêt évident pour les analystes financiers ainsi que les agences de notation dont un des rôles majeurs consiste à appréhender la probabilité de défaillance des entreprises.

52Cette étude comporte plusieurs limites qui ouvrent la voie à des pistes de recherche complémentaires. Par exemple, notre base de données utilise uniquement des données financières sur des sociétés françaises. La France possédant ses propres caractéristiques (notamment en termes de lois sur les faillites), il serait pertinent de réaliser une étude incluant les données relatives à des entreprises issues de pays différents à des fins de généralisation et des données extrafinancières (Takoudjou Nimpa et al., 2019). En outre, d’autres techniques de sélection de variables ou de modélisation pourraient être testées.

Annexe 1

Résultats de sélection des variables par ADL, ACP et LASSO

✓ ADL

Description de l'image par IA : Tableau récapitulatif des fonctions discriminantes canoniques.

L'image montre un résumé des fonctions discriminantes canoniques. Elle est divisée en plusieurs sections principales : 1. **Valeurs propres** : - **Fonction** : 1 - **Valeur propre** : .116 - **Pourcentage de variance** : 100.0 - **Pourcentage cumulatif** : 100.0 - **Corrélation canonique** : .323 - Note : Les premières fonctions discriminantes canoniques utilisées dans l'analyse. 2. **Test de Wilks' Lambda** : - **Fonction(s)** : 1 - **Lambda de Wilks** : .896 - **Carré chi** : 482.749 - **df** : 13 - **Sig.** : .000 3. **Coefficients de la Fonction Discriminante Canonique Normalisée** : - **Fonction** : 1 - **R2** : -.259 - **R6** : .275 - **R7** : -.336 - **R9** : .645 - **R13** : .306 - **R15** : .706 - **R16** : .223 - **R18** : -.465 - **R21** : -.318 - **R22** : .359 - **R25** : .227 - **R27** : .210 - **R29** : .610 L'image présente des données statistiques détaillées sur les fonctions discriminantes canoniques utilisées dans une analyse.

✓ ACP

Tableau de Facteur Analytique avec tests KMO et de Bartlett, matrices de communautés et composantes tournées.

Factor Analysis
KMOandBartlett'sTest
Kaiser-Meyer-OlkinMeasure ofSamplingAdequacy.		,744
BartlettsTestApprox.Chi- ofSphericity	Square df	11744,272 45
	Sig.	0,000
Communalities
	Initial	Extraction
r10	1,000	,727
r11	1,000	,712
r12	1,000	,727
r13	1,000	,688
r15	1,000	,745
r18	1,000	,747
r26	1,000	,832
r28	1,000	,819
r29	1,000	,804
Rotated ComponentMatrixa
	Component
	1	2	3	4
r10	-,057	-,170	-,833	-,005
r11	,033	-,050	,694	,000
r12	,831	,027	,005	-,190
r13	,132	560-	-,284	-,763
r15	,189	,225	,810	,045
r18	,047	,018	-,194	,841
r26	,040	,910	,039	,026
r28	,075	,889	,126	,084
r29	,853	,085	,259	,047
ExtractionMethod:Principal ComponentAnalysis.
a.Rotationconverged in5iterations.

✓ ACP

✓ LASSO

CATREG-RegressionforCategorical Data
CaseProcessingSummary
ValidActive Cases	4400
ActiveCases withMissing	0	Values
Supplementa	0	ryCases
	4400	Total
Cases Used	4400	inAnalysis

LassoModels

		n"RSquare"	Selected	Sumof	Prediction	PP
	Penalty	(1-Error)	Predictors	Coefficients	Error	Estimatea	Std.Error	Nb
	0,000	,208	16	1,000	,792	,811	,010	4400
2℃	,020	,204	16	,767	,796	,810	600	4400
3d	,040	,196	16	,627	,804	,815	600	4400
4	,060	,187	12	,518	,813	,822	,008	4400
5	,080	,177	11	,440	,823	,830	,008	4400
6	,100	,168	10	,386	,832	,838	,007	4400
4		,157	10	,334	,843	,848	,007	4400
8	,140	,147	10	,290	,853	,858	,007	4400
9		,134	9	,242	,866	,871	,006	4400
10	,180	,121	8	,201	,879	,883	,006	4400
11	,200	,110	5	,168	,890	,893	,006	4400
12	,220	,103	4	,149	,897	,899	,005	4400
13	,240	,098	3	,137	,902	,904	,005	4400
14	,260	,093	3	,127	,907	,908	,005	4400
15	,280	,089	3	,117	,911	,913	,004	4400
16	,300	,083	3	,107	,917	,918	,004	4400
17	,320	,078	3	,097	,922	,924	,004	4400
18	,340	,072	3	,087	,928	,930	,004	4400
19	,360	,065	3	,077	,935	,936	,003	4400
20	,380	,058	3	,067	,942	,943	,003	4400
21	,400	,052	2	,057	,948	,951	,003	4400
22	,420	,043	1	,047	,957	,956	,002	4400
23	,440	,038	1	,041	,962	,962	,002	4400
24	460	,034	1	,036	,966	,966	,002	4400
25	,480	,029	1	,030	,971	,971	,002	4400
26	,500	,024	1	,025	,976	,976	,001	4400
27	,520	,019	1	,019	,981	,981	,001	4400
28	,540	,014	1	,014	,986	,888	,005	4400
29	,560		0	0,000

a.MeanSquaredError(10foldCrossValidation).

b.IfNissmallerthanthenumberofactive(training)cases,thisisduetoexcludingcasesfromestimationof theexpected

c.Optimalmodel:2（predictors:r2r5r7r9r10r12r13r14r16r18r19r20r21r26r28r29）.

d.Selectedmodel:3（moreparsimonuousmodelwithin1Std.Erroroftheoptimalmodel,predictors:r2r5r7r9r10r12r13r14r16 r18r19r20r21r26r28r29).

✓ LASSO

Annexe 2

Résultats des modèles RN et Logit utilisant les variables sélectionnées par Lasso à N-1

Tableau de résumé de traitement des cas pour perceptron multicouche.

Multilayer Perceptron
CaseProcessing Summary
N Percent
Sample	Training	3034	69,0%
	Testing	1366	31,0%
Valid		4400	100,0%
Excluded			0
Total			4400
NetworkInformation
InputLayer	Covariates	1	r2
		2	r5
		3	r7
		4	r9
		5	r10
		6	r12
		7	r13
		8	r14
		9	r16
		10	r18
		11	r19
		12	r20
		13	r21
		14	r26
		15 16	r28 r29
	NumberofUnits
	RescalingMethodfor		16 Standardized
Hidden	NumberofHidden Layers NumberofUnitsinHidden		1
Layer(s)	ActivationFunction		Hyperbolic
OutputLayer	Dependent Variables	1	y
	NumberofUnits		2
	ActivationFunction		Softmax
	ErrorFunction		Cross-
			entropy
a.Excludingthebiasunit
Classification
			Predicted
Sample		saine	defaillante	Percent Correct
Training	saine	1210	337	78,2%
	defaillante Overall	571 58.7%	916 41,3%	61,6% 70,1%
Testing	Percent saine			77,5%
		506	147	64,4%
	defaillante Overall	254 55,6%	459 44,4%	70,6%
DependentVariable:y

Description de l'image par IA : Tableau de régression logistique avec résumé du traitement des cas, tableau de classification et encodage des variables.

L'image représente une sortie d'analyse de régression logistique. Voici une description détaillée : En haut, le titre "Régression Logistique" est affiché. Sous le titre, il y a une section intitulée "VARIABLES DE LA RÉGRESSION LOGISTIQUE y" suivie de plusieurs colonnes étiquetées de r2 à r29. Ensuite, il y a des commandes spécifiques : - /METHOD=ENTER - /CLASSPLOT - /PRINT=Corr - /CRITERIA=PIN(0.05) POUT(0.10) ITERATE(20) CUT(0.5). Une section intitulée "Résumé du Traitement des Cas" suit, avec un tableau indiquant : - Cas non pondérés - Cas sélectionnés inclus dans l'analyse : 4400 (100%) - Cas manquants : 0 (0%) - Total des cas sélectionnés : 4400 (100%) - Cas non sélectionnés : 0 (0%) - Total : 4400 (100%) Une note indique : "a. Si le poids est en vigueur, voir le tableau de classification pour le total." En dessous, il y a une section intitulée "Variable Dépendante Codage" avec : - Valeur originale - Valeur interne - "saine" codée comme 0 - "défaillante" codée comme 1 Ensuite, il y a une section intitulée "Table de Classification" avec un tableau montrant : - Observé - Prédit - Pourcentage Correct Le tableau de classification est divisé en : - Étape 1 - Observé : "saine" et "défaillante" - Prédit : "saine" et "défaillante" - Pourcentage Correct pour chaque catégorie Les résultats montrent : - Pour "saine" : 1500 prédits corrects sur 1500 (68,2%) - Pour "défaillante" : 865 prédits corrects sur 1335 (60,7%) - Pourcentage Correct global : 64,4% Une note indique : "a. La valeur de coupure est .500." L'image est une analyse statistique détaillée avec des résultats de classification et des pourcentages de précision.

Références

Altman, E. I. (1968). Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. The Journal of Finance, 23(4), 589-609.
Amendola, A., Francesco, G., Parrella, M.L., et Restaino, M. (2017). Variable selection in high ?dimensional regression : a nonparametric procedure for business failure prediction. Applied Stochastic Models in Business and Industry, 33, 355-368.
Anandarajan, M., Lee, P. et Anandarajan, A. (2001). Bankruptcy Prediction of Financially Stressed firms : An Examination of the Predictive Accuracy of Artificial Neural Networks. International Journal of Intelligent Systems in Accounting, Finance and Management, 10 (2), 69-81.
Atiya, A. F. (2001). Bankruptcy Prediction for Credit Risk Using Neural Networks : A Survey and New Results. IEEE Transactions on Neural Networks, 12 (4), 929-935.
Baek, J. et Cho, S. (2003, Mars). Bankruptcy Prediction for Credit Risk Using an Auto-Associative Neural Network in Korean Firms. Proceedings of the IEEE International Conference on Computational Intelligence for Financial Engineering, Hong Kong, 20-23 March, 25-29.
Banque de France, 2019. Les défaillances d’entreprises, STAT INFO, Repéré à https://www.banque-france.fr/statistiques/chiffres-cles-france-etetranger/défaillances-d’entreprises.
Bardos, M. (2005). Les scores de la Banque de France : leur développement, leurs applications, leur maintenance. Bulletin de la Banque de France, 144 Repéré à http://www.banquefrance.fr/fr/publications/telechar/bulletin/etu144_6.pdf
Bardos, M. (2001). Développements récents de la méthode des scores de la Banque de France. Bulletin de la Banque de France, 90. http://www.banque-france.fr/fr/publications/telechar/bulletin/etud90_4.pdf
Bardos, M. et Zhu, W. (1997). Comparaison de l’analyse discriminante linéaire et réseaux de neurones, applications à la détection de défaillance des entreprises. Revue de statistitique appliquée, 10 (4), 65-92.
Beaver, W.H. (1966). Financial ratios as predictors of failure. Journal of Accounting Research, 4, 71-111.
Beaver, W.H., Mc Nichols, M.F. et Rhie, J. (2005). Have financial statements become less informative ? Evidence from the ability of financial ratios to predict bankruptcy. Review of Accounting Studies, 10, 93-122.
Ben Jabeur, S. (2011). Statut de la faillite en théorie financière : approches théoriques et validations empiriques dans le contexte français, thèse de doctorat. Université Toulon et Université de Sousse.
Ben Jabeur, S. et Youssef, F. (2013). Prévision de la défaillance des entreprises : une approche de classification par les méthodes de data-mining. Gestion 2000, 30(4), 31-45.
Ben Jabeur, S. et Youssef, F. (2014). Les modèles de prévision de la défaillance des entreprises françaises : une approche comparative. IPAG Business School, working papers series
Bharath, S. et Shumway, T. (2008). Forecasting default with the merton distance to default model. Review of Financial Studies, 21, 1339-1369.
Boisselier, P. et Dufour, D. (2003). Scoring et anticipation de défaillance des entreprises : une approche par la régression logistique. Archive ouverte HAL (2003) Id : halshs-00582740 https://halshs.archives-ouvertes.fr/halshs-00582740/document.
Brabazon, A. et Keenan, P. B. (2004). A Hybrid Genetic Model for the Prediction of Corporate Failure. Computational Management Science, 1(3), 293-310.
Charalambous, C., Charitou, A. et Kaourou, F. (2000, July). Application of Feature Extractive Algorithm to Bankruptcy Prediction. Proceedings of the IEEE-INNS-ENNS International Joint Conference on Neural Networks, Como, Italy, 303-308.
Charitou, A., Neophytou, E. et Charalambous, C. (2004). Predicting Corporate Failure : Empirical Evidence for the UK. European Accounting Review, 13 (3), 465-497.
Chava, S. et Jarrow, R.A. (2004). Bankruptcy prediction with industry effects. Review of Finance, 8, 537-569.
Crutzen, C. et Van Caillie, D. (2007). L’enchaînement des facteurs de défaillance de l’entreprise : Une réconciliation des approches organisationnelles et financières. Comptabilité et environnement, CD-Rom.
De Almeida,F. C. et Dumontier, P. (1993). Réseaux de neurones, information comptable et détection du risque de défaillance. Actes de 17 eme Congré de l’Association Francaise de Comptabilité, 1, 269-286.
Ding, A.A., Tian, S., Yu, Y. et Guo, H. (2012). A class of discrete transformation survival models with application to default probability prediction. Journal of the American Statistical Association, 107, 990-1003.
Fan, J. et Li, R. (2001). Variable selection via non concave penalized likelihood and its oracle properties. Journal of the American Statistical Association, 96, 1348-1360.
Hamza, T. et Bagdadi, K. (2008). Profil et déterminants financiers de la défaillance des PME tunisiennes. Banque et Marchés, 93, 45-62.
Härdle, W., Lee, Y.J., Schäfer, D. et Yeh, Y.R. (2009). Variable selection and oversampling in the use of smooth support vector machines for predicting the default risk of companies. Journal of Forecasting, 28, 512-534.
Härdle, W., Moro, R. A. et Schafer, D. (2005). Predicting Bankruptcy with Support Vector Machines. Humboldt-University, Collaborative Research Center SFB, Economic Risk, Discussion Paper.
Koller, D. et Sahami, M. (1996). Toward Optimal Feature Selection. Communication présentée en 30eme International Conference on Machine Learning (ICML), 284-292.
Kotsiantis, S., Tzelepis, D., Koumanakos, E. et Tampakas, V. (2005). Efficiency of Machine Learning Techniques in Bankruptcy Prediction, 2d International Conference on Enterprise Systems and Accounting, 11-12 July, Thessaloniki, Greece.
Liang, L. et Wu, D. (2003). An application of pattern recognition on scoring Chinese corporations financial conditions based on back propagation neural network. Computers and Operations Research, 32,115-132.
Lili, S. et Prakash, P.S. (2007). Using Bayesian Networks for Bankruptcy Prediction Some Methodological Issues. European Journal of Operational Research, 180,738-753.
Marco, L. (1989). La montée des faillites en France : 19ème et 20ème siècle (1ère ed). Paris, France : Editions, L’Harmattan.
Meier, L., Geer, S. et Bühlmann, P. (2008). The group lasso for logistic regression. Journal of the Royal Statistical Society, 70 (1), 53-71.
Min, J. H. et Lee, Y. C. (2005). Bankruptcy Prediction Using Support Vector Machine with Optimal Choice of Kernel Function Parameters. Expert Systems with Applications, 28 (4), 603-614.
Min, S. H., Lee, J. et Han, I. (2006). Hybrid Genetic Algorithms and Support Vector Machines for Bankruptcy Prediction. Expert Systems with Applications, 31, 652-660.
Ohlson, J. (1980). Financial ratios and the probabilistic prediction of bankruptcy. Journal of Accounting Research, 18, 109-131.
Patrick, B., et Dominique, D. (2003). Scoring et anticipation de défaillance des entreprises : une approche par la régression logistique. Identification et maîtrise des risques : enjeux pour l’audit, la comptabilité et le contrôle de gestion Belgique.
Pindado, J. et Rodrigues, L.F. (2001). Parsimonious models of financial insolvency in small companies. Working Paper, SSRN Working Paper Series.
Pompe, P.P.M. et Bilderbeek, J. (2005 A). Bankruptcy Prediction : The Influence of the Year Prior to Failure Selected for Model Building and the Effects in a Period of Economic Decline. International Journal of Intelligent Systems in Accounting, Finance and Management, 13, 95-112.
Pompe, P.P.M. et Bilderbeek, J. (2005 B). The Prediction of Bankruptcy of Small- and Medium-Sized Industrial Firms. Journal of Business Venturing, 20,847-868.
Refait, C. (2004). La prévision de la faillite fondée sur l’analyse financière de l’entreprise : un état des lieux. Economie et Prévision, 162, 129-147.
Sharma, D. S. et Iselin, E. R. (2003). The Relative Relevance of Cash-Flow and Accrual Information for Solvency Assessments : A Multi-Method Approach. Journal of Business Finance and Accounting, 30 (8), 1115-1140.
Smith, M. et Liou D.K., (2007). Industrial sector and financial distress. Managerial Auditing Journal, 22(4), 376 – 391.
Souleymanou, K., Mbeya Senam, B., Braune, É. & Hikkerova, L. (2019). Les dispositions d’octroi de crédit dans les pays émergents : l’appréciation subjective des dirigeants de PME en République Centrafricaine. Gestion 2000, 36(2), 111-132.
Tang, T.C. et Chi, L.C. (2005). Neural Networks Analysis in Business Failure Prediction of Chinese Importers : A Between-Countries Approach. Expert Systems with Applications, 29, 244-255.
Tian, S., Yan, Y. et Hui, G. (2015). Variable selection and corporate bankruptcy forecasts. Journal of Banking and Finance, 52, 89-100.
Tibshirani, R. (1996). Regression shrinkage and selection via the lasso. Journal of the Royal Statistical Society : Series B, 58, 267-288.
Tibshirani, R. (2011). Regression shrinkage and selection via the lasso : a retrospective. Journal of the Royal Statistical Society : Series B, 73 (3), 273-282.
Takoudjou Nimpa, A., Braune, É. & Teulon, F. (2019). Capital social de l’entrepreneur et pérennité de sa PME. Gestion 2000, volume 36(6), 145-160.
Varetto, F. (1998). Genetic Algorithms Applications in the Analysis of Insolvency Risk. Journal of Banking and Finance, 22, 1421-1439.
Wang, Z. (2004). Financial Ratio Selection for Default-Rating Modeling : A Model-Free Approach and Its Empirical Performance. Journal of Applied Finance, 14 (1), 20-35.
Yim, J. et Mitchell, H. (2002). A Comparison of Corporate Failure Models in Australia : Hybrid Neural Networks, Logit Models and Discriminant Analysis. RMIT Business School of Economics and Finance, Working Paper, n°10-2002.
YIM, J. et MitchellI, H. (2005). A Comparison of Corporate Distress Prediction Models in Brazil : Hybrid Neural Networks, Logit Models and Discriminant Analysis, Universidade Federal de Minas Gerais, Economics Department, Nova Economia, 43.
Zavgren, C.V. (1985). Assessing the vulnerability to failure of American industrial firms : a logistic analysis. Journal of Business Finance and Accounting, 12(1), 19-45.
Zou, H., 2006. The adaptive lasso and its oracle properties. Journal of the American Statistical Association, 101, 1418-1429.

Mots-clés éditeurs : ACP, ADL, défaillance d’entreprise, LASSO, prévision, sélection de variables

Date de mise en ligne : 13/11/2020

https://doi.org/10.3917/g2000.373.0067

Compte personnel

Modèles de prévision de défaillance d’entreprise et sélection de variables explicatives : le cas de la France

Notes

Citer cet article

Notes

Introduction

Evolution des défaillances d’entreprises^a,b,c

Evolution des défaillances d’entreprises^a,b,c

1 – Revue de la littérature

2 – Méthodologie

2.1 – Données

2.2 – Sélection des variables

Liste initiale des ratios financiers utilisés^*

Liste initiale des ratios financiers utilisés^*

2.3 – Modèles

Modèle d’un neurone artificiel

Modèle d’un neurone artificiel

3 – Résultats et discussion

Statistiques descriptives

Statistiques descriptives

Modèle neuronal (RN) et modèle Logit

Modèle neuronal (RN) et modèle Logit

Evolution des catégories de ratios sélectionnés

Evolution des catégories de ratios sélectionnés

Conclusion

Résultats de sélection des variables par ADL, ACP et LASSO

✓ ADL

✓ ADL

✓ ACP

✓ ACP

✓ LASSO

✓ LASSO

Résultats des modèles RN et Logit utilisant les variables sélectionnées par Lasso à N-1

Références

Accès institutions

Toutes les institutions

Modèles de prévision de défaillance d’entreprise et sélection de variables explicatives : le cas de la France

Citer cet article

Notes

Citer cet article

Notes

Introduction

Evolution des défaillances d’entreprisesa,b,c

Evolution des défaillances d’entreprisesa,b,c

1 – Revue de la littérature

2 – Méthodologie

2.1 – Données

2.2 – Sélection des variables

Liste initiale des ratios financiers utilisés*

Liste initiale des ratios financiers utilisés*

2.3 – Modèles

Modèle d’un neurone artificiel

Modèle d’un neurone artificiel

3 – Résultats et discussion

Statistiques descriptives

Statistiques descriptives

Modèle neuronal (RN) et modèle Logit

Modèle neuronal (RN) et modèle Logit

Evolution des catégories de ratios sélectionnés

Evolution des catégories de ratios sélectionnés

Conclusion

Résultats de sélection des variables par ADL, ACP et LASSO

✓ ADL

✓ ADL

✓ ACP

✓ ACP

✓ LASSO

✓ LASSO

Résultats des modèles RN et Logit utilisant les variables sélectionnées par Lasso à N-1

Références

Accès institutions

Toutes les institutions

Evolution des défaillances d’entreprises^a,b,c

Evolution des défaillances d’entreprises^a,b,c

Liste initiale des ratios financiers utilisés^*

Liste initiale des ratios financiers utilisés^*