Performance del modello Gradient Boosting e importanza delle variabili
Il modello utilizza un algoritmo Gradient Boosting con 300 alberi decisionali (max depth 5, learning rate 0.05) per predire il volume delle entrate degli enti a partire dalle variabili del questionario. La variabile target è trasformata in scala logaritmica per gestire la distribuzione asimmetrica delle entrate. Le SHAP values misurano il contributo marginale di ciascuna variabile alla predizione per ogni ente.