next up previous contents
Next: Bibliography Up: Le logiciel SAS:généralités et Previous: Classement des statistiques et

La régression (PROC REG)

La procédure REG permet d'obtenir le meilleur modèle de régression linéaire par la méthode des moindres carrés.

PROC REG DATA=nom_du_jeu_de_données <options1>;

MODEL variables_dépendantes = variables_explicatives ... <options2>;
{Identifie les variables numériques du jeu de données qui forment le modèle.}
BY nom_variable ...;
{Effectue une régression différente pour les observations de chaque groupe.}
FREQ nom_variable;
{Identifie une variable numérique dont les valeurs représentent la fréquence de chaque observation.}
ID nom_variable;
{Avec CLI, CLM, P, R ou INFLUENCE, identifie les observations par les valeurs de cette variable plutôt que de les numéroter. }
VAR nom_variable ...;
{Identifie les variables numériques, qui ne font pas parti du modèle, à inclure dans la matrice des produits croisés.}
WEIGHT nom_variable;
{Identifie une variable numérique dont les valeurs serviront à balancer les observations.}
ADD nom_variable ...;
{Ajoute des variables indépendantes au modèle de régression. Ces variables doivent apparaître dans les instructions MODEL ou VAR.}
DELETE nom_variable ...;
{Enlève des variables indépendantes du modèle de régression.}
MTEST nom_variable, ...; <options3>
{Dans le cas d'un modèle de régression multiple avec plusieurs variables dépendantes, teste l'hypothèse que les variables sont égales à zéro. Si on remplace la première variable par une soustraction de variables dépendantes, teste l'hypothèse que les autres variables sont les mêmes pour chaque variable dépendante. Si aucune variable n'est spécifiée, teste l'hypothèse que les paramètres estimés sont tous égal à zéro.}
OUTPUT OUT=nom <statistique>=nom_variable ...;
{Nomme un nouveau jeu de données qui contiendra les statistiques spécifiées.}
PLOT
{Semblable à la procédure PLOT (voir section 5.1)}
RUN;


<options1>:

OUTEST=nom
Nomme le fichier de données qui contiendra les estimations des paramètres.
COVOUT
Écrit la matrice des covariances des paramètres estimés dans le fichier de données spécifié à l'instruction OUTEST.
OUTSSCP=nom
Nomme le jeu de données qui contiendra les sommes de carrés corrigées et la matrice des produits croisés.
SIMPLE
Imprime la somme, la moyenne, la variance, l'écart-type et la somme des carrés de chaque variable.
CORR
Imprime la matrice des corrélations de toutes les variables déclarées dans l'instruction MODEL ou VAR.
USSCP
Imprime les sommes de carrés et la matrice des produits croisés de toutes les variables.
ALL
Idem à SIMPLE, SSCP, CORR et à spécifier ALL dans tous les modèles.
NOPRINT
Supprime toutes les impressions. Idem à spécifier NOPRINT dans tous les modèles.


<options2>:

SELECTION=
Identifie parmi FORWARD, BACKWARD, STEPWISE, MAXR, MINR, RSQUARE, ADJRSQ, CP et NONE la méthode à utiliser.
BEST=n
Avec CP ou ADJRSQ, indentifie le nombre maximal (n) de sous-ensembles à imprimer. Avec RSQUARE, identifie le nombre maximal (n) de sous-ensembles de chaque taille.
DETAILS
Imprime les statistiques de chaque entrée et sortie d'une variable dans le modèle pour les méthodes FORWARD, BACKWARD et STEPWISE.
GROUPNAMES=nom...
Nomme les groupes de variables.
INCLUDE=n
Inclut les n premières variables explicatives de l'instruction MODEL dans chaque modèle.
NOINT
Enlève bêta 0 du modèle.
SLE= $\mathnormal{\alpha}$
Identifie le niveau de signification des entrées dans le modèle pour les méthodes FORWARD et STEPWISE. Par défaut $\mathnormal{\alpha}$ = 0.50 et $\mathnormal{\alpha}$ = 0.15 respectivement.
SLS= $\mathnormal{\alpha}$
Identifie le niveau de signification des sorties dans le modèle pour les méthodes BACKWARD et STEPWISE. Par défaut $\mathnormal{\alpha}$ = 0.10 et $\mathnormal{\alpha}$ = 0.15 respectivement.
ADJRSQ
Calcule les R2 ajustés.
AIC
Calcule le critère de Akaike pour chaque modèle.
B
Avec RSQUARE, ADJRSQ et CP calcule les r2.
BIC
Calcule le critère de Sawa pour chaque modèle.
CP
Calcule les statistiques Cp de Mallow pour chaque modèle.
GMSEP
Avec RSQUARE, ADJRSQ et CP estime les CME des prévisions en supposant que les variables indépendantes et explicatives sont multinormales.
JP
Avec RSQUARE, ADJRSQ et CP estime les CME des prévisions pour chaque modèle (statistiques Jp) en supposant que les valeurs des variables explicatives sont fixées et que le modèle est correct.
MSE
Avec RSQUARE, ADJRSQ et CP calcule les CME de chaque modèle.
PC
Avec RSQUARE, ADJRSQ et CP calcule le critère de prévision de Amemiya.
RMSE
Avec RSQUARE, ADJRSQ et CP imprime la racine des CME de chaque modèle.
SBC
Avec RSQUARE, ADJRSQ et CP calcule la statistique SBC pour chaque modèle.
SIGMA=valeur
Identifie la vraie valeur de l'écart-type du terme d'erreur à utiliser dans les calculs de CP et BIC.
SP
Avec RSQUARE, ADJRSQ et CP calcule la statistique Sp pour chaque modèle.
SSE
Avec RSQUARE, ADJRSQ et CP calcule SCE pour chaque modèle.
I
Imprime la matrice (X'X)-1.
XPX
Imprime la matrice X'X des produits croisés.
ACOV
Imprime la matrice des covariances asymptotiques estimées des estimations sous l'hypo-thèse de l'hétéroscédasticité.
COLLIN
Analyse détaillée de la colinéarité des variables explicatives.
COLLINOINT
Idem à COLLIN, mais sans bêta 0.
CORRB
Imprime la matrice de corrélations du vecteur bêta.
COVB
Imprime la matrice (X'X)-1*s2 des covariances du vecteur bêta.
STB
Imprime les coefficients de régression normalisés.
CLI
Intervalles de confiance à 95% pour une prédiction individuelle.
CLM
Intervalles de confiance à 95% pour l'espérance...
DW
Calcule les statistiques de Durbin-Watson.
INFLUENCE
Analyse détaillée de l'influence de chaque observation sur le vecteur bêta et sur les valeurs prédites.
P
Calcul des prévisions.
R
Analyse des résidus.
ALL
Idem à ACOV, CLI, CLM, CORRB, COVB, I, P, PCORR1, PCORR2, R, SCORR1, SCORR2, SEQB, SPEC, SS1, SS2, STB, TOL, VIF et XPX.
NOPRINT
Supprime l'impression des résultats de la régression.


<options3>:

CANPRINT
Imprime les corrélations canoniques.
DETAILS
Imprime la matrice M.
PRINT
Imprime les matirces H et E.


<statistique>:

COOKD, COVRATIO, DFFITS, H, L95, L95M, P, PRESS, R, RSTUDENT, STDI, STDP, STDR, STUDENT, U95, U95M.

SAS/STAT User's Guide Volume 2, p.1351


next up previous contents
Next: Bibliography Up: Le logiciel SAS:généralités et Previous: Classement des statistiques et
Usager stat
1999-01-22