La structure des données économiques
En économie on rencontre une grande variété de données. Généralement l’analyste dispose de données brutes extraites des fichiers de tailles et de formes différentes. L’analyste doit donc comprendre la structure des données et faire les traitements et les corrections nécessaires pour qu’elles soient exploitables et interprétables.
- Des données individuelles ou en coupe transversale
Les données en coupe transversale se composent d’un échantillon d’individus, de ménages, de sociétés, de villes, d’états, de pays, ou d’autres unités statistiques, prise à un instant donné.
Une caractéristique importante liée aux données en coupe transversale est que nous pouvons souvent supposer qu’elles ont été obtenues par échantillonnage aléatoire de la population mère. Par exemple, si nous obtenons l’information sur des salaires, l’éducation, l’expérience, et d’autres caractéristiques en tirant aléatoirement 100 personnes de la population active, alors nous avons un échantillon aléatoire représentant la population de toutes les personnes actives.
Des données en coupe transversale sont largement répandues dans les sciences économiques ainsi que dans d’autres sciences sociales.
Dans les sciences économiques, l’analyse des données en coupe transversale est étroitement liée aux questions micro-économiques, tels que les sciences de travail, l’organisation industrielle, les sciences économiques urbaines, la démographie, les sciences économiques de santé. Les données sur des individus, des ménages, des sociétés, et des villes à une période donnée sont importantes dans l’évaluation des hypothèses micro-économiques et ainsi que les politiques économiques.
Les données en coupe transversale sont présentées sous la forme suivante
Individus |
Variable 1 |
……………… |
Variable j |
Variable K |
1 |
||||
2 |
||||
|
||||
|
||||
i |
. | |||
. |
. | |||
. |
||||
N |
. |
On note que les variables peuvent être quantitative ou qualitative (Voir cours Statistiques descriptives). Il est important de souligner que le traitement économétrique des variables diffère selon qu’il s’agit d’une variable qualitative ou qualitative.
- Des données en séries temporelles ou chronologiques
Les séries temporelles dites aussi, chronologiques se composent des observations d’une variable ou d’un ensemble de variables dans le temps.
Les exemples des données de série chronologique incluent les cours des actions, la masse monétaire, l’indice de prix à la consommation, le produit intérieur brut, les chiffres d’affaires ou les coûts relatifs à une activité.
Dans cette conception, le temps est considéré comme une variable clé dans l’analyse des phénomènes économiques. En effet ; les variables ainsi que leurs retards permettent d’expliquer ou d’influencer les observations futures du phénomène étudié.
A la différence des données en coupe transversale l’arrangement des observations dans une série temporelle donne des informations potentiellement importantes, il est donc nécessaire d’ordonner les observations dans le temps. Les données peuvent être journalières, mensuelles, annuelles….
Les séries chronologiques se présentent sous la forme suivante :
temps |
Variable 1 |
……………… |
Variable j |
Variable K |
1 |
||||
2 |
||||
|
||||
|
||||
t |
. | |||
. |
. | |||
. |
||||
T |
. |
- Des données en panel ou longitudinales
Les données de panel sont des series chronologiques d’une ou plusieurs variables observées pour les différentes unités statistiques ou individus de la population étudiée. On peut aussi les définir comme étant des données en coupe transversale observées dans le temps.
À titre d’exemple, supposons que nous avons un ensemble de variables (le salaire, le niveau d’éducation, l’emploi) pour un ensemble d’individus suivis sur une période de cinq ans. Ou encore l’investissement, les dividendes distribuées, des données financières relatives à un ensemble homogène de sociétés sur une période de dix ans. Des données en panel peuvent également être rassemblées sur les unités géographiques ; par exemple le nombre de véhicules de tourisme ou les voitures utilitaires qui circulent dans les 24 gouvernorats de la Tunisie sur la période s’étalant entre 1995 et 2010.
Les données de panel se présentent sous la forme suivante :
Individu |
Temps |
Variable 1 |
…… |
Variable j |
Variable K |
1 |
1 |
||||
2 |
2 |
||||
|
|
||||
|
|
||||
i |
t |
. | |||
. |
. |
. | |||
. |
. |
||||
N |
T |
. |
Bibliographie
Greene W. (2005), Econométrie, Pearson Education.
Valerie M. (2008), Économétrie théories et applications, Economica.