TD1 :
Commande use : permet d'ouvrir un fichier .dta permet simplement de lire les données
Use « chemin\auto3.dta »
use "R:\cours\traitement_de_donnees\td1\auto3.dta", clear
Ceci s'obtient en allant dans File > open
Use : nom de la fonction qui ouvre une base de donnée, ici un fichier dta
Clear : pour détruire ma base de donnée
Browse : visualiser la base de donnée (= parcourir)
Dans la barre du menu, icône avec une loupe : pour visualiser les données du fichier
Summarize : affiche le nombre d'observation, la moyenne, l'écart type et les valeurs extrêmes. Pour plus de précisions il suffit de rajouter une option detail
Summarize liste de variable (sur le coté fenetre de variable) ici
Summarize prix
Ou
Summarize prix, detail
Obs : nombre d'observation
Mean : moyenne
Std dev : écart type
Min/max : valeurs extrèmes
Commande insheet
Si vos données sont sous la forme .csv soit .txt alors il faut utiliser la commande insheet
Une ligne par observation
Les variables en colonnes
Ouvrir et enregistrer le fichier sous un autre format
Insheet using « chemin/nom du fichier », comma dans le cas où le délimiteur de colonne est une virgule
Tab si tabulation
Ouvrir un fichier xls avec Excel
Enregistrer ce fichier sous un autre format en utilisant « CSV (séparateur point virgule) ou Texte (séparateur tabulation)
Une fenêtre apparaît demandant de choisir un séparateur de champs soit le point virgule soit la tabulation
Pour ouvrir sur stata :
Insheet using chemin fichier
La covariance d'une variable avec elle-même est égale à 1
Correlate : liste des variables
Sort : trier
Pie : tarte, graphique
Correlate taille poidskg va permettre de déterminer le coefficient de corrélation entre la taille et le poids
Menus « Graphics » > « Easy Graphs » > « Pie chart (by category) va représenter graphiquement la répartition des divers moyens de transport (ou autre variable selon la base de donnée) parmis les étudiants)
La commande infile : permet plus de flexibilité pour charger des données à des formats plus originaux mais il faut préciser à la main le nom des variables
Pour format txt, ascii ou .asc
« infile taille poids using » chemin/taipoi.txt », clear
Création de fichier
Commande « edit » entrer
Une nouvelle fenêtre stata editor fonctionnant comme un tableur apparaît. Double cliquer sur la colonne correspondant à la variable.
Une fenetre apparaît alors : name label et format
Pour sauvegarder : « file » « save as » « donner un nom comme exemple1 »
Au lieu de remplir par nous même le tableau il suffit de faire copier coller d'un fichier Excel ou text avec des tabulations pour séparateur.
Ex : Fichier au format Excel dev-geo.xls contenait diverses variables dans un tableau
Control C . puis dans stata Edit et dans la nouvelle fenêtre control V
Les noms des variables sont ceux de la première ligne du fichier xls
A partir d'un fichier txt, ouvrir ce fichier avec Excel même processus copier les données qui nous intéressent sans oublier que la première ligne d'Excel donnera le nom des variables sur stata. Edit et Control V
Puis dans le menu « graphics » « easy grapgs » « scatter plot » X : nom de la variable qu'on souhaite analyser en absice et en Y nom de la variable qu'on souhaite analyser en ordonnée et entrer
Sauvegarde
Save nom de fichier pour new fichier et pour un fichier existant dans le menu
Fichier : save as
TD 2
