Semaine 1 : introduction#

Cours#

Consignes#

Avant le TP :

  • Relisez le cours

Pendant le TP puis chez vous :

  • Faites les feuilles de travail de TP ci-dessous;

  • Déposez régulièrement le TP sur GitLab (submit),

Avant mardi 23 janvier 23h59 :

  • Déposez votre TP sur GitLab, même incorrect ou incomplet (5 points/100).

TP#

Notes aux enseignants

  • Donner les consignes suivantes aux étudiants pour démarrer le TP, typiquement à l’oral et en les écrivant au tableau. Leur dire que ce sont essentiellement les mêmes consignes que pour Info 111 au S1.

    1. Démarrez les ordinateurs sous Ubuntu/Linux et non sous Windows (en sélectionnant le bon choix lorsque cela est demandé au démarrage).

    2. Ouvrir le site web du cours. Pour cela, ils peuvent passer par l’espace de cours sur eCampus, ou faire une recherche sur Introduction Science Données Pouyet. Pour les fois suivantes, leur apprendre progressivement à simplement taper ScienceDonnees dans la barre de navigation (sans valider!) et choisir parmi les propositions du navigateur. C’est plus rapide et évite d’actionner un moteur de recherche pour rien.

    3. Ouvrir la page «Case Départ » et suivre les instructions.

  • Les élèves sont censés avoir leurs identifiants personnels fonctionnels. Si certains vous demandent de quel login ou mot de passe il s’agit, c’est celui de leur compte Adonis, c’est le même qu’ils utilisent pour se connecter sur ecampus. Le login est prénom.nom. Attention certains utilisateurs ont un compte suivi d’un chiffre ex : pierre.dupont1 (cas assez rare). Il existe aussi un login court; si certains connaissent le leur ils peuvent l’utiliser pour se connecter sous Linux, mais pas sur gitlab ou le hub. Pour le mot de passe, certains ne tapent pas ce qu’ils croient taper. Dites à ceux qui n’arrivent pas à se loguer de vérifier ce qu’ils tapent en tapant leur mot de passe dans la case login (comme cela ils le voient en clair, et voient s’ils ne tapent pas correctement certaines choses, par exemple les chiffres ou les majuscules). Certains ajoutent un espace à la fin de leur login et/ou de leur mot de passe en pensant que ça n’a aucune conséquence… En cas de problème de connexion, demander de l’aide au SIF (contacter Mounir ou Jean dont les bureaux sont respectivement aux troisième et deuxième étages du bâtiment, près des salles info).

Objectifs#

L’objectif de ce premier TP est de vous familiariser avec l’environnement de travail et les outils que nous utiliserons pendant tous le semestre :

  • Jupyter comme environnement interactif;

  • Python comme langage d’interaction, de calcul et de programmation;

  • GitLab pour la gestion des devoirs.

  • Pandas pour les statistiques et l’analyse de données

La plupart d’entre vous ont suivi les cours «Info 111: Programmation Impérative» et «Introduction à l’Informatique» au premier semestre et êtes déjà familiers avec l’environnement de travail. Les deux premières feuilles sont donc des rappels et vous permettront notamment de vous refamiliariser avec la correction automatique et les compréhensions. Viendra ensuite une feuille de prise en main de Pandas.

En fin de TP, vous combinerez tout ces outils pour mener une première étude statistique: il s’agira de tester une hypothèse sur la composition des jurys d’assise dans le contexte de la lutte pour les droits civiques aux États Unis.

Exercices avancés#

Les exercices (et projets) sont organisés en deux couches: tout d’abord des exercices pour mettre en œuvre les compétences fondamentales et les maîtriser à l’issue de l’UE; et d’autre part des exercices marqués d’un ♣ pour aller plus loin.

Feuilles de travail#