Accédez aux ressources directement depuis les compétences, savoirs, activités professionnelles, centres d'intérêt des référentiels, ainsi qu'aux sujets d'examen et séminaires nationaux.
publié le 23 juin 2025 par Olivier TOURVIEILLE
Objectifs : Utiliser un module d’IA (scikit-learn) pour reconnaitre des chiffres manuscrits, ce qui permet de comprendre les principes de l’IA par réseau de neurones et méthode knn, en comparant les performances et tailles des deux modèles obtenus
Matière : Sciences de l’Ingénieur
Niveau : CPGE SPE : MP-PC-PT-PSI
Activité : TD/TP/cours réalisé en 1h en classe par les élèves en ne faisant que la partie scikitlearn (Parties 5 & 6). Pas besoin de cours, ce sujet est conçu pour introduire les notions au programme tout en programmant.
Séquence : Chapitre « Intelligence artificielle » - Méthodes knn et réseau de neurones
Matériel : Ordinateur avec logiciel de programmation en langage Python (ex : Pyzo+Anaconda). Modules numpy, matplotlib, scikit-image et scikit-learn impératifs
Compétences du programme de S.I.
o C1.3.8 - Analyser les principes d'intelligence artificielle. S3
o C3.1.3 - Choisir une démarche de résolution d'un problème d'ingénierie numérique ou d'intelligence artificiel. S3
o C3.3.3 - Résoudre un problème en utilisant une solution d'intelligence artificielle. S3
o C4.3.3 - Effectuer des traitements à partir de données. S3
Ressources mises à disposition
o Sujet + Dossier élèves 1 à 6 et 5 à 6 (cf. remarques)
o Code corrigé
o Cours + Résumé « Matrices de pixels et images »
o Check Fichiers
o Dossier « Aller plus loin »
o Dossier « Starter kit »
- Il y a régulièrement des problèmes de chemins de fichiers, les élèves ayant du mal à comprendre tout ce qui est derrière. Je vous propose donc une « Check Fichiers » permettant de s’en sortir rapidement sur les erreurs « FileNotFoundError: [Errno 2] No such file or directory: 'test.txt' »
- Les parties 1 à 4 font appel au programme d’Informatique du Tronc Commun de SUP. Elles sont relativement longues à réaliser, je suggère aux élèves qui le souhaitent de les lire/programmer avant la séance sur l’IA.
- A défaut de préparation, il faut que les élèves et le professeur maîtrisent l’organisation des données créées dans l’exercice 4 (4-1 et 4-2) et bien rappelées dans le sujet à l’exercice 4. Il n’est pas du tout nécessaire de comprendre les parties 1 à 4 pour faire la suite, elles n’ont pour but de que de préparer les images et données à apprendre et reconnaitre.
- J’ai tenu, en fin de sujet, à partager les modèles d’apprentissage sur les 330 000 images de NIST de chiffres manuscrits compatibles avec ce sujet (un seul morceau noir sur l’image). Celui qui souhaitera aller plus loin pourra donc comprendre et réaliser l’apprentissage complet pour obtenir un modèle bien entraîné. Attention, le modèle knn pèse 5 Go... Je ne sais pas si son partage par Eduscol passera. Le modèle RN ne pèse que 5 Mo.
- Je partage un dossier « Starter kit », qui permet très facilement, à l’aide du modèle réseau de neurones entrainé sur les 330 000 images, de reconnaitre n’importe quelle image de chiffre manuscrit.