Classification automatique d images par arbres de décision



Similar documents
Introduction au BIM. ESEB Seyssinet-Pariset Economie de la construction contact@eseb.fr

Langages Orientés Objet Java

Personnalisez votre intérieur avec les revêtements imprimés ALYOS design

Introduction. GEAL Bibliothèque Java pour écrire des algorithmes évolutionnaires. Objectifs. Simplicité Evolution et coévolution Parallélisme

CSS : petits compléments

Note concernant votre accord de souscription au service «Trusted Certificate Service» (TCS)

Remote Method Invocation

«Object-Oriented Multi-Methods in Cecil» Craig Chambers (Cours IFT6310, H08)

CERN EUROPEAN ORGANIZATION FOR NUCLEAR RESEARCH

Méthodes ensemblistes pour une localisation robuste de robots sous-marins

DHI a.s. Na Vrsich 51490/5, , Prague 10, Czech Republic ( t.metelka@dhi.cz, z.svitak@dhi.cz )

Fondation Rennes 1. Atelier de l innovation. Fondation Rennes 1. Fondation Rennes 1 MANAGEMENT AGILE. Fondation Rennes 1 ET INNOVATION

Sun Management Center Change Manager Release Notes

Thursday, February 7, DOM via PHP

Sélection adaptative de codes polyédriques pour GPU/CPU

Office of the Auditor General / Bureau du vérificateur général FOLLOW-UP TO THE 2007 AUDIT OF THE ENVIRONMENTAL COMMITMENTS IN THE OTTAWA 20/20

Unrealized Gains in Stocks from the Viewpoint of Investment Risk Management

Statistiques en grande dimension

Archived Content. Contenu archivé

Account Manager H/F - CDI - France

Archived Content. Contenu archivé

Archived Content. Contenu archivé

Detection of water leakage using laser images from 3D laser scanning data

THE CITY OF TORONTO S JOB DEMANDS ANALYSIS AND JOB MATCH SYSTEM

Short Form Description / Sommaire: Carrying on a prescribed activity without or contrary to a licence

Qu est-ce que le Cloud? Quels sont ses points forts? Pourquoi l'adopter? Hugues De Pra Data Center Lead Cisco Belgium & Luxemburg

Troncatures dans les modèles linéaires simples et à effets mixtes sous R

Audit de sécurité avec Backtrack 5

Archived Content. Contenu archivé

General Certificate of Education Advanced Level Examination June 2012

A Lean journey. Presented at the APEX symposium May 27, Jennifer Little Transport Canada. France Bergeron Alpen Path Solutions Inc.

POB-JAVA Documentation

BILL C-665 PROJET DE LOI C-665 C-665 C-665 HOUSE OF COMMONS OF CANADA CHAMBRE DES COMMUNES DU CANADA

Measuring Policing Complexity: A Research Based Agenda

Solaris 10 Documentation README

PIXEL-PLANES: A VLSI-ORIENTED DESIGN FOR 3-D RASTER GRAPHICS. H. Fuchs and J. Pou1ton. University of North Carolina at Chapel Hill

Archived Content. Contenu archivé

Setting up a monitoring and remote control tool

The Register of the Domain of the State A Revolution in the Registration of Land Rights

Office of the Auditor General / Bureau du vérificateur général FOLLOW-UP TO THE 2010 AUDIT OF COMPRESSED WORK WEEK AGREEMENTS 2012 SUIVI DE LA

An In-Context and Collaborative Software Localisation Model: Demonstration

Report to/rapport au: Ottawa Board of Health Conseil de santé d Ottawa. November 18, novembre 2013

Archived Content. Contenu archivé

Page intentionally left blank

Processed weight to live-weight conversion factors for Atlantic halibut (Hippoglossus hippoglossus) of the Scotian Shelf and Southern Grand Banks

SunFDDI 6.0 on the Sun Enterprise Server

[ dessins, collages, illustrations, etcetera ]

Temporary Supplement Stamps, Templates & Chipboards. Janvier Supplément temporaire Étampes, pochoirs & chipboards

SEMIN- Dessine-moi un arbre : représentation graphique des arbres phylogénétiques avec le package ape

FATMAS : A Methodology to Design Fault-tolerant Multi-agent Systems

Insurance Fraud Estimation: More Evidence from the Quebec Automobile Insurance Industry. by Louis Caron and Georges Dionne

Neural Networks Tools for Improving Tacite Hydrodynamic Simulation of Multiphase Flow Behavior in Pipelines

Subject: Letter of opinion concerning the inventory report on greenhouse gas for Les Aliments Glutino Inc.

Office of the Auditor General / Bureau du vérificateur général FOLLOW-UP TO THE 2007 AUDIT OF THE DISPOSAL OF PAVEMENT LINE MARKER EQUIPMENT 2009

Modeling and simulation of wireless sensor networks

TR "Coverup" Protective Covers for Evidence

ATP Co C pyr y ight 2013 B l B ue C o C at S y S s y tems I nc. All R i R ghts R e R serve v d. 1

A model-based method to manage time properties in component based software systems

Holinger AG / Holinger Group Facts and Figures Holinger SA / Groupe Holinger Faits et chiffres 2011

ARE NEW OIL PIPELINES AND TANKER FACILITIES VIABLE IN CANADA?

Introduction ToIP/Asterisk Quelques applications Trixbox/FOP Autres distributions Conclusion. Asterisk et la ToIP. Projet tuteuré

THE DEVELOPMENT OF OFFICE SPACE AND ERGONOMICS STANDARDS AT THE CITY OF TORONTO: AN EXAMPLE OF SUCCESSFUL INCLUSION OF ERGONOMICS AT THE DESIGN STAGE

site et appel d'offres

Annual Event 2016 Workshop New to Interreg, where to begin? Évènement annuel 2016 Atelier «Interreg pour les débutants, par où commencer?

RAPPORT FINANCIER ANNUEL PORTANT SUR LES COMPTES 2014

mvam: mobile technology for remote food security surveys mvam: technologie mobile pour effectuer des enquêtes à distance sur la sécurité alimentaire

Applying this template to your existing presentation

EVALUATING POLICY OUTCOMES: FEDERAL ECONOMIC DEVELOPMENT PROGRAMS IN ATLANTIC CANADA

RÉPONSE DE ÉNERGIE LA LIÈVRE S.E.C. ET D ÉNERGIE BROOKFIELD MARKETING INC. À LA DEMANDE DE RENSEIGNEMENT N o 1 DE LA RÉGIE DE L ÉNERGIE («RÉGIE»)

Formulaire de Modification de Données de l Emploi/Job Data Change Form France

Credit Cards: Disentangling the Dual Use of Borrowing and Spending

Calcul parallèle avec R

F.S. Hillier & G.T Lierberman Introduction to Operations Research McGraw-Hill, 2004

Guidance on Extended Producer Responsibility (EPR) Analysis of EPR schemes in the EU and development of guiding principles for their functioning

Les manuels de Toastmasters International, les outils pour réussir

Financial Literacy Resource French As a Second Language: Core French Grade 9 Academic FSF 1D ARGENT EN ACTION! Connections to Financial Literacy

High performance traffic monitoring for network security and management

Survey on Conference Services provided by the United Nations Office at Geneva

Memory Eye SSTIC Yoann Guillot. Sogeti / ESEC R&D yoann.guillot(at)sogeti.com

Towards harmonising quality assurance for postgraduate training and research in RUFORUM member universities

A GREEN PARADISE AT THE GATES OF LISBON UN PARADIS VERT AUX PORTES DE LISBONNE

EPREUVE D EXPRESSION ORALE. SAVOIR et SAVOIR-FAIRE

Évariste Galois and Solvable Permutation Groups

Spectrométrie d absorption moléculaire UV-visible

EVALUATION AS A TOOL FOR DECISION MAKING: A REVIEW OF SOME MAIN CHALLENGES

READ AND FOLLOW ALL SAFETY INSTRUCTIONS 1. DANGER RISK OF SHOCK DISCONNECT POWER BEFORE INSTALLATION

Future Entreprise. Jean-Dominique Meunier NEM Executive Director Nov. 23, 2009 FIA Stockholm

Importance Sampling of Realistic Light Sources

Transcription:

Classification automatique d images par arbres de décision Raphaël Marée Thèse de Doctorat en Informatique Institut Montefiore, Université de Liège 8 février 2005 Raphaël Marée Classification d images (1 / 55)

Plan de la thèse Introduction Classification d images Objectifs de la thèse Apprentissage automatique supervisé Approches étudiées Globale Variantes locales Raphaël Marée Classification d images (2 / 55)

Classification d images Introduction Classification d images La thèse Apprentissage automatique Contexte : technologies d acquisition d images et de stockage engendrent de nombreuses bases de données d images But : classer systématiquement des images selon des classes bien définies Exemples de classe : objet, logo, cellule, type de situation Applications : diagnostic médical, étude de phénomènes naturels, contrôle qualité, catalogue d images, surveillance,... Raphaël Marée Classification d images (3 / 55)

Exemples Introduction Classification d images La thèse Apprentissage automatique Classification de visages (Etienne, Virginie, Thierry,...) Raphaël Marée Classification d images (4 / 55)

Exemples Introduction Classification d images La thèse Apprentissage automatique Classification de cellules (stomatocyte, discocyte, échinocyte) Classification de pollen (Parietaria judaica, Urtica membranacea, Urtica ureas) Classification de radiographies (abdomen, membre, sein, crâne, poitrine, colonne vertébrale) Raphaël Marée Classification d images (5 / 55)

Problèmes pour l humain Classification d images La thèse Apprentissage automatique Temps requis Faculté de concentration Répétitivité Lenteur (nb. images/jour?) Être prêt à travailler en horaire décalé. Accepter de faire un travail répétitif. Ne pas être daltonien. Être résistant au stress. Raphaël Marée Classification d images (6 / 55)

Classification d images La thèse Apprentissage automatique Classification automatique d images : approche classique Constitution d un échantillon d images étiquetées, c-à-d à chaque image correspond une classe Mise au point d une procédure informatique pour classer ces images Évaluation des performances sur échantillon indépendant de nouvelles images Raphaël Marée Classification d images (7 / 55)

Classification d images La thèse Apprentissage automatique Classification automatique d images : approche classique Constitution d un échantillon d images étiquetées, c-à-d à chaque image correspond une classe Mise au point d une procédure informatique pour classer ces images 1. Extraction de caractéristiques 2. Description par un ensemble de valeurs numériques (attributs) Évaluation des performances sur échantillon indépendant de nouvelles images Raphaël Marée Classification d images (7 / 55)

Classification d images La thèse Apprentissage automatique Classification automatique d images : approche classique Constitution d un échantillon d images étiquetées, c-à-d à chaque image correspond une classe Mise au point d une procédure informatique pour classer ces images 1. Extraction de caractéristiques 2. Description par un ensemble de valeurs numériques (attributs) Évaluation des performances sur échantillon indépendant de nouvelles images 1. Extraction, 2. description Classification de chaque image par comparaison de ses attributs avec ceux des images de l échantillon étiqueté Raphaël Marée Classification d images (7 / 55)

Exemples Introduction Classification d images La thèse Apprentissage automatique Classification de caractères manuscrits (0, 1, 2,..., 9) Classification de visages (Etienne, Virginie, Thierry,...) Raphaël Marée Classification d images (8 / 55)

Exemples Introduction Classification d images La thèse Apprentissage automatique Classification de textures (Métal, Briques, Fleurs, Grains,...) Raphaël Marée Classification d images (9 / 55)

Exemples Introduction Classification d images La thèse Apprentissage automatique Classification d objets (Flacon X, Bouteille Y, Fruit Z,...) Raphaël Marée Classification d images (10 / 55)

Inconvénients de l approche classique Classification d images La thèse Apprentissage automatique Définition et extraction de caractéristiques Caractéristiques idéales non connues a priori Nouvelle réflexion, adaptation Nouveau problème Nouvelles classes Variation des conditions (robustesse) : changements d illumination, orientation, échelle, bruit, encombrement, occultations Écarte potentiellement de l information Raphaël Marée Classification d images (11 / 55)

Thèse Introduction Classification d images La thèse Apprentissage automatique Est-il possible de mettre au point une méthode de classification d images autonome, générique et robuste par apprentissage automatique? Pas de pré-traitement : application directe de méthodes d apprentissage automatique à la représentation pixels Évaluation sur plusieurs problèmes et adaptation Précision Robustesse Raphaël Marée Classification d images (12 / 55)

Apprentissage automatique Classification d images La thèse Apprentissage automatique Mise au point d algorithmes pour l exploitation d observations issues d un environnement, construction de procédures de décision, de modèles. Applications : médecine, industrie, finance, réseaux,... Apprentissage supervisé : échantillon d entrées-sorties, construction d une règle (modèle) qui représente la relation entrées-sorties sous-jacente. Raphaël Marée Classification d images (13 / 55)

Classification d images La thèse Apprentissage automatique Apprentissage automatique supervisé Construction d un modèle (arbre de décision,...) à partir d un échantillon d observations étiquetées (LS) a 1 60 a 2 a 3 a 4 a 5 a 6 a 7 a 8 19 18 17 0 1 1 1 Classe C1 a 1 < 31 60 3 22 23 1 29 11 23 C1 O N 75 2 3 9 2 1 3 77 10 10 2 234 0 7 9 18 5 0 46 3 0 0 0 0 C1 C2 C2 APPRENTISSAGE O a 8< 5 N C1 2 14 5 10 8 10 8 10 C3 65 3 20 21 2 0 1 1? C2 C3 Raphaël Marée Classification d images (14 / 55)

Classification d images La thèse Apprentissage automatique Classification par apprentissage automatique supervisé Évaluation du taux d erreur du modèle sur un échantillon de test (TS) représentatif, indépendant du LS Précision, sources d erreur : Sous-apprentissage (biais) : modèle trop simple Sur-apprentissage (variance) : modèle trop précis Raphaël Marée Classification d images (15 / 55)

Méthodes d apprentissage supervisé Classification d images La thèse Apprentissage automatique K plus proches voisins Mono-arbre (CART) [BFOS84] Ensembles d arbres Bagging [Bre96] Boosting [FRS96] Random Forests [Bre01] Extra-Trees [Geu02] Machines à vecteurs de support (SVM) [Vap95] Raphaël Marée Classification d images (16 / 55)

Extra-Trees : apprentissage Classification d images La thèse Apprentissage automatique T1 T2 T3 T4 T5 Extra-Trees [Geu02] Construction indépendante des arbres Choix aléatoire des tests (attributs et seuils) Très rapide Arbre complet (classification parfaite du LS) Raphaël Marée Classification d images (17 / 55)

Extra-Trees : Prédiction Introduction Classification d images La thèse Apprentissage automatique Agrégation? T1 T2 T3 T4 T5 0 4 0 0 0 0 1 0 0 0 C1 C2 CM C2 Raphaël Marée Classification d images (18 / 55)

: plan Introduction Principe Évaluation de classification d images Principe Évaluation Bases de données Raphaël Marée Classification d images (19 / 55)

Principe Introduction Principe Évaluation Ensemble d apprentissage de N images pré-classifiées, LS = {(a i, c i ), i = 1,..., N} a i : vecteur de valeurs de pixels de l image c i : classe de l image Raphaël Marée Classification d images (20 / 55)

Bases de données et protocoles Principe Évaluation Bases de données # images # attributs # classes MNIST 70000 784 (28 28 1) 10 ORL 400 10304 (92 112 1) 40 COIL-100 7200 3072 (32 32 3) 100 OUTEX 864 49152 (128 128 3) 54 MNIST : LS = 60000 premières images ; TS = 10000 dernières images ORL : Validation croisée stratifiée : 10 tirages aléatoires LS = 360 ; TS = 40 COIL-100 : LS = 1800 images ; TS = 5400 images (36 autres images par objet) OUTEX : LS = 432 images (8 images par texture) ; TS = 432 images (8 images par texture) Raphaël Marée Classification d images (21 / 55)

Résultats : taux d erreur MNIST Principe Évaluation 70000 images, 784 variables, 10 classes Méthode Taux d erreur Mono-Arbre 11.50% K Plus proches voisins 5.66% Bagging 4.42% Extra-Trees 3.17% Random Forests 3.00% Boosting 2.29% SVMs 1.95% IDM, 3-NN [KGN04] 0.50% Raphaël Marée Classification d images (22 / 55)

Résultats : taux d erreur ORL Principe Évaluation 400 images, 10304 variables, 40 classes Méthode Taux d erreur Mono-Arbre 29.25% ± 6.89 Bagging 9.50% ± 5.70 Boosting 3.75% ± 2.79 K Plus proche voisins 2.25% ± 2.36 Extra-Trees 1.25% ± 1.68 Random Forests 1.25% ± 1.68 SVMs 1.25% ± 1.25 Raphaël Marée Classification d images (23 / 55)

Principe Évaluation Résultats : taux d erreur COIL-100 7200 images, 3072 variables, 100 classes Méthode Taux d erreur Mono-Arbre 20.80% Bagging 2.24% Extra-Trees 1.96% K Plus proche voisins 1.94% Random Forests 1.17% Boosting 0.54% SVMs 0.44% Local Affine Frames [OM02] 0.10% Raphaël Marée Classification d images (24 / 55)

Résultats : taux d erreur OUTEX Principe Évaluation 864 images, 49152 variables, 54 classes Méthode Taux d erreur Mono-Arbre 89.35% K Plus proche voisins 80.79% Bagging 73.15% SVMs 71.99% Boosting 69.44% Random Forests 66.90% Extra-Trees 65.05% RGB Histograms [MPV02] 0.20% Raphaël Marée Classification d images (25 / 55)

Résultats : résumé taux d erreur Principe Évaluation Random Forests, Extra-Trees, Boosting, SVM : bonnes performances pour 3 problèmes sur 4 Précision insatisfaisante pour textures Faible robustesse Raphaël Marée Classification d images (26 / 55)

Résultats : temps d exécution Principe Évaluation Temps d apprentissage MNIST (60000, 28 28) COIL-100 (1800, 32 32 3) Méthode Temps Méthode Temps Boosting ± 6h Boosting ± 5h Bagging ± 5h Bagging ± 2h SVMs ± 28m Random Forests ± 52m Random Forests ± 20m Mono-arbre ± 3m Extra-Trees ± 12m SVMs ± 1m Mono-arbre ± 7m Extra-Trees ± 9s Temps de prédiction (par image) MNIST COIL-100 Méthode Temps Méthode Temps SVM 49msec SVM 37msec Extra-Trees 0.6msec Extra-Trees 4msec Raphaël Marée Classification d images (27 / 55)

: plan Introduction Version de base Variantes robustes Résumé par extraction aléatoire de fenêtres Version de base Principes Évaluation : précision, robustesse Variantes robustes Raphaël Marée Classification d images (28 / 55)

Version de base Variantes robustes Résumé : phase d apprentissage C1 C2 C3!! " " # # $ $ $ % % % & & ' ' ( ( ) ) * * * + + +,-./ 0 0 0 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 4 4 5 5 6 6 6 7 7 7 8 8 9 9 :: :: :: ;; < <= ;; ;; = C1 C1 C1 C1 C1 C2 C2 C2 C2 C2 C3 C3 C3 C3 C3 Ensemble d apprentissage de N w fenêtres w w pré-classifiées, LS = {(a i, c i ), i = 1,..., N w } a i : vecteur de valeurs de pixels de la fenêtre c i : classe de l image dont est issue la fenêtre Raphaël Marée Classification d images (29 / 55)

: prédiction Version de base Variantes robustes Résumé??????? T1 T2 T3 T4 T5 + = 3 1 0 1 0 0 0 0 0 0 C1 C2 CM 0 4 0 0 0 0 0 0 0 1 C1 C2 CM 4 1 10 89 7 3 20 1 7 9 C1 C2 CM C2 Raphaël Marée Classification d images (30 / 55)

Résultats : taux d erreur Version de base Variantes robustes Résumé BDs Extra-Trees Extra-Trees État de l art et fenêtres MNIST 3.26% 2.63% 0.5% [DKN04] ORL 4.56% ± 1.43 1.66% ± 1.08 2% [Rav04] COIL-100 1.96% 0.37% 0.1% [OM02] OUTEX 65.05% 2.78% 0.2% [MPV02] 24 24 : 20 20 : 16 16 : 4 4 : Raphaël Marée Classification d images (31 / 55)

Version de base Variantes robustes Résumé Influence des paramètres : illustration sur ORL Taille des fenêtres : taux d erreur moyen 5.5% 5% 4.5% 4% 3.5% 3% 2.5% 2% 1.5% ORL, Nw=120000, T=10 16x16 32x32 48x48 64x64 80x80 96x96 dimension fenêtres (pixels) Nombre de fenêtres d apprentissage : taux d erreur moyen 5% 4% 3% 2% ORL, 20x20, T=10 1% 0 100000 200000 300000 400000 Nw Raphaël Marée Classification d images (32 / 55)

Résultats : temps d exécution Version de base Variantes robustes Résumé Apprentissage : dépend des paramètres MNIST : 6h, ORL : 37s, COIL-100 : 1h, OUTEX : 11m Prédiction : dépend des paramètres et du parcours Parcours exhaustif? MNIST : 2msec, ORL : 354msec COIL-100 : 14msec, OUTEX : 800msec Parcours aléatoire? MNIST : 1msec, ORL : 10msec COIL-100 : 5msec, OUTEX : 33msec Raphaël Marée Classification d images (33 / 55)

Version de base Variantes robustes Résumé Robustesse : changement de point de vue taux d erreur 40% 35% 30% 25% 20% 15% 10% 5% 0% COIL 100: changement point de vue Extra Trees Extra Trees + Fenêtres LAFs [OM02] 0 5 10 15 20 25 30 35 40 nb. vues apprentissage Raphaël Marée Classification d images (34 / 55)

Version de base Variantes robustes Résumé Robustesse : orientation, occultations, échelle Changements d orientation 2D Rotation de 20 : Globale : > 20% d erreurs Locale : < 5% d erreurs Mais > 30% d erreurs quand rotation de 45 Occultations Occultation de 40% : Globale : > 15% d erreurs Locale : < 10% d erreurs Changements d échelle 7% d erreurs quand facteur 1.5 Raphaël Marée Classification d images (35 / 55)

approche locale de base Version de base Variantes robustes Résumé par extraction aléatoire de fenêtres Amélioration de la précision Amélioration de la robustesse Paramètres Taille des fenêtres : effet non monotone Nombre de fenêtres : effet monotone Nombre d arbres << approche globale Raphaël Marée Classification d images (36 / 55)

Version de base Variantes robustes Résumé : plan variantes robustes par extraction et transformation aléatoires de fenêtres Variantes robustes Motivations Principes Évaluation Raphaël Marée Classification d images (37 / 55)

Motivations Introduction Version de base Variantes robustes Résumé En situations non contrôlées, échelle et orientation non connues a priori Méthodes locales de la littérature : Extraction de régions, de points d intérêts Normalisation, description invariante Notre approche : Apprentissage à partir de fenêtres transformées Raphaël Marée Classification d images (38 / 55)

%%$$ 1100 ===<<< Introduction Version de base Variantes robustes Résumé Variante 1 : fenêtres de tailles aléatoires Extraction de fenêtres de tailles aléatoires Transformation en une taille unique!!! """ # # ( ( ( ( ) ) ) ) & & & ' ' ' * *+ +,,, - -.. / / 22222 33333 44 55 6 6 6 7 7 7 8 8 9 9 : : ; ; C1 C2 C3 C1 C1 C1 C1 C1 C2 C2 C2 C2 C2 C3 C3 C3 C3 C3 Raphaël Marée Classification d images (39 / 55)

Version de base Variantes robustes Résumé Variante 2 : fenêtres de tailles et d orientations aléatoires Extraction de fenêtres de tailles aléatoires Transformation aléatoire de l orientation Transformation en une taille unique C1 C2 C3 C1 C1 C1 C1 C1 C2 C2 C2 C2 C2 C3 C3 C3 C3 C3 Raphaël Marée Classification d images (40 / 55)

Robustesse : échelle, orientation Version de base Variantes robustes Résumé Changement d échelle Changement d échelle Version de base Variante 1 16 16 71.72% 0.44% 32 32 0.37% 0.50% 48 48 7.15% 0.56% 128 128-0.44% Changement d orientation Changement d orientation Version de base Variante 2 0 0.37% 3.72% 30 8.85% - 45 31.69% 5.87% Raphaël Marée Classification d images (41 / 55)

Variante 3 : représentation HSV Version de base Variantes robustes Résumé Représentation HSV des pixels au lieu de RGB Précision : approche globale et locale de base OUTEX COIL-100 RGB HSV RGB HSV Globale 64.35% 41.20% 1.96% 1.59% Locale 2.78% 1.16% 0.37% 0.26% Robustesse : variante locale 2 COIL-100 Changement d orientation RGB HSV 0 3.72% 0.87% 45 5.87% 1.56% Raphaël Marée Classification d images (42 / 55)

Résumé résultats variantes Version de base Variantes robustes Résumé Représentation HSV Amélioration générale de la précision et de la robustesse par rapport à RGB Fenêtres tailles aléatoires et orientation fixe Changement d échelle : robustesse Changement de point de vue : amélioration Changement d orientation : pas d amélioration Fenêtres tailles et orientations aléatoires Changement d échelle : robustesse Changement de point de vue : amélioration Changement d orientation : robustesse Raphaël Marée Classification d images (43 / 55)

Méthodes locales : en résumé Version de base Variantes robustes Résumé Précision Paramètres pour compromis précision/efficacité Nombre de fenêtres (apprentissage, test) Nombre d arbres Robustesse Paramètres pour compromis précision/robustesse Variantes 1,2 Extra-Trees Scalable Raphaël Marée Classification d images (44 / 55)

: plan Introduction Étude empirique Pourquoi? Problèmes non encore investigués Application industrielle Étude empirique Autres bases de données Résumé Pourquoi ça marche? Problèmes non investigués Application industrielle de l approche Raphaël Marée Classification d images (45 / 55)

Autres applications : ETH-80 Étude empirique Pourquoi? Problèmes non encore investigués Application industrielle Classification de 8 classes d objets (Pomme, Poire, Tomate,...) Raphaël Marée Classification d images (46 / 55)

Autres applications : ZuBuD Étude empirique Pourquoi? Problèmes non encore investigués Application industrielle Classification de 201 bâtiments de Zürich (Bât 1, Bât 2,...) Raphaël Marée Classification d images (47 / 55)

Autres applications : WANG Étude empirique Pourquoi? Problèmes non encore investigués Application industrielle Classification de 10 thèmes de photographies (Plage, bus, éléphant, cheval,...) Raphaël Marée Classification d images (48 / 55)

Résumé des bases de données Étude empirique Pourquoi? Problèmes non encore investigués Application industrielle Bases de données largement utilisées, protocoles précis Caractéristiques : de 28 28 à 640 480 pixels, de 10 à 201 classes, de 400 à 70000 images Types : chiffres manuscrits, visages, objets, textures, immeubles, thèmes Variations : changements de point de vue, d illumination, d échelle, d orientation, encombrements et occultations Raphaël Marée Classification d images (49 / 55)

Pourquoi ça marche? Introduction Étude empirique Pourquoi? Problèmes non encore investigués Application industrielle Construction et agrégation d arbres Amélioration de la précision Réduction de la variance en présence d un grand nombre de variables (pixels) Extraction et agrégation de fenêtres Dissocie les attributs des positions fixes dans les images Fenêtres transformées : augmentation de la variabilité du LS Tolérance aux occultations et aux encombrements HSV Limite les effets des changements d illumination Raphaël Marée Classification d images (50 / 55)

Problèmes non encore investigués Étude empirique Pourquoi? Problèmes non encore investigués Application industrielle Nouveaux problèmes Nombre de classes ALOI (1000 classes) Variations plus importantes (bruits, encombrements,...) Butterflies Pascal challenges Au-delà de la classification Objets multiples Raphaël Marée Classification d images (51 / 55)

Application industrielle de l approche Étude empirique Pourquoi? Problèmes non encore investigués Application industrielle Projet européen pour la classification de défauts sur des réflecteurs de phares Exemples de défauts : Approche : utilisation des Extra-Trees à partir de la représentation pixels combinée avec des caractéristiques qui décrivent le voisinage Raphaël Marée Classification d images (52 / 55)

Introduction Contributions Perspectives Contributions Perspectives Raphaël Marée Classification d images (53 / 55)

Contributions Introduction Contributions Perspectives Nouvelle approche de classification d images Basée sur apprentissage automatique supervisé Extraction aléatoire de fenêtres Transformations de fenêtres Représentation pixels Étude empirique sur 7 problèmes divers Précision, robustesse Raphaël Marée Classification d images (54 / 55)

Perspectives Introduction Contributions Perspectives Évaluation Autres méthodes d apprentissage : SVM, Boosting Robustesse Autres transformations de fenêtres Autres techniques d extraction de régions invariantes Autres bases de données : dégradations accrues Autres types de données Textes Séquences génétiques Raphaël Marée Classification d images (55 / 55)

Contributions Perspectives L. Breiman, J. Friedman, R. Olsen, and C. Stone. Classification and Regression Trees. Wadsworth International (California), 1984. L. Breiman. Bagging predictors. Machine Learning, 24(2) :123 140, 1996. L. Breiman. Random forests. Machine learning, 45 :5 32, 2001. T. Deselaers, D. Keysers, and H. Ney. Classification error rate for quantitative evaluation of content-based image retrieval systems. In Proc. 17th International Conference on Pattern Recognition (ICPR), 2004. Y. Freund and E. Robert Schapire. Experiments with a new boosting algorithm. In Proc. Thirteenth International Conference on Machine Learning, pages 148 156, 1996. P. Geurts. Contributions to decision tree induction : bias/variance tradeoff and time series classification. Phd. thesis, Department of Electrical Engineering and Computer Science, University of Liège, May 2002. D. Keysers, C. Gollan, and H. Ney. Local context in non-linear deformation models for handwritten character recognition. In Proc. International Conference on Pattern Recognition, 2004. T. Mäenpää, M. Pietikäinen, and J. Viertola. Separating color and pattern information for color texture discrimination. Raphaël Marée Classification d images (55 / 55)

Contributions Perspectives In Proc. 16th International Conference on Pattern Recognition, 2002. S. Obdr zálek and J. Matas. Object recognition using local affine frames on distinguished regions. In Electronic Proceedings of the 13th British Machine Vision Conference, University of Cardiff, 2002. S. Ravela. Shaping receptive fields for affine invariance. In Proc. IEEE Conf. on Computer Vision and Pattern Recognition (CVPR2004), june 2004. V. Vapnik. The nature of statistical learning theory. Springer Verlag, 1995. Raphaël Marée Classification d images (55 / 55)