Troncatures dans les modèles linéaires simples et à effets mixtes sous R



Similar documents
Personnalisez votre intérieur avec les revêtements imprimés ALYOS design

Introduction au BIM. ESEB Seyssinet-Pariset Economie de la construction contact@eseb.fr

Introduction. GEAL Bibliothèque Java pour écrire des algorithmes évolutionnaires. Objectifs. Simplicité Evolution et coévolution Parallélisme

RAPPORT FINANCIER ANNUEL PORTANT SUR LES COMPTES 2014

Calcul parallèle avec R

Memory Eye SSTIC Yoann Guillot. Sogeti / ESEC R&D yoann.guillot(at)sogeti.com

Liste d'adresses URL

Audit de sécurité avec Backtrack 5

M1 UE3 Examen final 2014 / 2015 : China infrastructures strategy


Thursday, February 7, DOM via PHP

REQUEST FORM FORMULAIRE DE REQUÊTE

"Internationalization vs. Localization: The Translation of Videogame Advertising"

REQUEST FORM FORMULAIRE DE REQUÊTE

POB-JAVA Documentation

Sur 1 Bit bit n 4 bit n 3 bit n 2 bit n 1 bit n 4 bit n 3 bit n 2 bit n 1 bit n 4 bit n 3 bit n 2 bit n 1

DIRECTIVE ON ACCOUNTABILITY IN CONTRACT MANAGEMENT FOR PUBLIC BODIES. An Act respecting contracting by public bodies (chapter C-65.1, a.

Remote Method Invocation

Managing the competencies of team members in design projects through multi period task assignment. Onanong Hlaoittinun, Eric Bonjour, Maryvonne Dulmet

REQUEST FORM FORMULAIRE DE REQUETE

Sélection adaptative de codes polyédriques pour GPU/CPU

Langages Orientés Objet Java

Office of the Auditor General / Bureau du vérificateur général FOLLOW-UP TO THE 2010 AUDIT OF COMPRESSED WORK WEEK AGREEMENTS 2012 SUIVI DE LA

Licence Informatique Année Exceptions

TP1 : Correction. Rappels : Stream, Thread et Socket TCP

BILL C-665 PROJET DE LOI C-665 C-665 C-665 HOUSE OF COMMONS OF CANADA CHAMBRE DES COMMUNES DU CANADA

Centre International de Hautes Etudes Agronomiques MÄditerranÄennes. International Centre for Advanced Mediterranean Agronomic Studies POINT 9

Bac + 04 Licence en science commerciale, option marketing et communication. Degree in computer science, engineering or equivalent

Avez-vous entendu parler du Compressed sensing? Atelier Inversion d ISTerre 15 Mai 2012 H-C. Nataf

Certificat de fusion. Certificate of Amalgamation. Canada Business Corporations Act. Loi canadienne sur les sociétés par actions

ACP-EU Cooperation Programme in Science and Technology (S&T II) / Programme de Coopération ACP-UE pour la Science et la Technologie

Régression logistique : introduction

Altiris Patch Management Solution for Windows 7.6 from Symantec Third-Party Legal Notices

Gabon Tourist visa Application for citizens of Canada living in Alberta

Statistiques en grande dimension

2 RENSEIGNEMENTS CONCERNANT L ASSURÉ SI CELUI-CI N EST PAS LE REQUÉRANT INFORMATION CONCERNING THE INSURED PERSON IF OTHER THAN THE APPLICANT

Altiris Patch Management Solution for Windows 7.5 SP1 from Symantec Third-Party Legal Notices

Short Form Description / Sommaire: Carrying on a prescribed activity without or contrary to a licence

Gabon Business visa Application for citizens of Canada living in Alberta

COMMISSION INTERNATIONALE DE KARTING - FIA

Note concernant votre accord de souscription au service «Trusted Certificate Service» (TCS)

CERN EUROPEAN ORGANIZATION FOR NUCLEAR RESEARCH

Archived Content. Contenu archivé

Etude expérimentale et numérique du piégeage d un front de fissure par une interface hétérogène modèle

SIXTH FRAMEWORK PROGRAMME PRIORITY [6

Introduction ToIP/Asterisk Quelques applications Trixbox/FOP Autres distributions Conclusion. Asterisk et la ToIP. Projet tuteuré

«Object-Oriented Multi-Methods in Cecil» Craig Chambers (Cours IFT6310, H08)

Certificate of Incorporation Certificat de constitution

Millier Dickinson Blais

Spectrométrie d absorption moléculaire UV-visible

Office of the Auditor General / Bureau du vérificateur général FOLLOW-UP TO THE 2007 AUDIT OF THE DISPOSAL OF PAVEMENT LINE MARKER EQUIPMENT 2009

Bluetooth Low Energy

STAGE YOGA & RANDONNEES à MADERE

Archived Content. Contenu archivé

Fondation Rennes 1. Atelier de l innovation. Fondation Rennes 1. Fondation Rennes 1 MANAGEMENT AGILE. Fondation Rennes 1 ET INNOVATION

Méthodes ensemblistes pour une localisation robuste de robots sous-marins

Office of the Auditor General / Bureau du vérificateur général FOLLOW-UP TO THE 2007 AUDIT OF THE ENVIRONMENTAL COMMITMENTS IN THE OTTAWA 20/20

Cliquez sur le résultat que vous avez obtenu au test de classement linguistique Click on the result you obtained following the language test

Sun StorEdge Availability Suite Software Point-in-Time Copy Software Maximizing Backup Performance

We are pleased to present you with detailed instructions on processing your visa application with us. Within this information pack you will find:

Veritas Storage Foundation 5.0 Software for SPARC

Sun Management Center Change Manager Release Notes

Archived Content. Contenu archivé

Technical Service Bulletin

Archived Content. Contenu archivé

Parallel Discrepancy-based Search

Need for and requirements of national monitoring for prisons and jails within a sovereign State

Générer des graphiques 3D - Cours Université de Sfax

76,000. Administrative Monetary Penalty / Sanction administrative pécuniaire NOTICE OF VIOLATION / AVIS D'INFRACTION. Plains Midstream Canada ULC

Archived Content. Contenu archivé

Archived Content. Contenu archivé

Annual Event 2016 Workshop New to Interreg, where to begin? Évènement annuel 2016 Atelier «Interreg pour les débutants, par où commencer?

Installation troubleshooting guide

State of Maryland Health Insurance Exchange

The wolf who wanted to change his color Week 1. Day 0. Day 1. Day 2. Day 3. - Lecture de l album

"Templating as a Strategy for Translating Official Documents from Spanish to English"

C-32.2 Credit Unions Act

Implementation of SAP-GRC with the Pictet Group

Instruction de montage de voûte ISOLHIS grande portée PCA 32mm

Les fragments. Programmation Mobile Android Master CCI. Une application avec deux fragments. Premier layout : le formulaire

Relevé des frais annuels de l entente de licence destinée à l enseignement primaire et secondaire MAI 2016

In-Home Caregivers Teleconference with Canadian Bar Association September 17, 2015

Aspectual Properties of Deverbal Nouns

Il est repris ci-dessous sans aucune complétude - quelques éléments de cet article, dont il est fait des citations (texte entre guillemets).

Proposition d intervention

Administrer les solutions Citrix XenApp et XenDesktop 7.6 CXD-203

Measuring Policing Complexity: A Research Based Agenda

Solaris 9 9/05 Installation Roadmap

"Simultaneous Consecutive Interpreting: A New Technique Put to the Test"

SOFTWARE DEFINED SOLUTIONS JEUDI 19 NOVEMBRE Nicolas EHRMAN Sr Presales SDS

Section des Unités de recherche. Evaluation report. Research unit : Troubles du comportement alimentaire de l adolescent. University Paris 11


CSS : petits compléments

STRATEGY & OUTLOOK HIGHCO'S OFFER

You can choose to install the plugin through Magento Connect or by directly using the archive files.

ANIMATION OF CONTINUOUS COMPUTER SIMULATIONS C.M. Woodside and Richard Mallet Computer Center, Carleton University ABSTRACT

Electrical/Electronics

Machine de Soufflage defibre

Sun StorEdge A5000 Installation Guide

Transcription:

Troncatures dans les modèles linéaires simples et à effets mixtes sous R Lyon, 27 et 28 juin 2013 D.Thiam, J.C Thalabard, G.Nuel Université Paris Descartes MAP5 UMR CNRS 8145 IRD UMR 216 2èmes Rencontres D. THIAM (Paris Descartes) Troncatures 1 / 11

Motivations Le modèle linéaire simple y x1 x2 1 14.116 2.785 4.828 2 15.206 3.065 5.185 3 15.179 2.966 5.333 4 15.437 5.128 5.212 5 13.720 2.259 4.891 6 12.583 1.904 5.018 7 13.755 3.038 4.789 8 13.940 3.310 4.785 9 15.310 3.437 5.265 10 12.952 2.542 4.695 y: outcome, x 1, x 2 covariables Le modèle: Y = Xβ + ε (1, X = X 1, X 2 ); β = (β 0, β 1, β 2 ) Θ = (β, σ); σ=sd(ε) Θ = (1, 1, 2, 0.8); n = 1000 Maximum de vraisemblance n L(Θ; y) = f(y i ) Θ = arg max L(Θ; y) Θ 1 fonction R lm lm(y x 1 + x 2 ) Θ = (0.66, 0.98, 2.08, 0.79) D. THIAM (Paris Descartes) Troncatures 2 / 11

Motivations Le modèle linéaire simple y x1 x2 1 14.116 2.785 4.828 2 15.206 3.065 5.185 3 15.179 2.966 5.333 4 15.437 5.128 5.212 5 13.720 2.259 4.891 6 12.583 1.904 5.018 7 13.755 3.038 4.789 8 13.940 3.310 4.785 9 15.310 3.437 5.265 10 12.952 2.542 4.695 y: outcome, x 1, x 2 covariables Le modèle: Y = Xβ + ε (1, X = X 1, X 2 ); β = (β 0, β 1, β 2 ) Θ = (β, σ); σ=sd(ε) Θ = (1, 1, 2, 0.8); n = 1000 Maximum de vraisemblance L =sum(dnorm(y,mean=xβ,sd=σ,log=t)) Θ = arg max Θ L fonction R lm lm(y x 1 + x 2 ) Θ = (0.66, 0.98, 2.08, 0.79) D. THIAM (Paris Descartes) Troncatures 2 / 11

Motivations Le modèle linéaire avec troncatures y x1 x2 1 14.116 2.785 4.828 2 15.206 3.065 5.185 3 15.179 2.966 5.333 4 High 5.128 5.212 5 13.720 2.259 4.891 6 Low 1.904 5.018 7 13.755 3.038 4.789 8 13.940 3.310 4.785 9 15.310 3.437 5.265 10 Low 2.542 4.695 y: outcome, x 1, x 2 covariables Y = Xβ + ε si l y i < u Low=y i 13 High=y i 15.4 Maximum de vraisemblance L(Θ; y) = f(y i ) + Φ(l) + (1 Φ(u)) Fonctions R : tobit,censreg tobit(y x 1 + x 2,left=13,right=15.4) Θ = (0.6751, 0.9298, 2.1153, 0.728) D. THIAM (Paris Descartes) Troncatures 3 / 11

Motivations Le modèle linéaire avec troncatures y x1 x2 1 14.116 2.785 4.828 2 15.206 3.065 5.185 3 15.179 2.966 5.333 4 High 5.128 5.212 5 13.720 2.259 4.891 6 Low 1.904 5.018 7 13.755 3.038 4.789 8 13.940 3.310 4.785 9 15.310 3.437 5.265 10 Low 2.542 4.695 y: outcome, x 1, x 2 covariables Y = Xβ + ε si l y i < u Low=y i 13 High=y i 15.4 Maximum de vraisemblance L =sum(dnorm(y,mean=xβ,sd=σ,log=t)) +sum(pnorm(t,mean=xβ,sd=σ,log=t)) +sum(pnorm(u,mean=xβ,sd=σ,log=t, lower.tail=f)) Fonctions R : tobit,censreg tobit(y x 1 + x 2,left=13,right=15.4) Θ = (0.6751, 0.9298, 2.1153, 0.728) D. THIAM (Paris Descartes) Troncatures 3 / 11

Motivations Le modèle linéaire tronqué: extension y x1 x2 1 14.116 2.785 4.828 2 15.206 3.065 5.185 3 15.179 2.966 5.333 4 High 1 5.128 5.212 5 Low 2 2.259 4.891 6 Low 1 1.904 5.018 7 13.755 3.038 4.789 8 13.940 3.310 4.785 9 Low 2 3.437 5.265 10 Low 1 2.542 4.695 y: outcome, x 1, x 2 covariables Y = Xβ + ε si l y i < u Low 1 =y i 13; Low 2 =y i 13.72! aximum de vraisemblance L(Θ; y) = f(y i ) + Φ(l i ) + (1 Φ(u i )) Limites tobit,censreg Pas de seuils multiples Résidus calculés par imputation simple Alternative: Implémentation d un algorithme EM adapté D. THIAM (Paris Descartes) Troncatures 4 / 11

Motivations Le modèle linéaire tronqué: extension y x1 x2 1 14.116 2.785 4.828 2 15.206 3.065 5.185 3 15.179 2.966 5.333 4 High 1 5.128 5.212 5 Low 2 2.259 4.891 6 Low 1 1.904 5.018 7 13.755 3.038 4.789 8 13.940 3.310 4.785 9 Low 2 3.437 5.265 10 Low 1 2.542 4.695 y: outcome, x 1, x 2 covariables Y = Xβ + ε si l y i < u Low 1 =y i 13; Low 2 =y i 13.72! aximum de vraisemblance =sum(dnorm(y,mean=xβ,sd=σ,log=t)) sum(pnorm(t i,mean=xβ,sd=σ,log=t)) sum(pnorm(u i,mean=xβ,sd=σ,log=t, ower.tail=f)) Limites tobit,censreg Pas de seuils multiples Résidus calculés par imputation simple Alternative: Implémentation d un algorithme EM adapté D. THIAM (Paris Descartes) Troncatures 4 / 11

Notre approche: EM flexible Algorithe EM y O données observées; y T données tronquées M(θ) = arg max P(y T y O ; θ) log P(y O, y T ; θ ) dz dy T θ y } T {{ } Q(θ θ) y T y O loi normale tronquée log P(y O, y T ; θ ) donné par lm à y T fixé. P(y T y O ; θ) joue le rôle de poids EM flexlible pour Tobit 1) Générer N quantiles de la loi y T y O 2) Maximiser la vraisemblance des données complètes avec lm+ option weights 3) Alterner les deux étapes jusqu à convergence D. THIAM (Paris Descartes) Troncatures 5 / 11

Nombre optimal de quantiles Figure: Etude de la variabilité de l estimation en fonction du nombre de paramètres D. THIAM (Paris Descartes) Troncatures 6 / 11

Extension au modèle mixte Le modèle y ij = βx ij + z i + ε ij ; (lmer) l ij y ij < u ij z N(0, η); ε N(0, σ) Algorithme EM M(θ) = arg max θ P(z, y T y O ; θ) log P(y O, z, y T ; θ ) dz dy T z y } T {{ } Q(θ θ) Introduction de variables latentes continues y O : données observées y T variable latente continue: données tronquées z variable latente continue: effets aléatoires Approximation de la vraisemblance des données complètes Maximisation de cette vraisemblance avec les fonctions R usuelles D. THIAM (Paris Descartes) Troncatures 7 / 11

Extension au modèle mixte Remarque: y T fixé = lmer Solution Alernative: Modèle Tobit avec effets aléatoires z fixé = tobit Modèle mixte avec troncatures multiples Solution alternatives 1) EM combiné avec lmer du package lme4 M lmer (θ) = arg max P(y T y O ; θ) log P(y O, y T ; θ ) dy T θ y } T {{ } Q(θ θ) 2) EM combiné avec tobit des packages censreg ou AER M tobit (θ) = arg max P(z y O ; θ) log P(y O, z; θ ) dz θ z } {{ } Q(θ θ) D. THIAM (Paris Descartes) Troncatures 8 / 11

Extension au modèle mixte Etapes de l algorithme version lmer 1 ) Création des données complètes en remplaçant les données tronquées par N quantiles q ijk = (q ij1,..., q ijn ) 2 ) Estimation des paramètres du modèle mixte avec lmer 3 ) Mise à jour des paramètres et répétion jusqu à convergence Lois conditionnelles Pour chaque bloc i: i, y i,o, y i,t : y i, est un vecteur Gaussien avec pour loi N (βx i, Σ) σ 2 + η 2 η 2 η 2 Σ = η 2..... η 2 σ 2 + η ( 2 y i,t y i,o N t µi, Σ i, lower = t ) N t la loi normale tronqué µ i = βx i,t + Σ i,t,o Σ 1 i,o,o (y O,i µ i,o ) Σ i = Σ i,t,t Σ i,t,o Σ 1 i,o,o Σ i,o,t D. THIAM (Paris Descartes) Troncatures 9 / 11

Figure: Comparaison de la stabilité des paramètres en itérant les calculs en modifiant le taux de troncatures. 30% par FEM vs 40% par FEM D. THIAM (Paris Descartes) Troncatures 10 / 11

Figure: Comparaison de la stabilité des paramètres en itérant les calculs. 45% de troncatures par FEM; vs 10% de troncatures par imputation simple D. THIAM (Paris Descartes) Troncatures 10 / 11

Algorithme EM flexible : avantages Gestion externe des variables latentes Méthodologie flexible Utilisation des packages R familiers Seuils multiples autorisés Convergence rapide Algorithme EM flexible : extensions Modèle linéaire généralisé Introduction de classes latentes Recommendations Option weights!! Applications Application 1: mesures ELISA en immunologie (UMR 216 IRD) Application 2: Méta-analyse sur test de diagnostic à données corrélées avec statut réel du patient (Malade/non malade) latent( J.C. Thalabard). D. THIAM (Paris Descartes) Troncatures 11 / 11