Benoit Liquet - Academia.edu (original) (raw)

Papers by Benoit Liquet

Research paper thumbnail of Pr ediction de la pneumonie nosocomiale a l'aide d'un mod ele multi- etats

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Correction of theP-value after multiple coding of an explanatory variable in logistic regression

Statistics in Medicine, 2001

We propose a method and a program to determine a significance level for a series of codings of an... more We propose a method and a program to determine a significance level for a series of codings of an explanatory variable in logistic regression. Dichotomous and Box–Cox transformations are considered. Three methods of correcting the significance level are studied: the Bonferroni method; Efron's method, which uses the correlation between successive tests, and the exact calculation by numerical integration using all correlations. A simulation study has led to a strategy for the choice and number of the different codings of the variable. This method is illustrated using the data of a study of the relation between cholesterol and dementia. Copyright © 2001 John Wiley & Sons, Ltd.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Estimating the Expectation of the Log-Likelihood with Censored Data for Estimator Selection

Lifetime Data Analysis, 2004

A criterion for choosing an estimator in a family of semi-parametric estimators from incomplete d... more A criterion for choosing an estimator in a family of semi-parametric estimators from incomplete data is proposed. This criterion is the expected observed log-likelihood (ELL). Adapted versions of this criterion in case of censored data and in presence of explanatory variables are exhibited. We show that likelihood cross-validation (LCV) is an estimator of ELL and we exhibit three bootstrap estimators. A simulation study considering both families of kernel and penalized likelihood estimators of the hazard function (indexed on a smoothing parameter) demonstrates good results of LCV and a bootstrap estimator called ELLbboot . We apply the ELLbboot criterion to compare the kernel and penalized likelihood estimators to estimate the risk of developing dementia for women using data from a large cohort study.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Computation of the p -value of the maximum of score tests in the generalized linear model; application to multiple coding

Statistics & Probability Letters, 2005

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Asymptotic Distribution of Score Statistics for Spatial Cluster Detection with Censored Data

Biometrics, 2008

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Choice of Estimators Based on Different Observations: Modified AIC and LCV Criteria

Scandinavian Journal of Statistics, 2010

Abstract. It is quite common in epidemiology that we wish to assess the quality of estimators on... more Abstract. It is quite common in epidemiology that we wish to assess the quality of estimators on a particular set of information, whereas the estimators may use a larger set of information. Two examples are studied: the first occurs when we construct a model for an event which happens if a continuous variable is above a certain threshold. We can compare estimators based on the observation of only the event or on the whole continuous variable. The other example is that of predicting the survival based only on survival information or using in addition information on a disease. We develop modified Akaike information criterion (AIC) and Likelihood cross-validation (LCV) criteria to compare estimators in this non-standard situation. We show that a normalized difference of AIC has a bias equal to o(n−1) if the estimators are based on well-specified models; a normalized difference of LCV always has a bias equal to o(n−1). A simulation study shows that both criteria work well, although the normalized difference of LCV tends to be better and is more robust. Moreover in the case of well-specified models the difference of risks boils down to the difference of statistical risks which can be rather precisely estimated. For ‘compatible’ models the difference of risks is often the main term but there can also be a difference of mis-specification risks.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Choice between Semiparametric Estimators of Markov and Non-Markov Multistate Models from Coarsened Observations

Scandinavian Journal of Statistics, 2007

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Maintenance des sessions Pré-requis et objectif

Les commandes élémentaires consistent soit en des expressions, soit en des affectations obtenues ... more Les commandes élémentaires consistent soit en des expressions, soit en des affectations obtenues au moyen de la flèche <- ou ->. Si une expression est tapée, elle est évaluée, le résultat est affiché puis perdu. Une affectation évalue aussi une expression, mais n’affiche pas forcément le résultat. Ce résultat est alors stocké dans un objet.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Analyse de variance élémentaire

Objectif: L’analyse de la variance (ANOVA) est une méthode qui permet d’étudier la modification d... more Objectif: L’analyse de la variance (ANOVA) est une méthode qui permet d’étudier la modification de la moyenne μ du phénomène étudié Y (variable quantitative) selon l’influence d’un ou de plusieurs facteurs d’expérience qualitatifs (traitements ...). Dans le cas où la moyenne n’est influencée que par un seul facteur (noté facteur X), il s’agit d’une analyse de la variance à un facteur (one way ANOVA). Un facteur est souvent une variable qualitative présentant un nombre restreint de modalités. Le nombre de modalités (c’est-à-dire de niveaux) du facteur X sera noté I. On suppose que Y suit une loi normale N(μi ;σ2) sur chaque sous-population i définie par les modalités de X. L’objectif est de tester l’égalité des moyennes de ces I populations, à savoir de tester l’hypothèse nulle mathcalH0:mu1=mu2=cdotsmuI\mathcal{H}_0 :\mu _1 = \mu _2 = \cdots \mu _ImathcalH_0:mu_1=mu2=cdotsmuI contre l’assertion d’intérêt ℋ1: ∃ i ≠ i′ / μi ≠ μi′ («il existe au moins deux moyennes différentes»).

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Manipulation de données

Le logiciel R présente l’avantage de pouvoir opérer sur des vecteurs ou des matrices. Ainsi, l’ap... more Le logiciel R présente l’avantage de pouvoir opérer sur des vecteurs ou des matrices. Ainsi, l’appel suivant > x <- c(1,2,4,6,3) > y <- c(4,7,8,1,1) > x+y [1] 5 9 12 7 4 va renvoyer en une seule opéeration le vecteur des sommes (x 1 + y 1 , ..., x n + y n ).

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Quelques jeux de données et problématiques

Un échantillon de dossiers d’enfants a été saisi. Ce sont des enfants vus lors d’une visite en 1r... more Un échantillon de dossiers d’enfants a été saisi. Ce sont des enfants vus lors d’une visite en 1re section de maternelle en 1996–1997 dans des écoles de Bordeaux (Gironde, France). L’éechantillon est constitué de 152 enfants âgés de 3 ou 4 ans.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Présentation du logiciel R

Le logiciel R est un logiciel de statistique créé par Ross Ihaka & Robert Gentleman [21]. Il est ... more Le logiciel R est un logiciel de statistique créé par Ross Ihaka & Robert Gentleman [21]. Il est à la fois un langage informatique et un environnement de travail: les commandes sont exécutées grâce à des instructions codées dans un langage relativement simple, les résultats sont affichés sous forme de texte et les graphiques sont visualisés directement dans une fenêtre qui leur est propre. C’est un clone du logiciel S-plus qui est fondé sur le langage de programmation orienté objet S, développé par AT&T Bell Laboratories en 1988 [4]. Ce logiciel sert à manipuler des données, à tracer des graphiques et à faire des analyses statistiques sur ces données.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Importation-exportation et production de données

Soit vous disposez déj`a d’un fichier texte au format ASCII qui contient vos données, soit vous p... more Soit vous disposez déj`a d’un fichier texte au format ASCII qui contient vos données, soit vous pouvez les entrer vous-même dans un fichier à l’aide d’un éditeur de texte comme Wordpad sous Microsoft Windows ou bien Emacs sous Linux.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Techniques pour tracer des courbes et des graphiques

Tous les graphiques créés dans R sont affichés dans des fenêtres spéciales, distinctes de la cons... more Tous les graphiques créés dans R sont affichés dans des fenêtres spéciales, distinctes de la console, appelées «R graphics: Device numero-device», où numero-device est un entier donnant le numéro de la fenêtre (ou device).

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Odor vapor pressure and quality modulate local field potential oscillatory patterns in the olfactory bulb of the anesthetized rat

European Journal of Neuroscience, 2008

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Régression linéaire simple et multiple

Dans la plupart des situations, nous sommes amenés à étudier la relation entre une variable d’int... more Dans la plupart des situations, nous sommes amenés à étudier la relation entre une variable d’intérêt Y (souvent quantitative) et une ou plusieurs variable(s) X1, X2, ..., Xk , avec pour objectif d’expliquer les variations de la variable d’intérêt. La variable Y est appelée variable « à expliquer » (ou parfois variable dépendante), et les variables X1, X2, ..., Xk sont dites « explicatives » et représentent, en épidémiologie, les facteurs de risque ou de confusion. L’utilisation des méthodes d’analyse multivariée, et plus particulièrement des modèles de régression linéaire, permet donc: de prendre en compte simultanément plusieurs facteurs pouvant expliquer la variation ou la distribution de la variable Y; d’étudier le rôle de modification d’effet ou de confusion d’un ou de plusieurs facteur(s); de prédire les valeurs ou la distribution de la variable à expliquer connaissant les valeurs des variables explicatives.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Variables aléatoires, lois et simulations

Considérons une urne remplie avec n boules numérotées de 1 à n. La fabrication de nombres au hasa... more Considérons une urne remplie avec n boules numérotées de 1 à n. La fabrication de nombres au hasard peut s’imaginer facilement au travers d’une expérience consistant à piocher (on dit aussi tirer) avec remise, plusieurs fois de suite, une seule boule à la fois dans cette urne. Cette opération produit une suite de nombres entiers dont l’ordre d’apparition est régi par une loi dite uniforme discrète (sur l’ensemble {1,..., n}). Il devient ensuite naturel de se poser la question de la génération de nombres réels uniformément répartis sur un intervalle. Nous nous proposons ici de donner quelques éléments sur la génération de nombres selon une telle loi, dite uniforme, à l’aide d’un algorithme informatique.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Les concepts de base, l’organisation des donnèes

Après avoir lancé le logiciel R en double-cliquant sur son icône sur le Bureau de Windows (ou bie... more Après avoir lancé le logiciel R en double-cliquant sur son icône sur le Bureau de Windows (ou bien á partir du Menu Démarrer), vous voyez apparaître, à la fin de l’affichage qui se déroule dans la console de R (appelèe R Console), le caractère d’invite de commande > vous invitant à taper votre première instruction en langage R.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Understanding Convergence Concepts: A Visual-Minded and Graphical Simulation-Based Approach

American Statistician, 2009

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Statistique descriptive

Nous allons fonder tous les exemples de ce chapitre sur le fichier de données nutriage.xls que vo... more Nous allons fonder tous les exemples de ce chapitre sur le fichier de données nutriage.xls que vous pouvez importer dans R en suivant l’une des méthodes exposées dans le chapitre 2. Vous pourriez par exemple utiliser les instructions suivantes (pensez à installer le fichier http://www.biostatisticien.eu/ springeR/Rtools29.exe si vous travaillez sous l’environnement Microsoft): > require(gdata) # Donne accès à la fonction read.xls() > nutriage <- read.xls( + “http://www.biostatisticien.eu/springeR/nutriage.xls”) Downloading... Done. Converting xls file to csv file... Done. Reading csv file... Done.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Pr ediction de la pneumonie nosocomiale a l'aide d'un mod ele multi- etats

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Correction of theP-value after multiple coding of an explanatory variable in logistic regression

Statistics in Medicine, 2001

We propose a method and a program to determine a significance level for a series of codings of an... more We propose a method and a program to determine a significance level for a series of codings of an explanatory variable in logistic regression. Dichotomous and Box–Cox transformations are considered. Three methods of correcting the significance level are studied: the Bonferroni method; Efron's method, which uses the correlation between successive tests, and the exact calculation by numerical integration using all correlations. A simulation study has led to a strategy for the choice and number of the different codings of the variable. This method is illustrated using the data of a study of the relation between cholesterol and dementia. Copyright © 2001 John Wiley & Sons, Ltd.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Estimating the Expectation of the Log-Likelihood with Censored Data for Estimator Selection

Lifetime Data Analysis, 2004

A criterion for choosing an estimator in a family of semi-parametric estimators from incomplete d... more A criterion for choosing an estimator in a family of semi-parametric estimators from incomplete data is proposed. This criterion is the expected observed log-likelihood (ELL). Adapted versions of this criterion in case of censored data and in presence of explanatory variables are exhibited. We show that likelihood cross-validation (LCV) is an estimator of ELL and we exhibit three bootstrap estimators. A simulation study considering both families of kernel and penalized likelihood estimators of the hazard function (indexed on a smoothing parameter) demonstrates good results of LCV and a bootstrap estimator called ELLbboot . We apply the ELLbboot criterion to compare the kernel and penalized likelihood estimators to estimate the risk of developing dementia for women using data from a large cohort study.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Computation of the p -value of the maximum of score tests in the generalized linear model; application to multiple coding

Statistics & Probability Letters, 2005

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Asymptotic Distribution of Score Statistics for Spatial Cluster Detection with Censored Data

Biometrics, 2008

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Choice of Estimators Based on Different Observations: Modified AIC and LCV Criteria

Scandinavian Journal of Statistics, 2010

Abstract. It is quite common in epidemiology that we wish to assess the quality of estimators on... more Abstract. It is quite common in epidemiology that we wish to assess the quality of estimators on a particular set of information, whereas the estimators may use a larger set of information. Two examples are studied: the first occurs when we construct a model for an event which happens if a continuous variable is above a certain threshold. We can compare estimators based on the observation of only the event or on the whole continuous variable. The other example is that of predicting the survival based only on survival information or using in addition information on a disease. We develop modified Akaike information criterion (AIC) and Likelihood cross-validation (LCV) criteria to compare estimators in this non-standard situation. We show that a normalized difference of AIC has a bias equal to o(n−1) if the estimators are based on well-specified models; a normalized difference of LCV always has a bias equal to o(n−1). A simulation study shows that both criteria work well, although the normalized difference of LCV tends to be better and is more robust. Moreover in the case of well-specified models the difference of risks boils down to the difference of statistical risks which can be rather precisely estimated. For ‘compatible’ models the difference of risks is often the main term but there can also be a difference of mis-specification risks.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Choice between Semiparametric Estimators of Markov and Non-Markov Multistate Models from Coarsened Observations

Scandinavian Journal of Statistics, 2007

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Maintenance des sessions Pré-requis et objectif

Les commandes élémentaires consistent soit en des expressions, soit en des affectations obtenues ... more Les commandes élémentaires consistent soit en des expressions, soit en des affectations obtenues au moyen de la flèche <- ou ->. Si une expression est tapée, elle est évaluée, le résultat est affiché puis perdu. Une affectation évalue aussi une expression, mais n’affiche pas forcément le résultat. Ce résultat est alors stocké dans un objet.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Analyse de variance élémentaire

Objectif: L’analyse de la variance (ANOVA) est une méthode qui permet d’étudier la modification d... more Objectif: L’analyse de la variance (ANOVA) est une méthode qui permet d’étudier la modification de la moyenne μ du phénomène étudié Y (variable quantitative) selon l’influence d’un ou de plusieurs facteurs d’expérience qualitatifs (traitements ...). Dans le cas où la moyenne n’est influencée que par un seul facteur (noté facteur X), il s’agit d’une analyse de la variance à un facteur (one way ANOVA). Un facteur est souvent une variable qualitative présentant un nombre restreint de modalités. Le nombre de modalités (c’est-à-dire de niveaux) du facteur X sera noté I. On suppose que Y suit une loi normale N(μi ;σ2) sur chaque sous-population i définie par les modalités de X. L’objectif est de tester l’égalité des moyennes de ces I populations, à savoir de tester l’hypothèse nulle mathcalH0:mu1=mu2=cdotsmuI\mathcal{H}_0 :\mu _1 = \mu _2 = \cdots \mu _ImathcalH_0:mu_1=mu2=cdotsmuI contre l’assertion d’intérêt ℋ1: ∃ i ≠ i′ / μi ≠ μi′ («il existe au moins deux moyennes différentes»).

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Manipulation de données

Le logiciel R présente l’avantage de pouvoir opérer sur des vecteurs ou des matrices. Ainsi, l’ap... more Le logiciel R présente l’avantage de pouvoir opérer sur des vecteurs ou des matrices. Ainsi, l’appel suivant > x <- c(1,2,4,6,3) > y <- c(4,7,8,1,1) > x+y [1] 5 9 12 7 4 va renvoyer en une seule opéeration le vecteur des sommes (x 1 + y 1 , ..., x n + y n ).

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Quelques jeux de données et problématiques

Un échantillon de dossiers d’enfants a été saisi. Ce sont des enfants vus lors d’une visite en 1r... more Un échantillon de dossiers d’enfants a été saisi. Ce sont des enfants vus lors d’une visite en 1re section de maternelle en 1996–1997 dans des écoles de Bordeaux (Gironde, France). L’éechantillon est constitué de 152 enfants âgés de 3 ou 4 ans.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Présentation du logiciel R

Le logiciel R est un logiciel de statistique créé par Ross Ihaka & Robert Gentleman [21]. Il est ... more Le logiciel R est un logiciel de statistique créé par Ross Ihaka & Robert Gentleman [21]. Il est à la fois un langage informatique et un environnement de travail: les commandes sont exécutées grâce à des instructions codées dans un langage relativement simple, les résultats sont affichés sous forme de texte et les graphiques sont visualisés directement dans une fenêtre qui leur est propre. C’est un clone du logiciel S-plus qui est fondé sur le langage de programmation orienté objet S, développé par AT&T Bell Laboratories en 1988 [4]. Ce logiciel sert à manipuler des données, à tracer des graphiques et à faire des analyses statistiques sur ces données.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Importation-exportation et production de données

Soit vous disposez déj`a d’un fichier texte au format ASCII qui contient vos données, soit vous p... more Soit vous disposez déj`a d’un fichier texte au format ASCII qui contient vos données, soit vous pouvez les entrer vous-même dans un fichier à l’aide d’un éditeur de texte comme Wordpad sous Microsoft Windows ou bien Emacs sous Linux.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Techniques pour tracer des courbes et des graphiques

Tous les graphiques créés dans R sont affichés dans des fenêtres spéciales, distinctes de la cons... more Tous les graphiques créés dans R sont affichés dans des fenêtres spéciales, distinctes de la console, appelées «R graphics: Device numero-device», où numero-device est un entier donnant le numéro de la fenêtre (ou device).

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Odor vapor pressure and quality modulate local field potential oscillatory patterns in the olfactory bulb of the anesthetized rat

European Journal of Neuroscience, 2008

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Régression linéaire simple et multiple

Dans la plupart des situations, nous sommes amenés à étudier la relation entre une variable d’int... more Dans la plupart des situations, nous sommes amenés à étudier la relation entre une variable d’intérêt Y (souvent quantitative) et une ou plusieurs variable(s) X1, X2, ..., Xk , avec pour objectif d’expliquer les variations de la variable d’intérêt. La variable Y est appelée variable « à expliquer » (ou parfois variable dépendante), et les variables X1, X2, ..., Xk sont dites « explicatives » et représentent, en épidémiologie, les facteurs de risque ou de confusion. L’utilisation des méthodes d’analyse multivariée, et plus particulièrement des modèles de régression linéaire, permet donc: de prendre en compte simultanément plusieurs facteurs pouvant expliquer la variation ou la distribution de la variable Y; d’étudier le rôle de modification d’effet ou de confusion d’un ou de plusieurs facteur(s); de prédire les valeurs ou la distribution de la variable à expliquer connaissant les valeurs des variables explicatives.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Variables aléatoires, lois et simulations

Considérons une urne remplie avec n boules numérotées de 1 à n. La fabrication de nombres au hasa... more Considérons une urne remplie avec n boules numérotées de 1 à n. La fabrication de nombres au hasard peut s’imaginer facilement au travers d’une expérience consistant à piocher (on dit aussi tirer) avec remise, plusieurs fois de suite, une seule boule à la fois dans cette urne. Cette opération produit une suite de nombres entiers dont l’ordre d’apparition est régi par une loi dite uniforme discrète (sur l’ensemble {1,..., n}). Il devient ensuite naturel de se poser la question de la génération de nombres réels uniformément répartis sur un intervalle. Nous nous proposons ici de donner quelques éléments sur la génération de nombres selon une telle loi, dite uniforme, à l’aide d’un algorithme informatique.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Les concepts de base, l’organisation des donnèes

Après avoir lancé le logiciel R en double-cliquant sur son icône sur le Bureau de Windows (ou bie... more Après avoir lancé le logiciel R en double-cliquant sur son icône sur le Bureau de Windows (ou bien á partir du Menu Démarrer), vous voyez apparaître, à la fin de l’affichage qui se déroule dans la console de R (appelèe R Console), le caractère d’invite de commande > vous invitant à taper votre première instruction en langage R.

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Understanding Convergence Concepts: A Visual-Minded and Graphical Simulation-Based Approach

American Statistician, 2009

Bookmarks Related papers MentionsView impact

Research paper thumbnail of Statistique descriptive

Nous allons fonder tous les exemples de ce chapitre sur le fichier de données nutriage.xls que vo... more Nous allons fonder tous les exemples de ce chapitre sur le fichier de données nutriage.xls que vous pouvez importer dans R en suivant l’une des méthodes exposées dans le chapitre 2. Vous pourriez par exemple utiliser les instructions suivantes (pensez à installer le fichier http://www.biostatisticien.eu/ springeR/Rtools29.exe si vous travaillez sous l’environnement Microsoft): > require(gdata) # Donne accès à la fonction read.xls() > nutriage <- read.xls( + “http://www.biostatisticien.eu/springeR/nutriage.xls”) Downloading... Done. Converting xls file to csv file... Done. Reading csv file... Done.

Bookmarks Related papers MentionsView impact