Jean-Baptiste Denis - Academia.edu (original) (raw)
Papers by Jean-Baptiste Denis
HAL (Le Centre pour la Communication Scientifique Directe), 1994
Perte de rendement due aux maladies cryptogamiques sur blé tendre d'hiver. Construction et valida... more Perte de rendement due aux maladies cryptogamiques sur blé tendre d'hiver. Construction et validation d'un modèle de l'effet du système de culture
Applications of Mathematics, Oct 1, 1999
Institute of Mathematics of the Academy of Sciences of the Czech Republic provides access to digi... more Institute of Mathematics of the Academy of Sciences of the Czech Republic provides access to digitized documents strictly for personal use. Each copy of any part of this document must contain these Terms of use. This paper has been digitized, optimized for electronic delivery and stamped with digital signature within the project DML-CZ: The Czech Digital Mathematics Library http://project.dml.cz 44 (1999) APPLICATIONS OF MATHEMATICS No. 5, 359-374
Agronomie, 1982
agronomiques, F78000 Versailles. (*) I.N.R.A., Station d'Amélioration des Plantes fourragères, F8... more agronomiques, F78000 Versailles. (*) I.N.R.A., Station d'Amélioration des Plantes fourragères, F86600 Lusignan. RÉSUMÉ L'objectif de cette présentation est de faire le tour d'horizon des modélisations de l'interaction entre deux Interactions génotype x facteurs, sur des exemples tirés des problèmes d'interaction génotype-milieu, en les présentant de manière milieu, ! !! unifiée dans le cadre de modèles multiplicatifs. Ceux-ci se définissent comme une somme de produits de deux Régression factorielle, termes : un des termes est fonction du niveau d'un facteur, l'autre terme du niveau de l'autre facteur. Après Modèles multiplicatifs, avoir développé le modèle de régression conjointe, approche très prisée des phénomènes d'interaction par les Contraintes d'ordre. , améliorateurs , nous présentons l'analyse de variance classique de manière multiplicative. Finalement, la a on ram es !' ' régression factorielle, les modèles dits de Mandel, la structuration de l'interaction et les modèles respectant des contraintes d'ordre sont successivement passés en revue. Pour chacun des modèles un exemple est traité dont le plus souvent les données initiales sont fournies pour permettre au lecteur de retrouver toutes les étapes de calcul s'il le désire. SUMMARY Review of statistical methods for analysing the genotype-environment interaction Genotype x environment 'The aim of this paper is to review the modelling of two-factor interactions, such as the genotype-environment interaction, , interaction, by presenting the different cases uniformly as multiplicative models. These can be defined as a Factorial regression, sum of products of two terms : one is a function of the level of one factor and the other of the level of the Multiplicative models, !> other. After having developed the joint regression model, which is a very appreciated approach for interaction Order restrictions. phenomena in plant breeding, classical analysis of variance is presented in the multiplicative form. Finally, factorial regression, so-called Mandel models, interaction structuring, and rank-constrained models are reviewed in turn. One example is considered in each case, with initial data generally given so that the reader can follow through the calculations.
HAL (Le Centre pour la Communication Scientifique Directe), 1997
Multiparametric fixed approaches: GEI is modelled by means of several parameters associated with ... more Multiparametric fixed approaches: GEI is modelled by means of several parameters associated with each genotype. There are two basic models: biadditive (or AMMI) models and factorial regression models. They can be extended and combined in several ways, see Gauch (1992) and van Eeuwijk et al (1996). The multiplicative model is written: where & l a m b d a ; 1 is the singular value that accounts for the interactive part explained by the first term, γ g1 is the normalised genotype vector describing genotype differences and δ e1 similarly describes the environments; λ 2 , γ g2 and δ e2 are assigned to the second term involving orthogonality constraints with the first term and so on. As previously, other terms of the model, (μ + α g + β e), correspond to the additive part of the model. The factorial regression model can be written: where &thetas; kh , α' gh and β' ek are regression parameters involving H environment covariates E eh and K genotype covariates G gk. Again (μ + α g + β e) is the additive part of the model. A common feature of the AMMI model and factorial regression is that both describe the interaction multiplicatively as a genotype score times an environment score. However, in the AMMI model, both parameters are unknown (bilinear model in parameters), while only a single parameter is unknown in regression, implying a linear model. From a practical point of view, regression is thought to be easier for interpretation but on the other hand it requires that relevant covariates be available. (3) Mixed (random and fixed) parametric approaches: starting from a pioneer work of Shukla (1972), factorial regression models can also be used when environments are considered as a random factor and heteroscedastic genotype variances are introduced; see Denis et al (1997) for a recent development. (4) Nonparametric approaches: this family includes different methods whose common feature is based on genotype ranking and not on estimation or prediction of genotype performances. This is indeed an attractive aim in many breeding programs where breeders are interested in rank order for choosing the best genotypes. In such cases, relative comparisons are sufficient and there is no need to assess the levels. (5) Clustering approaches: here the idea is not to obtain a continuous function modelling the interaction but to identify clusters of similar genotypes and/or clusters of similar environments such that most of the interactive variability is captured by the groups of genotypes and/or environments (defining 'between' effects). From a statistical as well as an interpreting point of view, a crucial distinction has to be made according to whether the clusters are determined a priori (by additional information) or a posteriori (based on the data to be explained). In the last section, comparisons of most of the previous methods are carried out, mainly by means of tables summarising results obtained from the literature (tables II, IV, V, VIII and IX and fig 2). Among them, figure 2 depicts 52 interaction studies using either joint regression, multiplicative approach or factorial regression. These interaction studies are characterised by the proportion of parameters used by the model with respect to the complete interaction (the 'cost' or in the reverse term the 'parsimony') and the proportion of interaction explained by the model (the 'efficiency'). As illustrated in this figure, the AMMI model and factorial regression are equally efficient and much better than joint regression. Our advice is to use factorial regression when relevant covariates are available, owing to its easier interpretation. stability / genotype-environment interaction / plant breeding Résumé — En amélioration des plantes, le chercheur est souvent amené à réaliser des analyses de stabilité ou d'interaction génotype-milieu. Des revues bibliographiques existent sur le sujet et décrivent des approches différentes selon les auteurs. Le présent article propose une classification des principales méthodes utilisées pour une période allant jusqu'en 1996 en mettant l'accent sur les plus récentes, notamment les méthodes qui font intervenir plusieurs paramètres pour décrire la stabilité des génotypes. En vue de comparer la régression conjointe, la modélisation multiplicative de l'interaction (ou modèle AMMI) et la régression factorielle sur la base de l'efficacité (mesurée par le pourcentage de la somme des carrés des écarts de l'interaction décomposée par le modèle) et de la parcimonie (appréciée par le nombre de degrés de liberté utilisés par le modèle), diverses récapitulations ont été réalisées. Pour chaque méthode, elles s'appuient sur la littérature et mentionnent diverses caractéristiques telles que l'espèce étudiée, la variable analysée, le nombre de génotypes et d'environnements, l'efficacité, la parcimonie et le rapport entre les deux dernières. En général, ceci met en valeur la modélisation multiplicative de l'interaction et la régression factorielle. Cette dernière permet en outre de proposer une explication biologique à l'interaction. stabilité / interaction génotype-milieu / amélioration des plantes
HAL (Le Centre pour la Communication Scientifique Directe), 1990
Ajustements de modèles linéaires et bilinéaires sous contraintes linéaires avec données manquante... more Ajustements de modèles linéaires et bilinéaires sous contraintes linéaires avec données manquantes Revue de statistique appliquée, tome 39, n o 2 (1991), p. 5-24 <http://www.numdam.org/item?id=RSA_1991__39_2_5_0> © Société française de statistique, 1991, tous droits réservés. L'accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l'accord avec les conditions générales d'utilisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou impression systématique est constitutive d'une infraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright. Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques http://www.numdam.org/
Applications of Mathematics, Oct 1, 1999
Institute of Mathematics of the Academy of Sciences of the Czech Republic provides access to digi... more Institute of Mathematics of the Academy of Sciences of the Czech Republic provides access to digitized documents strictly for personal use. Each copy of any part of this document must contain these Terms of use. This paper has been digitized, optimized for electronic delivery and stamped with digital signature within the project DML-CZ: The Czech Digital Mathematics Library http://project.dml.cz
HAL (Le Centre pour la Communication Scientifique Directe), 1982
Reprenant une modélisation utilisée en particulier par D RISCOLL et al. (1980), nous dégageons le... more Reprenant une modélisation utilisée en particulier par D RISCOLL et al. (1980), nous dégageons les différentes Méiose, hypothèses probabilistes qu'elle suppose. Nous discutons de l'estimabilité des paramètres du modèle le plus Chromosome, général que permet l'observation microscopique. Nous proposons une estimation différente des paramètres, Chiasma, ' celle du maximum de vraisemblance, aux qualités statistiques supérieures. D'autre part, cette méthode Maximum de vraisem-dispense des variances asymptotiques des estimateurs, on peut donc en déduire des intervalles de confiance et blance , discuter du nombre de cellules à observer pour obtenir une précision désirée.
HAL (Le Centre pour la Communication Scientifique Directe), Sep 12, 2011
This book contains the proceedings of the Seventh International Conference on Predictive Modellin... more This book contains the proceedings of the Seventh International Conference on Predictive Modelling of Food Quality and Safety (7ICPMF). Following a decision by the Committee of the PMF society the name of the conference, originally Predictive Modelling in Foods, has been altered in order to accommodate research activities in the wider area of modelling in Food Science. The conference is hosted in Dublin, Ireland (September 12-15, 2011) and has been co-organised by three major Irish Institutes:
Agronomie, 1982
Reprenant une modélisation utilisée en particulier par D RISCOLL et al. (1980), nous dégageons le... more Reprenant une modélisation utilisée en particulier par D RISCOLL et al. (1980), nous dégageons les différentes Méiose, hypothèses probabilistes qu'elle suppose. Nous discutons de l'estimabilité des paramètres du modèle le plus Chromosome, général que permet l'observation microscopique. Nous proposons une estimation différente des paramètres, Chiasma, ' celle du maximum de vraisemblance, aux qualités statistiques supérieures. D'autre part, cette méthode Maximum de vraisem-dispense des variances asymptotiques des estimateurs, on peut donc en déduire des intervalles de confiance et blance , discuter du nombre de cellules à observer pour obtenir une précision désirée.
Heredity, Aug 1, 1997
An integration of two types of models for the analysis of genotype by environment interaction is ... more An integration of two types of models for the analysis of genotype by environment interaction is presented. On the one hand, the expectation of G x E interaction is frequently modelled by regression models; on the other hand, for deviations from these regressions, either separate stability parameters are defined or extra components of variance are introduced. A class of mixed models is described that contains facilities for modelling expectation by regression and, in addition, has extensive possibilities for dealing with heteroscedasticity. Practical aspects of the use of these mixed models are illustrated on a data set involving sugar yield in beet.
HAL (Le Centre pour la Communication Scientifique Directe), May 1, 2008
Les réseaux bayésiens sont surtout développés et promus par les spécialistes de l'intelligence ar... more Les réseaux bayésiens sont surtout développés et promus par les spécialistes de l'intelligence artificielle ; on peut aussi remarquer qu'ils sont généralement basés sur l'emploi de variables aléatoires discrètes. Nous tentons dans cette communication d'introduire le point de vue de statisticiens confrontés à la modélisation de systèmes et enclins à l'inférence statistique bayésienne. Les logiciels utilisant le langage BUGS de description des réseaux bayésiens permettent cette démarche. Néanmoins, ils représentent une boîte noire et ouvrir le code pour des interventions spécifiques n'est guère possible. À partir de situations concrètes et de la programmation de rebastaba, paquet R pour manipuler les réseaux bayésiens, nous développons nos idées. ABSTRACT. Bayesian networks are mainly supported and promoted by the artificial intelligence community; also most of the developments are made in the framework of discrete variates. Here we attempt to give a statistician viewpoint when modelling systems and/or doing Bayesian inference. Softwares of the BUGS family performs such approaches based on Bayesian networks with a known graph. If their potential is tremendous, for the standard user they represent a black box very difficult to access for specific interventions. Based on several cases that we have tackled, and on the construction of the rebastaba package to manipulate Bayesian networks, we exemplify these opinions.
HAL (Le Centre pour la Communication Scientifique Directe), Oct 8, 2008
Content Prions occur in the form of different strains, classically distinguished by the clinical ... more Content Prions occur in the form of different strains, classically distinguished by the clinical and histopathological effects they elicit, for example, incubation time and location of the lesions and of PrPSc deposition: different strains target distinct brain areas, suggesting that cells differ in their susceptibility to prion strains. Interestingly, many strains can be propagated in inbred mouse lines or in cell lines that express only a single PrP sequence, leading to the well-substantiated hypothesis that strain specificity is encoded by different conformations of PrPSc, and that as host PrPC adds onto the invading PrPSc it adopts their strain-specific conformation. It has been shown that some prion strains are very stable and can be transmitted across species without affecting their strain-ness, while others "mutate" to novel forms. We have developed a cell-based assay, the Cell Panel Assay (CPA), that allows discrimination of prion strains by virtue of their cell tropism, i.e., their capacity to chronically infect certain cell lines but not others. With it, we can readily distinguish 22L, RML, Me7 and 301C on a panel of 4 cell lines (Mahal et al., PNAS 104:20908 (2007)). Using the CPA we have found that the transfer of 22L propagated in brain to the neuroblastoma-derived cell lines N2a or R33 changes the cell tropism of these strains, however, when the cell-derived prions are again propagated in mouse brain, they regain their original properties. We consider two possible explanations. (1) Host cells can influence the tropism of prions by causing a change in their structure (for example, the glycosylation pattern of PrPSc) or by adding to them a host-derived component (for example, membrane fragments, or a small RNA). (2) Prion strains are relatively mutable and exist in the form of biased quasi-populations (Domingo et al., Cell, 13:735 (1978); Collinge & Clarke, Science, 318:930 (2007)) from which different sub-populations are selected in brain cells and cell lines, respectively. Thus, a "brain-adapted" quasi-population would shift to a "cell-adapted" quasipopulation on being transferred to cells, and vice-versa. We are currently examining whether the change of cell tropism is rapid, i.e. occurring immediately after the strain is replicated in the new host, as would be the case if tropism is imparted by the host cell, or gradual, as would be the case if selection occurred over several generations, as expected from the "quasi-population" hypothesis.
HAL (Le Centre pour la Communication Scientifique Directe), 2007
A survey of 500 pedigree dogs was carried out in the Paris region. For each dog, six behavioural ... more A survey of 500 pedigree dogs was carried out in the Paris region. For each dog, six behavioural traits were determined and ten of their astrological traits were retained. A statistical interpretation of the possible relationships between the two sets of traits was performed based on permutation tests. Two strong associations were detected between the angular positions of Jupiter and the Sun, and the extraversion dominant trait. There were indications of other associations. These associations have a remarkable resemblance to the standard associations usually proposed in "human" astrology.
Les norovirus sont impliqués dans les épidémies de gastro-entérites hivernales mais aussi dans le... more Les norovirus sont impliqués dans les épidémies de gastro-entérites hivernales mais aussi dans les toxiinfections collectives (TIAC) liées à l'ingestion d'huîtres contaminées. L'objectif de cette étude est d'évaluer l'impact de la transmission alimentaire vis-à-vis de la transmission inter-interhumaine dans une population côtière. La transmission alimentaire a été abordée par une Appréciation Quantitative des Risques. Une dose-réponse établie sur des données publiées de TIAC montre la forte infectiosité des norovirus. Un modèle dynamique prenant en compte les deux modes de transmission a été construit. Les premiers résultats montrent que la voie alimentaire peut avoir un impact sur le nombre de cas total en période épidémique et sur les cas attribués au génogroupe I et II. Le modèle, basé sur des hypothèses et des données publiées, devra être poursuivi par un ajustement à des données observées, afin de mieux évaluer la pertinence de mesures de gestion des zones conchylicoles.
Journal de la Société Française de Statistique & revue de statistique appliquée, Feb 12, 2013
Ross and Sumner (2002) proposed a convenient tool, Risk Ranger, for early-stage risk assessment o... more Ross and Sumner (2002) proposed a convenient tool, Risk Ranger, for early-stage risk assessment of microbial hazards in food systems. The authors describe the tool as being a simple way of comparing and classifying food-related risks and highlighting main factors that contribute to food safety. The output of the tool is a risk score based on answers to 11 questions. The objective of this work was to extend Risk Ranger towards a probabilistic version, distinguishing uncertainty and variability. For each question, we propose an elicitation procedure where the expert is asked for two quantiles to assess variability. Experts are also asked on their degree of confidence for the given quantiles to incorporate an uncertainty level. The new tool, also an Excel worksheet, allows the expert to check graphically, almost instantly, the uncertainty and variability of the variable of interest from the elicited quantiles and then to interactively modify them according to his/her view. Résumé : Ross et Sumner (2002) ont proposé un outil sous la forme d'une feuille de calcul Excel, Risk Ranger, pour une évaluation des risques simple et rapide des dangers microbiologiques dans les aliments. Il permet de comparer et classer les risques liés à certains aliments en identifiant les facteurs qui y contribuent le plus. La sortie de l'outil est un score unique calculé à partir de réponses à 11 questions. L'objectif de ce travail est de faire évoluer l'outil Risk Ranger vers une version probabiliste. Nous proposons une procédure d'élicitation de la variabilité à l'aide de deux quantiles de la distribution d'intérêt. De plus, un niveau d'incertitude est spécifié grâce au degré de confiance fourni par les experts sur ces quantiles. Le nouvel outil, également sous forme d'une feuille Excel, permet à l'expert de modifier de vérifier graphiquement presque instantanément les conséquences de ses réponses sur l'incertitude et la variabilité de la quantité d'intérêt pour mieux les ajuster à son expertise.
HAL (Le Centre pour la Communication Scientifique Directe), Aug 20, 2012
HAL (Le Centre pour la Communication Scientifique Directe), 2014
Dans cette étude, quelques développements matriciels sont proposés dans le but d'aboutir à la déc... more Dans cette étude, quelques développements matriciels sont proposés dans le but d'aboutir à la décomposition de matrices carrées, prenant en compte des eets de symétrie et d'anti-symétrie à l'aide de covariables communes aux lignes et aux colonnes de la matrice. La motivation initiale de cette recherche est la proposition de modélisations associées aux croisements diallèles. Ce faisant, un certain nombre de résultats sur les modèles linéaires sont reformulés (en particulier l'introduction de contraintes pour lever la surparamétrisation qui rend les termes orthogonaux). La décomposition tensorielle de tables rectangulaires (régression factorielle) est rappelée dans ce cadre, comme base à la proposition.
HAL (Le Centre pour la Communication Scientifique Directe), May 25, 2009
Changement de point de vue : de l'interprétation de données à la modélisation stochastique grâce ... more Changement de point de vue : de l'interprétation de données à la modélisation stochastique grâce aux approches bayésiennes. In: 41èmes Journées de Statistique, SFdS, Bordeaux (p. 7 pages).
HAL (Le Centre pour la Communication Scientifique Directe), 2014
Linear Gaussian Bayesian networks can dramatically reduce the parametric dimension of the covaria... more Linear Gaussian Bayesian networks can dramatically reduce the parametric dimension of the covariance matrices in the framework of multivariate multiple regression models. This idea is developed using structured, crossed directed acyclic graphs (DAGs) when node sets can be interpreted as the cartesian product of two sets. Some interesting properties of these DAGs are shown as well as the probability distributions of the associated Bayesian networks. A numerical experiment on simulated data was performed to check that the idea could be applied in practice. This modelling is applied to the prediction of body composition from easily measurable covariates and compared with the results of a saturated regression prediction. Résumé : Dans cet article, nous proposons de substituer aux régressions linéaires multivariées classiques des sous modélisations plus parcimonieuses construites à l'aide de réseaux bayésiens gaussiens. L'idée est d'améliorer la prédiction de variables par des covariables, grâce à une réduction sensible de la dimension paramétrique de la matrice de variance-covariance. Une mise en oeuvre est développée par l'utilisation de DAG (graphe orienté sans circuit) structurés lorsque l'ensemble des noeuds à modéliser est un produit cartésien de deux ensembles. Un certain nombre de propriétés intéressantes de ces DAG et des réseaux bayésiens associés en découle. Une expérimentation numérique basée sur des données simulées est réalisée pour vérifier la faisabilité de la proposition à partir de données lorsque la structure du DAG n'est pas connue. Enfin, la proposition est appliquée à la prédiction de la composition corporelle à partir de covariables faciles à obtenir. Les résultats obtenus par une recherche systématique de cette classe de réseaux bayésiens sont comparés avec la prédiction du modèle saturé de regression multiple multivariée.
HAL (Le Centre pour la Communication Scientifique Directe), 1994
Perte de rendement due aux maladies cryptogamiques sur blé tendre d'hiver. Construction et valida... more Perte de rendement due aux maladies cryptogamiques sur blé tendre d'hiver. Construction et validation d'un modèle de l'effet du système de culture
Applications of Mathematics, Oct 1, 1999
Institute of Mathematics of the Academy of Sciences of the Czech Republic provides access to digi... more Institute of Mathematics of the Academy of Sciences of the Czech Republic provides access to digitized documents strictly for personal use. Each copy of any part of this document must contain these Terms of use. This paper has been digitized, optimized for electronic delivery and stamped with digital signature within the project DML-CZ: The Czech Digital Mathematics Library http://project.dml.cz 44 (1999) APPLICATIONS OF MATHEMATICS No. 5, 359-374
Agronomie, 1982
agronomiques, F78000 Versailles. (*) I.N.R.A., Station d'Amélioration des Plantes fourragères, F8... more agronomiques, F78000 Versailles. (*) I.N.R.A., Station d'Amélioration des Plantes fourragères, F86600 Lusignan. RÉSUMÉ L'objectif de cette présentation est de faire le tour d'horizon des modélisations de l'interaction entre deux Interactions génotype x facteurs, sur des exemples tirés des problèmes d'interaction génotype-milieu, en les présentant de manière milieu, ! !! unifiée dans le cadre de modèles multiplicatifs. Ceux-ci se définissent comme une somme de produits de deux Régression factorielle, termes : un des termes est fonction du niveau d'un facteur, l'autre terme du niveau de l'autre facteur. Après Modèles multiplicatifs, avoir développé le modèle de régression conjointe, approche très prisée des phénomènes d'interaction par les Contraintes d'ordre. , améliorateurs , nous présentons l'analyse de variance classique de manière multiplicative. Finalement, la a on ram es !' ' régression factorielle, les modèles dits de Mandel, la structuration de l'interaction et les modèles respectant des contraintes d'ordre sont successivement passés en revue. Pour chacun des modèles un exemple est traité dont le plus souvent les données initiales sont fournies pour permettre au lecteur de retrouver toutes les étapes de calcul s'il le désire. SUMMARY Review of statistical methods for analysing the genotype-environment interaction Genotype x environment 'The aim of this paper is to review the modelling of two-factor interactions, such as the genotype-environment interaction, , interaction, by presenting the different cases uniformly as multiplicative models. These can be defined as a Factorial regression, sum of products of two terms : one is a function of the level of one factor and the other of the level of the Multiplicative models, !> other. After having developed the joint regression model, which is a very appreciated approach for interaction Order restrictions. phenomena in plant breeding, classical analysis of variance is presented in the multiplicative form. Finally, factorial regression, so-called Mandel models, interaction structuring, and rank-constrained models are reviewed in turn. One example is considered in each case, with initial data generally given so that the reader can follow through the calculations.
HAL (Le Centre pour la Communication Scientifique Directe), 1997
Multiparametric fixed approaches: GEI is modelled by means of several parameters associated with ... more Multiparametric fixed approaches: GEI is modelled by means of several parameters associated with each genotype. There are two basic models: biadditive (or AMMI) models and factorial regression models. They can be extended and combined in several ways, see Gauch (1992) and van Eeuwijk et al (1996). The multiplicative model is written: where & l a m b d a ; 1 is the singular value that accounts for the interactive part explained by the first term, γ g1 is the normalised genotype vector describing genotype differences and δ e1 similarly describes the environments; λ 2 , γ g2 and δ e2 are assigned to the second term involving orthogonality constraints with the first term and so on. As previously, other terms of the model, (μ + α g + β e), correspond to the additive part of the model. The factorial regression model can be written: where &thetas; kh , α' gh and β' ek are regression parameters involving H environment covariates E eh and K genotype covariates G gk. Again (μ + α g + β e) is the additive part of the model. A common feature of the AMMI model and factorial regression is that both describe the interaction multiplicatively as a genotype score times an environment score. However, in the AMMI model, both parameters are unknown (bilinear model in parameters), while only a single parameter is unknown in regression, implying a linear model. From a practical point of view, regression is thought to be easier for interpretation but on the other hand it requires that relevant covariates be available. (3) Mixed (random and fixed) parametric approaches: starting from a pioneer work of Shukla (1972), factorial regression models can also be used when environments are considered as a random factor and heteroscedastic genotype variances are introduced; see Denis et al (1997) for a recent development. (4) Nonparametric approaches: this family includes different methods whose common feature is based on genotype ranking and not on estimation or prediction of genotype performances. This is indeed an attractive aim in many breeding programs where breeders are interested in rank order for choosing the best genotypes. In such cases, relative comparisons are sufficient and there is no need to assess the levels. (5) Clustering approaches: here the idea is not to obtain a continuous function modelling the interaction but to identify clusters of similar genotypes and/or clusters of similar environments such that most of the interactive variability is captured by the groups of genotypes and/or environments (defining 'between' effects). From a statistical as well as an interpreting point of view, a crucial distinction has to be made according to whether the clusters are determined a priori (by additional information) or a posteriori (based on the data to be explained). In the last section, comparisons of most of the previous methods are carried out, mainly by means of tables summarising results obtained from the literature (tables II, IV, V, VIII and IX and fig 2). Among them, figure 2 depicts 52 interaction studies using either joint regression, multiplicative approach or factorial regression. These interaction studies are characterised by the proportion of parameters used by the model with respect to the complete interaction (the 'cost' or in the reverse term the 'parsimony') and the proportion of interaction explained by the model (the 'efficiency'). As illustrated in this figure, the AMMI model and factorial regression are equally efficient and much better than joint regression. Our advice is to use factorial regression when relevant covariates are available, owing to its easier interpretation. stability / genotype-environment interaction / plant breeding Résumé — En amélioration des plantes, le chercheur est souvent amené à réaliser des analyses de stabilité ou d'interaction génotype-milieu. Des revues bibliographiques existent sur le sujet et décrivent des approches différentes selon les auteurs. Le présent article propose une classification des principales méthodes utilisées pour une période allant jusqu'en 1996 en mettant l'accent sur les plus récentes, notamment les méthodes qui font intervenir plusieurs paramètres pour décrire la stabilité des génotypes. En vue de comparer la régression conjointe, la modélisation multiplicative de l'interaction (ou modèle AMMI) et la régression factorielle sur la base de l'efficacité (mesurée par le pourcentage de la somme des carrés des écarts de l'interaction décomposée par le modèle) et de la parcimonie (appréciée par le nombre de degrés de liberté utilisés par le modèle), diverses récapitulations ont été réalisées. Pour chaque méthode, elles s'appuient sur la littérature et mentionnent diverses caractéristiques telles que l'espèce étudiée, la variable analysée, le nombre de génotypes et d'environnements, l'efficacité, la parcimonie et le rapport entre les deux dernières. En général, ceci met en valeur la modélisation multiplicative de l'interaction et la régression factorielle. Cette dernière permet en outre de proposer une explication biologique à l'interaction. stabilité / interaction génotype-milieu / amélioration des plantes
HAL (Le Centre pour la Communication Scientifique Directe), 1990
Ajustements de modèles linéaires et bilinéaires sous contraintes linéaires avec données manquante... more Ajustements de modèles linéaires et bilinéaires sous contraintes linéaires avec données manquantes Revue de statistique appliquée, tome 39, n o 2 (1991), p. 5-24 <http://www.numdam.org/item?id=RSA_1991__39_2_5_0> © Société française de statistique, 1991, tous droits réservés. L'accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l'accord avec les conditions générales d'utilisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou impression systématique est constitutive d'une infraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright. Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques http://www.numdam.org/
Applications of Mathematics, Oct 1, 1999
Institute of Mathematics of the Academy of Sciences of the Czech Republic provides access to digi... more Institute of Mathematics of the Academy of Sciences of the Czech Republic provides access to digitized documents strictly for personal use. Each copy of any part of this document must contain these Terms of use. This paper has been digitized, optimized for electronic delivery and stamped with digital signature within the project DML-CZ: The Czech Digital Mathematics Library http://project.dml.cz
HAL (Le Centre pour la Communication Scientifique Directe), 1982
Reprenant une modélisation utilisée en particulier par D RISCOLL et al. (1980), nous dégageons le... more Reprenant une modélisation utilisée en particulier par D RISCOLL et al. (1980), nous dégageons les différentes Méiose, hypothèses probabilistes qu'elle suppose. Nous discutons de l'estimabilité des paramètres du modèle le plus Chromosome, général que permet l'observation microscopique. Nous proposons une estimation différente des paramètres, Chiasma, ' celle du maximum de vraisemblance, aux qualités statistiques supérieures. D'autre part, cette méthode Maximum de vraisem-dispense des variances asymptotiques des estimateurs, on peut donc en déduire des intervalles de confiance et blance , discuter du nombre de cellules à observer pour obtenir une précision désirée.
HAL (Le Centre pour la Communication Scientifique Directe), Sep 12, 2011
This book contains the proceedings of the Seventh International Conference on Predictive Modellin... more This book contains the proceedings of the Seventh International Conference on Predictive Modelling of Food Quality and Safety (7ICPMF). Following a decision by the Committee of the PMF society the name of the conference, originally Predictive Modelling in Foods, has been altered in order to accommodate research activities in the wider area of modelling in Food Science. The conference is hosted in Dublin, Ireland (September 12-15, 2011) and has been co-organised by three major Irish Institutes:
Agronomie, 1982
Reprenant une modélisation utilisée en particulier par D RISCOLL et al. (1980), nous dégageons le... more Reprenant une modélisation utilisée en particulier par D RISCOLL et al. (1980), nous dégageons les différentes Méiose, hypothèses probabilistes qu'elle suppose. Nous discutons de l'estimabilité des paramètres du modèle le plus Chromosome, général que permet l'observation microscopique. Nous proposons une estimation différente des paramètres, Chiasma, ' celle du maximum de vraisemblance, aux qualités statistiques supérieures. D'autre part, cette méthode Maximum de vraisem-dispense des variances asymptotiques des estimateurs, on peut donc en déduire des intervalles de confiance et blance , discuter du nombre de cellules à observer pour obtenir une précision désirée.
Heredity, Aug 1, 1997
An integration of two types of models for the analysis of genotype by environment interaction is ... more An integration of two types of models for the analysis of genotype by environment interaction is presented. On the one hand, the expectation of G x E interaction is frequently modelled by regression models; on the other hand, for deviations from these regressions, either separate stability parameters are defined or extra components of variance are introduced. A class of mixed models is described that contains facilities for modelling expectation by regression and, in addition, has extensive possibilities for dealing with heteroscedasticity. Practical aspects of the use of these mixed models are illustrated on a data set involving sugar yield in beet.
HAL (Le Centre pour la Communication Scientifique Directe), May 1, 2008
Les réseaux bayésiens sont surtout développés et promus par les spécialistes de l'intelligence ar... more Les réseaux bayésiens sont surtout développés et promus par les spécialistes de l'intelligence artificielle ; on peut aussi remarquer qu'ils sont généralement basés sur l'emploi de variables aléatoires discrètes. Nous tentons dans cette communication d'introduire le point de vue de statisticiens confrontés à la modélisation de systèmes et enclins à l'inférence statistique bayésienne. Les logiciels utilisant le langage BUGS de description des réseaux bayésiens permettent cette démarche. Néanmoins, ils représentent une boîte noire et ouvrir le code pour des interventions spécifiques n'est guère possible. À partir de situations concrètes et de la programmation de rebastaba, paquet R pour manipuler les réseaux bayésiens, nous développons nos idées. ABSTRACT. Bayesian networks are mainly supported and promoted by the artificial intelligence community; also most of the developments are made in the framework of discrete variates. Here we attempt to give a statistician viewpoint when modelling systems and/or doing Bayesian inference. Softwares of the BUGS family performs such approaches based on Bayesian networks with a known graph. If their potential is tremendous, for the standard user they represent a black box very difficult to access for specific interventions. Based on several cases that we have tackled, and on the construction of the rebastaba package to manipulate Bayesian networks, we exemplify these opinions.
HAL (Le Centre pour la Communication Scientifique Directe), Oct 8, 2008
Content Prions occur in the form of different strains, classically distinguished by the clinical ... more Content Prions occur in the form of different strains, classically distinguished by the clinical and histopathological effects they elicit, for example, incubation time and location of the lesions and of PrPSc deposition: different strains target distinct brain areas, suggesting that cells differ in their susceptibility to prion strains. Interestingly, many strains can be propagated in inbred mouse lines or in cell lines that express only a single PrP sequence, leading to the well-substantiated hypothesis that strain specificity is encoded by different conformations of PrPSc, and that as host PrPC adds onto the invading PrPSc it adopts their strain-specific conformation. It has been shown that some prion strains are very stable and can be transmitted across species without affecting their strain-ness, while others "mutate" to novel forms. We have developed a cell-based assay, the Cell Panel Assay (CPA), that allows discrimination of prion strains by virtue of their cell tropism, i.e., their capacity to chronically infect certain cell lines but not others. With it, we can readily distinguish 22L, RML, Me7 and 301C on a panel of 4 cell lines (Mahal et al., PNAS 104:20908 (2007)). Using the CPA we have found that the transfer of 22L propagated in brain to the neuroblastoma-derived cell lines N2a or R33 changes the cell tropism of these strains, however, when the cell-derived prions are again propagated in mouse brain, they regain their original properties. We consider two possible explanations. (1) Host cells can influence the tropism of prions by causing a change in their structure (for example, the glycosylation pattern of PrPSc) or by adding to them a host-derived component (for example, membrane fragments, or a small RNA). (2) Prion strains are relatively mutable and exist in the form of biased quasi-populations (Domingo et al., Cell, 13:735 (1978); Collinge & Clarke, Science, 318:930 (2007)) from which different sub-populations are selected in brain cells and cell lines, respectively. Thus, a "brain-adapted" quasi-population would shift to a "cell-adapted" quasipopulation on being transferred to cells, and vice-versa. We are currently examining whether the change of cell tropism is rapid, i.e. occurring immediately after the strain is replicated in the new host, as would be the case if tropism is imparted by the host cell, or gradual, as would be the case if selection occurred over several generations, as expected from the "quasi-population" hypothesis.
HAL (Le Centre pour la Communication Scientifique Directe), 2007
A survey of 500 pedigree dogs was carried out in the Paris region. For each dog, six behavioural ... more A survey of 500 pedigree dogs was carried out in the Paris region. For each dog, six behavioural traits were determined and ten of their astrological traits were retained. A statistical interpretation of the possible relationships between the two sets of traits was performed based on permutation tests. Two strong associations were detected between the angular positions of Jupiter and the Sun, and the extraversion dominant trait. There were indications of other associations. These associations have a remarkable resemblance to the standard associations usually proposed in "human" astrology.
Les norovirus sont impliqués dans les épidémies de gastro-entérites hivernales mais aussi dans le... more Les norovirus sont impliqués dans les épidémies de gastro-entérites hivernales mais aussi dans les toxiinfections collectives (TIAC) liées à l'ingestion d'huîtres contaminées. L'objectif de cette étude est d'évaluer l'impact de la transmission alimentaire vis-à-vis de la transmission inter-interhumaine dans une population côtière. La transmission alimentaire a été abordée par une Appréciation Quantitative des Risques. Une dose-réponse établie sur des données publiées de TIAC montre la forte infectiosité des norovirus. Un modèle dynamique prenant en compte les deux modes de transmission a été construit. Les premiers résultats montrent que la voie alimentaire peut avoir un impact sur le nombre de cas total en période épidémique et sur les cas attribués au génogroupe I et II. Le modèle, basé sur des hypothèses et des données publiées, devra être poursuivi par un ajustement à des données observées, afin de mieux évaluer la pertinence de mesures de gestion des zones conchylicoles.
Journal de la Société Française de Statistique & revue de statistique appliquée, Feb 12, 2013
Ross and Sumner (2002) proposed a convenient tool, Risk Ranger, for early-stage risk assessment o... more Ross and Sumner (2002) proposed a convenient tool, Risk Ranger, for early-stage risk assessment of microbial hazards in food systems. The authors describe the tool as being a simple way of comparing and classifying food-related risks and highlighting main factors that contribute to food safety. The output of the tool is a risk score based on answers to 11 questions. The objective of this work was to extend Risk Ranger towards a probabilistic version, distinguishing uncertainty and variability. For each question, we propose an elicitation procedure where the expert is asked for two quantiles to assess variability. Experts are also asked on their degree of confidence for the given quantiles to incorporate an uncertainty level. The new tool, also an Excel worksheet, allows the expert to check graphically, almost instantly, the uncertainty and variability of the variable of interest from the elicited quantiles and then to interactively modify them according to his/her view. Résumé : Ross et Sumner (2002) ont proposé un outil sous la forme d'une feuille de calcul Excel, Risk Ranger, pour une évaluation des risques simple et rapide des dangers microbiologiques dans les aliments. Il permet de comparer et classer les risques liés à certains aliments en identifiant les facteurs qui y contribuent le plus. La sortie de l'outil est un score unique calculé à partir de réponses à 11 questions. L'objectif de ce travail est de faire évoluer l'outil Risk Ranger vers une version probabiliste. Nous proposons une procédure d'élicitation de la variabilité à l'aide de deux quantiles de la distribution d'intérêt. De plus, un niveau d'incertitude est spécifié grâce au degré de confiance fourni par les experts sur ces quantiles. Le nouvel outil, également sous forme d'une feuille Excel, permet à l'expert de modifier de vérifier graphiquement presque instantanément les conséquences de ses réponses sur l'incertitude et la variabilité de la quantité d'intérêt pour mieux les ajuster à son expertise.
HAL (Le Centre pour la Communication Scientifique Directe), Aug 20, 2012
HAL (Le Centre pour la Communication Scientifique Directe), 2014
Dans cette étude, quelques développements matriciels sont proposés dans le but d'aboutir à la déc... more Dans cette étude, quelques développements matriciels sont proposés dans le but d'aboutir à la décomposition de matrices carrées, prenant en compte des eets de symétrie et d'anti-symétrie à l'aide de covariables communes aux lignes et aux colonnes de la matrice. La motivation initiale de cette recherche est la proposition de modélisations associées aux croisements diallèles. Ce faisant, un certain nombre de résultats sur les modèles linéaires sont reformulés (en particulier l'introduction de contraintes pour lever la surparamétrisation qui rend les termes orthogonaux). La décomposition tensorielle de tables rectangulaires (régression factorielle) est rappelée dans ce cadre, comme base à la proposition.
HAL (Le Centre pour la Communication Scientifique Directe), May 25, 2009
Changement de point de vue : de l'interprétation de données à la modélisation stochastique grâce ... more Changement de point de vue : de l'interprétation de données à la modélisation stochastique grâce aux approches bayésiennes. In: 41èmes Journées de Statistique, SFdS, Bordeaux (p. 7 pages).
HAL (Le Centre pour la Communication Scientifique Directe), 2014
Linear Gaussian Bayesian networks can dramatically reduce the parametric dimension of the covaria... more Linear Gaussian Bayesian networks can dramatically reduce the parametric dimension of the covariance matrices in the framework of multivariate multiple regression models. This idea is developed using structured, crossed directed acyclic graphs (DAGs) when node sets can be interpreted as the cartesian product of two sets. Some interesting properties of these DAGs are shown as well as the probability distributions of the associated Bayesian networks. A numerical experiment on simulated data was performed to check that the idea could be applied in practice. This modelling is applied to the prediction of body composition from easily measurable covariates and compared with the results of a saturated regression prediction. Résumé : Dans cet article, nous proposons de substituer aux régressions linéaires multivariées classiques des sous modélisations plus parcimonieuses construites à l'aide de réseaux bayésiens gaussiens. L'idée est d'améliorer la prédiction de variables par des covariables, grâce à une réduction sensible de la dimension paramétrique de la matrice de variance-covariance. Une mise en oeuvre est développée par l'utilisation de DAG (graphe orienté sans circuit) structurés lorsque l'ensemble des noeuds à modéliser est un produit cartésien de deux ensembles. Un certain nombre de propriétés intéressantes de ces DAG et des réseaux bayésiens associés en découle. Une expérimentation numérique basée sur des données simulées est réalisée pour vérifier la faisabilité de la proposition à partir de données lorsque la structure du DAG n'est pas connue. Enfin, la proposition est appliquée à la prédiction de la composition corporelle à partir de covariables faciles à obtenir. Les résultats obtenus par une recherche systématique de cette classe de réseaux bayésiens sont comparés avec la prédiction du modèle saturé de regression multiple multivariée.