Hétérogénéité non observée dans les modèles de durée (original) (raw)

Abstract

Cet article est une revue de la littérature où le temps passé dans un état est une variable aléatoire issue d'un mélange continu de distributions. Elle s'est constituée à partir de l'estimation de fonctions de hasards et de méthodes d'approximations d'intégrales. Nous présentons d'abord le modèle de mélange de hasards proportionnels et ses propriétés. Les conséquences des principaux résultats d'identification sont ensuite discutées. Nous présentons ensuite des méthodes d'estimations paramétriques, semi-paramétriques et bayésiennes, ainsi que les méthodes d'optimisation correspondantes.

Loading...

Loading Preview

Sorry, preview is currently unavailable. You can download the paper by clicking the button above.

References (90)

  1. T, d, v sim , θ sim ).
  2. Étape D Procéder aux étapes B et C pour un nombre Nrep 1 de réplications.
  3. Étape E Approcher E V |θ (L), où L est la vraisemblance conditionnelle aux v, par la moyenne sur les réplications.
  4. Étape F Procéder aux étapes A et E pour un nombre Nrep 2 de réplications.
  5. Étape G Approcher E π (θ|T, d) par la moyenne sur les réplications.
  6. La loi des grands nombres s'applique et pour un nombre suffisamment élevé de réplications, les moments d'ordre 1 calculés sur les simulations convergent en probabilité vers leurs espérances. De nombreuses méthodes d'intégrations numériques sont utilisées pour approcher l'estimateur bayé- sien, parmi lesquelles l'algorithme de Metropolis-Hasting (Geman et Geman, 1984), l'échantillonnage de Gibbs (Gelfand et Smith, 1990), et plus généralement les Méthodes de Monte Carlo par Chaînes de Markov (MCMC) que Robert (1996) passe en revue.
  7. 4 Utilisations de la vraisemblance partielle dans une approche bayésienne Kalbfleisch (1978) propose une justification de la vraisemblance partielle dans un cadre Bayésien. Spécifions l'a priori suivant pour le hasard de base : λ 0 (t) ∼ γ(cλ * 0 (t), c), (32) où γ désigne la loi gamma, c un paramètre et λ 0 (t) * une fonction connue. On a : E[λ 0 (t)] = λ * 0 (t) et V[λ 0 (
  8. de confiance. On peut montrer que lorsque c → 0, l'estimateur bayésien des coefficients de λ 1 converge vers l'estimateur du maximum de vraisemblance partielle. Clayton (1991) reprend cet argument dans l'estimation d'un modèle MPH à hétérogénéité gamma, fournissant une alternative bayésienne à l'algorithme EM de Klein (1992). Une l'hétérogénéité log-normale est traité dans Gauderman et Thomas (1994). Des évolutions dans les procédures numériques ont ensuite été produites par, entre autres, Korsgaard et alii (1998) et Sargent (1998). Un modèle à deux effets données appariées employeurs-employés, Horny et alii (2006) obtiennent des résultats stables . Dans quelle mesure la disponibilité récente et croissante de ces informations permet de stabiliser les estimations est une question ouverte. La prise en compte de l'hétérogénéité des agents dans les modèles théoriques se poursuit, notamment dans l'étude du marché du travail (Cahuc et alii , 2006). Le traitement de l'hétérogénéité non observée en est la contrepartie empirique, et nous avons présenté les contours actuels de cette littérature. Références
  9. Abbring J. et Van den Berg G. (2003a), The identifiability of the mixed proportional hazards com- peting risks model, Journal of the Royal Statistical Society, Series B, 65, pp. 701-711.
  10. Abbring J. et Van den Berg G. (2003b), The nonparametric identification of treatment effects in duration models, Econometrica, 71(5), pp. 1491-1518.
  11. Abbring J. et van den Berg G. (2007), The unobserved heterogeneity distribution in duration analysis, Biometrika, 94, pp. 87-99.
  12. Baker M. et Melino A. (2000), Duration dependence and nonparametric heterogeneity : a Monte Carlo study, Journal of Econometrics, 96 (2), pp. 357-393.
  13. Barnard G. et Bayes T. (1958), Studies in the history of probability and statistics : IX. Thomas Bayes's essay towards solving a problem in the doctrine of chances., Biometrika, 45 (3/4), pp. 293-315.
  14. van den Berg G. (2001), Duration models : specification, identification and multiple durations, dans Handbook of Econometrics, J. J. Heckman and E. Leamer (eds.), Elsevier, Amsterdam, tome 5, cha- pitre 55, pp. 3381-3463.
  15. Bolstad W. et Manda S. (2001), Investigating child mortality in Malawi using family and community random effects : a Bayesian analysis, Journal of the American Statistical Association, 96, pp. 12-19.
  16. Bonnal L., Fougère D. et Sérandon A. (1997), Evaluating the impact of French employment policies on individual labour market histories, Review of Economic Studies, 64, pp. 683-713.
  17. l'hétérogénéité par différentes méthodes de maximisation de la vraisemblance.
  18. Cahuc P., Postel Vinay F. et Robin J.M. (2006), Wage bargaining with on-the-job search : A structural econometric model, Econometrica, 74 (2), pp. 323-364.
  19. Cameron A. et Trivedi P. (2005), Microeconometrics, Cambridge University Press.
  20. Clayton D. (1978), A model for association in bivariate life tables and its application in epidemiological studies of familial tendency in chronic disease incidence, Biometrika, 65, pp. 141-151.
  21. Clayton D. (1991), A Monte Carlo method for Bayesian inference in frailty models, Biometrics, 47, pp. 467-485.
  22. Cox D. (1962), Renewal Theory, Methuen, London.
  23. Cox D. (1972), Regression models and life tables, Journal of the Royal Statistical Society, Series B, 34, pp. 187-220.
  24. Cox D. (1975), Partial likelihood, Biometrika, 62(2), pp. 269-276.
  25. Dempster A., Laird N. et Rubin D. (1977), Maximum likelihood estimation from incomplete data via the EM algorithm (with discussion), Journal of the Royal Statistical Society, Series B, 39, pp. 1-38.
  26. Elbers C. et Ridder G. (1982), True and spurious duration dependence : The identifiability of the proportional hazard model, Review of Economic Studies, 49, pp. 403-410.
  27. Fisher R. (1922), On the mathematical foundations of theoretical statistics, Philosophical Transactions of the Royal Society of London, 222, pp. 309-368.
  28. Florens J.P., Fougère D. et Mouchart M. (2007), Duration models and point processes, Discussion paper 2971, IZA.
  29. Florens J.P., Mouchart M. et Rolin J.M. (1999), Semi-and non-parametric Bayesian analysis of duration models with Dirichlet priors : a survey, International Statistical Review, 67, pp. 187-210.
  30. Fougère D. et Kamionka T. (2005), Econometrics of Individual Labor Market Transitions, Discussion paper 1850, IZA.
  31. Friedl H. et Kauermann G. (2000), Standard errors for EM estimates in generalized linear models with random effects, Biometrics, 56 (3), pp. 761-767.
  32. Frijters P. (2002), The non-parametric identification of lagged duration dependence, Economic letters, 75, pp. 289-292.
  33. Gauderman W. et Thomas D. (1994), Censored survival models for genetic epidemiology : a Gibbs sampling approach, Genetic Epidemiology, 11, pp. 171-188.
  34. Gaure S., Roed K. et Zhang T. (2005), Time and causality : a monte carlo assessment of the timing- of-events approach, Memorandum 19, University of Oslo.
  35. Gelfand A. et Smith A. (1990), Sampling based approaches to calculating marginal densities, Journal of the American Statistical Association, 85, pp. 398-409.
  36. Geman S. et Geman D. (1984), Stochastic relaxation, Gibbs distributions and the Bayesian restoration of images, IEEE Transactions on Pattern Analysis and Machine Intelligence, 6, pp. 721-741.
  37. Gönül F. et Srinivasan K. (1993), Consumer purchase behavior in a frequently bought product ca- tegory : estimation issues and managerial insights from a hazard function model with heterogeneity, Journal of the American Statistical Association, 88, pp. 1219-1227.
  38. Gourieroux C. et Jasiak J. (2007), The econometrics of individual risk : credit, insurance, and mar- keting, Princeton university press.
  39. Gouriéroux G. et Monfort A. (1995), Simulation Based Econometric Methods, Oxford University Press, Oxford.
  40. Green P. (1999), Penalized likelihood, dans Kotz S., Read C. et Banks D. (éds), Encyclopaedia of Statistical Sciences, Wiley, tome 3 update, pp. 578-586.
  41. Greenwood M. et Yule G. (1920), An Inquiry into the Nature of Frequency Distributions Representa- tive of Multiple Happenings with Particular Reference to the Occurrence of Multiple Attacks of Disease or of Repeated Accidents, Journal of the Royal Statistical Society, 83, pp. 255-279.
  42. Guo G. et Rodriguez G. (1992), Estimating a multivariate proportional hazards model for clustered data using the EM algorithm, with an application to child survival in Guatemala, Journal of the American Statistical Association, 87, pp. 969-976.
  43. Hausman J. et Woutersen T. (2005), A semi-parametric duration model with heterogeneity that does not need to be estimated, Presented at the Econometric Society World Congress 2005.
  44. Heckman J. (2001), Micro Data, Heterogeneity, and the Evaluation of Public Policy : Nobel Lecture, Journal of Political Economy, 109, pp. 673-748.
  45. Heckman J. et Honoré B. (1989), The identifiability of the competing risks model, Biometrika, 76, pp. 325-330.
  46. Heckman J. et Singer B. (1984a), Econometric duration analysis, Journal of Econometrics, 24, pp. 62- 132.
  47. Heckman J. et Singer B. (1984b), The identifiability of the proportional hazards model, Review of Economic Studies, 60, pp. 231-243.
  48. Heckman J. et Taber C. (1994), Econometric mixture models and more general models for unobser- vables in duration analysis, Satistical Methods in Medical Research, 3, pp. 279-302.
  49. Honoré B. (1993), Identification results for duration models with multiple spells, The Review of Eco- nomic Studies, 60, pp. 241-246.
  50. Horny G. (2006a), Modèles de durée multivariés avec hétérogénéité multiple : applications au marché du travail, Thèse de doctorat, Strasbourg I.
  51. Horny G. (2006b), Partial Likelihood Estimation of a Cox Model With Random Effects : an EM Algo- rithm Based on Penalized Likelihood, Working Paper 10, BETA.
  52. Horny G., Boockmann B., Djurdjevic D. et Laisney F. (2005), Bayesian estimation of Cox models with non-nested random effects : An application to the ratification of ILO conventions by developing countries, Discussion Paper 05-23, ZEW.
  53. Horny G., Mendes R. et van den Berg G.J. (2006), Job mobility in Portugal : a Bayesian study with matched worker-firm data, Working Paper 32, BETA.
  54. Horowitz J. (1999), Semiparametric estimation of a proportional hazard model with unobserved hete- rogeneity, Econometrica, 67, pp. 1001-1028.
  55. Hougaard P. (1984), Life table methods for heterogeneous populations : distributions describing the heterogeneity, Biometrika, 71, pp. 75-83.
  56. Hougaard P. (2000), Analysis of multivariate survival data, Springer-Verlag, New York.
  57. Hougaard P., Myglegaard P. et Borch-Johnsen K. (1994), Heterogeneity models of disease sus- ceptibility, with an application to diabetic nephropathy, Biometrics, 50, pp. 1178-88.
  58. Hsu L., Chen L.and Gorfine M. et Malone K. (2004), Semiparametric estimation of marginal hazard function from casecontrol family studies, biometrics, 60, pp. 936-944.
  59. Kalbfleisch J. (1978), Non-parametric Bayesian analysis of survival time data, Journal of the Royal Statistical Society, Series B, 40, pp. 214-221.
  60. Keiding N., Andersen P. et Klein J. (1997), The role of frailty models and accelerated failure time models in describing heterogeneity due to omitted covariates, Statistics in Medicine, 16, pp. 215-224.
  61. Kiefer N. (1988), Economic duration data and hazard function, Journal of Economic Literature, 26, pp. 646-679.
  62. Klein J. (1992), Semiparametric estimation of random effects using the Cox model based on the EM algorithm, Biometrics, 48, pp. 795-806.
  63. Korsgaard I., Madsen P. et Jensen J. (1998), Bayesian inference in the semiparametric log normal frailty model using Gibbs sampling, Genetics Selection Evolution, 30, pp. 241-256.
  64. Lancaster T. (1979), Econometric methods for the duration of unemployment, Econometrica, 47, pp. 939-956.
  65. Lancaster T. (1990), The econometric analysis of transition data, Cambridge University Press, Cam- bridge.
  66. Lancaster T. (2004), An introduction to modern Bayesian econometrics, Blackwell, Oxford.
  67. Lau J. (2006), Bayesian semi-parametric modeling for mixed proportional hazard models with right censoring, Statistics and Probability Letters, 76, pp. 719-728.
  68. Manda S. et Meyer R. (2005), Age at first marriage in Malawi : a Bayesian multilevel analysis using a discrete time model, Journal of the Royal Statistical Society, Series A, 168, pp. 439-455.
  69. Maples J., Murphy S. et Axinn W. (2002), Two level proportional hazards model, Biometrics, 58(4), pp. 754-763.
  70. Marin J., Mengersen K. et Robert C. (2005), Handbook of Statistics, Dey, D. Dey and Rao, C., tome 25, chapitre Bayesian modelling and inference on mixtures of distributions, pp. 1-56.
  71. McGilchrist C. (1993), REML estimation for survival model with frailty, Biometrics, 49, pp. 221-225.
  72. McGilchrist C. et Aisbett C. (1991), Regression with frailty in survival analysis, Biometrics, 47 (2), pp. 461-466.
  73. Ng S., Krishnan T. et McLachlan G. (2004), Handbook of computational statistics,, Springer, chapitre The EM algorithm.
  74. Nielsen G., Gill R., Andersen P. et Sorensen T. (1992), A counting process approach to maximum likelihood estimation in frailty models, Scandinavian Journal of Statistics, 19, pp. 25-44.
  75. Parner E. (1997), Inference in semiparametric frailty models, Thèse de doctorat, University of Aarhus.
  76. Ridder G. et TunalıI. (1999), Stratified partial likelihood estimation, Journal of Econometrics, 92, pp. 193-232.
  77. Ripatti S. Larsen K. et Palmgren J. (2002), Maximum likelihood inference for multivariate frailty models using an automated Monte Carlo EM algorithm, Lifetime Data Analysis, 8, pp. 349-360.
  78. Robert C. (1996), Méthodes de Monte Carlo par chaînes de Markov, Economica, Paris.
  79. Rodriguez G. (2001), Survival models, Lecture Notes, Chapter 7.
  80. Rodriguez G. et Goldman N. (2001), Improved estimation procedures for multilevel models with binary responses : a case study, Journal of the Royal Statistical Society, Series A, 164, pp. 339-355.
  81. Sargent D. (1998), A general framework for random effects survival analysis in the Cox proportional hazards setting, Biometrics, 54, pp. 1486-1497.
  82. Sastry N. (1997), A nested frailty model for survival data, with an application to the study of child survival in northeast Brazil, Journal of the American Statistical Association, 92, pp. 426-435.
  83. Tanner M. et Wong W. (1987), The calculation of posterior distributions by data augmentation, Journal of the American Statistical Association, 82, pp. 528-540.
  84. Therneau M. et Grambsch P. (2000), Modeling survival data : extending the Cox model, Statistics for Biology and Health, Springer, New-York.
  85. Therneau T., Grambsch P. et Pankratz V. (2003), Penalized survival models and frailty, Journal of Computational and Graphical Statistics, 12, pp. 156-175.
  86. Tsiatis A. (1975), A nonidentifiability aspect of the problem of competing risks, Proceedings of the National Academy of Sciences, 72, pp. 20-22.
  87. Vaida F. et Xu R. (2000), Proportional hazards model with random effects, Statistics in Medicine, 19, pp. 3309-3324.
  88. Vaupel J., Manton K. et Stallard E. (1979), The impact of heterogeneity in individual frailty on the dynamics of mortality, Demography, 16(3), pp. 439-454.
  89. Vu H. et Knuiman M. (2002), Estimation in semiparametric marginal shared gamma frailty models, Australian and New-Zealand Journak of Statistics, 44, pp. 489-501.
  90. Woutersen T. (2000), Consistent Estimators for Panel Duration Data with Endogenous Censoring and Endogenous Regressors, dans Econometric Society World Congress.