Colinha rlm (original) (raw)

Modelos de Regressão Múltipla-aula 22 Aula 22-Regressao linear multipla-introdução simples e multipla msma coisa oq q muda numero de preditoras (ensina simples antes por questao de didatica msm, mais facil sacar as coisas tipo, quanto maior R^2 mais proximos os pontos ddevem tar da reta…) n se preocupa com beta 0 (so se tudo alguma coisa la , acho q 0, aida pra interpretar alguma coisa) ter amostras pequenas acaba sendo incoveniente tamanho amostra e numero de variaveis preditoras em q ser bem escolhidos pra n ter porblemas (n foi bem isso, mas a ideia) r^2 ajustado → msm conceito de variabilidasde explicada, mas algum coisa a partir de um coeficiente q associa otamanho da amostra grando o bastante r^2 e r^2 aujstado sao iguais se degrau mt grande, mt parametro pra pouco dado, prestar atenção smp q mantenho msms preditores e aumento variaveis, r^2 mantem ou aumenta, n diminui (variaveis esdruxulas n vao alterar meu modelo) "bi é a estimativa de variação em Y decorrente de uma variação unitária em xi,mantendo as demais variáveispreditoras constantes" Se estamos testando as mesmas hipoteses os resultados tem q convergir! (na simples) ent na multipla vai ser diferente Se rejeito hipotese, mas quais componentes do meu modelo sao bons?? ent faço teste t para cada coef de variavel independente a) Determine a equação de regressão estimada que pode ser usada para prever o preço de uma mochila backpack, dada a capacidade e a avaliação do conforto. Estatísticas-> Ajuste de modelos-> regressao linear (variável resposta: preço, outra: conforto e capacidade (apertar ctrl pra selecionar) Ent preço variavel Y, variáveis independentes conforto e capacidade (com excel, teria q deixar todas variáveis organizadas de forma a ficar lado a lado) Amostra pequena, por isso tao nítida essa diferença do r^2 pro ajustado Diminui 0,006 o preço pra cada unidade de capacidade se mantiver o conforto constante (praticamente nula), ent o importante é dar mais conforto, n adianta aumenta a capacidade e querer cobrar mais caro y^ = 356,13-0,01*Capacidade + 122,87*Conforto b) Interprete b1 e b2. b1 (coeficiente da variável 'capacidade'): estimativa da variação no valor médio de uma mochila dada uma variação de 1 unidade na 'capacidade', mantendo constante o 'conforto'. b2 (coeficiente da variável 'conforto'): estimativa da variação no valor médio de uma mochila dada uma variação de 1 unidade em 'conforto', mantendo constante a 'capacidade'. c) Preveja o preço de uma mochila backpack com capacidade para 73.741 cm 3 , sendo 4 a avaliação de conforto. Observação: supõe-se que tenhamos adotado um nível de significância de ao menos 7% (para manter a variável 'capacidade' no modelo). ???? d) Melhorar resultado passado oferecendo um intervalo de predição com 95% de confiança. Grafia e ordem tem que seguir a do modelo (FOTO) e) Ofereça a estimativa intervalar para o preço esperado de mochilas que possuem capacidade = 73.741 cm^3 e avaliação de conforto = 4. Intervalo de confidence smp mais estreito q prediction Multicolinearidade Questão 1. O modelo é globalmente significante. No entanto, há alguns valores-p não significantes ao nível de 5%. O correto a fazer é: (mais candidata o q tem o valor p maior) A. Retirarmos a variável Densidade Demográfica, com maior valor-p, e rodarmos novo modelo, avaliando se ainda restam variáveis com valor-p maior que alfa. Se persistirem, retiramos novamente, uma por vez. Questão 2. Caso haja problemas de multicolinearidade neste modelo, seria devido provavelmente às variáveis: (se n tem vif, olhar matriz de correlação, , em modulo mais prox de +1 e-1) (na seguda coluna, e ignora homicídio pq ele q esta sendo explicado, portanto olha 2ª coluna) A. Renda e IDH. Matriz de Correlação