Bioestatística aplicada à Farmacologia

Ciência é prevê e provar. O Método Científico é um conjunto de etapas e processos ordenados, na investigação dos fatos ou na procura de uma verdade determinística ou probabilística.

Link da reunião: meet.google.com/xwf-stov-bvs soaresam@ufc.br 1ª semana - faça: Início.

Se o futuro for semelhante aos passados então é possível prevê-lo com p (frequência relativa) ou P (frequência acumulada), e, EU declaro que minha hipótese (H1) é estatísticamente significativa (α = 0,05*) ou altamente significativa (α = 0,01**) se o P (soma dos erros possíveis, os p_zinhos acumulados) < α (nível de significância, o máximo de erros aceitáveis estabelecidos pelo editor).
1º- Suplementos: Você vai precisar de ferramentas para trabalhar nos dados (nomes, números, vazios) da Tabela com papel, caneta, borracha, computador, Excel, Suplementos do Excel, SPSS, R, Epi Info, STATA, etc...
2º- Tabela: A tabela é feita Linhas (registros, não confunda com os sujeitos!) de Colunas (variáveis). Os tipos de variáveis são qualitativas e quantitativas: Nominal (nome), Ordinal (ordem), Intervalar (entre) e Razão (divisão)
Exemplos: Grupo (nominal), Sequencial (ordinal), Peso (intervalar) ou Pessoas/sala (Razão).
3º- Estatística descritiva: Namorando os dados...! A ED é MUITO fácil, quem faz é a máquina sobre os dados brutos da Tabela e ela é estúpida. Exemplos: média, variância, desvio e erro padrão, mediana, margem de erro, etc, para cada variável de cada grupo.

Hipótese H1: Vc quer COMPARAR quem com quem? Só sei se a média (Testes Paramétricos) ou a mediana (Testes Não Paramétricos) da População representada pelo grupo A > B. Ou determinar o IC(95%) da média, mediana, etc, de um grupo. 1º- 1 variável nominal binária com outra esperada? Teste de adesão ao X². 2º- 2 ou mais variáveis nominais? Teste de comparação do X². (moeda x dado). 3º- 1 nominal binária (pareadas?) com resultados intervalares Normais? Teste t de Student. (ctrl x exp). 4º- 3 ou mais nominais com resutados intervalares Normais (paramétricos)? Shapiro, Levene, ANOVA e os post hoc como o velho e Bonferroni. (grp_1 x grp_2 x ... x grp_n). 5º- com resutados intervalares não paramétricos? Veja no site...

Hipótese H1: Vc quer RELACIONAR (variáveis quantitativas) quem com quem? Só sei calcular Odds Ratio e Coeficiente angular. 6º - Determinar se o Odds ou Chance (não p de probabilidade: %) de uma determinada variável nominal interferir no Outcome (desfecho) nominal? Regressão logística. 7º - Determinar o impacto (coeficiente angular) que uma determinada variável intervalar Normal independente interfere no Outcome intervalar? Regressão Linear (HILE Gauss).

Objetivo final: Criar um MODELO BIOLÓGICO PREDITIVO (causa ⇒ efeito) e validá-lo estatísticamente? (isto é BioEstatística)

Suplementos.

http://www.real-statistics.com/free-download/real-statistics-resource-pack/

Tabela. Estatística descritiva.

SE a distibuição é Normal, o IC da média da amostra é o [intervalo] onde, com 95% de certeza, se encontra a VERDADEIRA média (µ da população). Não confunda com o IC das medidas da amostra [X̅±1,96DP], ou, arredondando X̅±2 desvios padrão.
A Margem de erro = Erro padrão * t crítico bicaudal com n-1 graus de liberdade.

Teste do Χ².

Era p'ra dá 50, deu 41, e aí? Tá dentro do esperado?
Repita 'n' vezes o experimento e mostre que <5% estão fora [não entre] do IC[95%] que vc previu!

Teste Z.

X ~ N(0;1) leia como "A variável X foi amostrada aleatóriamente e segue aproximadamente a função de densidade Normal com os parâmetros (características ou coeficientes): média = 0, e desvio padrão = 1"

Teste t.

Se o Teste t é unilateral à direita X̅_H(171,26) > X̅_M(165,26) e o Stat t (1,828) > t_{c_uni}(1,686), que depende dos graus de liberdade (gl = 38), então P (0,038) < α (0,05).

Regressão linear

É linerarmente proporcional?Intervalar (var dependente) x Intervalar (var independente). A equação Cº = 1,8*Fº + 32 é usada para RELACIONAR as duas escalas de medidas, assim como Altura x Idade, Peso x Altura, etc.

. Regressão logística

Gráfico de outro exemplo.

sadfdsf

Nominal (var dependente ou desfecho) ASSOCIADA x Var independente(s). O objetivo é determinaZr o(s) coeficiente(s) angulares e assim calcular o Odds (chance) = nro Sucessos / nro Fracassos (0:infinito). Probabilidade (p) = nro Sucessos / (nro Sucessos + nro Fracassos) (%).

2ª e 3ª semanas - desenvolva: 1- Título.

O problema é "ver" o comparado (diferença medida pelo P-value) entre as Populações estimadas pelas Amostras (as quais vc sabe TUDO) no Título da sua Tese.

2- Classificação.

A palavra EXPERIMENTO é usada em testes em não humanos e INTERVENÇÃO em humanos. Nos dois casos o que vc quer é alterar a "Ordem natural das coisas [grupo controle]".

3- Desenho experimental.

Muito cuidado com a Kontabiliade, especialmente se houver medidas repetidas pareadas (como nos casos "antes e dopois") ou não pareadas (duplicata, triplicata, etc, como no PCR em tempo real).

4- Estatística descritiva.

Além da Estatística Descritiva de cada grupo, no canto inferior direito do slide tem o resultado da Pré-análise: 1º- Os grupos são balanceados (H0: Pearson). 2ª- As medidas têm distribuição normal (H0: Shapiro-Wilk) e 3º- As variâncias são equivalentes (H0: Levene). E torça para aceitar H0.

5- Estatística analítica.

Árvore de decisão para Testes de Hipóteses comparativas (H0 x H1)... Como dizia o William "É uma estupidez usar Teste de Hipótese para comparar as médias de duas amostras." O que o gentil William quis dizer é que das suas Amostras (Grupos, Classes) vc sabe TUDO, incluindo cada Medida, a Mediana, Moda, Variância, Erro padrão da média, etc.

Se o P < α do editor, o Paper tá garantido... 4ª semana - crie: 6- Modelo biológico validado estatísticamente (Mapa conceitual).

Geração de modelos...
5180 variáveis no banco de dados... 208 modelos biológicos prontos...
O Modelo é pouco mais que um resumo da Introdução da sua Tese, ordenado na relação causa-efeito e na proporção de um em relação ao outro. A grande vantagem é que uma pessoa da sua área lê sua Introdução em menos de 1 minuto, já p'ra lê o texto...

...quanto, p'ra reduzir o problema pela metade?

Qual o Objetivo de um Pesquisador? Achar um P < α (exigência do Editor) p'ra publicar e manter a bolsa de $Pesquisa, p'ra isso, tem que ter uma Tabela mãe

O título da Tabela deve conter: 1- o Quê, 2- Quem, 3- Onde e 4- Quando.

p'ra poder fazer o Teste de Hipótese H0: H1 é falsa x H1: Stat X > X_c, α = 0,05
e achar o P que é a soma de tudo que pode dar errado e a Tabela mãe é o Legado... p'ra Posteridade.

aplicando o Teste estatístico adequado concluímos que (H1: X̅_A > X̅_B; α=0,05) a média do
grupo A é maior que

Stat Z > 1,645 é o valor mínimo (crítico) p'ra rejeitar H0 unilateral à direita com (α = 0,05).
Stat Z > 1,96 é o valor mínimo (crítico) p'ra rejeitar H0 bilateral com (α = 0,05).
Lembre-se: o cálculo do valor de z ou t (Stat z ou t) não depende de H0. Calcule Stat t na unha.

Se o valor de t (Stat t) é maior que o t crítico (unilateral, à direita), rejeitamos H0.

média do grupo B ao nível de significância

Área entre [-1:1] ≅ 68% (grande maioria); entre [-1,96:1,96] ≅ 95% (imensa maioria ou α=0,05),
entre [-3:3] ≅ 99% (praticamente todo mundo). IC[95%] = X̅ ± 1,96*epm = X̅ ± margem de erro.
Área de -oo:0] = 50%; de -oo:1] ≅ 84%, de -oo:1,645] ≅ 95% i.é, α = 0,05(*).
Se Stat Z=1,8>1,645 rejeito H0 unilateral para α=0,05 mas não para α=0,01(**), Z_c=2,326.
Densidade da frequência (φ=0,242) = Frequência da classe (0,95) / Largura da classe (2*1,96)

(α)

X ~ t(gl; X̅; S). William 'Student' Gosset corrigiu a margem de erro (±t_c-bi*epm) para amostras pequenas.
Se n=4, X~t(3;0;1), α=0,05, então, o IC(95%)=X±t_c-bi(α/2;gl)*S/√n = 0 ± 3,18 * 1/√4 = [-1,59:1,59].
Observe que se α = 0,05 e o teste é à direita, então o t_c estará entre 6,314 e 1,645 (gl de 1 a infinito).

e, por isso, rejeitamos H0.

Quer dizer que se pode rejeitar H0 quando ela é verdadeira? Sim.
Sim, o teste acredita que a amostra representa a população. Problema?

...Em estudos não-randomizados e não-pareados, o pesquisador aprende e introduz o viés (bias) de medida e, por isso, o desvio padrão diminui e assim aumenta a probabilidade de um P legal!.

Quanto maior o 'n' (tamanho da amostra) maior a certeza e menor o Erro tipo I e tipo II.

Viva errei e isto prova que sou humano uma vez que "Erá é umano!"

Entenda: Visão geral.

Estatística é o estudo do futuro dos pretéritos: n ≥ 2 (História ⇒ Padrão ⇒ Previsão).
H0: H1 é falsa. H1: é a sua hipótese estatística. α = 0,05 (5%).
O Nível de significância (α) é a intolerância a erros (≥5%)

Aumentar a exigência (altura do sarrafo) é diminuir o nível de significância α.
O quê significa "Se errar eu baixo o sarralfo!", que o α aumenta ou diminui?
O Preconceito muda o valor de α? E o que dizer de "tolerância zero"?

definido pelo Editor da Revista.
O seu Pzão é a medida da comparação... é a soma de todos os erros possíveis, os pzim indesejados.
α de Mãe

H0: Não há diferença na média de altura entre H e M (X̅_H - X̅_M = 0).
H1: A altura média de H é maior que a de M (X̅_H > X̅_M) para α = ?

= 0,5; Humanas = 0,30; Saúde = 0,05; Exatas = 0,01; Inimigo = 0,0000...

Gauss.

Feliz aniversário Gauss

N(0;1) = 1/RAIZ(2*PI())*EXP(-(A2^2/2))

"príncipe da Matemática" e viva à mais famosa f.d.p.
#sóumapessoanormalentendeanormal.

N(µ; σ). 2N(µ; σ). Student.

Feliz aniversário William "Student" Gosset (das f.d.p. e dos testes), nossas lembranças
à sua numerosa família "t"

Y0 = ((EXP(LNGAMA((A2+1)/2)))/((3,14*A2)^0,5*(EXP(LNGAMA(A2/2))))), onde A2 = gl

, em especial à sua caçula "Cauchy"

t(gl; x̅; s). gl e ICX̅[95%]. X² e gráfico t.
DR(S; pD₂).

DR_ac (S, pD₂) = 1/(1+C$1^(C$2-A1)). O parâmetro S = 10^coeficiente de Hill.
DR (S, pD₂) = (LN(C$1)*C$1^(C$2-A1))/(C$1^(C$2-A1)+1)^2

χ²(gl; N_α/2)

Feliz aniversário Ernst Abbe (Χ² → N) e Karl Pearson (dos testes de aderência e independência).
Faça X² = z², para 1 gl, gere uma N(0;1), X²_α/2 = área da N(0;1)±z, i.é, "área entre ±z" ou D2=1-DIST.QUI(B2;1)

. τ²(1gl; B(n;p); t_α/2).

A distribuição (tau) τ² usa a distribuição t e a binomial p'ra corrigir o valor crítico do χ² para amostras pequenas e também serve p'ra "discretizar" as t. Ex: t(20,0,1) de [7:13] temos 7 intervalos, cada "dente" com base = RAIZ(2,715)*2/7 = 0,47, ou ainda, INV.T.BC(1-0,885;20) = 1,648. Qui tau? Legal?

Compreensão e perguntas desconcertantes...

Curva aNormal...

#soumapessoanormalentendeanormal...

Curva Normal Padrão:

Se a altura das pessoas adultas adere a X ~ N(170;13) cm, então para se encontrar uma pessoa com 251 cm será preciso uma amostra com toda a população (amostra ou população?) da Terra!

X ~ N(0; 1)

Nas f.d.p. Normal e t, a densidade dos pontos próximos da média é maior! Incrível não?

, o famoso Z_score = (X̅ - µ) / σ < t_score = (X̅_A - X̅_B) / S

Onde vc já ouviu falar deste Z?
Depois ainda tem a transformação t ou t_score... a pD₂...

O Z é a abscissa da função de probabilidade Normal.

O quê significa função de "densidade" de probabilidades (f.d.p.)? Calcule a densidade da média da t(38;0;1).

C1 = gl; C2 = ((EXP(LNGAMA((C$1+1)/2)))/((3,14*C$1)^0,5*(EXP(LNGAMA(C$1/2))))).
A2 = t; B2 = C$2*(1+(A2^2/C$1))^(-(C$1+1)/2)

É exatamente a idéia do histograma onde a densidade da frequência = frequência acumulada da classe / largura da classe, que, neste casos, são intervalos na abscissa. Por exemplo, a densidade média na Normal padrão de [-1,96:1,96] é 0,242, mas a densidade pontual [1,95999999...:1,960000001...] é 0,058.
Onde vc já viu o valor 0,399?

Use a função para calcular "de cabeça" a densidade de probabilidade da média numa N(0;1)

Crie tabelas "sob medida" de função de densidade e de DISTRIBUIÇÃO (acumulada) de probabilidade
A primogênita (gl = 1) de Student ou f.d.p de Cauchy e a família de curvas t

Onde vc já viu a equação da f.d.p. de Cauchy, i.e, t(1;0;1)?

Só lembrando que a densidade da média da t(1;0;1) = 0,318 = 1/3,1416

Valores de t crítico bicaudal (t_{c_bi}) e IC[95%] dos valores.

Verifique nas suas tabelas "sob medida" de o valor de t_c está correto!

Teste t de Student para 1 amostra, uma ótima justificativa para rejeitar resultados indesejáveis...
Cálculo dos graus de liberdade. IC[95%] entre médias de amostras com variâncias bem diferentes.

Onde vc já vi isto?

ICr[95%] entre médias de amostras com n e S² iguais. Teste t para 2 amostras e ICr[95%] para as X̅

Teste-t: duas amostras presumindo variâncias diferentes
I15 = $H$13*(I5/I6)*(($H$5/$H$6+$I$5/$I$6)^-0,5)

.
Tabela dinâmica. ANOVA. Teste t x ANOVA.

A one-way ANOVA presupõe que as variâncias são equivalentes.

Teste não-paramétrico do Χ² para 1 grupo
Regressão linear simples. Regressão linear múltipla.
Curva Dose-Resposta farmacológica

Faltas?: Intervalo de Confiança.

Dado n e p = 0,5, calcule o IC[95%] dos valores. IC[95%] dos valores = 2113 a 2242.

Teste t de Student

Grupo A: n = 10; 170±10 cm. Grupo B: n=5, 165±15 cm,
calcule o Stat t e indique o t_c. Stat t = 2,5 e t_{c (13, 0,025)}.

. Teste do Χ²

Defina o valor de Stat χ²_c e o Stat χ² das tabelas de contingência (tabelas 2x2).
Stat χ²_c(1;0,05) = 1,96² e o Stat χ² é igual ao total geral (n) vezes o
quadrado da diferença dos produtos cruzados dividido pelos produtos das marginais.

. Regressão linear.

Dado os pares ordenados (25;10) e (45;20), determine a equação da reta. y = 0,5x -2,5.

Perguntas desconcertantes...

... a Lista (material e métodos) ...
1- Que tipo de pesquisa você faz?
2- Quais os critérios de inclusão/exclusão?
3- Quanto é o número total (N) da amostra?
4- Quantos grupos e qual o 'n' de cada um deles?
5- Quantas e quais são as variáveis (aleatórias) avaliadas?
6- Relacione as interferências e as medidas numa linha de tempo...

Protocolo de pesquisa x Projeto de pesquisa

01- Diferenciar Protocolo de pesquisa de Projeto de Pesquisa.

   O Protocolo de pesquisa é o conjunto de documentos encaminhados ao Comitê de Ética em Pesquisa (CEP) para apreciação. No Protocolo se descreve a pesquisa em seus aspectos fundamentais, informações relativas ao sujeito da pesquisa, à qualificação dos pesquisadores e todas as instâncias responsáveis.
   O Projeto de pesquisa é uma parte do Protocolo e contempla o planejamento de todas as etapas da pesquisa que se pretende realizar. (Conselho Nacional de Saúde - Resolução 466/12). Protocolo de pesquisa 01- Memorando da chefia imediata encaminhando o protocolo ou Ofício quando de outra instituição.
02- Folha de rosto...
03- Projeto de pesquisa contendo:
      A) Resumo; B) Justificativa; C) Introdução; D) Objetivos; E) Descrição detalhada da metodologia proposta; F) Casuística (amostragem), especificando os Critérios de Inclusão e Exclusão dos sujeitos da pesquisa na amostra, bem como os Planos de Recrutamento; G) Número de sujeitos da pesquisa; H) Análise crítica dos riscos e benefícios; I) Bibliografia; J) Cronograma de execução do projeto; K) Responsabilidades do pesquisador, da Instituição e do patrocinador (se houver); L) Critérios para suspender ou encerrar a pesquisa; M) Local de realização das várias etapas e infra-estrutura necessária; N) Justificativa do uso de grupos vulneráveis; O) Declaração sobre o uso e destinação do material e/ou dados coletados; P) Declaração de que os resultados serão tornados públicos, sejam favoráveis ou não.
...04- Orçamento financeiro detalhado, fonte do financiamento e remuneração do pesquisador (se houver).
05- Termo de consentimento livre e esclarecido (TCLE). 06- Definições das atribuições da equipe do projeto, titulação e a formação acadêmica e a anuência prévia de todos os participantes com as devidas assinaturas da equipe. 07- Curriculum vitae. 08- Declaração das instituições parceiras. 09- Para pesquisas com armazenamento de material biológico também adequar às resoluções 340/2004 e 347/2005. 10- Cópia dos documentos em cd-rom. 11- Informações referentes aos procedimentos de biossegurança envolvendo a equipe do projeto e os sujeitos da pesquisa quando for o caso.

02- Classificar os tipos de projetos de pesquisa. D) Objetivos. E) Descrição detalhada da metodologia proposta. F) Casuística (amostragem). I) quanto a área científica: 1- Ciências exatas (α = 0,01), 2- Ciências biológicas (α = 0,05), 3- Ciências humanas (α = 0,30).
II) quanto aos objetivos: 1- teórico, 2- metodológico, 3- observacional, 4- experimental ou intervencional, 5- confirmatório.
    1- Estudo teórico: 1- definição de leis, 2- sistemas estruturados e 3- modelos teóricos.
    2- Estudo metodológico: 1- desenvolvimento de metodologia científica, 2- comparação (confiabilidade) entre métodos.
    3- Estudo experimental: 1- fisiológico, 2- farmacológico, 3- físico, 4- químico... #intervenção em humanos
    4- Estudo de caso retrospectivo: 1- observacional...
    5- Estudo epidemiológico observacional: 1- descritivo (de prevalência), 2- analítico (de incidência)...

5.1) Estudo epidemiológico observacional descritivo:

5.1.1) Estudo exploratório (piloto ou preliminar)...

5.1.2) Estudo série de caso: 1- série de casos...

5.1.3) Levantamento: 1- não-normativo (amostra e censo), 2- normativo...

5.1.4) Estudo de Prevalência, transversal ou cross-sectional studies: 1- no ponto, 2- no período...

5.2) Estudo epidemiológico observacional analítico:

5.2.1) Estudo ecológico ou de correlação...

5.2.2) Vigilância epidemiológica...

5.2.3) Estudo de Caso-Controle ou Case-base study (Efeito ⇒ Causa - retrospectivo). Odds e Odds Ratio...

5.2.4) Coorte (Estudo de Incidência ou Causa ⇒ Efeito). Odds Ratio, Risco ou probabilidade e Risco Relativo...

5.2.5) Coorte Caso-Controle (Causa ⇒ Efeito - prospectivo)...

5.2.6) Processo estocástico e Série temporal... 1- intervalo (contínuo e discreto), 2- previsão (simples e múltiplos).

5.2.7) Revisão sistemática...

6- Estudo de caso prospectivo: 1- observacional, 2- intervencional...
7- Estudo epidemiológico intervencional: 1- ensaio clínico, 2- ensaio comunitário, 3- o famoso RCT...

7.1) Ensaio clínico: 1- randomizados, 2- não-randomizado, 3- paralelo, 4- cruzado (cross-over)...

   Ensaio clínico (Terapêuticos) ou coorte intervencional: Características: Avalia de forma sistemática as novas estratégias terapêuticas.
Após os estudos experimentais FARMACOLÓGICOS inicia-se a
Fase 0 (pré-clínica) - 10 a 15 indivíduos, são estudos não-randomizados, não cegos e não controlados, dura de semanas e o objetivo é o estudo Farmacocinético e Farmacodinâmico, Os testes são realizados com doses subterapêuticas.
Fase 1 - 20 a 80 indivíduos, são estudos não-randomizados, não cegos e não controlados, dura de semanas e o objetivo o estudo Farmacocinético e Farmacodinâmico. O objetivo é determinar a confiança e segurança dos medicamentos em pessoas saudáveis e definir a Dose Máxima Tolerada (MDT) e os efeitos.
Fase 2 - 50 a 200 indivíduos, dura de semanas a meses. São estudos randomizados de pequeno porte. É onde começa os Ensaios iniciais de investigação clínica do efeito do tratamento e a segurança. Na fase Fase IIa, grupos de pacientes com certos tipos de doença são tratados com a droga na dose igual à MTD para estudar a atividade da droga. Na Fase IIb oo objetivo é encontrar a dose terapêutica apropriada.
Fase 3 - 200 a 1000 indivíduos, dura de meses a anos, (estudo clínico prospectivo, controlado, randomizado, cegos ou duplo cegos, muiticêntricos). Compara com o tratamento padrão (ouro) vigente disponível para a mesma condição clínica. Testa a significância estatística e busca subsídios para autorização de comercialização da terapia. São os mais caros e demorados.
Fase 4 (Vigilância pós comercial) - 1000 a milhões indivíduos, dura anos, ocorrem após a comercialização da droga e objetivam expandir o conhecimento sobre toxicidades mais raras (efeitos adversos). A relação entre as amostras é expressa pelo risco relativo. Procura-se verificar a incidência de efeitos adversos nas amostras de expostos e não-expostos.
   No Ensaio clínico controlado (controlled clinical trial) uma amostra é o controle e a outra sofre intervenção formando portanto, grupos NÃO pareados.
   No Ensaio clínico paralelo (parallel clinical trial) cada elemento da amostra é analisada duas vezes, uma antes e outra após a intervenção, formando portanto, amostras pareadas.
   No Ensaio clínico cruzado (ensaio sequencial, crossover clinical trial) é feita uma intervenção paralela seguida de um tempo de clareamento e depois de outra intervenção paralela com as amostras trocados.

7.2) Ensaio comunitário...

7.3) Ensaio randomizado, controlado e prospectivo (RCT)...

8- Estudo confirmatório ou teste de hipóteses clínicas...
III) quanto à escala de mensuração da variável

Uma variável é um subconjunto das características da população!Cada variável mensurada tem que ter uma unidade. Se a análise é sobre 1 só Variável (Univariável) compara grupos amostras (previamente definidas como pareadas ou independentes) com unidades iguais. Se 2 é Bivariável (2 Populações), se compara amostras com unidades diferentes p'ra saber se são pareadas (uma delas é variada) ou independentes. Se 3 ou mais é multivariável (≥ 3 Populações), se compara a importância de amostras independentes com 1 ou mais amostras pareadas (desfecho).

: ♩ nominal ♪ ordinal ♫ intervalar ♬ razão, ão, ão, ão
    1- Quantitativa (métrica) razão: numerador/denominador. Ex: pessoas/sala, mg/mL...
    2- Quantitativa (métrica) intervalar: Intervalos (diferenças). Ex: tempo, temperatura (°C, ºF), densidade, QI...
    3- Qualitativa (categórica) ordinal: Classe ordenada. Ex: estágio (inicial, terminal); escolaridade (1º, 2º, 3º grau)...
    4- Qualitativa (categórica) nominal: Classe não-ordenada. Ex: sexo, cor dos olhos (azul, marrom, verde), doente/sadio...
    5- Dados censurados...
IV) quanto ao tipo de amostragem

Amostragem “é uma técnica e/ou conjunto de procedimentos necessários para descrever e selecionar as amostras, de maneira aleatória ou não, e quando bem utilizado é um fator responsável pela determinação da representatividade da amostra em relação à População.” (LEONE, Rodrigo. ET AL, 2009).
Amostra aleatória que dizer que a Amostra foi obtida por um processo de Amostragem aleatória.
Variável aleatória quer dizer que uma das características (variável) da População representada na Amostra foi obtida por um processo de Amostragem aleatória.

: 1- aleatória ou probabilística = representa a população, 2- determinística.
V) quanto ao tamanho 'N' das amostras

Amostra é um subconjunto da população com uma determinanda característica (variável)!A confusão entre amostra e grupo tem a ver com a(s) variável(is). Quando se analisa apenas 1 variável a amostra se são subdivididas em grupos, se não há subdivisão ela continua sendo chamada de amostra. Quando se compara 2 ou mais variáveis as amostras são chamadas de... amostras!

: 1- balanceadas ('N' semelhantes), 2- não-balanceadas ('N' diferentes).
VI) quanto ao relacionamento entre os grupos

Grupo é um subconjunto de uma amostraQuando só se tem uma amostra de uma variável intervalar, além da Estatística descritiva, podemos ainda recorrer a técnicas de agrupamento usando, por exemplo a Equação de Sturges.

(subconjunto de uma amostra): 1- pareado, 2- independente.
VII) quanto à técnica de mascaramento: 0- ausente, 1- na intervenção, 2- na coleta de dados, 3- na análise estatística.
VIII) quanto a origem dos dados: 1- fonte primária, 2- fonte secundária, 3- fonte terciária.
IX) quanto ao procedimento: 1- histórico, 2- estatístico, 3- estruturalista, 4- funcionalista, 5- comparativo e 6- monográfico.

X) quanto ao número de instituições envolvidas: 1- estudo monocêntrico, 2- estudo multicêntrico.

O número participantes da amostra

01- Listar os Critérios de Inclusão e Exclusão da amostra.

02- Compreender o conceito da representatividade do espaço amostral da população alvo e definir o tamanho da amostra ou n amostral.

as amostras experimentais

03- Listar os "n" de cada grupo e suas características.

04- Discutir os conceitos de amostras pareadas (vinculados) e independentes (não-pareadas) e entender o significado da soma das parcelas dos "n" das amostras em relação ao "n" amostral.

05- Compreender os conceitos de controle interno e externo em experimentos com amostras pareadas.

06- Discutir os conceitos de viés (bias, tendências, vícios) e o efeito do apredizagem do pesquisador em experiências com amostras independentes.

07- Compreender a importância da lista de entrada aleatória (randômica) em experimentos com amostras independentes.

Faça agora

08- Mostrar em um slide o desenho (delineamento) experimental e outro com o fluxograma da divisão das amostras.

... a Lógica (introdução e objetivos) ... 1- Como uma determinada variável X_i se relaciona com seu objetivo Y? (outcome) 2- Não enrole: Quais são os fatores (variáveis) diretamente relacionados com a SUA variável Y? (causa mortis) 3- Se eu não O vi com meus próprios olhos E não O tocar com as minhas próprias mãos, não vou acreditar. (Jo 20:25)

Raciocínio lógico x Raciocínio psicológico

01- Definir os operadores do Pensamento: Conceito, Juízo e Raciocínio e diferenciar raciocínio lógico de raciocínio psicológico.

02- Definir grafo e caminho e explicar como ele pode servir para representar o raciocínio lógico.

03- Fazer uma lista das palavras chaves começando e terminando com o objetivo da pesquisa.

05- Apresentar o Layout da pesquisa (Plano da pesquisa).

... a Sentença (resultados e conclusões) ...
1- Qual o tipo teste (paramétrico ou não-paramétrico)?
2- Quantas variáveis serão analisadas de cada vez (1, 2 ou mais)?

Estatística descritiva univariada ou dedutiva: who, what, when, where. Teoria das probabilidades → pzim = n_desejado/n_possíveis
não confunda com Chance (Odds) = n_desejado / n_{não-desejado} = p%/(100-p%)

A- Tamanho da amostra (n), da população (N), margem de erro (5%), poder do teste, σ, p

B. Geração de "resultados", padrões de distribuição de frequência normal, uniforme, etc...

C. Tabela mãe (o legado)...

Tenha cuidado com a Tabela mãe, até profissionais erram...

: L linhas+1; C colunas+2: 1ª coluna = chave primária; 2ª- grupos; 3ª- var_1; ...; nª+2- var_n.

D. Descrição de uma amostra... medidas de tendência central, de forma e de dispersão...

E. Intervalo de confiança [1-α]% para X̅, p, S, etc: Se este tópico não ficar claramente entendido, desista!...

1- Para os valores de uma amostra grande com distribuição N: IC[95%] dos valores Z = µ ± Z_(α/2)*σ (α = 0,05)

A curva de Gauss, a última das curvas t com valor crítico (α = 0,05) bilateral de 1,96, não 1,98!!!.

Se a área total é 1, então, de -oo até 0 = 0,5, concluímos que até 1,96 a área total é 0,5 + 0,95/2 = 0,975, em outras palavras, é 0,95 + 0,025 à esquerda. Densidade na prática!

A curva Dose-Resposta farmacológica.

2- Para os valores de uma amostra pequena (n<30) com distribuição t: IC[95%] dos valores t = X̅ ± t_{(gl, α/2)}*S
3- Para a média (X̅) com variância populacional (σ²) conhecida: IC[95%] da X̅ = X̅ ± Z_(α/2) * EPM (EPM = σ/√n)

Cuidado, este IC[95%] só serve para confundir..., se o valor crítico é 1,96 (α = 0,05, bilateral) então no 'n' tem que ser muito, muito alto, a última das curvas t.

4- Para a média (X̅) com variância (σ²) desconhecida: IC[95%] da X̅ = X̅ ± t_{(gl; α/2)} * EPM (EPM = S/√n)...
5- IC relativo X̅_a e X̅_b com distribuição t: Representação gráfica do Teste t de Student...

Intuitivamente sabemos que se os IC das médias não se sobrepõem, o P < α, mas, isto não quer dizer que se eles se sobrepõem o P não possa ser menor que α, a menos que se use estes IC relativos.

         IC[95%] relativo de X̅_a = X̅_a ± t_{(gl, α/2)} * MEr, onde, MEr = (S²_a/n_a) * ((S²_a/n_a + S²_b/n_b)^-0,5)
         IC[95%] relativo de X̅_b = X̅_b ± t_{(gl, α/2)} * MEr, onde, MEr = (S²_b/n_b) * ((S²_a/n_a + S²_b/n_b)^-0,5)
   6- Para os valores de uma amostra (n) dicotômica com p = 0,5: IC[95%] dos valores = n/2 ± 0,98*√n
   7- Outros tipos de IC...
F. Modelos probabilísticos (Função de densidade e de DISTRIBUIÇÃO de probabilidade)
   1- A variável é quantitativa (intervalar ou razão) para calcular os parâmetros (coeficientes ou pesos)!!!
      1.1- A variável tem distribuição normal de Gauss, X ~ N(µ; σ)

X ~ N(µ; σ). A abscissa é z e a ordenada é a densidade de probabilidade.
Entre (bilateral): Área entre [-1:1] ≅ 70% (grande maioria); entre [-2:2] ≅ 95% (melhor [-1,96:1,96]), a imensa maioria), entre [-3:3] ≅ 99% (praticamente todo mundo).
Até (unilateral): Área até [-oo:0] = 50%; até [-oo:1] ≅ 84%, até [-oo:1,645] ≅ 95% ou α = 0,05(*).
Função de DISTRIBUIÇÃO (1-α) de probabilidade da Normal

Se X~N(0;1), teste unilateral à direita, α = 0,05 e z > z_c (1,645) então P (tem que ser!) < α e, portanto, rejeitamos H0.

, α = 0,05, z_c: unilateral à direita (1,645), bi (±1,96).
1.2- A variável tem distribuição t de Student

À medida que o 'n' da amostra aumenta (graus de liberdade, lembre-se que cada gl é uma curva), a distribuição da "família" t de Student se aproxima da Normal (Teoria Central do Limite). A t com 1 gl (n = 2) é chamada de Função de densidade probabilidade de Cauchy. Ex: para 3 gl, 95% dos sujeitos da amostra estão entre ±3,18 s, já se for até (unilateral, acumulado) à direita, o valor é t_c = +2,353. Função de DISTRIBUIÇÃO (1-α) das curvas t de Student.

Se X₁ e X₂ ~ t(gl; x̅; s), gl = 1; Stat t (t calculado) > t_c (6,314) então P < α e, por isso, rejeitamos H0. De fato, se o teste é unilateral à direita (H1: Média do Grupo A > Média do Grupo B; α=0,05. H0: H1 é falsa) e t > 6,314, SEMPRE rejeitaremos H0.

, X ~ t(gl; X̅; S), α = 0,05, t_cuni (1,645:6,314); t_cbi (±1,96:±12,71).
1.3- A variável aleatória tem distribuição qui-quadrado

A função Χ² é de Ernst Abbe (1840-1905), físico alemão, usado por Karl Pearson (Testes de Aderência e de Independência) e pelo Bonner do JN. Lembre-se que na Normal, ±1,96 desvio-padrão (bilateral) contém 95% da população (α = 0,05) e, 1,96² = 3,84, que é o valor crítico do Χ² com 1 gl. Já para 68% da população (α = 0,32), z = ±1, o valor crítico do χ² = 1² com 1 gl. Função de densidade de probabilidade do χ²

À medida que o 'n' da amostra aumenta... se aproxima da Normal.
Atenção: As cores das curvas densidade x DISTRIBUIÇÃO não estão batendo.

, X ~ χ²(ν; E_i), v = 1 é filha "quadrática" da Normal.
1.4- A variável tem distribuição F de Fisher-Snedecor

≈ Qui-quadrado. Adequadas para representar a Concentração plasmática x tempo de uma ingestão um fármaco (é assimétrica à direita ou curtose positiva já que Média > Mediana > Moda), lembra?
Função de DISTRIBUIÇÃO (1-α) de probabilidade F.

, X ~ F(m; n), ANOVA e [Plasmática] x tempo ⇒ ASC.
1.5- A variável tem distribuição Dose-Resposta

X ~ DR(S; pD₂), onde S = 10 e pD₂ = 0 e Y0 = 0,576.
Área entre [-1,59:1,59] ≅ 95%. Área de -oo até 1,27] ≅ 95%.
Densidade da frequência (φ_±1,59 = 0,299) = Frequência da classe (0,95) / Largura da classe (2*1,59)

, X ~ DR(S; pD₂), Curva dose-resposta farmacológica.
      1.6- Outras funções probabilísticas intervalares...
   2- A variável é categórica (ordinal ou nominal) (Bernoulli, binomial, Poisson...)
      2.1- A variável é binária (nominal dicotômica), ex: cara/coroa, morreu/sobreviveu, presente/ausente, certo/errado)
         2.1.1- A variável aleatória tem distribuição de Bernoulli, X ~ Be(p), filha da Binomial quando n = 1.
         2.1.2- A variável aleatória tem distribuição Binomial

Onde μ = n.p; σ = (n.p.q)^0,5. Lembrar da correção de continuidade (acrescentar ou reduzir 0,5 da variável aleatória), utilizado para melhorar a aproximação de uma variável aleatória discreta pela distribuição normal que é contínua.

, X ~ B(n; p), sim/não, cara/coroa, deu ou não deu...
      2.2- A variável é politômica, ex: faces de um dado: face_1 a face_6, altura: alta/normal/baixa
         2.2.1- A frequência pode ser representada por uma distribuição Geométrica, X ~ Ge(p)
         2.2.2- A variável aleatória tem distribuição de Poisson

≈ Weibull. À medida que a 'n' aumenta,... observe ainda que, fixado um tempo, a probabilidade de NÃO ocorrência de eventos neste intervalo é reduzido para uma Exponencial.

, X ~ P(k; λ), nro de eventos/unidade de tempo, /área.
2.2.3- A variável aleatória tem distribuição Reverberativa, X ~ f(α)(C; F₀; w₀; m)

3- A variável é recorrente temporal... Série temporal

Série temporal com previsão por passo simples - previsão com base na média de 2 intervalos anteriores.

(Estudo dos ciclos: cardíaco, respiratório, uréia, Krebs, etc.)

G. Agrupamento de variável, Equação de Sturges , grupos (intevalar), categoria (ordinal) ou classe (nominal)...

Estatística analítica bi ou multivariada, comparativa ou indutiva: why. Testes de Hipóteses (H0 x H1) → Pzão = AUC = ∑pzim_indesejados -- Análise de grupo(s) (nominal) de 1 variável (univariada) amostrada aleatóriamente --
Antes de tudo faça os seguintes testes (comparações) e Torça para aceitar H0!!!!!!
H0: A distribuição de frequência é Normal e as variâncias são homocedásticas se P<0,05.H1:H0 é falsa.

A. Teste de aleatóriedade para uma amostra, a estranha história da Moeda balanceada e desonesta...
H0: A sequência da amostra é aleatória. H1: H0 é falsa. α=0,05. A amostragem é aleatória ou determinística?

      1- Teste de sequência para uma amostra, nominal, Transformação z ou t ...k,c,k,k,c,c,k,k,k,c,c,c,k,k,k,k,c,c,c,c...
      2- Outros testes de sequência...
B. Intervalar, 1 grupo de cada vez, testes de ajuste ou goodness-of-fit, compara com o "padrão-ouro".
      H0: X̅_A; X̅_B; ... X̅_K ~ N(µ, σ). H1: H0 é falsa. α=0,05. A amostra é paramétrica (coeficientes) ou não-paramétrica?
         1- Teste de aderência de Shapiro-Wilk

Atenção: A hipótese H0 é que a distribuição de frequência dos dados é NÃO-PARAMÉTRICA!!!
http://sdittami.altervista.org/shapirotest/ShapiroTest.html

, intervalar, Stat W
Tabela da estatística W, cuidado p'ra não se confundir com a Estatística Wald (da Logística)!
, é o preferido por mais de 95% dos usuários (P<0,05)...

2- Outros testes de aderência à distribuição Normal...

H0: S²_A = S²_B = ... = S²_K. H1: H0 é falsa. α=0,05. As variâncias são homocedásticas ou herterocedásticas?...

1- Teste de Levene, intervalar, Stat F
Tabela de distribuição F de Fisher-Snedecor
, testa a homocedasticidade (cedástico = dispersão) das variâncias...

2- Outros testes de equivalência entre as variâncias e resíduos de uma regressão...

1- Teste de aderência ao χ², nominal, Stat χ².
H0: n₁ = n₂ = ... = n_k. H1: H0 é falsa. α=0,05. Os grupos são balanceados ou não balanceados?

C. Transformações da escala intervalar, em geral (α = 0,05) é por desespero...

Testes paramétricos para comparar a variável intervalar (normal) que vc mediu entre os grupos (nominal) que vc criou
H0: H1 é falsa. H1: A diferença das médias entre os grupos é significativa se P < 0,05.

A. 1 amostra (intervalar) com X ~ N(µ; σ): IC[95%] da média...

   1- Teste para comparar a média (X̅) da amostra com um dado valor ou com a X̅ da População ...5, 7, 4, 50?, 6, 7, 4...
   2- Teste para comparar a variância (S²) da amostra com a (σ²) da População...
   3- Teste para comparar uma proporção (p) da amostra com uma população Normal (p_o)...

B. 2 grupos (nominal dicotômico) com X ~ t(gl; X̅; S): (Teste t de Student...)

1- Teste para comparar as médias entre 2 grupos (amostras)

1.1- Grupos pareados (vinculadas, em par, emparelhadas, dependentes, repetidas, "vocês 2 estão juntos?")...

1.1.1- Teste t de Student pareado para 2 médias, gl = n_a-1, Stat t_pareado, pré-teste x pós-teste; antes x depois, D x E...

1.2- Grupos independentes (não-pareadas, desemparelhadas, não-vinculadas, não-repetidas, "tem nada a ver!")...

1.2.1- Teste t de Student não-pareado para 2 X̅ com S² homocedásticas, gl = n_g1+n_g2-2, Stat t_{não-par homocedástico}
1.2.2- Teste t de Student não-pareado para 2 X̅ com S² heterocedásticas

Use o Teste F para ter certeza de que em 95% dos casos as variâncias são diferentes...
Use a Equação de Welch para calcular os graus de liberdade.

, gl = Eq. de Welch, Stat t_{não-par hetero}
Os testes paramétricos comparam a sopreposição dos Intervalos de Confiança da Média e, o cálculo do IC relativo, serve apenas p'ra se representar esta sobreposição mas "intuitivamente"!

2- Teste para comparar variâncias de 2 amostras (Teste de Levene...)

3- Teste para comparar proporções entre as 2 amostras...

C. 1 fator com 3 ou mais grupos de uma população com X ~ N(µ; σ): ANOVA..., ↓Erro α ®

1- ANOVA com fator (tratamento) único pareado

https://www.google.com.br/#q=real+statistics. Não esqueça de também instalar o Solver em suplementos.

, Stat F, amostras pareadas com variâncias equivalentes.
2- ANOVA com fator único independente , Stat F, amostras independentes com variâncias equivalentes...

O único Fator de variação (Tratamento) tem efeito em pelo menos 1 das X̅ das amostras A, B, C, D. α=0,05, e o Tratamento A é um forte candidato.

3- ANOVA ponderada com fator único, Stat F, para amostras independentes e variâncias diferentes.

D. ≥2 fatores com 3 ou mais grupos com variâncias equivalentes com X ~ N(µ; σ)

1- ANOVA com fator duplo sem repetição

Nem o Fator de variação 'Grau de instrução' nem a 'Faixa etária' fazem variar a média da variável 'Renda'.

, Stat F, amostras independentes, semelhante a uma tabela m x n do χ².
2- ANOVA com fator duplo com repetição (bloco)

Mesmos dados da ANOVA com fator duplo sem repetição e Valor-P completamente diferente... porque este é pareado)

, Stat F, amostras pareadas com medidas repetidas...

         ≡Teste não-paramétrico de Friedman.
         H0₁: Não há qualquer efeito no fator linha. H1₁: H0 é falsa. α = 0,05.
         H0₂: Não há qualquer efeito no fator coluna. H2₁: H0 é falsa. α = 0,05.
      Teste da ANOVA: fator duplo (2 ou mais fatores de variação) com repetição (replicações) de amostras pareadas. O número de fatores de variação não deve ser maior que 3, porque o número de interações possíveis aumenta exponencialmente (número de variâncias = 2ⁿ - 1), onde n é o número de fatores de variação. O objetivo é é identificar um eventual sinergismo (ou antagonismo) entre os Fatores de variação (grupos) na variável contínua dependente. Os princípios do teste são: 1- As amostras devem ser pareadas (vinculadas) entre si. 2- As populações devem ter a mesma variância. 3- As populações devem ter distribuição Normal. 4- Cada amostra deve ter o mesmo número linhas.
   1- Variável: é a medida pela qual alguma coisa é avaliada, tais como o peso, altura, idade etc. É sempre uma só.
   2- Fator de variação: é tudo aquilo que faz a variável realmente variar tais como tratamento que faça variar tais como o peso, altura, etc. Pode ser múltiplo.
   O teste pressupõe que o efeito final dos múltiplos fatores de variação que atuam ao mesmo tempo sobre uma variável pode ser decomposto e analisado por partes (fator com repetição). Esses efeitos parciais dependem de três tipos de Fatores de variação: 1- Fatores principais controlados - a variação é causada por fatores introduzidos de propósito no experimento e controlada pelo pesquisador; 2- Interação de fatores de interação - a variação é causada por interações entre alguns ou todos esses fatores experimentais controlados; e 3- Fatores de erro aleatórios - a variação é ocasional, não-controlada, decorrente de causas estranhas (erro experimental, variação residual ou resíduo) e é com ele que se mede o 'P' estatístico. Na Análise de variância com múltiplos fatores cada fator (ou interação) é analisado separadamente, ignorando-se os demais que são considerados como simples repetições.
      1.3- ANOVA para modelos mistos

E. Testes post hoc ANOVA com X ~ F(m; n) (Teste de Bonferroni, Tukey, Dunnett...)

   1- Teste de Dunnett, Stat DMS, tamanhos balanceados, rigoroso, compara o grupo controle com os experimentais...
   2- Teste de Bonferroni, Stat Q, grupos balanceados ou desbalanceados, muito rigoroso, compara X̅ 2 a 2...
   3- Teste de Tukey HSD (honest significant difference), Stat Q, k > 30, grupos balanceados, muito Erro tipo II...
   4- Teste de Scheffé , Stat F um dos mais usados, mais rigoroso que o de Tukey...
   5- Outros testes post hoc ANOVA (a ANOVA testa médias, não variâncias!!!)...

Testes não-paramétricos para comparar a variável mensurada entre os grupos criados ou já existentes
H0: H1 é falsa. H1: A diferença das medianas entre os grupos é significativa se P < 0,05.
H0: H1 é falsa. H1: A diferença das proporções entre as categorias é significativa se P < 0,05.

A. 1 amostra (noir) de uma população: IC[95%]...

1- Teste de Wilcoxon para uma amostra, intervalar, Stat T, testa Md por postos, mais potente que o dos sinais...

2- Teste dos sinais para a mediana de uma amostra, ordinal, Stat P ~ B, testa a mediana por postos...

3- Teste do χ² para uma amostra

Bem vindos à cidade de Bernoulli

, nominal, Stat χ²

Margem de erro da proporção [95%] = 1,96 * Erro padrão da proporção
Para p=0,5 use IC[95%] de eventos favoráveis = (n ± (n*Χ²_(1,α))^0,5)/2
Observe que o limite mínimo é 40,2 e o máximo é 59,8, portanto o
IC[95%] dos eventos favoráveis = 41 a 59.

, testa proporções entre a frequência observada e a esperada...

B. 2 grupos (nominal dicotômico) pareados: Teste χ² de McNemar, T⁺ de Wilcoxon...

1- Teste de Wilcoxon pareado

http://www.socscistatistics.com/tests/Default.aspx

, ordinal, Stat T, testa Δpar em relação à Md, muito usado na Psicologia...

   ≡95% da eficiência do Teste paramétrico t de Student pareado.
   H0: As duas amostras têm medianas iguais. H1: H0 é falsa. α = 0,05.
   Teste de Postos com Sinais de Wilcoxon para amostras combinadas; Teste de Postos com Sinais de Wilcoxon para Pares Combinados; Wilcoxon Matched-Paris Signed-Ranke T. É uma extensão do teste dos sinais para amostras pareadas.
   É o teste de sinais com verificação da magnitude da diferença entre os pares, e não somente qual deles é maior (ou menor). Se a distribuição da população for simétrica devemos usar o teste de Wilcoxon. Relativamente ao teste do sinal, o teste de Wilcoxon tem a vantagem de ser mais potente, i.e., é menor a probabilidade de se cometer o erro de aceitar H0 sendo H0 falsa.
   Somente é aplicado em amostras não paramétricas (determinadas pelo teste de distância K-S). Exige um tamanho de amostra maior do que o teste t pareado. Ex: comparando os escores de paciente na entrada na UTI e no dia do início da alimentação parenteral.    Uma amostra A1 submetida a um tratamento T1, e o seu efeito medido. Posteriormente, essa mesma amostra, chamada agora de A2, é submetida a um segundo tratamento T2, medindo-se o seu efeito pela mesma variável usada no primeiro tratamento.
   Comparando-se o efeito dos dois tratamentos em cada elemento da amostra, podem ocorrer 3 alternativas:
   H1: O efeito aumentou;
   H1: O efeito diminuiu;
   c) O efeito permaneceu o mesmo (=).
   Até este ponto, o teste seria idêntico ao chamado teste dos sinais. A diferença porém é que, no teste de Wilcoxon, leva-se em conta a magnitude do aumento ou da diminuição, e não apenas a direção da variação para mais ou para menos.
   Assim, para cada par vinculado A1/A2, calcula-se a diferença numérica T1 - T2. Essa diferença poderá ser positiva, negativa, ou igual a zero (quando não houver variação, sendo T1 = T2).
   Uma vez calculadas todas as diferenças entre os valores obtidos para cada par de dados, essas diferenças são ordenadas pelo seu valor absoluto (sem considerar o sinal), substituindo-se então os valores originais pelo posto que ocupam na escala ordenada.
   Feito isso, atribui-se a cada um desses novos valores dos dados o mesmo sinal que eles tinham antes da transformação em postos.
   A filosofia do teste presume que, se os tratamentos forem idênticos, a soma dos postos com sinais positivos será equivalente à soma dos postos com sinais negativos.
   O teste de Wilcoxon calcula um valor z, ao qual está associada um valor de probabilidade. Essa probabilidade traduz o grau de possibilidade de ocorrência desse valor de z por mero acaso, e não por efeito dos tratamentos efetuados (T1 = T2). No caso do GMC software, o programa já faz automaticamente o cálculo da probabilidade do z obtido pelo teste, não havendo necessidade de consultar qualquer tabela.
Análise Não-paramétricas que executa o teste de Wilcoxon para modelos em que a variável independente possua somente 2 (dois) níveis.

2- Teste de McNemar

http://www.real-statistics.com/non-parametric-tests/mcnemars-test/

, nominal dicotômica, Stat χ² de McNemar ou teste das mudanças entre 2 estados "antes e depois de"...

3- Outros testes não-pamétricos para 2 amostras pareadas...

C. 2 grupos (nominal dicotômico) independentes: Teste de Mann-Whitney...

1- Teste de Mann-Whitney

http://www.socscistatistics.com/tests/Default.aspx

, intervalar, Stat U, testa Medianas, mais potente que o K-S (menor o Erro β)...

2- Teste do χ² para duas amostras categorizadas, nominal, Stat χ², n≥5.

http://www.amendes.uac.pt/monograf/monograf01estatNparamt.pdf

3- Outros testes não-paramétricos para 2 amostras independentes...

D. 3 ou mais grupos pareadas: Teste de Cochran, Friedman com fator duplo...

1- Teste de Friedman com fator duplo com repetições, ordinal, Stat χ²_r ~ χ², ⇒ Teste post hoc de Dunn...

2- Teste de Cochran, nominal, Stat Q ~ χ², o post hoc é o teste de McNemar (mas não deveria ser!).

3- Outros testes não-paramétricos para 3 ou mais grupos pareados...

E. 3 ou mais grupos independentes: Teste de Kruskal-Wallis, χ² para K grupos one-way...

1- Teste da ANOVA nâo-paramétrica de Kruskal-Wallis (KW) fator único

New table & graph: Grouped. Bug no SPSS.v20: Duplo click na tab, vai em campos e escolha uma linha tab significativa, na visualização aparece a comparação de pares!

, ordinal, Stat H ~ χ², ⇒ Post hoc de Dunn...
2- Teste do χ² para k amostras one way, nominal, Stat χ², se a variável for intervalar® categorize...

3- Outros testes não-paramétricos com 3 ou mais grupos independentes...

---- Análise de amostras de 2 variáveis (Estatística bivariada) "aleatórias" ----

Uma é chamada variável independente, preditora ou covariável e a outra variável dependente, desfecho ou outcome.
H0: H1 é falsa. H1: Existe uma Equação linear ou logística simples cuja variável (X) prevê significativamente (P < α) o valor da variável desfecho (Y) com uma determinada porcentagem mínima de acerto (r²). O Modelo de regressão linear
Nesta etapa o que interessa são os coeficientes (parâmetros) da equação.
explica a forma e a Análise de correlação
O termo correlação (r) significa relação em dois sentidos (co+relação) e é usado em estatística para designar a força que mantém unidos dois conjuntos de valores (X,Y). O de determinação (r² é a proporção de variação total da variável dependente Y que é explicada pela variação da variável independente X.
quantifica a força da relação.
"As medidas do grau de relacionamento entre duas ou mais variáveis quantitativas são chamadas coeficiente de correlação (=covariância/DP) ou coeficiente de associação para variáveis qualitativas. Padronize as unidades (diferentes) com Z-score!
Os pressupostos para o uso da Regressão Linear Simples são: HILE Gauss!
Pronounced highly Gauss. Portanto, determinar os coeficientes (parâmetros) da função Linear é apenas o começo... a Análise dos resíduos é mandatória! Exogenidade estrita, significa que as variáveis preditoras podem ser tratadas como valores fixos, em vez de variáveis "aleatórias", ou seja, as variáveis preditoras deverão ser assumidas como isentas de erro, não estando contaminadas com erros de amostragem.

1º) n ≥ 50 + 8*nro de preditoras,
2º) A variável preditora tem Exogenidade estrita (valores fixos, não aleatórios),
3º) Linearidade: Y = a+bx, se o coef. angular b (Teste t) e o de correlação
Cuidado p'ra não confundir o coeficiente do correlação r de Pearson com a Matriz de correlação das preditoras.
linear r ≈ |1| forem significativos (P<α),
4º) A Análise dos resíduos mostra: Normalidade (Teste W) e Homocedásticidade (Teste F).

A. Intervalar x intervalar, relação linear, 2vii2apl

   1- Regressão linear simples
O pesquisador não sabe, mas além da massa (r² = 30%), há mais 2 variáveis (altura e idade) que "fechariam" o modelo de consumo de Energia (adulto, masculino) com P < 0,01...
, intervalares, Stat t, Y ~ f(x) = a+bx+ε, onde, ε ~ NID(0; σ²), coef. de correlação...
       Há relação estatísticamente significativa entre X e Y?. A mais famosa é a Regressão que determina 0ºK. Um pressuposto no uso da Análise da regressão linear é que a haja evidências de Linearidade nos parâmetros. Em outras palavras, o adjetivo "linear" é usado para indicar que o modelo é linear nos parâmetros b₁,..., b_k e não porque Y seja função linear dos X’s. Tem ainda o problema dos coeficientes padronizados.
      1- Médodo de ajuste (estimativa) dos parâmetros do modelo (cálculo dos coeficientes 'a' e 'b')...
         1.1- No caso em que as duas variáveis (preditiva e preditora) são contínuas. Nota: y = a + b*x, onde os coeficientes (parâmetros) a é o de intersecção e b é o de inclinação, angular ou de regressão. O pressuposto deste modelo de regressão é de que os erros (resíduos, desvios, ruídos ou componente aleatório) são independentes e variam aleatoriamente segundo uma distribuição (de probabilidade) Normal com média e covariância zero e variância constante.
         1.2- Método da máxima verossimilhança - Consiste em determinar uma função, chamada função de verossimilhança [L(y,Md)],que é a função de probabilidade de ocorrência daquele específico conjunto de dados e estimar os parâmetros que maximizam a mesma.

      2- Medidas de correlação: Coeficiente de correlação 'r' de Pearson, Coeficiente de determinação r²...
         2.1- Coeficiente de correlação 'r' de Pearson
Dica: se acostume com o uso da matriz de correlação (Análise de dados)
, coeficiente de correlação de Pearson, coeficiente de correlação linear de Pearson, coeficiente de correlação paramétrico de Pearson ou coeficiente de correlação produto-momento (-1 ≤ (correlação negativa) r ≤ 1 (correlação positiva)) r = 0 indica ausência de correlação, é uma medida do grau de relação linear entre duas variáveis quantitativas. A significância do coeficiente 'r' de Pearson: H0: r = 0. H1: H0 é falsa. 1º- Determinar t = r*RAIZ[(n-2) / (1 - r²)]. 2º- Deterninar t_c = t(α; gl), onde α = 0,05 e gl = n - 1 - variáveis independentes. 3º- Se Stat t > t_c, então P < 0,05.
         2.2- Coeficiente de determinação r²: Indica quanto da variação total é comum aos elementos que constituem os pares analisados, portanto, a qualidade da regressão é indicada por este coeficiente. r² = Variação explicada de Y / Variação total de Y. É importante notar que r² varia entre 0 (zero) e 1 (um), e, quanto mais próximo da 1, maior a validade da regressão. Exemplo: r² = 0,296, explica 29,6% da variação da variável dependente, o restante, 70,4%, é explicado por variáveis não estudadas. ATENÇÃO: r² NÃO é uma medida apropriada para avaliar a linearidade do modelo. O r² ajustado, corrige o valor do coeficiente de determinação r² levando em conta inclusive, o número de preditoras, já que qualquer adição de uma varíável expúria SEMPRE aumenta o r².

      4- Análise dos resíduos: Gráficos e Teste de Durbin-Watson...
         Na análise de regressão linear os erros E₁, E₂, ..., E_n são as diferenças entre o valor observado e o estimado calculado pela equação. O Objetivo da Análise dos resíduos é detectar violações nos seguintes pressupostos:
         1º- seguem uma distribuição Normal - Avaliação: Teste de Kolmogorov-Smirnov, Teste da Normalidade de Lilliefors ou uso de gráfico de probabilidade normal (Normal P-P Plot ou Normal Q-Q Plot) onde se os erros tiverem distribuição Normal, os pontos devem posicionarem-se quase numa reta. Alternativa: ANOVA não-paramétrica;
         2º- têm média zero e variância semelhantes (homocedasticidade) - Avaliação: Teste de Levene, Teste de Brown Forsythe, Teste de Bartlett ou uso de gráfico de probabilidade Normal;
         4º- os resíduos também são independentes independentes - Avaliação: Teste de Durbin-Watson para a medida da autocorrelação (dependência) nos resíduos de uma regressão: 1º- Valores próximo de 0: existe uma autocorrelação positiva. 2º- Valores próximo de 2: não existe autocorrelação dos resíduos. 3º- Valores próximo de 4: existe uma autocorrelação negativa.

   2- Regressão linear simples com BC[95%]
ATENÇÃO: As bandas de confiança delimitam a área que contém a verdadeira reta de regressão é, portanto, diferente das Bandas de predição (Prediction bands), que delimitam os valores amostrais. As Bandas correspondem a IC da média e as Predições do IC dos valores.
, Stat t, p'ra se determinar a banda de predição dos valores.

B. Intervalar x categórica, relação Logistica, 2vic2apL

   1- Regressão Logística nominal simples
http://statpages.info/logistic.html. É nominal por causa do out(Y)come!!!
, Stat Wald
O teste de Wald frequentemente falha em rejeitar coeficientes que são estatisticamente significativos, aconselha-se que estes coeficientes não significativos sejam testados novamente pelo teste da razão de verossimilhança.
, Stat TRV, X ~ p(x) = 1/(1 + e^{-(α + βx)}), e ≅ 2,72, Odds = e^β...

      É possível que a palavra Logística se refira não ao Log da função, mas a variável desfecho nominal dicotômica, ou, lógica (sim ou não)!
     A Resultados na "unha" (modelo logístico ou classificador de máxima entropia ??????
Quando uma ou as duas são categóricas temos que transformá-las. Quando a variável independente categórica é nominal, ela pode ter mais de duas classes e para isso cria-se variáveis codificadas chamadas de variáveis dummies.
Problemas quando a variável resposta é binária
1. Os erros não tem distribuição normal.
2. Variâncias heterogêneas.
3. Restrição na função resposta.
) é um modelo estatístico que permite calcular o valor de uma variável desfecho (outcome), a partir de uma variável preditora contínua ou binária. Os princípios são: 1- A variável dependente está limitada a dois resultados possíveis (binária ou dicotômica, mas pode ser estendido para 3 ou mais classes como alta, média ou normal e baixa). 2- Só se deve incluir as variáveis independentes relevantes. 3- Há um mínimo de 30 casos por variável independente. 4- Há o risco de se criar um modelo instável se duas ou mais variáveis independentes medirem um mesmo efeito (o modelo papoca...).
      2- Medidas de associação:
         Na Regressão Logística o coeficiente β estimaça diretamente o Odds (chance) = e^β.
      3- As 3 funções (transformações) utilizadas na modelagem de dados cuja variável é binária são:
         3.1- Transformação logit - é relacionada com a propriedade que a função logística ser linearizada e a variável dependente pode ser associada a uma variável aleatória de Bernoulli.
         3.2- Transformação probit - obtida transformando E(Y) por meio da distribuição normal acumulada e limitado a apenas uma variável preditora.
         3.3- Complemento log-log - Diferentemente das transformações logit e probit, esta transformação não é simétrica em torno de E(Y) = 0,5.
         3.3- Complemento log-linear - Quando a variável dependente é associada a uma variável aleatória de Poisson.
      4- Usos da função logística
         4.1- Descritivo: descrever a natureza do relacionamento entre a resposta média (isto é, a probabilidade de comprar, por exemplo) e uma (ou mais) variáveis regressoras.
         4.2- Preditivo: saber se uma pessoa irá comprar um automóvel no próximo ano, dado o seu rendimento.
         3.2- Significância dos parâmetros a e b: Teste de Wald, Razão de verossimilhança...
         H0: b = 0, ou seja, a reta de regressão é paralela ao eixo da abscissa. H1: b ≠ 0, ou seja, H0 é falsa.
            3.2.1- Teste de Wald: Pressupõe que X tenha distribuição normal. Algoritmo: 1º - Calcular b e o erro padrão de b, 2º- Calcular o Stat t = b/erro padrão de b, 3ª- Calcular os gl = n-2 onde n é o número de pares (x,y), 4º- Localizar o valor de t na tabela t, e, 5º se t ≤ t_c aceite H0. Este teste segue a distribuição Normal e frequentemente aceita H0 quando esta é falsa (Erro tipo II) especialmente quando n é pequeno.
            3.2.2- Teste da razão de verossimilhança (likelihoold ratio): Este teste recursivo baseado na estatística de Deviance do modelo (função desvio) e é indicado quando o 'n' é pequeno ou moderado ou quando o teste de Wald aceita a H0. O TRV = -2*[log da verossimilhança com a constante - log da verossimilhança sem a constante]. O valor com a constante é obtido no passo interativo 0 e o valor sem a constante no último passo (quando o modelo estabiliza). Este teste segue a distribuição do χ² com 1 grau de liberdade, portanto se χ² > 3,84 então P < 0,05.

   2- Regressão Logística ordinal simples, use o teste ante hoc do χ² para tendência linear.
C. Intervalar x intervalar, relação paramétrica mas não-linear
   1- Modelos farmacocinéticos de 1ª ordem, tempo x clearance, X ~ E(λ), C_(t) = C₀e^-kt, onde k = -Ln(2)/λ...
         Parâmetros: 1- Clearance plasmático. Meia-vida plamática. 3- Volume de distribuição do fármaco.
         1.1- Modelo linear aberto de um compartimeto (via de administração endovenosa)
            Características: 1. Absorção instantânea. 2. Eliminação de primeira ordem. 3. Distribuição instantânea.
            Modelo matemático: Cp_t = Cp₀ . e^-ke.t (ke = constante de eliminação).
         1.2- Modelo linear aberto de um compartimeto (via de administração oral)
            Características: 1. Absorção lenta. 2. Eliminação de primeira ordem. 3. Distribuição instantânea.
            Modelo matemático: Cp_t = Cp₀ . e^-ka.t + Cp₀ . e^-ke.t (ka = constante de absorção).
         1.3- Modelo linear aberto de dois compartimeto (via de administração endovenosa)
            Características: 1. Absorção instantânea. 2. Eliminação de primeira ordem. 3. Distribuição lenta.
            Modelo matemático: Cp_t = (D*F*ka)/(Vd(ka-ke)) * e^-ke.t (D= Dose administrada, F = fração absorvida, Vd = volume de distribuição aparente).

   2- Curva Dose-Resposta
Gráfico dose-resposta sigmóide usando o coeficiente de Hill
, log x linear, Stat r²,
Clique para ver as Equações e colar especial como texto no Excel.
X ~ DR(S; pD₂), E = 1/(1 + S^{(pD₂ - pD_x)})

R = R_max/(1+ S^{(pD2₂ - pD_x)}), onde S = 10^{(coeficiente de Hill)} e pD₂ = -Log (EC₅₀)       Na Curva Dose-Resposta clássica, o coeficiente de Hill é igual a 1 e, portanto, um caso particular da Regresssão logística simples quando pD₂ = x_1/2 e S = e^β.
      2.1- A Teoria dos Receptores
John Langley (1852-1925), fisiologista britânico, observou que a Nicotina (agonista) age apenas numa pequena área da fibra muscular (junção neuro-muscular) que pode ser bloqueada pelo Curare (antagonista) e, propôs a existência de Substâncias receptivas, hoje Receptores farmacológicos...
.
      2.2- Modelo hiperbólico de Clark & Ariens
Alfred Clark (1885-1941), farmacologista britânico e Everhardus Ariëns (1918-2002), farmacologiasta alemão, contribuiram com o modelo matemático hiperbólico: E = (Em * D)/(Kd + D), da interação droga-receptor (teoria dos receptores).
- Não é mais usada devido à dificuldade de se determinar o valor da constante de dissociação (Kd). D= Dose, Em = Efeito máximo.
      2.3- Modelo da dupla inversa de Lineweaver & Bury
Hans Lineweaver (1907-2009), físico-químico americano e Dean Burk (1904-1988), bioquímico americano, contribuiram com o modelo matemático da dupla inversa: 1/E = Kd/Em * 1/D + 1/Em, da interação droga-receptor (teoria dos receptores).
- convenientemente esquecida, quem a utiliza comumente fica constrangido com os valores de kd (constante de dissociação) e de Em (Efeito máximo).
      2.4- Modelo do duplo Log de Hill
Archibald Hill (1886-1977), *1922, fisiologista inglês, contribuiu com o modelo matemático do duplo Log: Log(Em/E - 1) = -Log(D) + Log(Kd), da interação droga-receptor (teoria dos receptores).
- a mais importante, se o coeficiente angular de Hill for estatísticamente diferente de 1, a equação não mais representa a de Ariens.
      2.5- Modelo sigmóide
Apesar dos dados serem os mesmos, há uma grande discrepância tanto na constante de dissociação de Clark & Ariens quanto no Efeito máximo de Lineweaver & Bury, e isto se deve ao fato de que o coeficiente de Hill ser diferente de 1.
- atualmente é a mais usada. Note que a constante hiperbólica S = 10^coef. de Hill representa uma família de curvas hiperbólicas. pDx = -Log(D).
Além disto se pode representar as curvas com Agonistas parciais.

   3- Curva de Replicação 2ⁿ
, X ~ R(S; n), onde n é o número de ciclos.
   4- Curva Dose-Mortalidade (DL50)
, Log x proporção, Stat r², Stat F, Stat t
   5- Regressão linear-Log
A média foi usada para se "centrar" os valores e, NÃO se pode fazer a Regressão Linear em cima dos valores Log, daí a necessidade de convertê-los em lineares.
, Stat t
D. Intervalar x intervalar, relação não-paramétrica: Coeficiente de correlação r_s de postos de Spearman
E. Ordinal x nominal dicotômica, relação não-paramétrica
   1- Teste do χ² de Mantel-Haenszel ou teste do χ² para tendência linear...
      ≡91% da eficiência da Regressão linear simples (intervalar x intervalar)
      H0: Não existe um relacionamento linear entre as duas variáveis. H1: H0 é falsa. α = 0,05.
      O Teste de associação linear de Mantel-Haenszel (para 2 amostras independentes) - é um teste de hipótese onde: 1- as amostras são independentes, 2- os itens de cada amostra são selecionados aleatoriamente, 3- as observações devem ser frequências ou contagens, 4- cada observação pertence a uma e somente uma categoria e 5- a amostra deve ser relativamente grande (pelo menos 5 observações em cada célula).
         2.3- Coeficiente de correlação r_s de Spearman, de postos ou coeficiente ρ (rô), ≡Coeficiente de correlação 'r'.
   Medida de correlação entre duas variáveis pelo menos ordinais de modo que os elementos em estudo possam ser dispostos por postos em duas séries ordenadas.. É menos sensível do que o de Pearson quando os valores estão muito distantes do esperado. Este coeficiente avalia uma função monótona arbitrária que pode ser a descrição da relação entre duas variáveis, sem fazer nenhuma suposição sobre a distribuição de frequências.
         2.4- Coeficiente de correlação por postos de Kendall, t (tau)-
         2.4- Coeficiente de correlação parcial por postos de Kendall

F. Nominal x nominal, teste não-paramétrico, Odds ratio, Risco relativo, coeficiente de contingência
   1- Teste do χ² de independência de Pearson ou de associação:
NÃO CONFUNDA o Teste do χ² de independência com o χ² de aderência, este último é para 1 variável dicotômica como é o caso da moeda (cara x não_cara)!!!
P(A∩B) = P(A)*P(B), compara proporções...
   ≠Teste do χ² de aderência de 1 ou mais amostras à uma frequência esperada (pré-definida), este, é para 2 variáveis.
   H0: As duas variável nominal são independentes. H1: H0 é falsa. α = 0,05.
   Regras de Cochran ou restrições para grau de liberdade = 1:
      1) n ≥ 40 (n = número total de observações por casela);
      2) 20 ≤ n < 40, o teste só pode ser aplicado se todas as frequências esperadas forem ≥ 5;
      3) n < 20 e se a frequência esperada n < 20, usar o teste exato de Fisher.
   O Teste do χ² de independência (já que é não-pareado) ou Teste de correlação (A correlação quantifica quão bem o X e Y variam em conjunto, ou seja mede o grau de associação), compara frequências observadas com frequências teóricas (esperadas). O estudo da frequência é feito através de matrizes (tabelas de contingência ou de frequência) e a mais famosa é a 2 x 2. O grau de liberdade é o produto do número do linhas (l) - 1 vezes o número do colunas (c) - 1: (2-1) x (2-1) = 1 x 1 = 1. No caso da 2 x 2, gl = 1 e α = 0,05 o valor crítico do χ²_c = 3,841, se o Stat χ²_c estiver acima deste valor, rejeita-se H0.
   Medidas de força (ou intensidade) de associação entre as 2 variáveis nominais (qualitativas)
      1- Odds ratio (OR) ou Razão de Chances (RC) ou Razão de produtos cruzados. OR = pacientes com anormalia / pacientes sem anormalia = (a*d) / (c*b) = paciente expostos / paciente não exposto = (a/b) / (c/d) Este índice é usado em Estudos de Caso-Controle e em Coortes. Deve-se também determinar o IC95% de OR.
      2- Risco relativo (RR) = Incidência do desfecho entre sujeitos expostos / Incidência do desfecho entre sujeitos não expostos = a/(a+b) / c/(c+d). Este índice só pode ser usado em Coortes, não pode ser usado em Estudos de Caso-Controle. Tem como base a observação empírica de que nem todos têm a mesma probabilidade (risco) de sofrer um desfecho, mas que para algumas (amostra) este risco é maior do que para outros. Grau de Risco é uma classificação do valor do Risco (alto grau de risco, baixo risco, etc). Deve-se determinar o seu IC95% do RR, uma vez que é possível obter um valor do RR alto, mas se o tamanho da amostra for pequeno, o seu valor será duvidoso.
      3- Coeficiente de contingência C um indicador do grau de associação entre duas variáveis analisadas pelo Qui quadrado. Quanto mais próximo de 1, melhor o coeficiente de contingência, que varia de 0 a 1.
      4- Risco Atribuível (RA)
Taxa de Incidência na amostra com o fator de risco menos a Taxa de Incidência na amostra sem o fator de risco
É uma medida de associação entre fatores de risco e o desfecho. É definido com a diferença entre a probabilidade ter o desfecho nos que estão expostos ao fator e a probabilidade de ter o desfecho nos que não estão expostos.
      5- Fração Atribuível (FA): É a medida do efeito da eliminação do Fator de Risco para determinado desfecho, ou seja, mede o quanto a ocorrência do desfecho pode ser diminuída se o Fator de Risco fosse eliminado.
      6- Fração Atribuível Populacional (FAP): É a medida da proporção da incidência do desfecho na população, atribuída à exposição de um determinado fator.
      7- Coeficiente de associação Q de Yule
         Algoritmo de execução: 1º - Montar a tabela de contingência 2x2, 2º- Calcular o valor de Q = (ad - bc) / (ad - bc), 3º- Calcular o desvio padrão (s) de Q: s = ((1 - Q²) / 2) * ((1/a + 1/b + 1/c +1/d)^0,5), 4º- Calcular o IC(95%) = Q ± t*s. 5º- Calcular t = (r/(n-2)^^0,5)/((1-r²)^0,5). 6º- Se t > t_c rejeitar H0.
      8- Coeficiente V de Crámer.
         Apesar de sua popularidade o coeficiente de contingência C tem a desvantagem de que o número de linhas e colunas influencia o resultado. A alternativa é utilizar o coeficiente V (de Cramer),
      9- Método de correlação não-paramétricos de Kendall.

   2- Teste do χ² com correção de continuidade de Yates: Só tabela 2x2 (20 ≤ n ≤ 40 e frequências esperadas ≥ 5)
         H0: A probabilidade do evento A é independente da de B - P(A∩B) = P(A)*P(B). H1: H0 é falsa.
   O Teste do χ² ou Teste de independência (já que é não-pareado) do χ², compara frequências observadas com frequências teóricas, calculadas matemáticamente para o mesmo número de dados da amostra. O estudo da frequência é feito através de matrizes (tabelas de contingência ou de frequência) e a mais simples é a 2 x 2 (duas linhas e duas colunas). O grau de liberdade é igual ao produto do número do linhas menos 1 vezes o número do colunas menos 1: (2-1) x (2-1) = 1 x 1 = 1. O teste calcula a relação: quadrado da diferença entre as frequências obtida e esperada em cada uma das quatro células da tabela de contingência (ou de dupla entrada), dividido pela frequência esperada, e soma esses quadrados. No caso da 2 x 2, gl = 1 e α = 0,05 o valor crítico do χ²_c = 3,841, se o Stat χ²_c estiver acima deste valor, rejeita-se H0.
   As restrições para 1 grau de liberdade (matriz 2x2) são:
      1) pode ser aplicado para n maior que 40 (n = número total de dados);
      2) para n entre 20 e 40, o teste só pode ser aplicado se todas as frequências esperadas forem maiores ou iguais a 5;
      3) se a menor frequência n < 20, ou se 'n' for menor que 20, será preferível usar o teste exato de Fisher.
   B. Para mais de 1 grau de liberdade:
   a) nenhuma casela pode ter valor menor que 1;
   b) o número de caselas com valores esperados menores do que 5 não pode ultrapassar 20 % do número total de caselas; e
   c) se isso ocorrer, reformule a tabela (somando caselas vizinhas).

   3- Teste exato de Fisher ou Χ² de 'n' pequeno, ≡Teste paramétrico t de Student não-pareado...
Variáveis: nominal; para n < 20 ou 20 < n < 40 e frequência esperada < 5 ou frequência esperada < 1
   O teste exato de Fisher (Probabilidades exatas de Fisher) testa diferenças entre duas variáveis independentes que só admitam duas alternativas como resposta: Sim/Não, Positivo/Negativo, ou +/-. Isso leva à construção de uma tabela de contingência 2 x 2.
   O teste é basicamente um χ², particularmente adequado para pequenas amostras (com 20 dados ou menos), caso em que o teste do χ² estaria contra-indicado, entretanto, quando o número de dados da amostra é grande, o teste de Fisher é que não deve ser usado, porque envolve o cálculo de fatoriais, o que pode conduzir a números excessivamente elevados. Nesses casos, a opção deve ser pelo teste do χ².

   4- Teste do χ² para k amostras independentes, nominal, Stat χ², tabela m x n...
      Regras de Cochran ou restrições para grau de liberdade > 1:
      1- nenhuma casela pode ter valor < 1;
      2- o número de caselas com valores esperados < 5 não pode ultrapassar 20% do número total de caselas e,
      3- se isso ocorrer, reformule a tabela (somando caselas vizinhas).
   O teste do χ² é um teste que compara frequências obtidas experimentalmente com frequências teóricas calculadas matemáticamente, ou seja, compara proporções. A tabela de contingência é formada de (m) linhas e (n) colunas. O grau de liberdade é dado pelo produto de (m-1) x (n-1), quando m E n ≥ 2. O teste calcula a relação: quadrado da diferença entre as frequências obtida e esperada em cada casa da tabela de contingência, dividido pela frequência esperada, e soma esses quadrados. Pode-se determinar ainda (SPSS): 1- Qui-Quadrado de Pearson; 2- Corrigido de Yates ou Correção de Continuidade; 3- Razão de verossimilhança; 4- Teste exato de Fisher; 5- Qui-Quadrado de Mantel-Haenszel ou teste de associação linear ou ainda associação linear por linear.

Antes da analise de muitas variáveis considere o uso da Análise de Fatores
Os Fatores encontrados são formados por variáveis com forte colinearidade (polos gravitacionais). Análise de 3 ou mais variáveis (multivariável ou multivariada = multivariate) ao acaso
É p'ra casualidade, previsão (Regressão e Redes Neurais) ou otimização (Simplex e Planejamento fatorial)
Para entrada das covariáveis (explicativas) no modelo usa-se um α de [0,10:0,25] usando o Teste do χ² de tendência linear.
Cov(X,Y) = 0 ou Covariância nula significa ausência de correlação linear. Corr(X,Y) = Cov(X,Y) / DP_X*DP_Y A. A variável desfecho (outcome) e as preditoras são intervalares com Y ~ N(Y_{X_i}, X_{Y|X_i})

A regressão é linear múltipla se, além dos pressupostos anteriores,
6º) Não há colinearidade
O VIF (Variance Inflation Factor) é o inverso da tolerância. Valores altos de VIF indicam alto grau de multicolinearidade.
, Independentes (Stat d) ou multicolinearidade entre as variáveis preditoras.
7º) Pontos outlines eliminados ou pontos aberrantes usando a medida da distância Cook (D_i ≤ 1).
H1: Existe uma Equação linear ou logística múltipla com variáveis (X_i) que prevêm significativamente (P < α)
o valor da variável desfecho (Y) com uma determinada porcentagem mínima de acerto (r²).

   1- Regressão linear múltipla (≥2 preditoras independentes) univariada ou multivariada (>1 desfecho intervalar)...

A tabela para a Análise Estatística usando o método da Regressão linear múltipla tem um (univariada) ou mais desfechos (multivariada), onde Y1, Y2..., são variáveis intervalares (na logística, normalmente, são binárias) e duas ou mais variáveis independentes, onde X1, X2, X3..., chamadas de covariáveis. O objetivo é determinar os parâmetros (β0, β1, β2, β3...), destas covariáveis. Quando uma variável "independente" é função da outra (colinearidade), ou uma delas é retirada do modelo ou o modelo é multivariado (Regresão multivariada). Seus 2 modelos são:
1- modelo preditor ou explicativo (roda de macumba com Y no centro): a associação entre a preditora e o desfecho deve ser independente de qualquer variável de interação (X2 modifica a relação entre X1 e Y).
2- modelo causal ou de causalidade (time de futebol, modelos fisiopatológicos, com o Y no final): a associação deve ser independente de variáveis de confusão (X1 modifica X2 e Y).
Fazer o ajuste dos dados, ou seja determimnar o efeito de uma variável X, ajustando ou levando em conta outras variáveis independentes.
Obter uma equação linear para predizer valores de Y a partir dos valores de várias variáveis X1, X2, ...,Xk.
Explorar as relações entre múltiplas variáveis ( X1, X2, ..., Xk ) para determinar que variáveis influenciam Y.
      3- Significância estatística: Coeficiente de correlação 'r', ANOVA e para os parâmetros 'a' e 'b'...

         3.1- ANOVA
            3.1.1- A variável contínua é Normal e NÃO HÁ covariadas para serem controladas: ANOVA - two-way
            3.1.2- A variável contínua é Normal e HÁ covariadas para serem controladas: Análise de covariância...
            A análise da covariância é assim denominada quando se procede a análise da variância simultaneamente para duas ou mais variáveis. Geralmente, como resultado de um experimento, têm-se uma variável (Y) dependente principal e uma ou mais variáveis (X1,X2,...) independentes denominadas de covariáveis.

            3.1.3- A variável contínua NÃO é Normal, n > 5, não-pareado: ANOVA não-paramétrica de Kruskal-Wallis.

      1.1- Regressão linear múltipla (2¹ - 1 equações), intervalar, Stat r², y = b₀ + b₁*x₁ + ... + b_n*x_n + ε (Obs-Esp)...
Estima os COEFICIENTES de uma Equação linear multivariável com 'n' monômios (EXPOENTES = 1)       SIMPLE LINEAR REGRESSION AND CORRELATION Análise dos Resultados. Variável categórica com 3 ou mais níveis: Fatóra-se a variável em variáveis dummy (indicadoras) (categórica 0-1)...
      O objetivo da análise de regressão linear múltipla, assim como de todos os tipos de regressão, é encontrar uma equação (chamada de equação de regressão, variável estatística de regressão ou modelo de regressão) que prevê a variável resposta (outcome, desfecho) a partir de uma combinação das variáveis explicativas.

      1.2- Regressão linear múltipla completa (2ⁿ-1)
Uso do Solver para calcular, por aproximação, dado um determinado Y...
: y = b₀ + ∑ⁿ_i b_i*x_i + ∑ⁿ_i+1 b_i,i+1*x_i,i+1 + ... + ∑ⁿ_i+1,...,n ...,n
      1.3- Regressão linear múltipla interativa simples (2ⁿ-1)
Na Regressão linear interativa, o #monômios é (2^n-1) e os expoentes de cada variável de cada monômios = 1.
: y = b₀ + ∑ⁿ_i b_i*x¹_i + ∑ⁿ_i+1 b_i,i+1*x¹_i,i+1 + ... + ∑ⁿ_i+1,...,n ...,n       1.4- Regressão linear múltipla interativa completa (2^2ⁿ-1)
Na Regressão linear interativa plena, o #monômios é (2^2ⁿ-1) e os expoentes de cada variável de cada monômios = 1.
: y = b₀ + ∑ⁿ_i b_i*x¹_i + ... + ∑ⁿ_i+1,...,n ...,n
Estima os COEFICIENTES de uma Equação linear multivariável com 2ⁿ monômios (EXPOENTES = 1) n é o #variáveis independentes, k = 2ⁿ-1 é o #monômios da maior equação e o #total de equações = n!/(n-k)!/k!       O termo "Interação" entre variáveis independentes foi usado pela primeira vez por Fisher em 1926. "An effect of interaction occurs when a relation between (at least) two variables is modified by (at least one) other variable. In other words, the strength or the sign (direction) of a relation between (at least) two variables is different depending on the value (level) of some other variable(s). Statistical interaction means the effect of one independent variable(s) on the dependent variable depends on the value of another independent variable(s). Conversely, 'Additivity' means that the effect of one independent variable(s) on the dependent variable does NOT depend on the value of another independent variable(s)." Brian Stipak, Portland State University.
      Na Regressão linear múltipla interativa o número de monômios = 2ⁿ
No Excel 2007 o máximo de monômios é 16.384 (equivale a processar apenas 13 variáveis "cheias").
(onde n = #variáveis e incluindo b₀) e as 'n' camadas de interações (= #variáveis) se distribuem de acordo com as linhas do Triângulo de Pascal
Blaise Pascal (1623-1662), matemático francês, estudou as propriedades de um triângulo numérico infinito formado por números binomiais. Ex: n = 7, k = 3, o número de monômios 35, i.é, a parcela com maior número de monômios é quando k = n/2. Ele pode ter sido "inspirado" pelos números "triangulares" de Pitágoras.
.

      1.5- Regressão linear multivariada, intervalar, várias variáveis dependentes (variada) simultâneas.

B. A variável desfecho é intervalar e as preditoras são categóricas com Y ~ N(Y_{x_i}, X_{Y/X_i})
   1- ANCOVA
www.ufpr.br/~aanjos/CE213/ancova.pdf
ou Análise de Covariância, Stat F, desfecho numérico e preditores categóricos/numéricos...

      A covariável tem que estar correlacionada com a variável resposta para que se possa fazer uso da ANCOVA. como se fosse a média das retas de amostras não-pareadas aos pares...

C. 2 ou mais desfechos: Análises multivariadas (mais de uma variada) com Y_i ~ N(Y_{x_i}, X_{Y/X_i})

      1- MANOVA ou Análise Mutivariada de Variância
https://www.google.com.br/#q=real+statistics
, Stat F, desfecho numérico e preditores categóricos.

      O teste Λ* (lambda) de Wilk é o mais utilizado para testar a hipótese H0 da MANOVA. Outros testes também são utilizados, tais como Pillai, Hotelling-Lawley e o teste de Roy, os quais podem apresentar resultados diferentes para a mesma análise.
D. As variável de desfecho é ordinal, preditoras quaisquer e a incidência (tempo) não é importante
   1- Logit ordenada
E. A variável desfecho é binária, as preditoras quaisquer e a incidência não é importante
Os pressupostos (assumptions) da regressão logística múltipla não requer que as preditoras tenham linearidade, normalidade, homocedasticidade ou escala intervalar ou razão (que pode ser usada).
1º- As preditoras são independentes entre si (não devem vir de medições repetidas ou dados correspondentes).
2º- Pouca ou nenhuma multicolinearidade entre as variáveis independentes.
3º- Linearidade entre as variáveis independentes e os log odds.
4º- n grande. Mínimo 10 casos com o resultado menos frequente para cada variável independente. Ex: para 5 preditoras e com probabilidade esperada do menos frequente é 0,10, então o n mínimo = 500 (10 * 5 / 0,10).

   Regressão Logística múltipla (≥ 2 preditoras) dicotômica ou politômica (>2 classes de desfecho ordinal)...

Pressupostos: 1- ausência de colinearidade, 2- singularidade e ausência de observações aberrantes, 3- Homoscedasticidade, 4- normalidade dos erros e erros independentes, 5- linearidade.
1- Exclusão de estudo de variáveis importantes para a explicação do fenômeno em questão, as quais podem estar correlacionadas com uma variável multicolinear.
1 e 2- No caso da inclusão de variáveis multicolineares ou singulares, perde-se graus de liberdade com diminuição do poder de teste estatístico.
3- a homogeneidade variâncias pode ser reduzida por intermédio da transformação de variáveis que não possuem distribuição normal (e.g., assimetria positiva ou negativa).
4- A violação do pressuposto de normalidade (teorema do limite central) pode ser atenuada por meio do aumento do tamanho da amostra da população pesquisada.
Quando o pressuposto da linearidade é violado, deve-se estar ciente de que o modelo de regressão linear não é o melhor modelo explicativo para o estudo das variáveis envolvidas, e que outros modelos (e.g. o quadrático) devem ser utilizados.
A qualidade do modelo é avaliada pelo valor do coeficiente de determinação, r² e da distribuição dos resíduos. Em outras palavras, o R2 é a quantidade da variância da variável dependente que é explicada conjuntamente pela(s) variável(is) independente(s) e é a estatística mais utilizada para interpretar os resultados da regressão.
Mediação: No caso do uso da regressão para verificar se o relacionamento entre as variáveis é linear ou não, a RM pode ser empregada na identificação de variáveis mediadoras e moderadoras. O conceito de mediação implica suposição de relacionamentos causais entre as variáveis envolvidas. Uma variável mediadora é aquela que, ao estar presente na equação de regressão, diminui a magnitude do relacionamento entre uma variável antecedente e uma variável dependente ou critério. Para melhor ilustrar a definição de uma variável mediadora, podemos analisar o relacionamento entre três variáveis hipotéticas, sendo a variável B a mediadora do relacionamento de A com C (A -> B -> C). Note-se que a relação entre as variáveis A e C ficará enfraquecida na presença da variável B. No caso de uma variável mediadora pura, o relacionamento entre A e C deixa de existir na presença da variável B. A identificação de variáveis mediadoras pode ser feita, por exemplo, com base na observação dos padrões assumidos pelos pesos b das variáveis envolvidas. No caso de uma variável mediadora pura, tem-se um b significativo de A para C, antes da entrada de B na equação. Contudo, uma vez que B é adicionado à equação, o b de B torna-se significativo, enquanto a significância do b de A desaparece. No caso de uma mediação pura, o B captura totalmente a relação entre A e C. Contudo, quando a mediação não é total, pode ainda existir uma relação entre A e C mesmo na presença de B.
Moderação: o conceito de moderação implica influência entre as variáveis e não suposição de causalidade, como no caso da mediação. Para testar a moderação, o pesquisador deve observar a interação entre A e B. Para tal, procurase observar se A é um bom preditor de C. Em caso positivo, verifica-se se A e B predizem C, e se a interação entre A e B, calculada por meio do produto A x B, também prediz C. Caso a interação seja uma preditora estatisticamente significativa de C, diz-se que B é uma variável moderadora. A existência de uma interação entre A e B só é um indicador de moderação quando, adicionada à equação, é preditora do critério. Logo, na moderação, o relacionamento entre A e C depende do valor assumido pela variável B. Vale salientar que, no caso da mediação, a relação entre A e C fica enfraquecida com a entrada de B na equação. No caso do moderador, além da interação A x B tornar-se um preditor significativo, a relação entre A e C poderá aumentar ou diminuir, dependendo do valor de B. Pedhazur (1982) discute detalhadamente a diferença entre moderadores e mediadores. Os trabalhos de Gordon (2000) e Torres (1999) exemplificam o uso da RM na identificação de mediadores e moderadores, respectivamente. O´Connor (1998), comparando testes e programas estatísticos, discutiu detalhadamente procedimentos para identificação de moderadores por meio da regressão múltipla.
Redundância: este fenômeno refere-se à entrada de preditores correlacionados positivamente entre si na equação, acarretando perda de parcimônia na explicação de um critério. A redundância pode ser observada quando os pesos b e os Sr2 (i.e., soma das contribuições únicas de cada variável) para cada preditor são menores do que a correlação ivariada entre cada um desses preditores e o critério. Por exemplo, Abbad (1999) identificou redundância em variáveis preditoras que mantinham fortes correlações (0,70 £ r ³ 0,50) com a variável critério e que, ao entrarem na equação de regressão múltipla, resultaram em coeficientes de correlação múltipla muito menores (e.g., bs variando de 0,11 a 0,23 e Sr2s de 0,07 a 0,14). Este fenômeno reflete que cada preditor explica parte da variância do critério que já foi explicada por outro preditor. Nas Ciências Sociais, em geral (Cohen & Cohen, 1975), grande parte das variáveis são correlacionadas entre si. Na Psicologia Organizacional, em particular, este fato se deve ao uso de múltiplas medidas edundantes (Dunlap & Landis, 1998), estratégia esta considerada ecessária para conferir validade de conteúdo e consistência interna aos instrumentos.
Complementaridade: refere-se a um padrão pouco freqüente de associação entre preditores e critério, em que a soma da contribuição única de um conjunto de preditores excede a soma das contribuições individuais de cada preditor na explicação do critério. Na complementaridade, dois preditores (x1 e x2) devem ter uma alta correlação negativa entre si (Tabachnick & Fidell, 1996), bem como uma correlação bivariada positiva com a variável critério (Keppel, 1991). Em alguns casos, observa-se um decréscimo no valor do b de x1, podendo o mesmo assumir valores negativos quando a variável x2 entra na equação. Nestes casos, os dois preditores (x1 e x2) são considerados interdependentes ou complementares. A conseqüência da complementaridade é uma diminuição no poder estatístico da pesquisa devido à inclusão de duas variáveis que, juntas, acrescentam pouca explicação à variância do critério e, portanto, representam uma diminuição nos graus de liberdade. Um exemplo de complementaridade pode ser observado na pesquisa de Torres (1999), que utilizava, como preditores da preferência por estilos de liderança (y), as variáveis padrão cultural (x1) e país de origem (x2) dos participantes, medidas por escala intervalar de altitude (x1) e dados categóricos (x2). Torres observou uma correlação negativa (rx1x2 = - 0, 11) entre x1 e x2 e correlações positivas entre x1 e y (rx1y = 0, 22) e entre x2 e y (rx2y = 0,29). Na análise de regressão hierárquica, foi observado um forte decréscimo com inversão de sinal do bx1 depois que a variável x2 entrava na equação (de 0,29 para - 0,61). Neste caso, x1 foi caracterizado como uma variável complementar a x2. Complementaridade, na verdade, é um caso especial do fenômeno de supressão, que será descrito a seguir.
Supressão: refere-se à situação na qual uma variável (x1), que mantém uma fraca correlação bivariada com a variável critério (y), entra como preditora na equação de regressão múltipla com um b de sinal oposto ao da correlação bivariada que mantém com y. Trata-se de um fenômeno estatístico raro. A supressão pode ser um sinal de relações complexas entre variáveis preditoras na explicação da variável critério. Esse fenômeno é inicialmente identificado por meio da análise do padrão assumido pelos coeficientes de regressão e de correlação de cada preditor com o critério. Entre os sinais de supressão, deve-se observar, segundo Tabachnick e Fidell, os dois seguintes: (1) o valor absoluto da correlação simples entre as variáveis x1 e y deve ser substancialmente menor que o peso b para a variável supressora x1; e (2) a correlação simples e o peso b dessa variável devem ter sinais opostos. Para Cohen e Cohen (1975), há mais dois indicadores importantes da supressão: (1) a soma das contribuições únicas de cada variável (Sr2) na explicação da variável critério excede o valor assumido por R2; e (2) em alguns casos, o valor de b pode ser maior do que 1. Uma variável supressora é identificada quando se observa que esta variável aumenta a importância de outras variáveis preditoras ao se suprimir parte da variância irrelevante em outros preditores, ou na variável critério (Tabachnick & Fidell, 1996). Um exemplo de supressão pode ser encontrado na pesquisa de Abbad (1999), que investigou o relacionamento entre variáveis organizacionais, características do treinamento, características do treinando, satisfação com treinamento e aprendizagem, com a variável critério impacto do treinamentono trabalho (y). A variável aprendizagem (x1) mantinha uma correlação próxima de zero com o critério (rx1y = 0,002). Na análise de regressão múltipla stepwise, encontrou- se que x1, apesar de não se correlacionar com y, entrou na equação com o peso b de sinal negativo (b = - 0,07), suprimindo a variância de outro(s) preditor(es). Neste caso, observou-se ainda que a soma dos Sr2 era superior ao valor do R2 (Sr2 = 0,94 > R2 = 0,61), caracterizando assim o fenômeno da supressão.

   1- Regressão Logística múltipla dicotômica (padrão)
Diferenciar da Regressão Logística Multinomial (Politômica)
, desfecho binário, p(x) = 1/(1 + e^{-( β₀ + β₁x₁ + β₂x₂ + ... + β_kx_k)})...

      Onde β_i são os parâmetros do modelo, estimados pelo método de máxima verossimilhança. O primeiro teste de significância importante na regressão logística é o teste da razão de verossimilhança, onde a hipótese de que pelo menos um dos parâmetros β_ij é diferente de zero (exceto os interceptos – parâmetros β_i0) é testada.
      É equivalente à Regressão Linear Múltipla para 2 ou mais variáveis preditoras não-paramétricas. Permite que a variável desfecho seja predita a partir de duas ou mais variáveis independentes (covariadas ou determinantes).
Antes de iniciar a análise de regressão múltipla deve-se calcular os coeficientes de correlação de todas as variáveis tomadas aos pares. Se houver duas ou mais variáveis com coeficientes de correlação muito altos (r igual ou superior a 0,95) elas interferirão nos cálculos de regressão múltipla, neste caso deve-se escolher apenas uma delas.
Exemplo
http://www.cultura.ufpa.br/dicas/ - Laboratório de Informática - ICB - UFPA
: H1 - Amostra de 36 hansenianos de sexo masculino há correlação entre a quantidade de uma determinada droga presente no sangue 6 hs após a sua ingestão (variável dependente) com a idade (x1), peso corporal (x2), duração da doença (x3), anos de sulfonoterapia (x4), valor do hematócrito (x5), taxa de hemoglobina (x6), nível de globulinas (x7) e nível de albumina (x8). Conclui-se que o nível sanguíneo da droga após 6 hs de ingestão depende apenas da variável x5 pois entre todos os coeficientes de regressão calculados somente o b (-0,2317) dessa variável é significativamente diferente de zero (pois t(27) = -2,340), que determina um P < 0,05.
   2- Regressão Logística múltipla dicotômica com algoritmos de pesquisa, estratégia de entrada das preditoras.
   Regressão stepwise introduz os preditores passo-a-passo no modelo, começando com a variável independente mais correlacionada com y. Depois do primeiro passo, o algoritmo seleciona a amostra de variáveis remanescentes aquela que dá a maior redução na variâncial residual (não-explicada) da variável dependente, i.e. a variável cuja correlação parcial com y é a maior. O programa então executa um teste-F parcial na entrada para checar se a variável absorverá uma quantidade significante da variação em relação aquela removida por variáveis já na regressão. O usuário pode especificar um valor de F mínimo para a inclusão de qualquer variável; o programa avalia se o valor de F obtido em um dado passo satisfaz o mínimo, e se satisfizer, a variável entrará. Similarmente, o programa decide a cada passo se qualquer variável previamente incluída ainda satisfaz um mínimo (também fornecido pelo usuário) e, caso contrário, remove-se tal variável. Em qualquer passo do procedimento, os resultados são os mesmos de como seriam em uma regressão padrão usando-se um conjunto particular de variáveis; portanto, o passo final de uma regressão stepwise mostra os mesmos coeficientes que uma execução normal usando as variáveis que sobreviveram" ao procedimento stepwise.
É um modelo de regressão que permite selecionar as variáveis independentes por ordem decrescente de intensidade de correlação com a variável dependente. matemáticamente se chega à formula do coeficiente de determinação r2, que mede o componente da regressão que decorre da variação concomitante das variáveis estudadas. (Como já foi visto, a expressão 1 - r2 indica o quanto da variância não depende dessas variáveis em estudo). Nessa análise se ordena as variáveis independentes de acordo com o valor de bSP. E, depois desse ordenamento se faz a análise de regressão simples da variável dependente sobre a independente que apresentou o maior valor de bSP. Finalmente,inicia-se a análise de regressão múltipla introduzindo as outras variáveis independentes pela ordem de grandeza decrescente do valor de bSP. Ao final, verifica-se se o acréscimo de r2 é significativo ou não por meio de um teste t : t = (b / sb). A tabela que se segue mostra o resultado da análise de regressão múltipla escalonada aplicada aos mesmos dados que foram usados para a tabela anterior.

      2.1- Algoritmo de entrada forçada, forced entry, todas as preditoras entram simultâneamente no modelo.
      2.2- Algoritmo de blocos , blockwise ou setwise, preditoras incluidas em blocos com pouca relação entre si...
Visão geral: Logistic Organ Dysfunction System (LODS)
http://statpages.info/lods.html

Fluxograma recursivo de análise de bloco onde o nome de cada bloco é um desfecho.
   Modelo empírico...
Vantagem: 1- Pergunta tudo. 2- Não há necessidade de estratégia de análise. Desvantagem: 1- Grande número de variáveis. Entrada: Das centenas de perguntas o PI elege as "mais importantes" para um determinado DESFECHO e solicita a análise estatística. Saída: Lista de variáveis ordenadas usando o método de Regressão logística múltipla. (empirical model)

   ...diagrama de bloco...
Base: Lista de variáveis ordenadas na etapa "Modelo empírico". Vantagem: 1- Organizar as variáveis em bloco, o nome de cada bloco é um DESFECHO. Desvantagem: 1- Bidirecionamento entre os blocos. Entrada: Conjunto de variáveis afins para ser classificadas (ex: situação sócio-econômica). Saída: Variável classificatória "ponte" (modelo SES) que é a única saída de todo o bloco, é a variável DESFECHO auxiliar. Nova análise... (modelo reducionista ou framework)

   ...modelo clínico epidemiológico...
Vantagem: 1- Total de monômios razoável (variáveis independentes e de seus interrelacionamentos, máximo 2ⁿ), 2- Criação de um banco de análise "desmontável". Desvantagem: 1- Limitação do número de variáveis. Entrada: Determinar o porcentual de explicação do desfecho (ex:70%) e estabelecer a equação da regressão (deduzida a partir do modelo fisiopatológico). O estatístico calcula os coeficientes e o P. (sistema especialista ou relationships model)

      2.3- Algoritmo hierárquico , há uma estratégia prévia (modelo biológico) para a sequência de entrada das preditoras...
Ao contrário da sequencial, aqui a redundância não é bem vinda, já que ela aumentaria a confiabilidade da predição, por manter no modelo de regressão apenas variáveis não-correlacionadas (ou fracamente correlacionadas) entre si. Nos casos dos estudos exploratórios, eliminar a variável redundante pertencente a um mesmo construto subjacente pode gerar um efeito indesejável, pois a variável preditora eliminada da equação pode ser uma das mais importantes na explicação da variável latente que prediz o critério.
A regressão hierárquica é utilizada em estudos confirmatórios, uma vez que este tipo de análise busca a explicação sobre o relacionamento entre variáveis descrito em modelos teóricos consistentes, ou seja, em modelos que apresentam um conjunto de proposições empíricas que já indicam a magnitude e direção da relação entre variáveis, mas que, apesar de já terem sido testados, ainda carecem de validação. Neste caso, a ordem de entrada dos preditores na equação de regressão é definida pelo pesquisador, que baseia sua decisão em teorias ou outras pesquisas relacionadas, como, por exemplo, no caso das pesquisas sobre liderança internacional (Torres, 1999). A exemplo do que ocorre com a regressão stepwise, a regressão hierárquica tem o objetivo de determinar os melhores preditores de um critério. Diversos autores, entre os quais Keppel (1991), ao descreverem a regressão hierárquica como forma de se preparar uma path analysis, sugerem que esta regressão é capaz de identificar relações de causalidade entre variáveis. Contudo, é importante lembrar que, como qualquer outra técnica de análise correlacional, a regressão hierárquica não pode identificar causalidade, mas apenas a relação (ou correlação) entre variáveis. Mesmo quando utilizada para testar modelos teóricos que apenas teoricamente indicam uma relação de causa e efeito entre variáveis, a regressão hierárquica está, no máximo, descrevendo padrões de relacionamento entre variáveis.

      2.4- Algoritmo de exclusão sequencial, backward elimination, descendente ou r² decrescente, critério estatístico...
      No algoritmo de backward elimination - modelo mais complexo para o mais simples.
     1º- Algoritmo de exclusão sequencial para ajuste do modelo completo, com os p preditores;
     2º- Verificar se existe alguma variável cujo coeficiente b_i não difira significativamente de zero. Em caso negativo, passar ao ponto seguinte. Em caso afirmativo, qualquer dessas variáveis é candidata a sair do modelo.
     3º- Se apenas existe uma candidata a sair, excluir essa variável;
     4º- Se existir mais do que uma variável candidata a sair, excluir a variável associada ao maior p-value (isto é, ao valor da estatística t mais próxima de zero). Em qualquer caso, reajustar o modelo após a exclusão da variável e repetir este ponto
     5º- Quando não existirem variáveis candidatas a sair, ou quando sobrar um único preditor, o algoritmo pára. Tem-se então o modelo final.

      2.5- Algoritmo de inclusão sequencial , forward selection, ascendente ou 1-r² crescente...
      No algoritmo de inclusão sequencial (forward selection - modelo mais simples para o complexo) o submodelo inicial é a regressão linear simples com o maior valor de r², ou seja, classifique as variáveis de forma ascendente em função de 1- r² e, sequencialmente, se acrescenta cada variável até a última ou até se alcançar uma condição de paragem e, em cada passo, é necessário ajustar tantos submodelos quantas forem as variáveis ainda não incluídas.
1º- ajustar o modelo de regressão linear simples, com a variável preditora mais fortemente correlacionada com Y (menor 1-r²);
2º- ajustar os submodelos constituídos pela(s) variável(is) preditora(s) já incorporadas, e mais um preditor de entre os que ainda não foram incluídos no submodelo;
3º- verificar se nalgum dos submodelos assim criados, a variável cuja inclusão se ensaiou tem coeficiente b que seja diferente significativamente de zero. Em caso negativo, passar ao ponto seguinte. Em caso afirmativo, qualquer dessas variáveis é candidata a entrar no modelo.
1- se apenas existe uma candidata a entrar, incluir essa variável;
2- se existir mais do que uma variável candidata a entrar, incluir a variável associada ao menor p-value (isto é, ao valor da estatística t mais longe de zero)
3- Reajustar o modelo com a nova variável e repetir este ponto.
4- Quando não existirem variáveis candidatas a entrar, o algoritmo pára. Tem-se então o modelo final.

      2.6- Algoritmo de exclusão/inclusão alternada, Stat F, stepwise selection, passo-a-passo ou escalonada...
A regressão stepwise geralmente é a estratégia escolhida para estudos exploratórios. Quando se está utilizando este tipo de regressão, o pesquisador, desprovido de uma teoria consistente sobre os fenômenos estudados, está interessado apenas em escrever relacionamentos pouco conhecidos entre variáveis, e não em os explicar. Neste tipo de regressão, a seleção da seqüência de entrada dos preditores na equação é feita estatisticamente, sem um modelo teórico consistente a ser seguido. Em estudos exploratórios, o pesquisador elabora um modelo teórico de investigação que inclui hipóteses sobre relacionamentos entre variáveis, mas que ainda não possibilita afirmações consistentes sobre a magnitude ou direção desses relacionamentos. Além disso, este tipo de estudo ainda não encontra apoio empírico às hipóteses a serem testadas.

Proposta de um modelo bioestatístico: Modelo biológico com validade estatística.
Material Característica do modelo biológico: Grafo orientado temporalmente, com os conectivos e-ou (representação enzimática) e os quantificadores aumenta-diminui (status da variável).
Mínímo de duas tabelas com as variáveis do modelo biológico em tempos diferentes (Estudo de Coorte).
Um bloco é definido como qualquer vértice (variável) com suas causas imediatas.
H1: O modelo é (total ou parcialmente) válido estatísticamente. Método 1ª etapa: Exploratória - Aplicar a regressão logística usando toda a tabela.
2ª etapa: Par - Aplicar a regressão logística para cada par (orientado) de variáveis.
F. As variáveis de desfecho são nominais, as preditoras quaisquer, incidência não é importante
   1- Regressão Logística múltipla politômica (multinomial), o desfecho tem 3 ou mais categorias...
Polytomous LR, multiclass LR, softmax regression, multinomial logit, maximum entropy (MaxEnt) classifier, conditional maximum entropy model.

G. A variável de desfecho é binária, as preditoras quaisquer e a incidência é importante
      1.1- A taxa de incidência é constante no tempo (Regressão de Poisson...) (nominal)...

         1.1.1- Há apenas 1 amostra: Regressão de Poisson para uma amostra.
         1.1.2- Há 2 amostras: Teste de comparação de taxa de incidência para 2 amostras.
         1.1.3- Há 3 ou mais amostras: Teste de incidência para taxa de incidência.

      1.2- A taxa de incidência NÃO é constante no tempo (Análise de sobrevivênica...) (tempo até o evento)

         Testes de significância para comparar amostras em análise de sobrevida - Univariada: Teste de log-rank, multivariável: Regressão de Cox...
Curvas de sobrevivência de Kaplan-Meier...
         1.2.1- Comparação de curvas de sobrevivência de 2 amostras com controle limitado de covariâncias:
            1.2.1.1- Teste de log-rank.
            1.2.1.1- Teste de associação linear de Mantel- Haenszel ou Qui-quadrado de Mantel-Haenszel (para 2 amostras independentes).
            1.2.1.1- Conditional proportional hazards regression (para 2 amostras pareadas)...
         1.2.2- Efeito de alguns fatores de risco na sobrevivência: Regressão de Cox de riscos proporcionais (proportional-hazards) para 2 ou mais amostras independentes, Regressão condicional proporcional (conditional proportional hazards regession) para 2 ou mais amostras pareados..       1.1- Fração Atribuível Populacional Agregada (FAPA): Determina a proporção total da incidência do desfecho na população, atribuída à combinação de diversos fatores de exposição.
      1.2- Fração Atribuível Populacional por Componentes (FAPC) - Determina a proporção total da incidência do desfecho na população, atribuída à cada componente de exposição.
      1.3- Fração Atribuível Populacional Ajustada por Estratificação (FAPAE).
      1.4- Fração Atribuível Populacional Ajustada Sequencial (FAPAS).
      1.5- Fração Atribuível Populacional Ajustada pela Média (FAPAM).
H. Outros testes não-paramétricos para 3 ou mais variáveis
      1- Teste de Mantel-Haenszel-Cochran (MHC test)
: Use the MHC test to conditionally test the associations of two binary variables in the presence of a third categorical variable.

      2- Método Solver de aproximação.
      3- Redes Neurais, estima-se a estrutura (aproximada) da função, os parâmetros são pesos.
      4- Série de Fourier (função base senoidal).
      5- Redes RBF com centro e dispersão fixas (gaussiana, multiquadrática, etc).
      6- Perceptron (função-base logística).
F. Técnicas de Agrupamento e Redução de Variáveis
      1- Análise de agrupamentos (AA)...

      Análise de conglomerados ou dendrograma (Cluster Analysis)
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O termo Análise de Conglomerados, Aglomerados (Cluster analysis ) foi utilizado pela primeira vez por Tryon em 1939 e a técnica é de fato um conjunto de técnicas (algoritmos) de classificação. É uma técnica multivariada que tem como objetivo agrupar dados de acordo com as similaridades entre eles. É uma ferramenta estatística com a qual é possível formar grupos com homogeneidade dentro do agrupamento e heterogeneidade entre eles.
Como são determinados os grupos? Existem diferentes métodos para isto, que deverão ser selecionados em função da quantidade de dados disponíveis e do número de agrupamentos a serem formados.
As Hipóteses 9 A amostra deve ser representativa da população; 9 A colinearidade múltipla entre as variáveis deve ser mínima; 9 A amostra deve estar livre de “outliers” e a razão n/k deve ser razoável
Outras nomenclaturas Técnicas similares tem sido independentemente desenvolvidas em vários campos, dando origem a nomes diferentes para esta técnica estatística (p. e. Biologia, Arqueologia, etc.) . Análise de Conglomerados Taxionomia Numérica Análise Q Análise de Tipologia Análise de Classificação
Variações Existem várias técnicas diferentes de aglomeração dependendo do: Procedimento utilizado para medir a similaridade ou distância entre os objetos e do algoritmo de agrupamento empregado. Metodologi a No estágio inicial, quando cada item representa seu próprio grupo, as distâncias entre os itens são definidas pela distância escolhida. No entanto, uma vez que vários itens tenham sido agrupados, como determinar a distância entre os grupos formados? Em outras palavras, é necessário uma regra de agrupamento para determinar quando dois grupos são semelhantes o suficiente para serem transformados em um novo grupo.
Existem várias possibilidades. Por exemplo, se poderia juntar dois grupos quando dois itens quaisquer nos dois grupos estão mais próximos do que a distância de agrupamento. Colocando de outra forma: será utilizado o “vizinho mais próximo” ( nearest neighbors ) entre grupos para determinar as distâncias entre os aglomerados. Este ‘método é denominado de encadeamento simples ( single linkage ). Esta regra produz grupos ligados por itens que estão próximos por acaso. De forma alternativa pode-se utilizar vizinhos que estão o mais distante possível um do outro dando origem ao método de encadeamento completo (complete linkage). Existem muitos métodos de encadeamento semelhantes aos dois propostos.
Passo 1 - A análise inicia com o estabelecimento de uma base de dados nxk;
Passo 2 - Utilizando um dos vários métodos, uma matriz nxn é criada para indicar as similaridades (ou dissimilaridades) de cada objeto para os demais basedo nas “k variáveis
Passo 3 - Utilizando um dos vários algoritmos, os objetos são colocados nos diferentes grupos, onde: os objetos dentro dos grupos são os mais homogêneos possíveis e os grupos são os mais diferentes possíveis entre si.
Medidas de similaridades ou diferenças A análise de aglomerados inicia criando uma matriz que indica a similaridade (ou distância) entre cada par de objetos relativos às k variáveis contidas na base de dados. Existem várias formas de se fazer isto.
      2- Análise de componentes principais (ACP)...
      3- Análise de Fatores (FacAn)...
Utilizar o arquivo "survey.sav" ou o “seven.var” e realizar uma análise de fatores utilizando o SPSS. Definições de Análise de Fatores coassociados ou correlacionados? •A análise fatorial também pode ser usado para reduzir um grande número de variáveis ??relacionadas a um número mais gerenciável, antes de usá-los em outras análises, como regressão múltipla ou análise de variância multivariada. Existem duas abordagens principais à análise fatorial que você vai ver descritos na literatura-exploratória e confirmatória •É uma classe de processos utilizados na redução e sumarização de dados (Malhotra, 2001). Não é um teste de hipótese (ce comparação entre grupos)
•É um nome genérico dado a uma classe de métodos estatísticos multivariados, cujo propósito principal é definir uma estrutura fundamental em uma matriz de dados (Hairetal., 1995).

O termo “análise de fatores” foi introduzido por Thurstone em 1931.
1) Identificar dimensões latentes, isto é, fatores que justifiquem as correlações observadas entre as variáveis
2) Substituir o conjunto original de variáveis (em geral grande) e correlacionadas por um conjunto menor de variáveis sem correlação ou com baixa correlação.
3) Objetivo Global: parcimônia, isto é, redução da complexidade.

Objetivos Examinar a “interdependência” entre todas as variáveis (correlações).
Reduzir diversas variáveis, provavelmente “correlacionadas”, a uma quantidade menor e mais facilmente “gerenciável”.
Analisar a estrutura das correlações entre um grande número de variáveis, definindo um conjunto menor de dimensões básicas comuns, chamadas fatores.

Aplicações Identificar fatores que expliquem as correlações entre um conjunto de variáveis;
Identificar, em um conjunto maior de variáveis, um conjunto menor que se destaque para uso em uma futura análise multivariada;
Sumarizar os dados, para obter uma melhor percepção do objeto de pesquisa.

Termos básicos Comunalidade: representada por h2, é a proporção da variância de uma variável que é compartilhada com os fatores comuns na análise de fatores.
Autovalor: é a variância padronizada associada com um particular fator. A soma dos autovalores não pode exceder o número de variáveis (itens), uma vez que cada item contribui com a unidade na soma das variâncias.
Fator: uma combinação linear das variáveis (itens) no sentido de uma regressão, onde o escore total do teste é a variável dependente e os itens são as variáveis independentes. Carga do fator:a carga de um fator expressa a correlação do fator com a variável. O quadrado da carga do fator indica a proporção da variância partilhada entre a variável e o fator.
Escore do fator: Medida composta criada para cada observação em cada fator da análise. Os pesos dos fatores são utilizados em conjunto com os valores originais da variável para calcular cada um dos escores. Os escores dos fatores são padronizados da mesma forma que o escore z.
Matriz padrão dos fatores: uma matriz contendo os coeficientes ou cargas utilizadas para expressar um item em termos do fator. Ela coincide com a matriz de estrutura se os fatores são ortogonais (não-correlacionados). Matriz estrutura dos fatores: uma matriz contendo as correlações dos itens com cada um dos fatores.
Solução rotada dos fatores: uma solução, onde os eixos são girados com o propósito de mostrar um padrão mais visível das cargas dos fatores. Gráfico de declividade (Scree plot): um diagrama mostrando os autovalores de cada fator. Teste de esfericidade de Bartlett: Verifica se todas as correlações dentro da matriz de correlações são significativas.
Matriz de correlação anti-imagem: é a matriz das correlações parciais entre as variáveis (itens) após a análise de fatores. Representa o grau com que os fatores “explicam”um ao outro nos resultados. Análise de factores comum: modelo de fatores na qual os fatores são baseados numa matriz de correlação reduzida, isto é, as comunalidades são inseridas na diagonal da matriz de correlação e a extração dos fatores é baseada somente na variância comum excluindo as variâncias específicas e do erro.
Variância do erro: variância de uma variável devido a erros na coleta ou medida dos valores. Medida de adequação da amostra (MAS - Measure of Sampling Adequacy): medida calculada tanto para a matriz de correlação quanto para cada variável individualmente avaliando a adequação da aplicação da análise de fatores. Valores maiores do que 0,5 tanto para a matriz como um todo quanto para as variáveis indivualmente indicam que o método é adequado.

Etapas
1. Formular o problema
2. Montar matriz de correlações
3. Validar a Análise de Fatores
4. Determinar o método
5. Determinar Número de Fatores
6. Rotacionar Fatores
7. Interpretar Fatores
8. Atribuir Nomes aos Fatores

----- Análise de variáveis amostradas de forma não aleatória -----

1- Árvore de Decisão

r1 e r2 são as regras (filtros) de decisão da árvore.

- CART (Classification - categóricas - and Regression - intervalares - Tree)...

Classification and regression trees (CART) are a non-parametric decision tree learning technique that produces either classification or regression trees, depending on whether the dependent variable is categorical or numeric, respectively.
A árvore de decisão (binária, mas pode ter mais divisões) consiste numa hierarquia de nós internos e externos que são conectados por ramos (Na teoria dos grafos: nó = vértice, ramos = aresta). O nó interno, também conhecido como nó decisório ou nó intermediário, é a unidade de tomada de decisão que avalia através de teste lógico qual será o próximo nó descendente ou filho. O nó externo (não tem descendente), também conhecido como folha ou nó terminal, está associado a um rótulo ou a um valor. Em geral, o procedimento de uma árvore de decisão é: aplicase a regra a um conjunto de dados ao nó inicial (ou nó raiz; nó interno), dependendo do resultado do teste lógico, a árvore ramifica-se para um dos nós filhos e este procedimento é repetido recursivamente até que um nó terminal seja alcançado. Quando os dados satisfazem o teste lógico do nó intermediário seguem para o nó esquerdo (VERDADEIRO) se não para o nó direito (FALSO).
O aprendizado de uma árvore de decisão é supervisionado, ou seja, o método aproxima funções-alvo de valor discreto, na qual a função aprendida é representada por uma árvore de decisão. As árvores treinadas podem ser representadas como um conjunto de regras “Se-Então” para melhoria da Árvore de Decisão compreensão e interpretação. Árvores de decisão usadas para problemas de classificação são chamadas de Árvores de Classificação. Nas árvores de classificação, cada nó terminal ou folha contém um rótulo que indica a classe predita para um determinado conjunto de dados. Neste tipo de árvore pode existir dois ou mais nós terminais com a mesma classe. Para ilustrar uma árvore de classificação, encontra-se na Figura 2 a representação gráfica deste tipo de árvore para duas classes. Figura 2 - Árvore de Classificação Na árvore de classificação ilustrada na figura anterior as classes formadas são Classe 1, representada pelos nós 3 e 5 , e a Classe 2, representada pelo nó 4. As regras obtidas após a árvore treinada são: Regra para Classe 1 Se (x1 > 0.7) ou Se (x1 = 0.7 e x2 > 0.5) Regra para Classe 2 Se (x1= 0.7 e x2= 0.5) Árvores de decisão usadas para problemas de regressão são chamadas de Árvores de Regressão. Nas árvores de regressão, cada nó terminal ou folha contém uma constante (geralmente, uma média) ou uma equação para o valor previsto de um determinado conjunto de dados. Empregando a mesma representação gráfica da árvore de classificação (Figura 2), temos para cada nó terminal um modelo linear. -ésimo parâmetro ß do modelo linear do k-ésimo nó; ruído do modelo linear do k-ésimo nó; x : dados de entrada Y : dados de saída Existem dois aspectos que merecem destaques em uma árvore de decisão, o crescimento e a poda, que serão abordados na seção 3.1. Por fim, um dos mais conhecidos e mais completos algoritmos de árvore de decisão é o CART “Classification and Regression Tree” - que foi proposto por Breiman (1984). Como este algoritmo será empregado em uma das etapas da modelagem proposta nesta tese, é conveniente realizar uma breve descrição do CART na seção 3.2. Árvore de Decisão 25 3.1. Crescimento e Poda As árvores de decisão são construídas usando um algoritmo de partição recursiva. Este algoritmo constrói uma árvore por divisões recursivas binárias que começa no nó raiz e desce até os nós folhas. Têm-se dois fatores principais no algoritmo de partição: a forma para selecionar uma divisão para cada nó intermediário (Crescimento) e uma regra para determinar quando um nó é terminal (Poda). O problema chave, no algoritmo de partição recursiva, é a confiabilidade as estimativas do erro usado para selecionar as divisões. As escolhas da divisão em níveis maiores da árvore produzem, freqüentemente, estatísticas não- confiáveis apesar da estimativa do “erro de resubstituição” (estimativa obtida com os dados de treinamento usado durante o crescimento da árvore) manter-se decrescendo. Com isto, a precisão das estimativas do erro é fortemente dependente da qualidade da amostra. Como o algoritmo divide recursivamente o conjunto de dados de treinamento original, as divisões estão sendo avaliadas com amostras cada vez menores. Isto significa que as estimativas de erro têm menos confiabilidade à medida que crescemos a árvore. Com intuito de minimizar este problema e evitar o superajustamento dos dados de treinamento com árvores muito complexas, tem-se a estratégia conhecida como método de podagem. Há dois procedimentos alternativos para podagem da árvore de decisão: a pós-podagem e a pré-podagem. A pós-podagem é o processo pelo qual uma árvore é crescida ao tamanho máximo e então métodos de evolução confiáveis são usados para selecionar a árvore podada de tamanho certo desde o modelo inicial. Este algoritmo considera a podagem como um processo de “dois-estágios”. No primeiro estágio, um conjunto de árvores podadas de Tmax (árvore de tamanho máximo) é gerado de acordo com algum critério, enquanto no segundo estágio uma dessas árvores é selecionada como o modelo final. Os métodos de pós-podagem podem ser computacionalmente ineficientes, no sentido que não é usual achar domínios onde uma árvore extremamente grande (por exemplo, com milhares de nós) é pós-podada em poucas centenas de nós - isto parece um desperdício computacional. Uma alternativa de parada no Árvore de Decisão procedimento de crescimento da árvore é interromper o crescimento tão logo a divisão seja considerada não-confiável. Isto é conhecido como a pré-podagem da árvore. O método de pré-podagem usa um procedimento “passo único”. Este algoritmo corre através dos nós da árvore ou “de baixo para cima” ou “de cima para baixo”, decidindo para cada nó, se é para podar de acordo com algum critério de avaliação. Os métodos de pré-podagem também apresentam um ponto negativo no seu algoritmo. A pré-podagem corre o risco de selecionar uma árvore subótima ao interromper o crescimento da árvore (Breiman, 1984). Breiman (1984) descreveu duas alternativas para a seleção da árvore final baseada nas estimativas dos erros obtidos. Ou seleciona a árvore com menor erro estimado ou escolhe a menor árvore na seqüência, cujo erro estimado está dentro do intervalo: Errb + SE(Errb), onde Errb é o menor erro estimado e SE(Errb ) é o erro padrão desta estimativa. Mas tarde, este método será conhecido como a regra “1-SE”. Para maiores detalhes sobre essas alternativas consultar Breiman (1984) ou Zighed (2000). Destaca-se que para árvores de classificação a podagem é em função da complexidade do custo mínimo (erro de resubstituição) e para árvores de regressão, a podagem é em função da complexidade do erro mínimo. 3.2. CART A metodologia do modelo CART (Breiman, 1984) é tecnicamente conhecida como partição recursiva binária. O processo é binário porque os nós pais são sempre divididos exatamente em dois nós filhos e recursivamente porque o processo pode ser repetido tratando cada nó filho como um nó pai. As principais características do CART são: definir o conjunto de regras para dividir cada nó da árvore; decidir quando a árvore está completa; associar cada nó terminal a uma classe ou a um valor preditivo no caso da regressão. Para dividir um nó em dois nós filhos, o algoritmo sempre faz perguntas que tem apenas um “sim” ou um “não” como resposta. Por exemplo, as questões podem ser: a idade é <=55? ou o crédito é <=600? Árvore de Decisão 27 O próximo passo é ordenar cada regra de divisão com base no critério de qualidade de divisão. O critério padrão usado para classificação é o Índice de Gini que tem por base o cálculo da entropia (Zighed, 2000 e Lamas, 2000)(2) onde p é a frequência encontrada de cada classe j, e o processo de divisão da árvore de regressão procura minimizar R(T). (3) sendo t o identificador de cada nó da árvore e R(T) o valor esperado da soma dos erros quadráticos da regressão utilizando uma constante como modelo preditivo (a média). Como pode-se notar na equação 3, o CART não apresenta na árvore de regressão, um modelo linear em seus nós terminais e sim uma média. Uma vez encontrada a melhor divisão, repete-se o processo de procura para cada nó filho, continuamente até que a divisão seja impossível ou interrompida. No procedimento do CART, ao invés de determinar quando um nó é terminal ou não, continua-se proporcionando o crescimento da árvore até que não seja mais possível fazê-lo, como por exemplo ao atingir um número mínimo de dados na amostra. Depois que todos os nós terminais foram encontrados, é definida a árvore como maximal, ou seja, a árvore de tamanho máximo. Após encontrar a árvore maximal, começa-se a podar alguns ramos da mesma árvore de modo a aumentar o poder de generalização. Algumas sub-árvores, obtidas através da poda de alguns ramos desta árvore, são examinadas testando taxas de erros e a melhor delas é escolhida.

   2- Teste do χ² de Pearson para testes diagnósticos: Estudo metodológico sobre acurácia de testes diagnósticos...
   3- Curvas ROC: Estudo metodológico sobre acurácia de testes diagnósticos...
   4- Estatística Kappa (K): Estudo metodológico sobre a de concordância entre diferentes observadores...
   5- Análise de correspondência.

6- Ordenação (ordenar em gradientes)...

"Talvez a melhor resposta não esteja em estatísticas melhores, mas em um melhor pensamento ou elaboração sobre a natureza do problema." Kromrey e Foster-Johnson (1999).
"Se você acha que o texto que você escreveu está maravilhoso, rasgue e jogue fora, porque com certeza ele não presta!" Oscar Wilde (1854-1900), escritor irlandês.
"Espere pelo pior e prepare-se para uma surpresa!" a. (1954-amanhã), professor brasileiro.