segunda-feira, 30 de junho de 2025

IA Indutiva Não Supervisionada para Agrupamentos e Distancias Multivariados

  IA Indutiva Não Supervisionada para Agrupamentos e Distancias Multivariados

Colocar todo em Power Point e deixar arquivo para download

 Nome: Clus_Com_Out_Sign_Preditoras_2025_05_12

DadosQualidade de Vida de Diferentes Categorias

Categ

IMC

Movim

Kcal

AT

20,2

53,7

3200

AT

21,3

54,8

3100

AT

19,3

49,6

2800

AT

21,1

52,3

3300

AT

26,1

52,3

3300

SEM

22,4

14,9

2600

SEM

21,9

17,8

2700

SEM

23,8

18,6

3200

SEM

24,1

15,1

3300

SE

27,3

2,5

2700

SE

23,4

4,3

2300

SE

25,2

2,3

2600

SE

26,4

2,6

3200

PR

26,2

4,1

2600

PR

24,2

2,1

2700

PR

25,4

1,9

2650

PR

19,3

70

2650



Gafico Equalizado

Dados Equalizados

Programa SAS para ANOVA - Box PLot e Robust ANOVA
data QV;
input Categ $ IMC Movim Kcal;
datalines;
AT 20.2 53.7 3200
AT 21.3 54.8 3100
AT 19.3 49.6 2800
AT 21.1 52.3 3300
AT 26.1 52.3 3300
SEM 22.4 14.9 2600
SEM 21.9 17.8 2700
SEM 23.8 18.6 3200
SEM 24.1 15.1 3300
SE 27.3 2.5 2700
SE 23.4 4.3 2300
SE 25.2 2.3 2600
SE 26.4 2.6 3200
PR 26.2 4.1 2600
PR 24.2 2.1 2700
PR 25.4 1.9 2650
PR 19.3 70 2650
;
proc print; run;
/* input Categ $ IMC Movim Kcal; */
/*
title "ANOVA e Box and Wisker PLot";
proc anova;
   class Categ;
   model IMC Movim Kcal = Categ;
   means Categ / tukey lines;
run;
*/
title "Robust ANOVA"; 
/* Modelo de Programa para RANOVA para Benchmarking

RANOVA - Kruskal Wallis
*/
proc npar1way data=QV wilcoxon dscf;
 class Categ;
 var IMC Movim Kcal;
run;


IA Não Supervisionada para Agrupamentos e Distâncias Multivariados sem Ajuste de Outliers

data qv;

input cat $ imc mov kcal;

cards;

dados da tabela dinámica

;

proc print; run;

proc cluster outtree = arvore method = average;

var imc mov kcal;

id cat;

run;

PROC TREE DATA = arvore;

RUN;

Resultado de IAI com Outliers



Análise Outliers
Proc ANOVA em SAS

data imc_dat;

input cat $ imc corr kcal;

cards;

Tabela do Excel

;

proc print;

run;

/*

input cat $ imc corr kcal;  */

proc anova;

    class cat;

    model imc corr kcal = cat;

    means cat / tukey lines;

run;

 

Checar outliers (resíduos) em Excel para IMC ver congruência


Categ

Corrida

Erros

AT

53,7

6,76

AT

54,8

0,86

AT

49,6

-4,34

AT

52,3

-1,64

AT

52,3

-1,64

SEM

14,9

-1,7

SEM

17,8

1,2

SEM

18,6

2

SEM

15,1

-1,5

SE

2,5

-0,425

SE

4,3

1,375

SE

2,3

-0,625

SE

2,6

-0,325

PR

4,1

-15,425

PR

2,1

-17,425

PR

1,9

-17,625

PR

70

50,475

PR

2,2

-17,325


Eliminar Outliers e Rodar Novamente IAI

data medias;

input cat $ IMC Mov KCal;

cards;

AT 20.475 52.6 31

PR 25.26666667 2.7 26.625

SE 25.575 2.925 27

SEM 23.05 16.6 29.5

;

proc print;

run;

/* input cat $ IMC Mov KCal; */

proc cluster outtree = arvore method = average;

var IMC Mov KCal ;

id cat;

run;

PROC TREE DATA = arvore;

RUN;

Testar por RANOVA significância de variáveis preditoras

Eliminar v. preditoras não significativas e Rodar Novamente IAI

 


Modelo de Programa para RANOVA para Benchmarking

RANOVA - Kruskal Wallis

proc npar1way data=SUCOS wilcoxon dscf;

 class suco;
 var NaOH;

run;

segunda-feira, 23 de junho de 2025

Horários de Consulta do Gabriel Link e Whatsapp

   Horários de Consulta do Gabriel Link e Whatsapp

No Link:

https://meet.google.com/xgf-jman-pyv

 


Programação semanal em:

https://sites.google.com/usp.br/horarios-consulta-gabriel

  

·     Terças das 21:30 às 22:30 (Grupo de Educação Continuada em IA e CD)

·     Sextas das 15:30 às 16:30 

·     Sábados das 18 às 19 


No Link:

https://meet.google.com/xgf-jman-pyv

 

WhatsApp 019 - 988 - 627 - 438

Aula 23/6/2025

 Aula 23/6/2025

Pauta:

- Robson avaliação

- Laboratórios de IA - CD e Computação

        - Todas as terças das 14:30 às 17 - Internet e Presencial ( Lab. A do LCE )

        - Analise de trabalhos dos alunos de graduação e pós graduação da ESALQ e CENA

                - Se confidencial em outro horário com contrato de sigilo, grátis para alunos e remunerado para empresas ou a risco compartilhado (sociedade com a USP)

                - Atividades de formação: Escolinha de Python, base matemática e estatística para CD e IA

               - Go Conqr apresentar

- Pós Graduação Profissionalizante

      - Go Conqr ou ppt

 

- Orientações:

        - TCC Ex. Luiz Zaia - TCC defesa 5/7/2025 das 15 às 17 por Interent link do horario de consulta, Robson Campos, Gabriel Ferreira, Fabio Tagliaferro, Gabriela Trivelato, Nelson Franco Cerino, Azulai (Alexandre)

        - Todos os estágios de todos os cursos da ESALQ

        - Pós Graduação Profissionalizante

        - Estatística IA e CD - M D PD

        - Ecologia Aplicada (Do artificial e do natural) - M D PD

        - Administração (dupla diplomação USP – Univ. da China) - M

 

- Aula 30/6 simularemos trabalho dos laboratórios com dados de alunos ou de trabalhos publicados. Ou analisaremos exemplo de Gemini, fatorial 2 x 2 com Interação (ver postagem especifica com o exemplo).

- Se problemas com exercícios podem entrar em horários de consulta e laboratórios. Posso retificar nota e frequência até agosto. 2 HC = 1 Presença.

- Avaliação de disciplina hoje ou semana que vem.

Exemplo Modelo Fatorial 2 x 2 com Interação - Gemini

 

ID_Equipe

Treinamento

CRM

Produtividade (Chamadas/Hora)

1

Padrão

Básico

10.3

2

Padrão

Básico

9.8

...

...

...

...

13

Padrão

Básico

10.5

Méd. A1B1

 

 

10.1

14

Padrão

Avançado

12.1

15

Padrão

Avançado

11.9

...

...

...

...

26

Padrão

Avançado

12.3

Méd. A1B2

 

 

12.0

27

Intensivo

Básico

13.2

28

Intensivo

Básico

12.8

...

...

...

...

39

Intensivo

Básico

13.0

Méd. A2B1

 

 

13.1

40

Intensivo

Avançado

19.5

41

Intensivo

Avançado

20.3

...

...

...

...

52

Intensivo

Avançado

20.1

Méd. A2B2

 

 

19.9

 

 

 

 



SAS

exemplo numerico de fatorial com dois fatores minimo 50 observaçoes banco de dados area administraçao

Certo! Vamos criar um exemplo numérico detalhado de um experimento fatorial com dois fatores, usando um cenário da área de Administração e com um mínimo de 50 observações.

Cenário: Impacto na Produtividade de Equipes de Atendimento

Imagine uma empresa de call center que deseja otimizar a produtividade de suas equipes de atendimento (medida pelo número de chamadas resolvidas por hora). Eles decidem testar o impacto de duas variáveis principais:

1.            Fator A: Treinamento dos Atendentes

o             Nível 1 (A1): Treinamento Padrão (treinamento inicial básico)

o             Nível 2 (A2): Treinamento Intensivo (treinamento padrão + módulos avançados de resolução de problemas e empatia)

2.            Fator B: Software de CRM Utilizado

o             Nível 1 (B1): CRM Básico (funcionalidades essenciais)

o             Nível 2 (B2): CRM Avançado (integração com IA para sugestão de respostas e histórico completo do cliente)

A empresa suspeita que possa haver uma interação entre o tipo de treinamento e o software de CRM. Por exemplo, o CRM Avançado pode ter um impacto muito maior na produtividade quando os atendentes recebem treinamento intensivo, enquanto com o treinamento padrão, a diferença entre os CRMs pode ser menor.

________________________________________

Estrutura do Experimento e Coleta de Dados (Exemplo Numérico)

Vamos simular a coleta de dados, onde temos 4 combinações possíveis (A1B1, A1B2, A2B1, A2B2). Para ter no mínimo 50 observações, alocaremos 13 equipes para cada uma das 4 combinações, totalizando 52 observações.

Cada observação representa a produtividade média (chamadas resolvidas/hora) de uma equipe durante um período de teste, sob uma das quatro condições.

Valores Base (Médias Hipotéticas para simular a interação):

             A1B1 (Treinamento Padrão + CRM Básico): Média de 10 chamadas/hora

             A1B2 (Treinamento Padrão + CRM Avançado): Média de 12 chamadas/hora (pequeno ganho com CRM avançado sem treinamento intensivo)

             A2B1 (Treinamento Intensivo + CRM Básico): Média de 13 chamadas/hora (ganho com treinamento intensivo mesmo com CRM básico)

             A2B2 (Treinamento Intensivo + CRM Avançado): Média de 20 chamadas/hora (grande ganho, indicando forte interação: o treinamento intensivo potencializa o CRM avançado)

Para cada uma das 13 observações em cada grupo, adicionaremos uma pequena variação aleatória (ruído) para simular dados reais.

________________________________________

Exemplo Numérico Detalhado do Banco de Dados

Abaixo, um extrato do banco de dados simulado com 52 observações.

ID_Equipe          Treinamento     CRM      Produtividade (Chamadas/Hora)

1             Padrão Básico   10.3

2             Padrão Básico   9.8

...            ...            ...            ...

13           Padrão Básico   10.5

Méd. A1B1                                         10.1

14           Padrão Avançado            12.1

15           Padrão Avançado            11.9

...            ...            ...            ...

26           Padrão Avançado            12.3

Méd. A1B2                                         12.0

27           Intensivo             Básico   13.2

28           Intensivo             Básico   12.8

...            ...            ...            ...

39           Intensivo             Básico   13.0

Méd. A2B1                                         13.1

40           Intensivo             Avançado           19.5

41           Intensivo             Avançado           20.3

...            ...            ...            ...

52           Intensivo             Avançado           20.1

Méd. A2B2                                         19.9

Exportar para as Planilhas

(Nota: Os valores acima são exemplos ilustrativos para demonstrar as médias e a variação. Em um banco de dados real, os valores exatos de cada observação seriam únicos.)

________________________________________

Análise e Interpretação

Ao analisar este conjunto de dados com uma ANOVA fatorial (como faríamos em SAS com PROC GLM), esperaríamos os seguintes resultados, confirmando a interação:

1.            Efeito Principal do Treinamento: Provavelmente significativo, indicando que o Treinamento Intensivo, em média, leva a uma maior produtividade do que o Treinamento Padrão.

2.            Efeito Principal do CRM: Provavelmente significativo, indicando que o CRM Avançado, em média, leva a uma maior produtividade do que o CRM Básico.

3.            Efeito de Interação (Treinamento * CRM): Este seria o resultado mais importante e, neste cenário, altamente significativo. Isso significa que o efeito do tipo de treinamento na produtividade não é o mesmo para ambos os CRMs, e vice-versa.

O que a interação numérica nos diz:

             Com Treinamento Padrão, a troca de CRM Básico para Avançado gera um pequeno aumento de produtividade (de 10.1 para 12.0, um ganho de 1.9).

             Com Treinamento Intensivo, a troca de CRM Básico para Avançado gera um aumento muito maior de produtividade (de 13.1 para 19.9, um ganho de 6.8!).

Essa interação é crucial para a tomada de decisão gerencial. A empresa aprenderia que investir apenas no CRM Avançado sem um treinamento adequado (Intensivo) não traria o retorno máximo esperado. A combinação de Treinamento Intensivo e CRM Avançado é a estratégia que maximiza a produtividade, atingindo quase o dobro das chamadas resolvidas por hora em comparação com a estratégia Padrão/Básico.

Este exemplo ilustra como a análise fatorial com interação pode fornecer insights mais profundos do que analisar cada fator isoladamente, levando a decisões administrativas mais eficazes.