segunda-feira, 29 de maio de 2023

Aula 5/6

 Aula 5/6 

Pauta:

- Video semana passada:

Assunto: Renato MLS Predição Exemplo com dados de Internet. Anova e Teste de Comparaçoes Multiplas de Tukey.

Data: 29/5/2023

https://youtu.be/YnIvQSwkIcs

- Rodar PCA - Biplot

 IA Indutiva Não Supervisionada para Redução de Dimensão – PCA e Biplot







- Mostrar Exercícios, fechamos lista hoje!

- Prova valendo 10% da nota, quando?

 


segunda-feira, 22 de maio de 2023

Aula 29/5/2023

 Pauta:

- Cientista de Dados Municipal RJ, minha filha, Robson (CENA), Gustavo (Harvard), Antônio (China) etc.

- Laboratório de IA – CD e Gestão 4.0 e 5.0

       Campus da USP de Piracicaba

              - América Latina, próximo passo

- Renato apresenta Ex. 1B



=================================

Seleção de Variáveis Preditoras para IA

=================================


- Refazer ANOVA agregar Tukey

data selecao;

input Categ $ IMC Movim KCal Colesterol Ac_Urico;

Cards;

ATL 20.9 60.9 3259 114.59 5.59

ATL 21.3 54.8 3100 127.35 3.28

ATL 19.3 49.6 2800 121.09 6.96

ATL 21.1 52.3 3300 111.84 4.06

ATL 20.3 52.2 2950 124.22 5.12

ATL 20.2 51.0 3050 116.47 5.51

SEMI 22.4 14.9 2600 145.61 3.96

SEMI 21.9 17.8 2700 140.91 4.11

SEMI 23.8 18.6 3200 149.90 6.98

SEMI 24.1 15.1 3300 149.33 3.21

SEMI 22.2 16.4 2650 143.26 4.04

SEMI 22.9 18.2 2950 145.41 5.55

SEDE 27.3 2.5 2700 213.90 5.03

SEDE 23.4 4.3 2300 155.78 5.39

SEDE 25.2 2.3 2600 198.01 5.61

SEDE 26.4 2.6 3200 219.55 4.74

SEDE 25.4 3.4 2500 184.84 5.21

SEDE 24.3 3.3 2450 176.90 5.50

PROF 26.2 4.1 2600 177.66 3.11

PROF 24.2 2.1 2700 218.84 5.09

PROF 25.4 1.9 2650 205.04 3.96

PROF 25.2 3.1 2650 198.25 4.10

PROF 24.8 2.0 2675 211.94 4.53

;

proc print;

run;

/*input Categ $ IMC Movim KCal

 Colesterol Ac_Urico;proc anova;*/

proc anova;

   class Categ;

   model IMC Movim KCal Colesterol

         Ac_Urico = Categ;

run;



- Fazer RobustANOVA

Modelo de Programa Robust ANOVA:
Programa de RANOVA com OUTLIER (Suco de Manga com 200 mg/l de NaOH)


data SUCOS;
input suco $ NaOH;
cards;
Maca    8
Maca    11
Maca    10
Maca    8
Maca    9
Uva 8
Uva 6
Uva 7
Uva 9
Laranja 5
Laranja 4
Laranja 5
Manga   200
Manga   1
Manga   1
;
proc npar1way data=SUCOS wilcoxon dscf;
 class suco;
 var NaOH;
run;





=================================

Testar o Resultado da IA

=================================


- Fazer MANOVA

 Program to do MANOVA

data imc_dat;

input cat $ imc corr kcal;
cards;
DADOS
;
proc print;
run;
proc glm;
 class cat;
 model imc corr kcal  = cat;
 contrast " Atl e Semiat Vs Seden e Prof"  cat 1 -1 -1 1;
 contrast " Professor Vs Sedentario" cat  0 1 -1 0;
 contrast " Atleta Vs Semiatleta" cat -1 0 0 1;
 manova h=_all_ / printe printh;
 contrast " Atl e Semiat Vs Seden e Prof"  cat 1 -1 -1 1;
 contrast " Professor Vs Sedentario" cat  0 1 -1 0;
 contrast " Atleta Vs Semiatleta" cat -1 0 0 1;
run;

Elaboração de Contraste:



AT PR  SE SEM
1  -1 -1   1 Atleta e Semiatleta Vs Professor e Sedentario
0   1 -1   0 Professor Vs Sedentario
1   0  0  -1 Atleta Vs Semiatleta
3  -1 -1  -1  Atleta Vs Outras Categorias





Aula 22/5/2023

 Aula

- Link para a gente formar um grupo de Whatsapp

      https://chat.whatsapp.com/F3da9cl4eIeLyYkVTnmudN

MANOVA

 Program to do MANOVA

data imc_dat;

input cat $ imc corr kcal;
cards;
DADOS
;
proc print;
run;
proc glm;
 class cat;
 model imc corr kcal  = cat;
 contrast " Atl e Semiat Vs Seden e Prof"  cat 1 -1 -1 1;
 contrast " Professor Vs Sedentario" cat  0 1 -1 0;
 contrast " Atleta Vs Semiatleta" cat -1 0 0 1;
 manova h=_all_ / printe printh;
 contrast " Atl e Semiat Vs Seden e Prof"  cat 1 -1 -1 1;
 contrast " Professor Vs Sedentario" cat  0 1 -1 0;
 contrast " Atleta Vs Semiatleta" cat -1 0 0 1;
run;

Elaboração de Contraste:



AT PR  SE SEM
1  -1 -1   1 Atleta e Semiatleta Vs Professor e Sedentario
0   1 -1   0 Professor Vs Sedentario
1   0  0  -1 Atleta Vs Semiatleta
3  -1 -1  -1  Atleta Vs Outras Categorias




ML Não Superv. para Clasificação ANOVA RANOVA

ML Não Superv. para Clasificação



Com 5 Variáveis Preditoras


Vamos Aumentar para Aproximar de


 Situações Reais





 Calcular as medias aritmeticas em planilha eletronica (Excel ou LO Calc)


Categ IMC Movim KCal Colesterol Ac_Urico

ATL 20.? 60.? 32?? 11?.?? 5.??

ATL 21.3 54.8 3100 127.35 3.28

ATL 19.3 49.6 2800 121.09 6.96

ATL 21.1 52.3 3300 111.84 4.06

ATL 20.3 52.2 2950 124.22 5.12

ATL 20.2 51.0 3050 116.47 5.51

SEMI 22.4 14.9 2600 145.61 3.96

SEMI 21.9 17.8 2700 140.91 4.11

SEMI 23.8 18.6 3200 149.90 6.98

SEMI 24.1 15.1 3300 149.33 3.21

SEMI 22.2 16.4 2650 143.26 4.04

SEMI 22.9 18.2 2950 145.41 5.55

SEDE 27.3 2.5 2700 213.90 5.03

SEDE 23.4 4.3 2300 155.78 5.39

SEDE 25.2 2.3 2600 198.01 5.61

SEDE 26.4 2.6 3200 219.55 4.74

SEDE 25.4 3.4 2500 184.84 5.21

SEDE 24.3 3.3 2450 176.90 5.50

PROF 26.2 4.1 2600 177.66 3.11

PROF 24.2 2.1 2700 218.84 5.09

PROF 25.4 1.9 2650 205.04 3.96

PROF 25.2 3.1 2650 198.25 4.10

PROF 24.8 2.0 2675 211.94 4.53


Sequencia para Ler do Blog para LO Calc

 



Graficar todas as variaveis equalizadas



Elaborar Dendrograma de Cluster Analysis

Modelo de Programa:

proc cluster outtree = Dendrog method = average;
var BMI Movm kcal;
id Categ;
run;
PROC TREE DATA = Dendrog;

RUN; 


Fazer ANOVA e RANOVA para seleção de variaveis preditoras para a IA

Modelo de Programa ANOVA:

Proc ANOVA;
     Class Categ;
      Model IMC Movim Kcal = Categ;
     Means Categ / Duncan Lines;
Run;

Modelo de Programa Robust ANOVA:
Programa de RANOVA com OUTLIER (Suco de Manga com 200 mg/l de NaOH)


data SUCOS;
input suco $ NaOH;
cards;
Maca    8
Maca    11
Maca    10
Maca    8
Maca    9
Uva 8
Uva 6
Uva 7
Uva 9
Laranja 5
Laranja 4
Laranja 5
Manga   200
Manga   1
Manga   1
;
proc npar1way data=SUCOS wilcoxon dscf;
 class suco;
 var NaOH;
run;




domingo, 14 de maio de 2023

ML Não Supervisionado para Clasifiação - Cluster Analysis - ANOVA and MANOVA

 ML Não Supervisionado para Clasifiação - Cluster Analysis - ANOVA and MANOVA


UML - Unsupervised Machine Learning: Machine Learning Não Supervisionado


Dados:

    - Categoria: Variável Classificatória

    - IMC: Primeira Variável Preditora - Indice de Massa Corporal

    - Movim: Segunda Variável Preditora - Movimentação caminhando ou correndo por semana (Km)

    - KCal: Quilocalorias consumidas por dia


Categ

IMC

Movim

KCal

ATL

20,?

60,?

32??

ATL

21,3

54,8

3100

ATL

19,3

49,6

2800

ATL

21,1

52,3

3300

SEMI

22,4

14,9

2600

SEMI

21,9

17,8

2700

SEMI

23,8

18,6

3200

SEMI

24,1

15,1

3300

SEDE

27,3

2,5

2700

SEDE

23,4

4,3

2300

SEDE

25,2

2,3

2600

SEDE

26,4

2,6

3200

PROF

26,2

4,1

2600

PROF

24,2

2,1

2700

PROF

25,4

1,9

2650


Obter as Médias por Data Crunching - Pivot Table


Categor

IMC

Movim

Kcal

ATL

20,65

54,4

3114,75

PROF

25,27

2,7

2650

SEDE

25,58

2,925

2700

SEMI

23,05

16,6

2950




\t para trocar o tab por espaço em Linux

    - No Editor

Caractere de Tabulação em Word (Windows)



Obtaining Cluster Analysis

data  People;
input Categ $ IMC Movim Kcal;
cards;

DADOS TABELA DINÁMICA

;
proc cluster outtree = Dendrog method = average;
var IMC Movim Kcal;
id Categ;
run;
PROC TREE DATA = Dendrog;

RUN; 







Program to do ANOVA


data People;

/* BMI: body mass index --> Índice de M. Corporal = Peso / (Altura * Altura)
     Movm: Movement (Km por semana)
     KCal : Kilocalories (ingeridas por dia)
     ATL: Athletes
     SEMI: Semi-athletes
     SEDE: Sedentary
     PROF: Professor

*/
input Categ $ IMC Movim Kcal;
cards;
ATL 20.2 60.7 3200
ATL 21.3 54.8 3100
ATL 19.3 49.6 2800
ATL 21.1 52.3 3300
SEMI 22.4 14.9 2600
SEMI 21.9 17.8 2700
SEMI 23.8 18.6 3200
SEMI 24.1 15.1 3300
SEDE  27.3 2.5 2700
SEDE 23.4 4.3 2300
SEDE  25.2 2.3 2600
SEDE  26.4 2.6 3200
PROF 26.2 4.1 2600
PROF 24.2 2.1 2700
PROF 25.4 1.9 2650
;
Proc ANOVA;
     Class Categ;
      Model IMC Movim Kcal = Categ;
     Means Categ / Duncan Lines;
Run;




Arithmetic Averages of Categories

Categ IMC Movim Kcal

AT 20.5 54.4 3100

PR 25.3 2.7 2650

SE 25.6 2.9 2700

SEM 23.1 16.6 2950













Program to do MANOVA

data imc_dat;

input cat $ imc corr kcal;
cards;
ATL 20.2 60.7 3200
ATL 21.3 54.8 3100
ATL 19.3 49.6 2800
ATL 21.1 52.3 3300
SEMI 22.4 14.9 2600
SEMI 21.9 17.8 2700
SEMI 23.8 18.6 3200
SEMI 24.1 15.1 3300
SEDE  27.3 2.5 2700
SEDE 23.4 4.3 2300
SEDE  25.2 2.3 2600
SEDE  26.4 2.6 3200
PROF 26.2 4.1 2600
PROF 24.2 2.1 2700
PROF 25.4 1.9 2650
;
proc print;
run;
proc glm;
 class cat;
 model imc corr kcal  = cat;
 contrast " Atl e Semiat Vs Seden e Prof"  cat 1 -1 -1 1;
 contrast " Professor Vs Sedentario" cat  0 1 -1 0;
 contrast " Atleta Vs Semiatleta" cat -1 0 0 1;
 manova h=_all_ / printe printh;
 contrast " Atl e Semiat Vs Seden e Prof"  cat 1 -1 -1 1;
 contrast " Professor Vs Sedentario" cat  0 1 -1 0;
 contrast " Atleta Vs Semiatleta" cat -1 0 0 1;
run;

Elaboração de Contraste:



AT PR  SE SEM
1  -1 -1   1 Atleta e Semiatleta Vs Professor e Sedentario
0   1 -1   0 Professor Vs Sedentario
1   0  0  -1 Atleta Vs Semiatleta
3  -1 -1  -1  Atleta Vs Outras Categorias

Aula 15/5/2023

 Pauta:


- Videos Anteriores:


Assunto: Tipos de Machine Learning e IA.  Machine Learning Supervisionado para Predição 

Data: 8/5/2023

https://youtu.be/ZggTLe059Sw


Assunto: Tipos de Machine Learning e IA.  Machine Learning Supervisionado para Predição 

Data: 24/4/2023

https://youtu.be/G-USW-cbmNg


Link Site com todas as videoaulas:

https://sites.google.com/view/lce137-usp-gabriel


 - Por favor os Exercícios enviá-los para o E-Mail de Exercícios, não para meu E-Mail da USP


- Exercicio 1 A:

    - Arquivo Weka, gravar (Linux e Windows) e rodar


- ML Não Supervisionado para Clasifiação - Cluster Analysis - ANOVA and MANOVA