sábado, 31 de maio de 2025

ML Não Super. para Redução de Dimenção - Cidades Economia

ML Não Super. para Redução de Dimenção 


data cidades;

input Cid_reg $ IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Comp;

cards;

Pir_SE 0.785 1.14 0.54 0.695 0.598 0.7??

SC_SE 0.805 1.08 0.686 0.653 0.564 0.788

SJ_SE 0.797 1.17 0.613 0.73 0.597 0.769

MC_SE 0.77 0.65 0.481 0.651 0.549 0.666

Ron_CO 0.755 0.84 0.452 0.509 0.567 0.651

Aná_CO 0.737 0.79 0.481 0.645 0.562 0.708

CG_NE 0.72 0.63 0.458 0.565 0.571 0.59

Pet_NE 0.697 0.61 0.419 0.43 0.528 0.57

RB_Norte 0.727 0.74 0.342 0.47 0.486 0.503

BV_Norte 0.752 0.79 0.338 0.458 0.502 0.585

Mar_S 0.808 1.2 0.652 0.753 0.611 0.765

CS_S 0.75 0.95 0.446 0.715 0.559 0.715

;

proc prinqual plots=(MDPref)

                 /* project onto Prin1 and Prin2 */

              ; /* use COV scaling */

   transform identity(IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Comp);  /* identity transform */

   id Cid_reg;

   ods select MDPrefPlot;

run;

segunda-feira, 26 de maio de 2025

Regressão Múltipla Convencional e Robusta - Base de MLS para Predição

 Regressão Múltipla Convencional e Robusta - Base de MLS para Predição 


Bu_Unit

Sales

Price

Qu_level

Claims

NPS

PV

Satisfac

1

65,98108

97,8022

96,77419

13,58025

98,9011

19

97,82609

2

15,8371

98,9011

98,3871

12,34568

97,8022

29

98,91304

3

8,885232

100

100

11,11111

100

21

100

4

12,46401

98,9011

95,16129

12,34568

96,7033

94

96,73913

5

80,66639

21,97802

19,35484

100

2,197802

34

21,73913

6

32,16783

23,07692

22,58065

97,53086

3,296703

64

23,91304

7

23,44714

24,17582

24,19355

96,2963

2,747253

61

25

8

89,96298

24,17582

19,35484

95,06173

2,197802

25

26,08696

9

31,4274

64,83516

56,45161

50,61728

65,93407

10

65,21739

10

11,22995

65,93407

51,6129

49,38272

71,42857

3

66,30435

11

77,45784

70,32967

53,22581

46,91358

63,73626

56

68,47826

12

23,89963

68,13187

51,6129

45,67901

61,53846

4

67,3913

13

7,40436

86,81319

80,64516

25,92593

90,10989

90

86,95652

14

0,287947

87,91209

79,03226

24,69136

85,71429

48

85,86957

15

83,42246

87,91209

77,41935

22,22222

90,10989

78

88,04348

16

100

86,81319

75,80645

25,92593

84,61538

88

84,78261

 

 

 

 

 

média=

724

 


Outlier

17

65,98108

97,8022

96,77419

13,58025

98,9011

19

15

 




SAS Program


Data Customer;

Input Bu_Unit  Sales  Price Qu_level Claims NPS Satisfac;

Cards;

1 65.98107775 97.8021978 96.77419355 13.58024691 98.9010989 97.82608696

2 15.83710407 98.9010989 98.38709677 12.34567901 97.8021978 98.91304348

3 8.885232415 100 100 11.11111111 100 100

4 12.46400658 98.9010989 95.16129032 12.34567901 96.7032967 96.73913043

5 80.66639243 21.97802198 19.35483871 100 2.197802198 21.73913043

6 32.16783217 23.07692308 22.58064516 97.5308642 3.296703297 23.91304348

7 23.44714109 24.17582418 24.19354839 96.2962963 2.747252747 25

8 89.9629782 24.17582418 19.35483871 95.0617284 2.197802198 26.08695652

9 31.42739613 64.83516484 56.4516129 50.61728395 65.93406593 65.2173913

10 11.22994652 65.93406593 51.61290323 49.38271605 71.42857143 66.30434783

11 77.45783628 70.32967033 53.22580645 46.91358025 63.73626374 68.47826087

12 23.89962978 68.13186813 51.61290323 45.67901235 61.53846154 67.39130435

13 7.404360346 86.81318681 80.64516129 25.92592593 90.10989011 86.95652174

14 0.287947347 87.91208791 79.03225806 24.69135802 85.71428571 85.86956522

15 83.42245989 87.91208791 77.41935484 22.22222222 90.10989011 88.04347826

16 100 86.81318681 75.80645161 25.92592593 84.61538462 84.7826087

17 65.98108 97.8022 96.77419 13.58025 98.9011 19 15

;

proc print; run;

/* Input Bu_Unit  Sales  Price Qu_level Claims NPS Satisfac; */

proc reg;

   model  Satisfac = Sales  Price Qu_level Claims NPS;

Run;

/* Agora Ciencia de Dados Robusta */

/*

proc robustreg;

model Satisfac = Sales  Price Qu_level Claims NPS  / diagnostics;

Run;

*/


Rodando no Weka com o Outlier

Arquivo Weka com Outlier


Linear Regression Model

Satisf =

      0.7931 * Niv_Qual +

     15.28  



MLS Causas - Efeito ou Regressão ou Predição - Weka


Download Arquivo para Weka


@RELATION Customer

@ATTRIBUTE U_Neg REAL

@ATTRIBUTE Vendas REAL

@ATTRIBUTE Preco REAL

@ATTRIBUTE Niv_Qual REAL

@ATTRIBUTE Reclama REAL

@ATTRIBUTE NPS REAL

@ATTRIBUTE Satisf REAL

@DATA

1,65.98107775,97.8021978,96.77419355,13.58024691,98.9010989,97.82608696

2,15.83710407,98.9010989,98.38709677,12.34567901,97.8021978,98.91304348

3,8.885232415,100,100,11.11111111,100,100

4,12.46400658,98.9010989,95.16129032,12.34567901,96.7032967,96.73913043

5,80.66639243,21.97802198,19.35483871,100,2.197802198,21.73913043

6,32.16783217,23.07692308,22.58064516,97.5308642,3.296703297,23.91304348

7,23.44714109,24.17582418,24.19354839,96.2962963,2.747252747,25

8,89.9629782,24.17582418,19.35483871,95.0617284,2.197802198,26.08695652

9,31.42739613,64.83516484,56.4516129,50.61728395,65.93406593,65.2173913

10,11.22994652,65.93406593,51.61290323,49.38271605,71.42857143,66.30434783

11,77.45783628,70.32967033,53.22580645,46.91358025,63.73626374,68.47826087

12,23.89962978,68.13186813,51.61290323,45.67901235,61.53846154,67.39130435

13,7.404360346,86.81318681,80.64516129,25.92592593,90.10989011,86.95652174

14,0.287947347,87.91208791,79.03225806,24.69135802,85.71428571,85.86956522

15,83.42245989,87.91208791,77.41935484,22.22222222,90.10989011,88.04347826

16,100,86.81318681,75.80645161,25.92592593,84.61538462,84.7826087







Linear Regression Model


Satisf =


      0.2481 * Preco +

      0.1063 * Niv_Qual +

     -0.4275 * Reclama +

      0.1135 * NPS +

     57.4038



IA Indutiva Não Supervisionada (26/5/2025) para Agrupamentos e Distancias Multivariados

  IA Indutiva Não Supervisionada para Agrupamentos e Distancias Multivariados

Colocar todo em Power Point e deixar arquivo para download

 Nome: Clus_Com_Out_Sign_Preditoras_2025_05_12

DadosQualidade de Vida de Diferentes Categorias

Categ

IMC

Movim

Kcal

AT

20,2

53,7

3200

AT

21,3

54,8

3100

AT

19,3

49,6

2800

AT

21,1

52,3

3300

AT

26,1

52,3

3300

SEM

22,4

14,9

2600

SEM

21,9

17,8

2700

SEM

23,8

18,6

3200

SEM

24,1

15,1

3300

SE

27,3

2,5

2700

SE

23,4

4,3

2300

SE

25,2

2,3

2600

SE

26,4

2,6

3200

PR

26,2

4,1

2600

PR

24,2

2,1

2700

PR

25,4

1,9

2650

PR

19,3

70

2650



Gafico Equalizado

Dados Equalizados

IA Não Supervisionada para Agrupamentos e Distâncias Multivariados sem Ajuste de Outliers

data qv;

input cat $ imc mov kcal;

cards;

dados da tabela dinámica

;

proc print; run;

proc cluster outtree = arvore method = average;

var imc mov kcal;

id cat;

run;

PROC TREE DATA = arvore;

RUN;

Resultado de IAI com Outliers



Análise Outliers
Proc ANOVA em SAS

data imc_dat;

input cat $ imc corr kcal;

cards;

Tabela do Excel

;

proc print;

run;

/*

input cat $ imc corr kcal;  */

proc anova;

    class cat;

    model imc corr kcal = cat;

    means cat / tukey lines;

run;



Programa completo

data box;

input Categ $ IMC Movim Kcal;

cards;

AT 20.2 53.7 3200

AT 21.3 54.8 3100

AT 19.3 49.6 2800

AT 21.1 52.3 3300

AT 26.1 52.3 3300

SEM 22.4 14.9 2600

SEM 21.9 17.8 2700

SEM 23.8 18.6 3200

SEM 24.1 15.1 3300

SE 27.3 2.5 2700

SE 23.4 4.3 2300

SE 25.2 2.3 2600

SE 26.4 2.6 3200

PR 26.2 4.1 2600

PR 24.2 2.1 2700

PR 25.4 1.9 2650

PR 19.3 70 2650

;

/* input Categ $ IMC Movim Kcal; */

proc anova;

   class Categ;

   model IMC Movim Kcal = Categ;

   means Categ / tukey lines;

run;

   

 

Checar outliers (resíduos) em Excel para IMC ver congruência


Categ

Corrida

Erros

AT

53,7

6,76

AT

54,8

0,86

AT

49,6

-4,34

AT

52,3

-1,64

AT

52,3

-1,64

SEM

14,9

-1,7

SEM

17,8

1,2

SEM

18,6

2

SEM

15,1

-1,5

SE

2,5

-0,425

SE

4,3

1,375

SE

2,3

-0,625

SE

2,6

-0,325

PR

4,1

-15,425

PR

2,1

-17,425

PR

1,9

-17,625

PR

70

50,475

PR

2,2

-17,325


Eliminar Outliers e Rodar Novamente IAI

data medias;

input cat $ IMC Mov KCal;

cards;

AT 20.475 52.6 31

PR 25.26666667 2.7 26.625

SE 25.575 2.925 27

SEM 23.05 16.6 29.5

;

proc print;

run;

/* input cat $ IMC Mov KCal; */

proc cluster outtree = arvore method = average;

var IMC Mov KCal ;

id cat;

run;

PROC TREE DATA = arvore;

RUN;

Testar por RANOVA significância de variáveis preditoras

Eliminar v. preditoras não significativas e Rodar Novamente IAI

 Rodar novamente Cluster para ver diferença com presença de outliers e variável não significativa.

 




Modelo de Programa para RANOVA para Benchmarking

RANOVA - Kruskal Wallis

proc npar1way data=SUCOS wilcoxon dscf;

 class suco;
 var NaOH;

run;