Exercícios 16/6/2025
Dead line - Prazo : 5/7/2025
Enviar por Favor para o E-mail da Disciplina:
gestao.estat.cert@gmail.com
Coloque seu nome e o número do exercício.
Cada resolução terá um vídeo em YouTube que colocaremos nesta lista de exercícios. Exemplo da primeira reunião do grupo de educação continuada em IA e CD
https://youtu.be/o9Q2aZgv8dE
Exercício 1. Regressão Linear Simples em SAS (proc reg e robustreg). Dead Line: 2/6/2025
Onde tiver sinais de interrogação colocar os últimos dígitos do seu RG
Link de YouTube:
Machine Learning Supervisionado para Predição - Introdução: Regressão Linear Simples
Exemplo: Propaganda - Vendas
X:Propaganda | Y:Vendas |
30 | 4?? |
21 | 3?? |
35 | 520 |
42 | 490 |
37 | 470 |
2 | 210 |
8 | 195 |
17 | 270 |
35 | 400 |
25 | 480 |
3 800 (===> Outlier)
data propag;
input X Y;
cards;
30 4??
21 3??
35 520
42 490
37 470
2 210
8 195
17 270
35 400
25 480
3 800
;
proc print;
run;
/* Y: Vendas e X:Propaganda */
proc robustreg;
model Y = X;
run;
Resultados e D.
A análise com proc reg no sas, deu resultado errado, aconteceria mesma coisa no Excel e L.O. Calq. Assim nunca devemos utilizar prog reg ou as analises do Excel o LOCalq.
Com essa análise errada falaríamos para a CEO do Mag. Luiza (Dona Luiza) que a propaganda não está funcionando.
Agora analisando os dados com a procedure Robustreg, concluímos que a propaganda influencia a venda com 99,99% de confiança.
Arquivo de resultado e discussão em Power Point (pdf):
Resultados para download
Exercício Pratico 2. Regressão Múltipla em Excel ou LOffice Calc, SAS (proc reg e robustreg). Dead Line: 9/6
Onde tiver sinais de interrogação colocar os últimos dígitos do seu RG
Link de YouTube:
Bu_Unit | Sales | Price | Qu_level | Claims | NPS | PV | Satisfac |
1 | 65,98108 | 97,8022 | 96,77419 | 13,58025 | 98,9011 | 19 | 97,82??? |
2 | 15,8371 | 98,9011 | 98,3871 | 12,34568 | 97,8022 | 29 | 98,91??? |
3 | 8,885232 | 100 | 100 | 11,11111 | 100 | 21 | 100 |
4 | 12,46401 | 98,9011 | 95,16129 | 12,34568 | 96,7033 | 94 | 96,73913 |
5 | 80,66639 | 21,97802 | 19,35484 | 100 | 2,197802 | 34 | 21,73913 |
6 | 32,16783 | 23,07692 | 22,58065 | 97,53086 | 3,296703 | 64 | 23,91304 |
7 | 23,44714 | 24,17582 | 24,19355 | 96,2963 | 2,747253 | 61 | 25 |
8 | 89,96298 | 24,17582 | 19,35484 | 95,06173 | 2,197802 | 25 | 26,08696 |
9 | 31,4274 | 64,83516 | 56,45161 | 50,61728 | 65,93407 | 10 | 65,21739 |
10 | 11,22995 | 65,93407 | 51,6129 | 49,38272 | 71,42857 | 3 | 66,30435 |
11 | 77,45784 | 70,32967 | 53,22581 | 46,91358 | 63,73626 | 56 | 68,47826 |
12 | 23,89963 | 68,13187 | 51,6129 | 45,67901 | 61,53846 | 4 | 67,3913 |
13 | 7,40436 | 86,81319 | 80,64516 | 25,92593 | 90,10989 | 90 | 86,95652 |
14 | 0,287947 | 87,91209 | 79,03226 | 24,69136 | 85,71429 | 48 | 85,86957 |
15 | 83,42246 | 87,91209 | 77,41935 | 22,22222 | 90,10989 | 78 | 88,04348 |
16 | 100 | 86,81319 | 75,80645 | 25,92593 | 84,61538 | 88 | 84,78261 |
| | | | | | | |
Outlier
3 | 8,885232 | 100 | 100 | 11,11111 | 100 | 21 | 20 |
Data Customer;
Input Bu_Unit Sales Price Qu_level Claims NPS Satisfac;
Cards;
1 65.98107775 97.8021978 96.77419355 13.58024691 98.9010989 97.82???
2 15.83710407 98.9010989 98.38709677 12.34567901 97.8021978 98.91???
3 8.885232415 100 100 11.11111111 100 100
4 12.46400658 98.9010989 95.16129032 12.34567901 96.7032967 96.73913043
5 80.66639243 21.97802198 19.35483871 100 2.197802198 21.73913043
6 32.16783217 23.07692308 22.58064516 97.5308642 3.296703297 23.91304348
7 23.44714109 24.17582418 24.19354839 96.2962963 2.747252747 25
8 89.9629782 24.17582418 19.35483871 95.0617284 2.197802198 26.08695652
9 31.42739613 64.83516484 56.4516129 50.61728395 65.93406593 65.2173913
10 11.22994652 65.93406593 51.61290323 49.38271605 71.42857143 66.30434783
11 77.45783628 70.32967033 53.22580645 46.91358025 63.73626374 68.47826087
12 23.89962978 68.13186813 51.61290323 45.67901235 61.53846154 67.39130435
13 7.404360346 86.81318681 80.64516129 25.92592593 90.10989011 86.95652174
14 0.287947347 87.91208791 79.03225806 24.69135802 85.71428571 85.86956522
15 83.42245989 87.91208791 77.41935484 22.22222222 90.10989011 88.04347826
16 100 86.81318681 75.80645161 25.92592593 84.61538462 84.7826087
17 65.98108 97.8022 96.77419 13.58025 98.9011 19 15
proc print; run;
/* Input Bu_Unit Sales Price Qu_level Claims NPS Satisfac;
proc reg;
model Satisfac = Sales Price Qu_level Claims NPS;
Run;
*/
/* Agora Ciencia de Dados Robusta */
proc robustreg;
model Satisfac = Sales Price Qu_level Claims NPS / diagnostics;
Run;
Arquivo de resultado e discussão em Power Point (pdf):
Resultados para download
Exercício Pratico 3. Cuidado na regressão com estratificações
Regist | Repet | Sexo | Sexo | Colest | P_Sang |
1 | 1 | F | 1 | 18? | 12,0 |
2 | 2 | F | 1 | 185 | 12,1 |
3 | 3 | F | 1 | 183 | 12,3 |
4 | 4 | F | 1 | 182 | 12,2 |
5 | 5 | F | 1 | 181 | 12,4 |
6 | 6 | F | 1 | 183 | 12,5 |
7 | 7 | F | 1 | 184 | 12,6 |
8 | 8 | F | 1 | 185 | 12,1 |
9 | 9 | F | 1 | 184 | 12,2 |
10 | 10 | F | 1 | 183 | 12,3 |
11 | 1 | M | 0 | 187 | 12,9 |
12 | 2 | M | 0 | 188 | 12,9 |
13 | 3 | M | 0 | 188 | 13,0 |
14 | 4 | M | 0 | 187 | 13,0 |
15 | 5 | M | 0 | 186 | 13,1 |
16 | 6 | M | 0 | 187 | 13,2 |
17 | 7 | M | 0 | 189 | 13,5 |
18 | 8 | M | 0 | 191 | 13,8 |
19 | 9 | M | 0 | 188 | 13,0 |
20 | 10 | M | 0 | 188 | 13,0 |
Exercício Pratico 4 Optativo. ML Não S para Agrupamentos e Distancias Multivariados. Rodar os dados procurando outliers e variáveis não significativas. Dead Line: 16/6.
Onde tiver sinais de interrogação colocar os últimos dígitos do seu RG
Dados: Qualidade de Vida de Diferentes Categorias
Categ | IMC | Movim | Kcal |
AT | 20,2 | 53,7 | 32?? |
AT | 21,3 | 54,8 | 31?? |
AT | 19,3 | 49,6 | 2800 |
AT | 21,1 | 52,3 | 3300 |
AT | 26,1 | 52,3 | 3300 |
SEM | 22,4 | 14,9 | 2600 |
SEM | 21,9 | 17,8 | 2700 |
SEM | 23,8 | 18,6 | 3200 |
SEM | 24,1 | 15,1 | 3300 |
SE | 27,3 | 2,5 | 2700 |
SE | 23,4 | 4,3 | 2300 |
SE | 25,2 | 2,3 | 2600 |
SE | 26,4 | 2,6 | 3200 |
PR | 26,2 | 4,1 | 2600 |
PR | 24,2 | 2,1 | 2700 |
PR | 25,4 | 1,9 | 2650 |
PR | 19,3 | 70 | 2650 |
| | | |
Exercício Prático 4.A
Elaborar um gráfico tridimensional equalizado para ordem de grandeza. Gerar dados para o SAS.
Exercício Prático 4.B
Fazer box plot em SAS para diagnosticar outliers e variáveis não significativas.
Exercício Prático 4.C.
Rodar IA Não Supervisionado para Distancias e Agrupamentos Multivariados - Cluster Analysis.
Interpretar os resultados
Exercício Prático 4.D.
Optativo. Rodar com outlier e variável não significativa.
Exercício Prático 5
ML Não S para Agrupamentos e Distancias Multivariados
Cluster e Dendrograma de todas as cidades, programa SAS: ver banco de dados
data cidades;
input Cid_reg $ IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Comp;
cards;
Pir_SE 0.785 1.14 0.54 0.695 0.598 0.759
SC_SE 0.805 1.08 0.686 0.653 0.564 0.788
SJ_SE 0.797 1.17 0.613 0.73 0.597 0.769
MC_SE 0.77 0.65 0.481 0.651 0.549 0.666
Ron_CO 0.755 0.84 0.452 0.509 0.567 0.651
Ana_CO 0.737 0.79 0.481 0.645 0.562 0.708
CG_NE 0.72 0.63 0.458 0.565 0.571 0.59
Pet_NE 0.697 0.61 0.419 0.43 0.528 0.57
RB_Norte 0.727 0.74 0.342 0.47 0.486 0.503
BV_Norte 0.752 0.79 0.338 0.458 0.502 0.585
Mar_S 0.808 1.2 0.652 0.753 0.611 0.765
CS_S 0.75 0.95 0.446 0.715 0.559 0.715
;
proc print;
run;
proc cluster data=cidades outtree = arvore method = average;
var IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Comp;
id Cid_reg;
run;
PROC TREE DATA = arvore;
RUN;
Exercício Prático 6
ML Não Superv. para Redução de Dimenção
data cidades;
input Cid_reg $ IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Comp;
cards;
Pir_SE 0.785 1.14 0.54 0.695 0.598 0.7??
SC_SE 0.805 1.08 0.686 0.653 0.564 0.788
SJ_SE 0.797 1.17 0.613 0.73 0.597 0.769
MC_SE 0.77 0.65 0.481 0.651 0.549 0.666
Ron_CO 0.755 0.84 0.452 0.509 0.567 0.651
Aná_CO 0.737 0.79 0.481 0.645 0.562 0.708
CG_NE 0.72 0.63 0.458 0.565 0.571 0.59
Pet_NE 0.697 0.61 0.419 0.43 0.528 0.57
RB_Norte 0.727 0.74 0.342 0.47 0.486 0.503
BV_Norte 0.752 0.79 0.338 0.458 0.502 0.585
Mar_S 0.808 1.2 0.652 0.753 0.611 0.765
CS_S 0.75 0.95 0.446 0.715 0.559 0.715
;
proc prinqual plots=(MDPref)
/* project onto Prin1 and Prin2 */
; /* use COV scaling */
transform identity(IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Comp); /* identity transform */
id Cid_reg;
ods select MDPrefPlot;
run;