Exercícios
Enviar por Favor para o E-mail da Disciplina:
gestao.estat.cert@gmail.com
Coloque seu nome e o número do exercício.
Cada resolução terá um vídeo em YouTube que colocaremos nesta lista de
exercícios. Exemplo da primeira reunião do grupo de educação continuada em IA e
CD
Exercício 1. Regressão Linear Simples em SAS (proc reg e
robustreg). Dead Line: 2/6/2025
Onde tiver sinais de
interrogação colocar os últimos dígitos do seu RG
Link de YouTube:
Machine Learning
Supervisionado para Predição - Introdução: Regressão Linear Simples
Exemplo:
Propaganda - Vendas
X:Propaganda |
Y:Vendas |
30 |
4?? |
21 |
3?? |
35 |
520 |
42 |
490 |
37 |
470 |
2 |
210 |
8 |
195 |
17 |
270 |
35 |
400 |
25 |
480 |
3 800 (===> Outlier)
data
propag;
input X Y;
cards;
30 4??
21 3??
35 520
42 490
37 470
2 210
8 195
17 270
35 400
25 480
3 800
;
proc print;
run;
/* Y: Vendas e
X:Propaganda */
proc robustreg;
model Y = X;
run;
Resultados e D.
A análise com proc reg no sas, deu resultado
errado, aconteceria mesma coisa no Excel e L.O. Calq. Assim nunca devemos
utilizar prog reg ou as analises do Excel o LOCalq.
Com essa análise errada falaríamos para a CEO do
Mag. Luiza (Dona Luiza) que a propaganda não está funcionando.
Agora analisando os dados com a procedure
Robustreg, concluímos que a propaganda influencia a venda com 99,99% de
confiança.
Arquivo de resultado e discussão em Power Point
(pdf):
Exercício Pratico 2.
Regressão Múltipla em Excel ou LOffice Calc, SAS (proc reg e robustreg) e
Weka. Dead Line: 9/6
Onde tiver sinais de
interrogação colocar os últimos dígitos do seu RG
Link de YouTube:
Bu_Unit |
Sales |
Price |
Qu_level |
Claims |
NPS |
PV |
Satisfac |
1 |
65,98108 |
97,8022 |
96,77419 |
13,58025 |
98,9011 |
19 |
97,82??? |
2 |
15,8371 |
98,9011 |
98,3871 |
12,34568 |
97,8022 |
29 |
98,91??? |
3 |
8,885232 |
100 |
100 |
11,11111 |
100 |
21 |
100 |
4 |
12,46401 |
98,9011 |
95,16129 |
12,34568 |
96,7033 |
94 |
96,73913 |
5 |
80,66639 |
21,97802 |
19,35484 |
100 |
2,197802 |
34 |
21,73913 |
6 |
32,16783 |
23,07692 |
22,58065 |
97,53086 |
3,296703 |
64 |
23,91304 |
7 |
23,44714 |
24,17582 |
24,19355 |
96,2963 |
2,747253 |
61 |
25 |
8 |
89,96298 |
24,17582 |
19,35484 |
95,06173 |
2,197802 |
25 |
26,08696 |
9 |
31,4274 |
64,83516 |
56,45161 |
50,61728 |
65,93407 |
10 |
65,21739 |
10 |
11,22995 |
65,93407 |
51,6129 |
49,38272 |
71,42857 |
3 |
66,30435 |
11 |
77,45784 |
70,32967 |
53,22581 |
46,91358 |
63,73626 |
56 |
68,47826 |
12 |
23,89963 |
68,13187 |
51,6129 |
45,67901 |
61,53846 |
4 |
67,3913 |
13 |
7,40436 |
86,81319 |
80,64516 |
25,92593 |
90,10989 |
90 |
86,95652 |
14 |
0,287947 |
87,91209 |
79,03226 |
24,69136 |
85,71429 |
48 |
85,86957 |
15 |
83,42246 |
87,91209 |
77,41935 |
22,22222 |
90,10989 |
78 |
88,04348 |
16 |
100 |
86,81319 |
75,80645 |
25,92593 |
84,61538 |
88 |
84,78261 |
|
|
|
|
|
|
Outlier
3 |
8,885232 |
100 |
100 |
11,11111 |
100 |
21 |
20 |
Data Customer;
Input Bu_Unit Sales Price Qu_level
Claims NPS Satisfac;
Cards;
1 65.98107775 97.8021978 96.77419355 13.58024691
98.9010989 97.82???
2 15.83710407 98.9010989 98.38709677 12.34567901
97.8021978 98.91???
3 8.885232415 100 100 11.11111111 100 100
4 12.46400658 98.9010989 95.16129032 12.34567901
96.7032967 96.73913043
5 80.66639243 21.97802198 19.35483871 100
2.197802198 21.73913043
6 32.16783217 23.07692308 22.58064516 97.5308642
3.296703297 23.91304348
7 23.44714109 24.17582418 24.19354839 96.2962963
2.747252747 25
8 89.9629782 24.17582418 19.35483871 95.0617284
2.197802198 26.08695652
9 31.42739613 64.83516484 56.4516129 50.61728395
65.93406593 65.2173913
10 11.22994652 65.93406593 51.61290323 49.38271605 71.42857143
66.30434783
11 77.45783628 70.32967033 53.22580645 46.91358025
63.73626374 68.47826087
12 23.89962978 68.13186813 51.61290323 45.67901235
61.53846154 67.39130435
13 7.404360346 86.81318681 80.64516129 25.92592593
90.10989011 86.95652174
14 0.287947347 87.91208791 79.03225806 24.69135802
85.71428571 85.86956522
15 83.42245989 87.91208791 77.41935484 22.22222222
90.10989011 88.04347826
16 100 86.81318681 75.80645161 25.92592593
84.61538462 84.7826087
17 65.98108 97.8022 96.77419 13.58025 98.9011 19 15
proc print; run;
/* Input Bu_Unit Sales Price Qu_level
Claims NPS Satisfac;
proc reg;
model Satisfac = Sales
Price Qu_level Claims NPS;
Run;
*/
/* Agora Ciencia de Dados Robusta */
proc robustreg;
model Satisfac = Sales Price Qu_level Claims
NPS / diagnostics;
Run;
Arquivo de resultado e discussão em Power Point
(pdf):
Exercício Pratico 3. Cuidado na regressão com estratificações
Regist |
Repet |
Sexo |
Sexo |
Colest |
P_Sang |
1 |
1 |
F |
1 |
18? |
12,0 |
2 |
2 |
F |
1 |
185 |
12,1 |
3 |
3 |
F |
1 |
183 |
12,3 |
4 |
4 |
F |
1 |
182 |
12,2 |
5 |
5 |
F |
1 |
181 |
12,4 |
6 |
6 |
F |
1 |
183 |
12,5 |
7 |
7 |
F |
1 |
184 |
12,6 |
8 |
8 |
F |
1 |
185 |
12,1 |
9 |
9 |
F |
1 |
184 |
12,2 |
10 |
10 |
F |
1 |
183 |
12,3 |
11 |
1 |
M |
0 |
187 |
12,9 |
12 |
2 |
M |
0 |
188 |
12,9 |
13 |
3 |
M |
0 |
188 |
13,0 |
14 |
4 |
M |
0 |
187 |
13,0 |
15 |
5 |
M |
0 |
186 |
13,1 |
16 |
6 |
M |
0 |
187 |
13,2 |
17 |
7 |
M |
0 |
189 |
13,5 |
18 |
8 |
M |
0 |
191 |
13,8 |
19 |
9 |
M |
0 |
188 |
13,0 |
20 |
10 |
M |
0 |
188 |
13,0 |
Exercício Pratico 4 Optativo. ML Não S para Agrupamentos e Distancias
Multivariados. Rodar os dados procurando outliers e variáveis não
significativas. Dead Line: 16/6.
Onde tiver sinais de
interrogação colocar os últimos dígitos do seu RG
Dados: Qualidade de Vida de Diferentes Categorias
Categ |
IMC |
Movim |
Kcal |
AT |
20,2 |
53,7 |
32?? |
AT |
21,3 |
54,8 |
31?? |
AT |
19,3 |
49,6 |
2800 |
AT |
21,1 |
52,3 |
3300 |
AT |
26,1 |
52,3 |
3300 |
SEM |
22,4 |
14,9 |
2600 |
SEM |
21,9 |
17,8 |
2700 |
SEM |
23,8 |
18,6 |
3200 |
SEM |
24,1 |
15,1 |
3300 |
SE |
27,3 |
2,5 |
2700 |
SE |
23,4 |
4,3 |
2300 |
SE |
25,2 |
2,3 |
2600 |
SE |
26,4 |
2,6 |
3200 |
PR |
26,2 |
4,1 |
2600 |
PR |
24,2 |
2,1 |
2700 |
PR |
25,4 |
1,9 |
2650 |
PR |
19,3 |
70 |
2650 |
Exercício Prático 4.A
Elaborar um gráfico
tridimensional equalizado para ordem de grandeza. Gerar dados para o SAS.
Exercício
Prático 4.B
Fazer box plot em SAS para diagnosticar outliers e variáveis
não significativas.
Exercício Prático 4.C.
Rodar IA Não Supervisionado para Distancias e
Agrupamentos Multivariados - Cluster Analysis.
Interpretar os resultados
Exercício Prático 4.D.
Optativo. Rodar com outlier e variável
não significativa.
Exercício Prático 5
ML Não S para Agrupamentos e Distancias Multivariados
Cluster e Dendrograma de todas as cidades, programa SAS: ver banco de dados
data cidades;
input Cid_reg $ IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Comp;
cards;
Pir_SE 0.785 1.14 0.54 0.695 0.598 0.7??
SC_SE 0.805 1.08 0.686 0.653 0.564 0.788
SJ_SE 0.797 1.17 0.613 0.73 0.597 0.769
MC_SE 0.77 0.65 0.481 0.651 0.549 0.666
Ron_CO 0.755 0.84 0.452 0.509 0.567 0.651
Ana_CO 0.737 0.79 0.481 0.645 0.562 0.708
CG_NE 0.72 0.63 0.458 0.565 0.571 0.59
Pet_NE 0.697 0.61 0.419 0.43 0.528 0.57
RB_Norte 0.727 0.74 0.342 0.47 0.486 0.503
BV_Norte 0.752 0.79 0.338 0.458 0.502 0.585
Mar_S 0.808 1.2 0.652 0.753 0.611 0.765
CS_S 0.75 0.95 0.446 0.715 0.559 0.715
;
proc print;
run;
proc cluster data=cidades outtree = arvore method = average;
var IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Comp;
id Cid_reg;
run;
PROC TREE DATA = arvore;
RUN;
Exercício Prático 6
data cidades;
input Cid_reg $ IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Comp;
cards;
Pir_SE 0.785 1.14 0.54 0.695 0.598 0.7??
SC_SE 0.805 1.08 0.686 0.653 0.564 0.788
SJ_SE 0.797 1.17 0.613 0.73 0.597 0.769
MC_SE 0.77 0.65 0.481 0.651 0.549 0.666
Ron_CO 0.755 0.84 0.452 0.509 0.567 0.651
Aná_CO 0.737 0.79 0.481 0.645 0.562 0.708
CG_NE 0.72 0.63 0.458 0.565 0.571 0.59
Pet_NE 0.697 0.61 0.419 0.43 0.528 0.57
RB_Norte 0.727 0.74 0.342 0.47 0.486 0.503
BV_Norte 0.752 0.79 0.338 0.458 0.502 0.585
Mar_S 0.808 1.2 0.652 0.753 0.611 0.765
CS_S 0.75 0.95 0.446 0.715 0.559 0.715
;
proc prinqual plots=(MDPref)
/* project onto Prin1 and Prin2 */
; /* use COV scaling */
transform identity(IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Comp); /* identity transform */
id Cid_reg;
ods select MDPrefPlot;
run;
Nenhum comentário:
Postar um comentário