segunda-feira, 31 de março de 2025

Inteligência artificial indutiva não supervisionada (Machine Learning) para classificação - Cluster analysis

 Inteligência artificial indutiva não supervisionada (Machine Learning) para classificação  - Cluster analysis


Tipos de Machine Learning



                                   ML UL Clustering






Fonte de Dados Sebrae

Cidade: Caxias do Sul








Tabela Excel dos Dados
 

Cidade

Regiao

Cid_reg

Habitantes

IDH

Rend_Cap

Cap_Empr

Teci_Emr

Gov_Descn

Org_Prod

Ins_Compet

Edu_Empr

Piracicaba

SE

Pir_SE

439

0,785

1,14

0,54

0,695

0,796

0,598

0,761

0,004

Sao_Car

SE

SC_SE

252

0,805

1,08

0,686

0,653

0,812

0,564

0,788

0,002

Sao_Jose

SE

SJ_SE

461

0,797

1,17

0,613

0,73

0,648

0,597

0,769

0,011

Mon_Clar

SE

MC_SE

409

0,77

0,65

0,481

0,651

0,696

0,549

0,666

0,124

Rondono

CO

Ron_CO

232

0,755

0,84

0,452

0,509

0,626

0,567

0,651

0

Anápolis

CO

Aná_CO

387

0,737

0,79

0,481

0,645

0,695

0,562

0,708

0

Camp_Gra

NE

CG_NE

410

0,72

0,63

0,458

0,565

0,683

0,571

0,59

0,584

Petroli

NE

Pet_NE

349

0,697

0,61

0,419

0,43

0,678

0,528

0,57

0,009

Rio_Bran

Norte

RB_Norte

407

0,727

0,74

0,342

0,47

0,663

0,486

0,503

0,0009

Boa_Vista

Norte

BV_Norte

399

0,752

0,79

0,338

0,458

0,538

0,502

0,585

0,082

Maringa

S

Mar_S

424

0,808

1,2

0,652

0,753

0,791

0,611

0,765

0,01

Cax_Sul

S

CS_S

347

0,75

0,95

0,446

0,715

0,654

0,559

0,715

0,046

 

 

Kruskal Wallis

NS

*

*

*

*

NS

*

*

NS

 






  Inteligência artificial indutiva (Machine Learning) não supervisionada para classificação - Cluster analysis


Cluster e Dendrograma de todas as cidades, programa SAS: ver banco de dados

data cidades;

input Cid_reg $ IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Comp;

cards;

Pir_SE 0.785 1.14 0.54 0.695 0.598 0.761

SC_SE 0.805 1.08 0.686 0.653 0.564 0.788

SJ_SE 0.797 1.17 0.613 0.73  0.597 0.769

MC_SE 0.77  0.65 0.481 0.651 0.5   0.666

Ron_CO 0.755 0.84 0.452 0.509 0.567 0.651

Aná_CO 0.737 0.79 0.481 0.645 0.562 0.708

CG_NE 0.72 0.63 0.458 0.565 0.571 0.59

Pet_NE 0.697 0.61 0.419 0.43 0.528 0.57

RB_Norte 0.727 0.74 0.342 0.47 0.486 0.503

BV_Norte 0.752 0.79 0.338 0.458 0.502 0.585

Mar_S 0.808 1.2 0.652 0.753 0.611 0.765

CS_S 0.75 0.95 0.446 0.715 0.559 0.715

;

proc print;

run;

proc cluster data=cidades outtree = arvore method = average;

var IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Comp;

id Cid_reg;

run;

PROC TREE DATA = arvore;

RUN;

 


Cluster e Dendrograma de todas as regiões e Piracicaba, programa SAS:

data regioes;

input Local $ IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Compet;

cards;

CO 0.746 0.815 0.4665 0.577 0.5645 0.6795

NE 0.7085 0.62 0.4385 0.4975 0.5495 0.58

Norte 0.7395 0.765 0.34 0.464 0.494 0.544

S 0.779 1.075 0.549 0.734 0.585 0.74

SE 0.78925 1.01 0.58 0.68225 0.577 0.746

Piracic 0.785 1.14 0.54 0.695 0.598 0.761

;

proc print;

run;

proc cluster outtree = arvore method = average;

var IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Compet;

id Local;

run;

PROC TREE DATA = arvore;

RUN;


Aula 31/3/2025

Pauta:


ML Não S para Classificação

            Cidades Brasileiras e Piracicaba


- La Liga da IA - LIA-CDG/USP

            - Inicio 12/12/2025 sabado, das 13:30 às 14:30

           


quarta-feira, 26 de março de 2025

A comparação entre SAS e Python no contexto das empresas brasileiras

 A comparação entre SAS e Python no contexto das empresas brasileiras envolve diversos fatores, desde a tradição e robustez do SAS até a flexibilidade e o custo-benefício do Python. Aqui está uma análise detalhada:

IA Gemini 26/3/2025

SAS:


Tradição e Robustez:

O SAS é uma ferramenta consolidada, amplamente utilizada em grandes empresas, especialmente no setor financeiro e de saúde.

Sua robustez e confiabilidade são pontos fortes, especialmente para análises complexas e regulamentadas.

Custo:

O SAS geralmente envolve custos de licenciamento mais elevados, o que pode ser um fator limitante para empresas menores ou com orçamentos restritos.

Curva de Aprendizagem:

A curva de aprendizado do SAS pode ser mais íngreme para profissionais que não têm experiência prévia com a ferramenta.

Python:


Flexibilidade e Versatilidade:

Python é uma linguagem de programação de código aberto, o que significa que é gratuita e altamente personalizável.

Sua vasta gama de bibliotecas (como Pandas, NumPy e Scikit-learn) a torna uma ferramenta poderosa para análise de dados, aprendizado de máquina e inteligência artificial.

Comunidade e Ecossistema:

Python possui uma comunidade global ativa, o que significa que há uma grande quantidade de recursos, tutoriais e suporte disponíveis.

Existe também um crescimento grande de profissionais com essas habilidades dentro do mercado brasileiro.

Custo-Benefício:

A natureza de código aberto do Python o torna uma opção atraente para empresas que buscam reduzir custos com software.

Mercado de Trabalho:

Existe uma crescente demanda por profissionais com habilidades em Python no mercado brasileiro, especialmente em áreas como ciência de dados e análise de dados.

Considerações Adicionais:


Muitas empresas estão adotando uma abordagem híbrida, utilizando tanto SAS quanto Python para diferentes finalidades.

O SAS está evoluindo, com iniciativas como o SAS Viya, que busca integrar-se melhor com outras tecnologias, incluindo Python.

A velocidade de implantação de um projeto usando Python tende a ser mais rápida, devido a sua flexibilidade e grande quantidade de bibliotecas já prontas.

A escolha entre SAS e Python depende das necessidades específicas de cada empresa, incluindo o tamanho da empresa, o orçamento disponível, a complexidade das análises e a disponibilidade de profissionais qualificados.

Em resumo:


SAS: Ideal para empresas que priorizam robustez e confiabilidade em análises complexas e regulamentadas.

Python: Ideal para empresas que buscam flexibilidade, custo-benefício e inovação em análise de dados e inteligência artificial.

Comparação entre R e SAS no Brasil - IA Generativa

 Comparação entre R e SAS no Brasil - IA Generativa


 Prompt: Comparação entre R e SAS no Brasil

IA Gemini

Data: 26/3/2025

Comparação entre SAS e R no Brasil

A utilização de SAS e R no Brasil reflete uma tendência global, mas com nuances específicas do mercado brasileiro. Ambas as ferramentas são amplamente utilizadas para análise de dados, mas possuem características e aplicações distintas.

SAS

  • Histórico e Mercado: SAS tem uma longa tradição no mercado brasileiro, especialmente em setores como bancos, finanças e saúde. Sua reputação de confiabilidade e suporte técnico robusto o torna uma escolha frequente para empresas que lidam com dados críticos e precisam de soluções estáveis e auditáveis.

  • Vantagens:

  • Confiabilidade e estabilidade.

  • Suporte técnico especializado.

  • Documentação abrangente.

  • Adequado para grandes volumes de dados e aplicações empresariais.

  • Desvantagens:

  • Custo elevado de licenciamento.

  • Menor flexibilidade e capacidade de personalização em comparação com R.

  • Curva de aprendizado mais íngreme para tarefas complexas.

R

  • Crescimento e Adoção: R tem ganhado popularidade rapidamente no Brasil, impulsionado pela sua natureza de código aberto, flexibilidade e vasta comunidade de usuários. É amplamente utilizado em pesquisa acadêmica, startups e empresas de tecnologia.

  • Vantagens:

  • Código aberto e gratuito.

  • Grande variedade de pacotes e funcionalidades.

  • Flexibilidade e capacidade de personalização.

  • Comunidade ativa e suporte online.

  • Desvantagens:

  • Curva de aprendizado acentuada para iniciantes.

  • Requer mais habilidades de programação.

  • Desempenho pode ser inferior ao SAS em grandes volumes de dados, dependendo da implementação.

  • Suporte técnico menos centralizado.

Utilização nas Empresas Brasileiras

  • Setores Tradicionais (Bancos, Finanças, Saúde): SAS ainda é predominante devido à sua confiabilidade e conformidade regulatória.

  • Setor de Tecnologia e Startups: R é amplamente adotado devido ao seu baixo custo e flexibilidade.

  • Academia e Pesquisa: R é a escolha preferida para análise estatística e pesquisa devido à sua capacidade de lidar com modelos complexos e sua natureza de código aberto.

Tendências

  • A adoção de R está crescendo rapidamente no Brasil, impulsionada pela disponibilidade de cursos online, comunidades ativas e a crescente demanda por profissionais com habilidades em ciência de dados.

  • Muitas empresas estão adotando uma abordagem híbrida, utilizando SAS para aplicações críticas e R para análise exploratória e projetos de pesquisa.

  • A demanda por profissionais com conhecimento em ambas as ferramentas está aumentando no mercado de trabalho brasileiro.

Em resumo, tanto SAS quanto R desempenham papéis importantes no cenário da análise de dados no Brasil. A escolha entre eles depende das necessidades específicas da empresa, do orçamento, da infraestrutura de TI e das habilidades da equipe.