Este projeto de análise exploratória de dados (AED) investiga um conjunto de dados de gorjetas coletadas em um restaurante. O objetivo é descobrir padrões e insights sobre como diversos fatores influenciam o valor das gorjetas.
Este projeto de análise exploratória de dados (AED) explora o conjunto de dados de gorjetas, utilizando as bibliotecas Numpy, Pandas, Mathplotlib e Seaborn. Foi construído no jupyter notebook e é dividido em três partes:
-
Descrição do conjunto de dados através de estatísticas e gráficos.
-
Análise da relação entre o valor total da conta e o valor da gorjeta através de regressão.
-
Investigação das relações entre todas as variáveis do conjunto de dados.
- O sexo de quem paga a conta tem influência no valor da gorjeta?
- Existe relação entre o valor da conta e o da gorjeta?
- Fumantes costumam dar gorgetas maiores?
- O dia da semana ou o horário das refeições podem afetar o valor das gorjetas?
- Mesas com mais pessoas costumam dar gorjetas maiores?
- Qual o perfil dos clientes que frequentam o restaurante?
- Quais os dias e horários com o maior número de clientes?
Análises futuras poderiam incluir:
- Modelos de regressão mais complexos: Explorar modelos que levem em conta interações entre as variáveis, como a interação entre o tamanho da mesa e o status de fumante.
- Análise de outliers: Investigar os outliers identificados nos gráficos de caixa para entender melhor seu impacto nas conclusões.
- Coleta de dados adicionais: Coletar mais dados para aumentar o tamanho da amostra e a representatividade dos resultados.
- pandas
- numpy
- matplotlib.pyplot
- seaborn
Para mais informações ou colaborações, entre em contato.