#from bokeh.io import output_notebook, show
#from bokeh.plotting import figure
#output_notebook()
Base de dados:https://consumidor.gov.br/pages/principal/?1594Base
Dois mundos ainda dividem as relações de consumo no Brasil: o pré e o pós-venda. No primeiro, os atendentes estão sempre disponíveis, o cliente é tratado cordialmente e é possível acessar a empresa por todos os canais. Já no segundo, especialmente após se deparar com um problema, o consumidor recebe um atendimento insatisfatório e encontra inúmeras dificuldades para acessar a companhia.
O estudo de caso é sobre empresas nacionais e internacionais. O estudo relata a quantidade de reclamações feita pelo consumidore com diferente tipo de idade. Vamos estudar quais empresas tem o maior numero de reclamações e quais empresas tem feito a sua parte para ajudar os consumidores.
Vamos para o nosso estudo de caso.
#pip install plotly
import pandas as pd
import numpy as np
import plotly.offline as py
import plotly.graph_objs as go
py.init_notebook_mode(connected=True)
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
import plotly.offline as py
import plotly.graph_objs as go
py.init_notebook_mode(connected=True)
Base de Dados
dados = pd.read_csv('2_semestre_2016.csv', encoding='latin', sep=';')
dados.head()
Na base de dados temos uma relação de cidade, sexo, data da reclamação, segmento de mercado, assunto, problemas. Não vou usar todos os dados, porque o meu estudo vai ser pelas reclamações dos clientes com todas as mepresas. Futuramente usarei a base de dados para fazer um estudo da Área, onde obteremos um segmento especifico.
dados.describe().T
Fiz um agrupamento de todas as reclamações separado por estado. No momento não separei por reclamaçõe.
dados.groupby('UF')['UF'].count()
A satisfação pode ser definida, de acordo com Kotler (1998, p. 53), como "o sentimento de prazer ou de desapontamento resultante da comparação do desempenho esperado pelo produto (ou resultado) em relação às expectativas da pessoa". Satisfação não é deixar o cliente surpreso ou alegre, mas atender ou superar as suas expectativas, de modo que fique a contento com os resultados. O consumidor deve perceber que a troca foi justa, recebendo da empresa um valor que corresponda aos esforços despendidos. Para a empresa, este comprometimento com a satisfação do consumidor deverá ser recompensado, pois hoje há suporte empírico para comprovar que resultados elevados de satisfação dos clientes podem ser acompanhados por uma rentabilidade superior a médio prazo (Anderson, Fornell, & Lehmann, 1994; Anderson & Mittal, 1999).
O estudo revela, pessoas do sexo masculino fizeram mais reclamações.
dados['Sexo'].value_counts()
sns.set(style="darkgrid")
sexo = dados[u'Sexo'].unique()
cont = dados[u'Sexo'].value_counts()
sns.barplot(x=sexo,y=cont,hue=sexo)
plt.show()
O estudo revela o perfil dos consumidores. Vamos pegar como base de estudo, idade entre 21 a 30 anos e entre 61 a 70 anos.
O estudo mostra que são jovens, que estão no melhor momento de compras, pode ser que esteja bem empregado. Observando as pessoas mais novas temos como os maiores consumidores o sexo masculino. Precisamos observar porque os homens nessa faixa etária têm consumido mais dos que as mulheres. Quando chega a fase adulta, temos um quadro totalmente oposto, consumidores que gastam bem menos. O normal que os gastos fixos tenham caído, como por exemplo escola educação e preparo de filhos. Mais uma vez temos pessoas do sexo masculino que gastam bem mais do que a do sexo feminino.
dados.groupby('Faixa Etária')['Sexo'].value_counts()
Temos uma disparidade em relação entre a faixa etaria 21 a 30 anos do que 61 a 70 anos. O público mais jovem nasceu na era digital e já está familiarizado com a internet. Para as pessoas desse grupo, é natural comprar em lojas virtuais, entretanto, quem não cresceu acompanhando as tendências digitais pode se sentir inseguro ao disponibilizar os seus dados e a acreditar que os produtos serão entregues em casa sem problemas.
Daí a necessidade de conquistar a confiança do nicho da terceira idade, mostrando que as compras virtuais são procedimentos seguros e eficientes. Frisar pontos como garantia de entrega, prazos, descontos e políticas de trocas transparentes é fundamental para fortalecer a confiança das marcas com os idosos.
base = dados[dados['Como Comprou Contratou']=='Internet']
base.groupby('Faixa Etária')['Como Comprou Contratou'].value_counts().plot.barh()
plt.show()
Parece que os consumidores brasileiros são bem amigáveis, tentam de tudo para combinar com as empresas, o gráfico mostrar que antes de procurar plataformas de reclamação ou meios jurídicos, os consumidores tentam entrar em contato com as empresas. Temos algo em comum entrar as faixas etárias do nosso estudo. Pessoas com a faixa etária de 21 a 30 anos como pessoas da faixa etária de 51 a 60 procuram as empresas antes de registrar uma reclamação.
base = dados[dados['Faixa Etária']=='entre 21 a 30 anos']
base['Procurou Empresa'].value_counts().plot.barh()
plt.show()
base = dados[dados['Faixa Etária']=='entre 61 a 70 anos']
base['Procurou Empresa'].value_counts().plot.barh()
plt.show()
Cobranças indevidas é o campeão em numeros de reclamações. Desde cobranças indevidas tem tirado o sono de muitos brasileros. para ter um boa relação com os consumidores, as empresas devem criar mecanismo para cuidar dos consumidores, criar meios de anti fraude. Proteger o consumidor é proteger o relacionamento cliente empresa.
dados['Grupo Problema'].value_counts()
dados['Grupo Problema'].value_counts().plot.barh()
plt.show()
Relação das reclamações
dados[dados['Grupo Problema'] == u'Cobrança / Contestação'][u'Problema'].value_counts()
Empresas de telecomunicações, ganham disparada em reclamação. Clientes estão insatisfeito com os serviços prestado pelas companhias de telecomunicação, desde cobranças indevidas, internet lenta serviços não entregue. Tudo isso tem deixado clientes irritados. Mas não é só a telefonia. EM segundo lugar temos empresas financeiras, cartão de crédito é a dor de cabeça dos consumidores, cartão clonado, fraude em compras tem feito clientes abandonar as compras online.
dados['Segmento de Mercado'].value_counts()
Segmentos de Mercado com maior número de reclamações do tipo de problema Cobrança e Contestação
segmento = dados[dados[u'Grupo Problema']==u'Cobrança / Contestação']
segmento['Segmento de Mercado'].value_counts()
plt.style.use('ggplot')
plt.rcdefaults()
fig, ax = plt.subplots()
y_pos = np.arange(len(segmento['Segmento de Mercado'].value_counts()))
values = segmento['Segmento de Mercado'].value_counts()
segmentos = segmento['Segmento de Mercado'].unique()
ax.barh(y_pos, values, align='center', color='black')
ax.set_yticks(y_pos)
ax.set_yticklabels(segmentos)
ax.invert_yaxis()
ax.set_xlabel('Reclamacoes')
ax.set_title('Cobranca e Contestacao por Segmento de Mercado')
plt.show()
O gráfico diz tudo. Empresas de telecomunicação lideram nas reclamações.
fig, ax = plt.subplots()
y_pos = np.arange(len(segmento['Nome Fantasia'].value_counts()[:20]))
values = segmento['Nome Fantasia'].value_counts()[:20]
segmentos = segmento['Nome Fantasia'].unique()[:20]
ax.barh(y_pos, values, align='center', color='black')
ax.set_yticks(y_pos)
ax.set_yticklabels(segmentos)
ax.invert_yaxis()
ax.set_xlabel('Reclamacoes')
ax.set_title('Rank de Empresas')
plt.show()
Listagem e contagem de problemas do grupo.
dados[dados['Grupo Problema']=='Cobrança / Contestação']['Problema'].value_counts()
Tempo de resposta tem alguma correlação com a nota do consumidor?
import pandas as pd
df = dados.drop('Total',axis=1)
corr = df.corr()
corr.style.background_gradient(cmap='coolwarm')
dados.plot.density(y='Nota do Consumidor',xlim=[0,6],figsize=[6,3])
plt.show()
dados.plot.density(y='Tempo Resposta',xlim=[0,11],figsize=[6,3])
plt.show()
Proporção de reclamações registradas e não respondidas
x = dados.groupby(u'Segmento de Mercado')[u'Segmento de Mercado'].count()
#Filtrando os segmentos de mercado com mais de 20 reclamações
x = x[x > 20]
df = dados[dados[u'Segmento de Mercado'].isin(x.keys())]
df = df[df[u'Avaliação Reclamação']==u'Não Resolvida']
x1 = df.groupby(u'Segmento de Mercado')[u'Segmento de Mercado'].count()
x1
import seaborn as sns
sns.set(style="whitegrid")
f, ax = plt.subplots(figsize=(8, 10))
sns.set_color_codes("pastel")
sns.barplot(x=x.values, y=x.keys(), label="Total de reclamacoes", color="b")
sns.set_color_codes("muted")
sns.barplot(x=x1.values, y=x1.keys(),label="Reclamacoes nao resolvidas", color="r")
ax.legend(ncol=2, loc="lower right", frameon=True)
ax.set(ylabel="", xlabel="Reclamacoes e suas situacoes")
sns.despine(left=False, bottom=True)
Avaliando o desempenho de instituições financeiras.
df = dados[dados['Segmento de Mercado']==u'Bancos, Financeiras e Administradoras de Cartão']
df = df[df[u'Área']==u'Serviços Financeiros']
fig, ax = plt.subplots(figsize=(12,8))
df.groupby('Assunto')['Assunto'].value_counts().unstack().plot.area(ax=ax)
plt.show()