Como criar um gráfico de dispersão no R e no Excel

Confira nosso curso online de QGIS

Confira como realizar um gráfico de dispersão utilizando dados de vazão e de chuva, de forma a ter uma noção rápida se seus dados têm relação entre si. Faça seus gráficos de dispersão com Excel e R.

É comum em qualquer ciência querermos comparar duas variáveis para verificar se elas têm relação entre si.

Essa relação pode ser proporcional, onde ao aumentar (ou diminuir) os valores da primeira variável, o mesmo irá acontecer com os valores da segunda variável. Ou a relação pode ser inversamente proporcional, onde aumentá-se o valor de uma variável e a segunda irá diminuir, e vice-versa.

Para avaliar visualmente essa relação, podemos criar gráficos de dispersão. E para isso, vamos utilizar alguns dados fluvio e pluviométricos do Portal do Departamento de Água e Energia Elétrica de São Paulo.

Neste tutorial, vamos avaliar se há correlação entre a vazão de um rio e a quantidade de chuva.

Por que medir a vazão?

Diante dos atuais problemas de escassez de água, o correto gerenciamento deste recurso inicia pela sua medição. Se não medimos, não poderemos administrar corretamente o recurso natural.

Além disso, os dados de vazão também podem ser utilizados para o dimensionamento de estrutura físicas, tais como pontes e sistemas de drenagem, e para estudos ambientais de modelagem de plumas de contaminação.

Os dados pluviométricos (chuva) estão diretamente relacionados às vazões do rio.

Se observarmos o ciclo hidrológico, veremos que a água da chuva que cai sobre o continente poderá infiltrar no solo, evaporar e alimentar os rios e córregos.

Logo, vemos que estas duas variáveis estão interligadas.

Obtendo dados de vazão e chuva

Vamos iniciar nosso tutorial baixando os dados do Portal do DAEE-SP. Lembre-se de utilizar o Internet Explorer (ou o navegador Edge), para conseguir baixar os dados.

Primeiro, selecione o tipo de dado para ser baixado, vamos começar com os dados Fluviométricos.

Em seguida, novas opções irão aparecer, vamos realizar uma busca pelo nome do rio. Selecionaremos o Rio Cubatão (R, 07-Baixada Santista), prefixo 3E-077, tipo de dados “Vazões Médias Diárias”, e vamos selecionar o ano de 1968.

Note que o site do DAEE-SP fornece várias formas de pesquisa de dados (inclusive por mapas), possibilitando localizar sua área de interesse rapidamente.

Agora é só baixar o arquivo CSV.

Vamos realizar o mesmo procedimento para os dados Pluviométricos. Selecionaremos uma estação pluviométrica no mesmo município, Cubatão, prefixo E3-038, tipo de dados “Chuva Diária” e o ano de 1968.

Para realizar esse tipo de análise, o ideal é que as estações fluviométricas e pluviométricas estejam o mais próximas possíveis, e se possível, uma do lado da outra.

Ajeitando os dados no Excel

Os arquivos que baixamos estão no formato CSV. Ao abrirmos ele no Excel, pode ocorrer dos dados estarem todos na primeira coluna.

Como separar seus dados no Excel.
Como separar seus dados no Excel.

Como resolver isso?

Simples, selecione a sua série de dados (aqui, desconsidere as primeiras linhas com dados da estação), clique em Dados (1) e em seguida, selecione a ferramenta Texto para Colunas (2). Uma nova janela será aberta e haverá três etapas a serem seguidas:

  1. Escolha se seus dados são separados por um delimitador (este é o nosso caso, mantenha essa opção) ou por uma largura fixa;
  2. Na segunda etapa, vamos escolher o delimitador. Nesse caso, vamos selecionar Ponto e Vírgula (;);
  3. Na ultima etapa, o Excel irá solicitar para você indicar o tipo de dado de cada coluna.

Pronto. Seus dados devem ficar semelhantes ao da imagem abaixo.

Organização dos dados após Texto para Colunas.
Organização dos dados após Texto para Colunas.

Se necessário, repita o processo com os dados de pluviometria.

Para plotarmos esses dados em um gráfico de dispersão, precisamos realizar um ultimo ajuste – Vamos criar quatro colunas, a primeira coluna mostrar o mês/ano; a segunda coluna o dia do mês; a terceira irá guardar os dados de chuva e a quarta irá mostrar os dados de vazão.

Utilize a ferramenta do Excel “Colar Especial” para transformar os dados de linhas para colunas, ou seja, para transpor os dados.

Gráfico de Dispersão no Excel

No nosso tutorial, estaremos utilizando somente a série de dados do ano de 1968, mas você pode realizar essa análise para qualquer intervalo de tempo. Só tome cuidado com os dados faltantes.

Por exemplo, no ano de 1968, não foi realizado medição de vazão no mês de maio, portanto, não usaremos este mês na nossa análise. Você pode baixar a planilha que usaremos neste link.

Para criar um gráfico de dispersão no Excel, selecione as duas colunas que contêm os seus dados (no nosso caso, Chuva e Vazão) e clique em Inserir (1), Gráficos e escolha Gráficos de Dispersão (2).

Criando um gráfico de dispersão no Excel.
Criando um gráfico de dispersão no Excel.

O Excel irá criar então um gráfico de dispersão, ao selecionar o gráfico criado, irá aparecer um conjunto de opções nas abas de opções do Excel chamadas de Ferramentas de Gráfico.

Nela, você poderá editar as cores, tamanho da fonte, layout, entre outros parâmetros gráficos. Utilizamos o item Layout de Gráfico para ter acesso rápido à uma formatação pre-determinada. Confira o resultado abaixo.

Gráfico de Dispersão no Excel.
Gráfico de Dispersão no Excel.

Veja que não temos uma boa correlação entre os dados de precipitação e vazão. Possivelmente, isso se deve à distância entre a estação pluviométrica e fluviométrica, onde a resposta da vazão não seja tão rápida (logo após a chuva).

Ou ainda, podemos remover os valores extremos (outliers) e criar o gráfico novamente, para avaliar se teremos uma correlação melhor.

Lembre-se que, em estudos ambientais, a remoção de dados deve vir acompanhada de uma boa justificativa. Não podemos simplesmente deletar dados porque eles não se encaixam na nossa hipótese.

Gráfico de Dispersão no R

Já vimos em postagens passadas como realizar um gráfico de dispersão utilizando o pacote ggplot2. Nesta postagem, vou focar no gráfico de dispersão “comum”, assim vamos chamá-lo.

Para criá-lo, vamos aproveitar os dados organizados no Excel e salvá-los no formato CSV, para importar eles no R com o comando read.csv() em uma variável chamada dadosB2E.


dadosB2E <- read.csv("caminho para arquivo CSV/B2E_chuva_vazao.csv", 
  header = TRUE, sep = ";", dec = ",")

Não esqueça de substituir no código o caminho para o seu arquivo CSV. Note que também incluímos parâmetros para dizer que temos um cabeçalho (Header), um parâmetro indicando qual é o delimitador, ou separador (sep) e um parâmetro indicando qual é o símbolo decimal (dec).

Agora, vamos utilizar a função plot() para criar nosso gráfico de dispersão. Acompanhe o código abaixo e veja os parâmetros relacionados à aparência do gráfico.


plot(dadosB2E$chuva_mm, dadosB2E$vazao_m3.s, main = "Gráfico de Dispersão Chuva x Vazão",
  sub = "* gráfico do Blog 2 Engenheiros", xlab = "Precipitação (mm)",
  ylab = "Vazão (m³/s)", pch = 15, col = "#64b428", col.main = "#64b428",
  font.sub = 3)

Os dois primeiros parâmetros da função plot() são os valores de x e y, no nosso caso, dadosB2E$chuva_mm e dadosB2E$vazao_m3.s (clique aqui e veja nossa postagem sobre como chamar ou acessar seus dados nas variáveis do R).

Adicionamos vários parâmetros para modificar nosso gráfico, confira na lista abaixo o que é cada um deles:

  • main: Título do gráfico (aparece no topo dele);
  • sub: Subtítulo do gráfico (aparece na parte inferior dele);
  • xlab: Rótulo do eixo x;
  • ylab: Rótulo do eixo y;
  • pch: Tipo de ponto no gráfico (varia entre 0 e 25);
  • col: Cores dos pontos, linhas do gráfico (aqui, inserimos uma cor no formato hexadecimal);
  • col.main: Cor do título;
  • font.sub: Formato da fonte do subtítulo (pode ser 1 = Normal, 2 = Negrito, 3 = Itálico, 4 = Negrito e Itálico, 5=Símbolo).

No final, você obterá um gráfico como o da figura abaixo.

Gráfico de Dispersão realizado no R.
Gráfico de Dispersão realizado no R.

Você pode executar esses passos para correlacionar qualquer tipo de dado e observar qual é a influência deles entre si.

Embora não consigamos uma boa correlação com os nossos dados, possivelmente por causa da distância entre as estações fluviométricas e pluviométricas, o tratamento de dados brutos passa por diversas etapas e aqui nosso objetivo foi mostrar como realizar um gráfico de dispersão.

Ficou com alguma dúvida ou teve alguma dificuldade? Deixe ela aqui nos comentários.



Clique na figura abaixo e assine nossa lista de emails para receber nosso ebook "Como criar mapas de localização com ArcGIS 10.x".

Apostila Mapa de Localização Banner

Author: Fernando BS

Engenheiro Ambiental e de Segurança do Trabalho. Atua nas áreas de geoprocessamento, mineração e hidrologia. Busca soluções utilizando softwares como QGIS, R e Python.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *