Exemplos de busca de tendências do Google Trend
Google Trend - Buscas
Nesse post, Henrique Martins e Gerson Júnior irão fazer uma rápida análise de tendências na pesquisa do Google. Primeiro plot é um comparativo das tendências de pesquisa de “Covid 19” versus “Vacina”. Primeiramente vamos carregar os pacotes necessários para o code.
library(gtrendsR)
library(ggplot2)
library(scales)
Buscar as tendencias das palavras “Covid 19” e “Vacina”
Vacina<-gtrends(keyword = "Vacina",geo = "BR",time = "today 12-m",gprop = c("web"),
category = 0,hl = "en-US",low_search_volume = FALSE,
cookie_url = "http://trends.google.com/Cookies/NID",
tz = 0,onlyInterest = FALSE)
covid<-gtrends(keyword = "covid 19",geo = "BR",time = "today 12-m",gprop = c("web"),
category = 0,hl = "en-US",low_search_volume = FALSE,
cookie_url = "http://trends.google.com/Cookies/NID",
tz = 0,onlyInterest = FALSE)
Fazendo um tratamento nos dados.
x <-Vacina$interest_over_time$date
Vacina <-Vacina$interest_over_time$hits
covid <-covid$interest_over_time$hits
Plotar o gráfico de uma tendência contra a outra.
plot(covid~as.Date(x),type = "b",lty = 1,main = "",xlab = "",ylab = "",yaxt="none",
col="darkgreen", cex=1.5,pch=16)
par(new=TRUE)
plot(Vacina~as.Date(x), type = "b",lty = 1,main = "",xlab = "",ylab = "",yaxt="none",
col="red",cex=1.5,pch=16)
legend("topright", legend=c("Vacina", "Covid 19"),col=c("red", "darkgreen"), lty=1:1, cex=1.0)
mtext(side=1, line=2, "Meses", col="black", font=2, cex=1.5)
mtext(side=2, line=2, "Hits", col="black", font=2, cex=1.5)
mtext(side=3, line=2, "Pesquisa das palavra 'Vacina' e 'Covid-19' nos últimos 12 meses", col="black",font=2,cex=2.25)
axis(2, seq(0,100),las=2, font=2, col="black")
Podemos reparar numa queda da tendência da busca da Covid, é plausível que o começo da pandemia além de assustar a população, fez com que ela procurasse conteúdo sobre sintomas, possíveis tratamentos, e com o tempo reduzisse essa busca. E por outro lado, com o começo da campanha de vacinação, parte da população buscou a palavra “vacinação” para acompanhamento da campanha e do calendário da vacinação.
Uma outra análise que nós fizemos era sobre a palavra “futebol”, nós esperamos que o final do ano tenha picos de busca da palavra,pois é quando o Campeonato Brasileiro, Copa do Brasil e Libertadores se encontram nas rodadas finais e decisivas.
Futebol <-gtrends(keyword = "Futebol",geo = "BR",time = "2015-03-01 2021-05-05",gprop = c("web", "news", "images", "froogle", "youtube"),
category = 0,hl = "en-US",low_search_volume = FALSE,
cookie_url = "http://trends.google.com/Cookies/NID",
tz = 0,onlyInterest = FALSE)
date <-Futebol$interest_over_time$date
Futebol <-Futebol$interest_over_time$hits
Futebol = data.frame(date,Futebol)
Futebol$date = as.Date(Futebol$date)
g1=ggplot(data = Futebol, aes(x = date, y = Futebol)) + geom_line() + scale_x_date(breaks = seq(as.Date("2000-01-01"), as.Date("2021-01-01"), by="6 month"),labels=date_format("%m-%Y")) +theme(plot.title = element_text(color="darkblue", size=40, face="bold"), panel.background = element_rect(fill = "grey95", colour = "grey95"),axis.title=element_text(size=14,face="bold"),title=element_text(size=14,face="bold", color="darkblue"),axis.text.y = element_text(face = "bold", color = "darkblue", size = 15),axis.text.x = element_text(face = "bold", color = "darkblue", size = 10, angle = 20))
g1 = g1 + ggtitle("Pesquisas da palavra Futebol") + theme(plot.title = element_text(size = 15, face = "bold"))
g1
Além da hipótese ser confirmada, outro ponto importante é ver a queda brusca da busca por futebol no começo da pandemia em 2020, além do foco da população ter mudado, não havia jogos.
Se futebol ocorreu essa tendência de aumentar as buscas no final do ano. Nós ficamos curiosos para saber sobre a tendência de Flamengo. Nesse caso, nós esperamos que o Flamengo tenha um ápice no final de 2019, ano que o clube venceu a Copa Libertadores e o Brasileiro. Mesmo fenômeno pode ser observado pelo Palmeiras em 2020, quando venceu Libertadores e Copa do Brasil (fica como exercício).
Flamengo <-gtrends(keyword = "Flamengo",geo = "BR",time = "2015-03-01 2021-05-05",gprop = c("web", "news", "images", "froogle", "youtube"),
category = 0,hl = "en-US",low_search_volume = FALSE,
cookie_url = "http://trends.google.com/Cookies/NID",
tz = 0,onlyInterest = FALSE)
date <-Flamengo$interest_over_time$date
Flamengo <-Flamengo$interest_over_time$hits
Flamengo = data.frame(date,Flamengo)
Flamengo$date = as.Date(Flamengo$date)
g2=ggplot(data = Flamengo, aes(x = date, y = Flamengo)) + geom_line() + scale_x_date(breaks = seq(as.Date("2000-01-01"), as.Date("2021-01-01"), by="6 month"),labels=date_format("%m-%Y")) +theme(plot.title = element_text(color="darkblue", size=40, face="bold"), panel.background = element_rect(fill = "grey95", colour = "grey95"),axis.title=element_text(size=14,face="bold"),title=element_text(size=14,face="bold", color="darkblue"),axis.text.y = element_text(face = "bold", color = "darkblue", size = 15),axis.text.x = element_text(face = "bold", color = "darkblue", size = 10, angle = 20))
g2 = g2 + ggtitle("Pesquisas da palavra Flamengo") + theme(plot.title = element_text(size = 15, face = "bold"))
g2
A hipótese foi confirmada, além de uma queda na busca no começo da pandemia, fenômeno com mesma explicação que a palavra futebol. A modalidade de negociação day-trade vem crescendo nas mídias sociais, essa é uma modalidade de muito risco, vale a leitura do paper de Fernando Chague e Bruno Giovannetti (É possível viver de day-trade?). Nossa hipótese é que vem crescendo o número de pesquisas sobre a palavra “day-trade” no google.
Day_trade <-gtrends(keyword = "Day Trade",geo = "BR",time = "2015-03-01 2021-05-05",gprop = c("web", "news", "images", "froogle", "youtube"),
category = 0,hl = "en-US",low_search_volume = FALSE,
cookie_url = "http://trends.google.com/Cookies/NID",
tz = 0,onlyInterest = FALSE)
date <-Day_trade$interest_over_time$date
Day_trade <-Day_trade$interest_over_time$hits
Day_trade = data.frame(date,Day_trade)
Day_trade$date = as.Date(Day_trade$date)
g3=ggplot(data = Day_trade, aes(x = date, y = Day_trade)) + geom_line() + scale_x_date(breaks = seq(as.Date("2000-01-01"), as.Date("2021-01-01"), by="6 month"),labels=date_format("%m-%Y")) +theme(plot.title = element_text(color="darkblue", size=40, face="bold"), panel.background = element_rect(fill = "grey95", colour = "grey95"),axis.title=element_text(size=14,face="bold"),title=element_text(size=14,face="bold", color="darkblue"),axis.text.y = element_text(face = "bold", color = "darkblue", size = 15),axis.text.x = element_text(face = "bold", color = "darkblue", size = 10, angle = 20))
g3 = g3 + ggtitle("Pesquisas da palavra Day_trade") + theme(plot.title = element_text(size = 15, face = "bold"))
g3
Hipótese confirmada. Novamente ressaltando a leitura do paper anterior.
É inegável que a mudança do BBB, mesclando celebridades com anônimos e a entrada de Tiago Leifert como apresentador deu um novo gás ao programa. Mas será que as ultimas duas edições tiveram mais buscas pela palavra BBB? Vamos aos dados.
BBB <-gtrends(keyword = "BBB",geo = "BR",time = "2010-01-01 2021-04-01",gprop = c("web", "news", "images", "froogle", "youtube"),
category = 0,hl = "en-US",low_search_volume = FALSE,
cookie_url = "http://trends.google.com/Cookies/NID",
tz = 0,onlyInterest = FALSE)
date <-BBB$interest_over_time$date
BBB <-BBB$interest_over_time$hits
BBB = data.frame(date,BBB)
BBB$date = as.Date(BBB$date)
g4=ggplot(data = BBB, aes(x = date, y = BBB)) + geom_line() + scale_x_date(breaks = seq(as.Date("2000-01-01"), as.Date("2021-01-01"), by="6 month"),labels=date_format("%m-%Y")) +theme(plot.title = element_text(color="darkblue", size=40, face="bold"), panel.background = element_rect(fill = "grey95", colour = "grey95"),axis.title=element_text(size=14,face="bold"),title=element_text(size=14,face="bold", color="darkblue"),axis.text.y = element_text(face = "bold", color = "darkblue", size = 15),axis.text.x = element_text(face = "bold", color = "darkblue", size = 10, angle = 20))
g4 = g4 + ggtitle("Pesquisas da palavra BBB") + theme(plot.title = element_text(size = 15, face = "bold"))
g4
Podemos observer os picos no começo do ano, logicamente, pois é nessa época que ocorre o programa e principalmente o aumento na busca das duas últimas edições. Pelo visto, a Globo acertou em cheio.
Ainda sobre o BBB, temos talvez o maior fenômeno entre os participantes, uma vitória na final com mais de 90%, vamos ver como foi a busca pela participante Juliete??
Juliette <-gtrends(keyword = "Juliette Freire",geo = "BR",time = "2021-02-01 2021-05-01",gprop = c("web", "news", "images", "froogle", "youtube"),
category = 0,hl = "en-US",low_search_volume = FALSE,
cookie_url = "http://trends.google.com/Cookies/NID",
tz = 0,onlyInterest = FALSE)
date <-Juliette$interest_over_time$date
Juliette <-Juliette$interest_over_time$hits
Juliette = data.frame(date,Juliette)
Juliette$date = as.Date(Juliette$date)
g5=ggplot(data = Juliette, aes(x = date, y = Juliette)) + geom_line() + scale_x_date(breaks = seq(as.Date("2000-01-01"), as.Date("2021-01-01"), by="2 month"),labels=date_format("%m-%Y")) +theme(plot.title = element_text(color="darkblue", size=40, face="bold"), panel.background = element_rect(fill = "grey95", colour = "grey95"),axis.title=element_text(size=14,face="bold"),title=element_text(size=14,face="bold", color="darkblue"),axis.text.y = element_text(face = "bold", color = "darkblue", size = 15),axis.text.x = element_text(face = "bold", color = "darkblue", size = 10, angle = 20))
g5 = g5 + ggtitle("Pesquisas da palavra Juliette") + theme(plot.title = element_text(size = 15, face = "bold"))
g5
Enfim, você pode brincar, buscar outras palavras, fica ai nosso post.
Please, cite this work:
Martins, Henrique; Junior, Gerson (2022), “Exemplos de busca de tendências do Google Trend published at Open Code Community”, Mendeley Data, V1, doi: 10.17632/t2wmgv352k.1