Filtrare i tweet

Analisi dei dati dei social media in R

Vivek Vijayaraghavan

Data Science Coach

Panoramica della lezione

  • Filtri basati sui componenti del tweet
    • Estrai tweet originali
    • Lingua del tweet
    • Tweet popolari per numero minimo di retweet e like
Analisi dei dati dei social media in R

Filtrare i tweet originali

  • Un tweet originale è un post originale di un utente
  • Non è un retweet, una citazione o una risposta
  • I tweet originali evitano contenuti ripetitivi
  • Aiuta a mantenere l'engagement
Analisi dei dati dei social media in R

Filtrare i tweet originali

  • -filter usato per estrarre i tweet originali
  • -filter:retweets esclude tutti i retweet
  • -filter:quote esclude le citazioni
  • -filter:replies filtra le risposte
Analisi dei dati dei social media in R

Estrai tweet senza filtri

  • Estrai tweet su "digital marketing" senza filtri
# Estrai 100 tweet su "digital marketing"
tweets_all <- search_tweets("digital marketing", n = 100)
Analisi dei dati dei social media in R

Estrai tweet senza filtri

  • Verifica il conteggio in reply_to_screen_name, is_quote, is_retweet
# Verifica il conteggio delle risposte
library(plyr)
count(tweets_all$reply_to_screen_name)
x               freq
<fct>          <int>
blairaasmith      2            
javiergosende     1            
juanburgos        1            
WhutTheHale       2            
NA               94
Analisi dei dati dei social media in R

Estrai tweet senza filtri

# Verifica il conteggio delle citazioni
count(tweets_all$is_quote)
x        freq
<lgl>    <int>
FALSE     98            
TRUE       2
Analisi dei dati dei social media in R

Estrai tweet senza filtri

# Verifica il conteggio dei retweet
count(tweets_all$is_retweet)
x         freq
<lgl>    <int>
FALSE      61            
TRUE       39
Analisi dei dati dei social media in R

Escludi retweet, citazioni e risposte

  • Estrai tweet su "digital marketing" applicando -filter
# Applica '-filter'
tweets_org <- search_tweets("digital marketing 
                            -filter:retweets 
                            -filter:quote 
                            -filter:replies", 
                            n = 100)
Analisi dei dati dei social media in R

Escludi retweet, citazioni e risposte

  • Controlla che risposte, citazioni e retweet siano esclusi
# Verifica il conteggio delle risposte
library(plyr)
count(tweets_org$reply_to_screen_name)
x         freq
<lgl>    <int>
NA         100
Analisi dei dati dei social media in R

Escludi retweet, citazioni e risposte

# Verifica il conteggio delle citazioni
library(plyr)
count(tweets_org$is_quote)

x         freq
<lgl>    <int>
FALSE     100
# Verifica il conteggio dei retweet
library(plyr)
count(tweets_org$is_retweet)
x         freq
<lgl>    <int>
FALSE     100
Analisi dei dati dei social media in R

Filtrare i tweet per lingua

  • lang filtra i tweet per lingua
  • Seleziona i tweet di una lingua specifica

Codici lingua di Twitter per alcune lingue

Analisi dei dati dei social media in R

Filtrare i tweet per lingua

# Filtra ed estrai i tweet in spagnolo
tweets_lang <- search_tweets("brand marketing", lang = "es")
Analisi dei dati dei social media in R

Filtrare i tweet per lingua

View(tweets_lang)

Tweet estratti in spagnolo

Analisi dei dati dei social media in R

Filtrare i tweet per lingua

head(tweets_lang$lang)
[1] "es" "es" "es" "es" "es" "es"
Analisi dei dati dei social media in R

Filtra per retweet e like

  • min_faves: filtra per numero minimo di like
  • min_retweets: filtra per numero minimo di retweet
  • Usa l'operatore AND per entrambe le condizioni
Analisi dei dati dei social media in R

Filtra per retweet e like

# Estrai tweet con almeno 100 like e retweet 
tweets_pop <- search_tweets("bitcoin min_faves:100 AND
                            min_retweets:100")
Analisi dei dati dei social media in R

Filtra per retweet e like

# Crea un data frame per verificare retweet e like
counts <- tweets_pop[c("retweet_count", "favorite_count")]
head(counts)
retweet_count    favorite_count
    <int>              <int>
1    162                833
2    141                894    
3    164                1128
4    395                1346    
5    475                2271
6    270                1654
Analisi dei dati dei social media in R

Filtra per retweet e like

# Visualizza i tweet
head(tweets_pop$text)
text    
<chr>
1    As we continue to build the Bakkt Bitcoin Futures contract, we reached a
2    BREAKING: The United States is considering entering into a "currency pact"
3    REMINDER: The Bitcoin ETF will eventually get approved.\n\nNot a question
4    [New Post] Bitcoin is becoming much more important in Hong Kong and India.
5    Reports are surfacing that some Hong Kong ATMs have run out of cash as
6    Bitcoin is the most transparent currency ever created.
Analisi dei dati dei social media in R

Ayo berlatih!

Analisi dei dati dei social media in R

Preparing Video For Download...