Componenti dei dati di Twitter

Analisi dei dati dei social media in R

Sowmya Vivek

Data Science Coach

Panoramica della lezione

  • Introduzione al JSON di Twitter
  • Estrai componenti dei metadati dal JSON
  • Usa le componenti per ottenere insight
Analisi dei dati dei social media in R

Twitter JSON

  • Un tweet può avere oltre 150 componenti di metadata
  • Tweet e componenti restituiti in JavaScript Object Notation
Analisi dei dati dei social media in R

Attributi e valori JSON

  • Attributi e valori per descrivere tweet e componenti
  • Esempio: screen_name memorizza l’handle dell’utente

Attributi e valori del JSON di Twitter

Analisi dei dati dei social media in R

Convertire JSON in dataframe

  • Il JSON di Twitter è convertito in dataframe dalla libreria rtweet
  • Attributi e valori diventano nomi colonna e valori

Attributi JSON convertiti in colonne del dataframe

Analisi dei dati dei social media in R

Vedere le componenti dei tweet

# Estrai tweet su "#brexit" con search_tweets()
tweets_df <- search_tweets("#brexit")
# Visualizza i nomi delle colonne
names(tweets_df)
Analisi dei dati dei social media in R

Vedere le componenti dei tweet

Componenti di un tweet

Analisi dei dati dei social media in R

Esplorare le componenti

  • screen_name per capire l’interesse dell’utente
  • followers_count per confrontare l’influenza social
  • retweet_count e text per trovare i tweet più popolari
Analisi dei dati dei social media in R

Interesse utente e numero di tweet

  • screen_name è l’handle di Twitter
  • Il numero di tweet pubblicati indica l’interesse per un tema
  • Promuovi prodotti a utenti interessati
Analisi dei dati dei social media in R

Interesse utente e numero di tweet

# Estrai tweet su "#Arsenal" con search_tweets()
twts_arsnl <- search_tweets("#Arsenal", n = 18000)
# Crea una tabella di utenti e conteggi di tweet per l’argomento
sc_name <- table(twts_arsnl$screen_name)
head(sc_name)
_____today_____   ___JJ23    ___SAbI__   __ambell   __Amzo__     __bobbysingh 
       1               2          3           1         1               1
Analisi dei dati dei social media in R

Interesse utente e numero di tweet

# Ordina la tabella in ordine decrescente di tweet
sc_name_sort <- sort(sc_name, decreasing = TRUE)
# Vedi i 6 utenti top e le frequenze
head(sc_name_sort)
 _whatthesport  footy90com  Official_ATG1   TheShortFuse   RubellM   ArsenalZone_Ind 
      176           90            88             53           48            43
Analisi dei dati dei social media in R

Conteggio follower

  • Numero di follower iscritti a un account
  • Indica la popolarità dell’account
  • Misura dell’influenza sui social
  • Posiziona annunci su account popolari per più visibilità
Analisi dei dati dei social media in R

Confronta il numero di follower

# Estrai dati utente con lookup_users()
tvseries <- lookup_users("GameOfThrones", "fleabag", "BreakingBad")
# Crea un dataframe con le colonne screen_name e followers_count
user_df <- tvseries[,c("screen_name","followers_count")]
Analisi dei dati dei social media in R

Confronta il numero di follower

# Visualizza il numero di follower per confronto
user_df
screen_name        followers_count
<chr>                   <int>
GameOfThrones          8597188            
fleabag                  58727            
BreakingBad            1240349
Analisi dei dati dei social media in R

Retweet e tweet popolari

  • Un retweet è un tweet condiviso da un altro utente
  • retweet_count memorizza il numero di retweet
  • I retweet aiutano a individuare i trend
  • Retweet popolari possono promuovere un brand
Analisi dei dati dei social media in R

Retweet e tweet popolari

# Crea un data frame con testo del tweet e retweet
rtwt <- tweets_arsenal[,c("text", "retweet_count")]
# Ordina in modo decrescente per numero di retweet
library(dplyr)
rtwt_sort <- arrange(rtwt, desc(retweet_count))
Analisi dei dati dei social media in R

Retweet e tweet popolari

# Escludi righe con testo del tweet duplicato
rtwt_unique <- unique(rtwt_sort, by = "text")
Analisi dei dati dei social media in R

Retweet e tweet popolari

# Stampa le prime 6 pubblicazioni uniche più retwittate
head(rtwt_unique)
retweet_count                text
<int>                        <chr>
5606            Once a Gunner, Always a Gunner. We are proud of you @alexanderiwob
3764            Emirates on Fire 🔥🔥🔥🔥 Never give up Gunners💪🏽💪🏽💪🏽 #Arsenal #CO
2798            That mood tonight ⚡️⚡️⚡️ 3️⃣ POINTS 🔴⚪️ #Arsenal #Gunners #COYG h
2741            #Arsenal fan: "I reckon we'll win the League this season." @Robbie
1687            Auba 😭😭😍😍 Questo è ciò che chiamo felicità #aubameyang #arsenal
1166            When sky sports introduced the new Monday night football! The Sha
Analisi dei dati dei social media in R

Ayo berlatih!

Analisi dei dati dei social media in R

Preparing Video For Download...