Onderdelen van Twitter-data

Socialemediagegevens analyseren in R

Sowmya Vivek

Data Science Coach

Lesoverzicht

  • Introductie tot Twitter-JSON
  • Metadata-onderdelen uit de JSON halen
  • Onderdelen gebruiken om inzichten te krijgen
Socialemediagegevens analyseren in R

Twitter-JSON

  • Een tweet kan >150 metadata-onderdelen hebben
  • Tweets en onderdelen worden geretourneerd als JavaScript Object Notation
Socialemediagegevens analyseren in R

JSON-attributen en -waarden

  • Attributen en waarden beschrijven tweets en onderdelen
  • Voorbeeld: screen_name bevat de Twitter-handle van een gebruiker

Twitter-JSON: attributen en waarden

Socialemediagegevens analyseren in R

JSON omzetten naar een dataframe

  • Twitter-JSON wordt naar een dataframe omgezet door de rtweet-bibliotheek
  • Attributen en waarden worden kolomnamen en -waarden

JSON-attributen omgezet naar dataframe-kolommen

Socialemediagegevens analyseren in R

Tweet-onderdelen bekijken

# Tweets over "#brexit" ophalen met search_tweets()
tweets_df <- search_tweets("#brexit")
# Bekijk de kolomnamen
names(tweets_df)
Socialemediagegevens analyseren in R

Tweet-onderdelen bekijken

Onderdelen van een tweet

Socialemediagegevens analyseren in R

Onderdelen verkennen

  • screen_name om interesse van gebruikers te zien
  • followers_count om invloed op social media te vergelijken
  • retweet_count en text om populaire tweets te vinden
Socialemediagegevens analyseren in R

Gebruikersinteresse en tweet-aantallen

  • screen_name is de Twitter-handle
  • Aantal geplaatste tweets toont interesse in een onderwerp
  • Promoot producten bij geïnteresseerde gebruikers
Socialemediagegevens analyseren in R

Gebruikersinteresse en tweet-aantallen

# Tweets over "#Arsenal" ophalen met search_tweets()
twts_arsnl <- search_tweets("#Arsenal", n = 18000)
# Tabel maken met gebruikers en aantallen tweets over het onderwerp
sc_name <- table(twts_arsnl$screen_name)
head(sc_name)
_____today_____   ___JJ23    ___SAbI__   __ambell   __Amzo__     __bobbysingh 
       1               2          3           1         1               1
Socialemediagegevens analyseren in R

Gebruikersinteresse en tweet-aantallen

# Sorteer de tabel aflopend op aantal tweets
sc_name_sort <- sort(sc_name, decreasing = TRUE)
# Bekijk de top 6 gebruikers en tweetfrequenties
head(sc_name_sort)
 _whatthesport  footy90com  Official_ATG1   TheShortFuse   RubellM   ArsenalZone_Ind 
      176           90            88             53           48            43
Socialemediagegevens analyseren in R

Aantal volgers

  • Aantal volgers van een Twitter-account
  • Geeft populariteit van het account aan
  • Maatstaf voor invloed op social media
  • Plaats advertenties op populaire accounts voor meer zichtbaarheid
Socialemediagegevens analyseren in R

Volgersaantal vergelijken

# Gebruikersdata ophalen met lookup_users()
tvseries <- lookup_users("GameOfThrones", "fleabag", "BreakingBad")
# Dataframe maken met de kolommen screen_name en followers_count
user_df <- tvseries[,c("screen_name","followers_count")]
Socialemediagegevens analyseren in R

Volgersaantal vergelijken

# Bekijk het aantal volgers ter vergelijking
user_df
screen_name        followers_count
<chr>                   <int>
GameOfThrones          8597188            
fleabag                  58727            
BreakingBad            1240349
Socialemediagegevens analyseren in R

Retweets en populaire tweets

  • Een retweet is een tweet die door een ander is gedeeld
  • retweet_count slaat het aantal retweets op
  • Het aantal retweets helpt trends te vinden
  • Populaire retweets kunnen een merk promoten
Socialemediagegevens analyseren in R

Retweets en populaire tweets

# Dataframe met tweet-tekst en retweetaantallen
rtwt <- tweets_arsenal[,c("text", "retweet_count")]
# Sorteer aflopend op retweetaantallen
library(dplyr)
rtwt_sort <- arrange(rtwt, desc(retweet_count))
Socialemediagegevens analyseren in R

Retweets en populaire tweets

# Rijen met dubbele tweet-tekst uitsluiten
rtwt_unique <- unique(rtwt_sort, by = "text")
Socialemediagegevens analyseren in R

Retweets en populaire tweets

# Top 6 unieke posts met de meeste retweets printen
head(rtwt_unique)
retweet_count                text
<int>                        <chr>
5606            Once a Gunner, Always a Gunner. We are proud of you @alexanderiwob
3764            Emirates on Fire 🔥🔥🔥🔥 Never give up Gunners💪🏽💪🏽💪🏽 #Arsenal #CO
2798            That mood tonight ⚡️⚡️⚡️ 3️⃣ POINTS 🔴⚪️ #Arsenal #Gunners #COYG h
2741            #Arsenal fan: "I reckon we'll win the League this season." @Robbie
1687            Auba 😭😭😍😍 This is what I call happiness #aubameyang #arsenal
1166            When sky sports introduced the new Monday night football! The Sha
Socialemediagegevens analyseren in R

Laten we oefenen!

Socialemediagegevens analyseren in R

Preparing Video For Download...