Analyse van Twitter-gebruikers

Socialemediagegevens analyseren in R

Vivek Vijayaraghavan

Data Science Coach

Lesoverzicht

  • friends_count en followers_count van een gebruiker
  • Gouden ratio interpreteren voor merkpromotie
  • Twitterlijsten om geïnteresseerde gebruikers te vinden
Socialemediagegevens analyseren in R

Volgers vs vrienden

Twitter vrienden en volgers

  • Followers zijn gebruikers die een twitteraar volgen
  • Friends zijn accounts die die twitteraar zelf volgt
Socialemediagegevens analyseren in R

Twitter ratio volgers vs volgen

Formule voor gouden ratio

  • Gebruikt door marketeers om promoties te plannen
Socialemediagegevens analyseren in R

Positieve en negatieve ratio’s

  • Positieve ratio: meer volgers dan vrienden
  • Negatieve ratio: meer vrienden dan volgers
Socialemediagegevens analyseren in R

Gebruikersinfo extraheren

# Zoek 1000 tweets over #fitness
tweet_fit <- search_tweets("#fitness", n = 1000)
# Haal gebruikersinformatie op
user_fit <- users_data(tweet_fit)
Socialemediagegevens analyseren in R

Gebruikersinfo extraheren

# Bekijk kolomnamen van de gebruikersdata
names(user_fit)

kolomnamen van gebruikersdata

Socialemediagegevens analyseren in R

followers_count en friends_count extraheren

  • Agregeer schermnamen met volgers- en vrienden­ aantallen
# Agregeer screen_name, followers_count & friends_count
library(dplyr)
counts_df <- user_fit %>%
               group_by(screen_name) %>%
               summarize(follower = mean(followers_count),
               friend = mean(friends_count))
Socialemediagegevens analyseren in R

followers_count en friends_count extraheren

head(counts_df)
screen_name      follower     friend
<chr>              <dbl>       <dbl>
__seokjinnie124     209        454        
_Aminata            623        523        
_amsvn              167        126        
_arweeennn          539        801        
_asof_             1336        455        
_blendac            833        195
Socialemediagegevens analyseren in R

De gouden ratio

# Maak een kolom voor de gouden ratio
counts_df$ratio <- follow_df$follower/follow_df$friend
head(counts_df$ratio)
[1] 0.4603524 1.1912046 1.3253968 0.6729089 2.9362637 4.2717949
Socialemediagegevens analyseren in R

Verken gebruikers op basis van de ratio

  • Bekijk gouden ratio’s om gebruikerstypen te begrijpen
# Sorteer aflopend op aantal volgers
counts_sort <- arrange(counts_df, desc(follower))
Socialemediagegevens analyseren in R

Verken gebruikers op basis van de ratio

# Selecteer rijen met > 30000 volgers
counts_sort[counts_sort$follower>30000,]
screen_name    follower    friend    ratio        
<chr>            <dbl>      <dbl>    <dbl>
mashable         9817699    2783     3528    
MensHealthMag    4528421    1111     4076    
Sophie_Choudry   2367827    157      15082    
thewebmaster_    103936     6508     16    
qwikad           92932      89557    1    
Rharvley         90464      19484    5    
SayWhenLA        68122      6680     10
  • Kanaal om fitnessproducten te promoten
Socialemediagegevens analyseren in R

Verken gebruikers op basis van de ratio

# Selecteer rijen met < 2000 volgers
counts_sort[counts_sort$follower<2000,]
screen_name    follower     friend    ratio        
<chr>            <dbl>       <dbl>    <dbl>
workout_ehime    1960        1027       2    
SardImperium     1932        256        8    
Deem_Hoops       1912        1520       1    
kaykay_inem      1890        443        4    
bhealhty         1855        3066       1
  • Adverteer gericht via individuele accounts
Socialemediagegevens analyseren in R

Gebruikersanalyse met Twitterlijsten

  • Een Twitterlijst is een samengestelde groep accounts
  • Gebruikers abonneren zich op interessante lijsten
Socialemediagegevens analyseren in R

Geabonneerde lijsten extraheren

# Haal alle lijsten op waarop "Playstation" geabonneerd is
lst_playstation <- lists_users("PlayStation")
lst_playstation[,1:4]
list_id          name                      uri               subscriber_count
<chr>            <chr>                    <chr>                      <int>
58505230       PS Family         /PlayStation/lists/ps-family         136    
4747423        GameDevelopers    /PlayStation/lists/gamedevelopers    467    
2490894        gaming            /PlayStation/lists/gaming            658
Socialemediagegevens analyseren in R

Abonnees van een lijst extraheren

# Haal 100 abonnees op van de lijst "gaming" van "Playstation"
list_PS_sub <- lists_subscribers(slug = "gaming", owner_user = "PlayStation", n = 100)
Socialemediagegevens analyseren in R

Schermnamen van abonnees bekijken

# Bekijk schermnamen van de abonnees
list_PS_sub$screen_name

Schermnamen van abonnees

Socialemediagegevens analyseren in R

Gebruikersinfo van lijstabonnees

# Maak een lijst met vier schermnamen
users <- c("Morten83032201","ndugumr", "WOLF210_Warrior", "souransb")
# Haal gebruikersinformatie op
users_PS_gaming <- lookup_users(users)
user_id                   status_id              created_at          screen_name
<chr>                       <chr>               <S3: POSIXct>          <chr>
1158299850573791233    1172604921121824769    2019-09-13 20:16:13    Morten83032201    
894525207620321280     1183293767215992832    2019-10-13 08:09:53    ndugumr    
325760816              1182867378293616640    2019-10-12 03:55:34    WOLF210_Warrior    
469270931              511997829384904704     2014-09-16 21:59:29    souransb
Socialemediagegevens analyseren in R

Laten we oefenen!

Socialemediagegevens analyseren in R

Preparing Video For Download...