Tweets filteren

Socialemediagegevens analyseren in R

Vivek Vijayaraghavan

Data Science Coach

Lesoverzicht

  • Filteren op onderdelen van een tweet
    • Originele tweets ophalen
    • Taal van de tweet
    • Populaire tweets op min. aantal retweets en favorieten
Socialemediagegevens analyseren in R

Filteren op originele tweets

  • Een originele tweet is een eigen bericht van een Twitter-gebruiker
  • Geen retweet, quote of reply
  • Originele tweets voorkomen herhaling
  • Helpt betrokkenheid vasthouden
Socialemediagegevens analyseren in R

Filteren op originele tweets

  • -filter om originele tweets op te halen
  • -filter:retweets sluit alle retweets uit
  • -filter:quote sluit quotes uit
  • -filter:replies sluit replies uit
Socialemediagegevens analyseren in R

Tweets ophalen zonder filters

  • Haal tweets over "digital marketing" op zonder filters
# Haal 100 tweets over "digital marketing" op
tweets_all <- search_tweets("digital marketing", n = 100)
Socialemediagegevens analyseren in R

Tweets ophalen zonder filters

  • Controleer aantallen in reply_to_screen_name, is_quote, is_retweet
# Aantal replies controleren
library(plyr)
count(tweets_all$reply_to_screen_name)
x               freq
<fct>          <int>
blairaasmith      2            
javiergosende     1            
juanburgos        1            
WhutTheHale       2            
NA               94
Socialemediagegevens analyseren in R

Tweets ophalen zonder filters

# Aantal quotes controleren
count(tweets_all$is_quote)
x        freq
<lgl>    <int>
FALSE     98            
TRUE       2
Socialemediagegevens analyseren in R

Tweets ophalen zonder filters

# Aantal retweets controleren
count(tweets_all$is_retweet)
x         freq
<lgl>    <int>
FALSE      61            
TRUE       39
Socialemediagegevens analyseren in R

Retweets, quotes en replies uitsluiten

  • Haal tweets over "digital marketing" op met de -filter
# Pas de '-filter' toe
tweets_org <- search_tweets("digital marketing 
                            -filter:retweets 
                            -filter:quote 
                            -filter:replies", 
                            n = 100)
Socialemediagegevens analyseren in R

Retweets, quotes en replies uitsluiten

  • Controleer of replies, quotes en retweets zijn uitgesloten
# Aantal replies controleren
library(plyr)
count(tweets_org$reply_to_screen_name)
x         freq
<lgl>    <int>
NA         100
Socialemediagegevens analyseren in R

Retweets, quotes en replies uitsluiten

# Aantal quotes controleren
library(plyr)
count(tweets_org$is_quote)

x         freq
<lgl>    <int>
FALSE     100
# Aantal retweets controleren
library(plyr)
count(tweets_org$is_retweet)
x         freq
<lgl>    <int>
FALSE     100
Socialemediagegevens analyseren in R

Tweets filteren op taal

  • lang filtert tweets op taal
  • Matcht tweets in een specifieke taal

Twitter-taalcodes voor een paar talen

Socialemediagegevens analyseren in R

Tweets filteren op taal

# Filter tweets die in het Spaans zijn gepost
tweets_lang <- search_tweets("brand marketing", lang = "es")
Socialemediagegevens analyseren in R

Tweets filteren op taal

View(tweets_lang)

Tweets opgehaald in het Spaans

Socialemediagegevens analyseren in R

Tweets filteren op taal

head(tweets_lang$lang)
[1] "es" "es" "es" "es" "es" "es"
Socialemediagegevens analyseren in R

Filteren op retweet- en favorietenaantal

  • min_faves: filtert tweets met minimaal aantal favorieten
  • min_retweets: filtert tweets met minimaal aantal retweets
  • Gebruik AND om beide voorwaarden te eisen
Socialemediagegevens analyseren in R

Filteren op retweet- en favorietenaantal

# Haal tweets op met min. 100 favorieten en retweets 
tweets_pop <- search_tweets("bitcoin min_faves:100 AND
                            min_retweets:100")
Socialemediagegevens analyseren in R

Filteren op retweet- en favorietenaantal

# Maak een data frame om retweet- en favorietenaantallen te checken
counts <- tweets_pop[c("retweet_count", "favorite_count")]
head(counts)
retweet_count    favorite_count
    <int>              <int>
1    162                833
2    141                894    
3    164                1128
4    395                1346    
5    475                2271
6    270                1654
Socialemediagegevens analyseren in R

Filteren op retweet- en favorietenaantal

# Bekijk de tweets
head(tweets_pop$text)
text    
<chr>
1    As we continue to build the Bakkt Bitcoin Futures contract, we reached a
2    BREAKING: The United States is considering entering into a "currency pact"
3    REMINDER: The Bitcoin ETF will eventually get approved.\n\nNot a question
4    [New Post] Bitcoin is becoming much more important in Hong Kong and India.
5    Reports are surfacing that some Hong Kong ATMs have run out of cash as
6    Bitcoin is the most transparent currency ever created.
Socialemediagegevens analyseren in R

Laten we oefenen!

Socialemediagegevens analyseren in R

Preparing Video For Download...