Menyaring tweet

Menganalisis Data Media Sosial dengan R

Vivek Vijayaraghavan

Data Science Coach

Gambaran pelajaran

  • Penyaringan berdasarkan komponen tweet
    • Ekstrak tweet asli
    • Bahasa tweet
    • Tweet populer berdasar minimal retweet dan favorit
Menganalisis Data Media Sosial dengan R

Menyaring tweet asli

  • Tweet asli adalah posting asli oleh pengguna Twitter
  • Bukan retweet, kutipan, atau balasan
  • Tweet asli mencegah konten berulang
  • Membantu menjaga keterlibatan pengguna
Menganalisis Data Media Sosial dengan R

Menyaring tweet asli

  • -filter untuk mengekstrak tweet asli
  • -filter:retweets mengecualikan semua retweet
  • -filter:quote menghapus tweet kutipan
  • -filter:replies memastikan tweet balasan tersaring
Menganalisis Data Media Sosial dengan R

Ekstrak tweet tanpa filter

  • Ekstrak tweet tentang "digital marketing" tanpa filter
# Ekstrak 100 tweet tentang "digital marketing"
tweets_all <- search_tweets("digital marketing", n = 100)
Menganalisis Data Media Sosial dengan R

Ekstrak tweet tanpa filter

  • Periksa jumlah nilai pada kolom reply_to_screen_name, is_quote, is_retweet
# Periksa jumlah balasan
library(plyr)
count(tweets_all$reply_to_screen_name)
x               freq
<fct>          <int>
blairaasmith      2            
javiergosende     1            
juanburgos        1            
WhutTheHale       2            
NA               94
Menganalisis Data Media Sosial dengan R

Ekstrak tweet tanpa filter

# Periksa jumlah kutipan
count(tweets_all$is_quote)
x        freq
<lgl>    <int>
FALSE     98            
TRUE       2
Menganalisis Data Media Sosial dengan R

Ekstrak tweet tanpa filter

# Periksa jumlah retweet
count(tweets_all$is_retweet)
x         freq
<lgl>    <int>
FALSE      61            
TRUE       39
Menganalisis Data Media Sosial dengan R

Kecualikan retweet, kutipan, dan balasan

  • Ekstrak tweet tentang "digital marketing" dengan -filter
# Terapkan '-filter'
tweets_org <- search_tweets("digital marketing 
                            -filter:retweets 
                            -filter:quote 
                            -filter:replies", 
                            n = 100)
Menganalisis Data Media Sosial dengan R

Kecualikan retweet, kutipan, dan balasan

  • Periksa output untuk memastikan balasan, kutipan, dan retweet dikecualikan
# Periksa jumlah balasan
library(plyr)
count(tweets_org$reply_to_screen_name)
x         freq
<lgl>    <int>
NA         100
Menganalisis Data Media Sosial dengan R

Kecualikan retweet, kutipan, dan balasan

# Periksa jumlah kutipan
library(plyr)
count(tweets_org$is_quote)

x         freq
<lgl>    <int>
FALSE     100
# Periksa jumlah retweet
library(plyr)
count(tweets_org$is_retweet)
x         freq
<lgl>    <int>
FALSE     100
Menganalisis Data Media Sosial dengan R

Menyaring tweet berdasarkan bahasa

  • lang menyaring tweet berdasarkan bahasa
  • Mencocokkan tweet dalam bahasa tertentu

Kode bahasa Twitter untuk beberapa bahasa

Menganalisis Data Media Sosial dengan R

Menyaring tweet berdasarkan bahasa

# Saring dan ekstrak tweet berbahasa Spanyol
tweets_lang <- search_tweets("brand marketing", lang = "es")
Menganalisis Data Media Sosial dengan R

Menyaring tweet berdasarkan bahasa

View(tweets_lang)

Tweet yang diekstrak dalam bahasa Spanyol

Menganalisis Data Media Sosial dengan R

Menyaring tweet berdasarkan bahasa

head(tweets_lang$lang)
[1] "es" "es" "es" "es" "es" "es"
Menganalisis Data Media Sosial dengan R

Saring berdasarkan jumlah retweet dan favorit

  • min_faves: menyaring dengan minimal jumlah favorit
  • min_retweets: menyaring dengan minimal jumlah retweet
  • Gunakan operator AND untuk cek kedua syarat
Menganalisis Data Media Sosial dengan R

Saring berdasarkan jumlah retweet dan favorit

# Ekstrak tweet dengan minimal 100 favorit dan retweet 
tweets_pop <- search_tweets("bitcoin min_faves:100 AND
                            min_retweets:100")
Menganalisis Data Media Sosial dengan R

Saring berdasarkan jumlah retweet dan favorit

# Buat data frame untuk memeriksa jumlah retweet dan favorit
counts <- tweets_pop[c("retweet_count", "favorite_count")]
head(counts)
retweet_count    favorite_count
    <int>              <int>
1    162                833
2    141                894    
3    164                1128
4    395                1346    
5    475                2271
6    270                1654
Menganalisis Data Media Sosial dengan R

Saring berdasarkan jumlah retweet dan favorit

# Lihat tweet
head(tweets_pop$text)
text    
<chr>
1    As we continue to build the Bakkt Bitcoin Futures contract, we reached a
2    BREAKING: The United States is considering entering into a "currency pact"
3    REMINDER: The Bitcoin ETF will eventually get approved.\n\nNot a question
4    [New Post] Bitcoin is becoming much more important in Hong Kong and India.
5    Reports are surfacing that some Hong Kong ATMs have run out of cash as
6    Bitcoin is the most transparent currency ever created.
Menganalisis Data Media Sosial dengan R

Ayo berlatih!

Menganalisis Data Media Sosial dengan R

Preparing Video For Download...