Estrazione di dati da Twitter

Analisi dei dati dei social media in R

Sowmya Vivek

Data Science Coach

Panoramica della lezione

  • Fondamenti di API
  • Tipi di API di Twitter
  • Configura l’ambiente R
  • Estrai dati da Twitter
Analisi dei dati dei social media in R

Cos’è un’API

  • Application Programming Interface
  • Intermediario software che permette a due applicazioni di comunicare
  • Le API di Twitter interagiscono con Twitter e permettono di accedere ai tweet
Analisi dei dati dei social media in R

Abbonamenti basati su API

API Standard

Analisi dei dati dei social media in R

Abbonamenti basati su API

API Premium e Enterprise

Analisi dei dati dei social media in R

Prerequisiti per configurare R

  • Prerequisiti per configurare R sul tuo computer
    • Un account Twitter
    • Blocco pop-up disattivato nel browser
    • Sessione R interattiva
    • Pacchetti rtweet e httpuv installati in R
  • Nell’interfaccia DataCamp tutti i prerequisiti sono già pronti
Analisi dei dati dei social media in R

I pacchetti rtweet e httpuv

pacchetto rtweet

pacchetto httpuv

Analisi dei dati dei social media in R

Configurare l’ambiente R

  • Passi per configurare l’ambiente R sul tuo computer
    • Librerie rtweet e httpuv attivate
    • Funzione search_tweets() con query per connetterti a Twitter
    • Autorizza l’accesso dal pop-up del browser
    • "Authentication complete" conferma l’accesso a Twitter
  • Nell’interfaccia DataCamp l’ambiente R è già configurato
Analisi dei dati dei social media in R

Estrai dati da Twitter: search_tweets()

  • search_tweets() restituisce dati Twitter che corrispondono alla query
  • Solo tweet degli ultimi 7 giorni
  • Max 18.000 tweet per richiesta
# Load the rtweet library
library(rtweet)
# Extract tweets on "#gameofthrones" using search_tweets()
tweets_got <- search_tweets("#gameofthrones", n = 1000, include_rts = TRUE, lang = "en")
Analisi dei dati dei social media in R

Estrai dati da Twitter: search_tweets()

head(tweets_got, 4)
  user_id                status_id               created_at         screen_name            text
    <chr>                  <chr>                <S3: POSIXct>          <chr>               <chr>
727816588171350017    1176103860554915841    2019-09-23 11:59:45    LeonardoUzcat1    Today.\n\n#GameofThrones has won Outstanding Drama Series at this year's #Emmys. https://t.co/YHlqvmKxLF    
363838927             1176103859464396806    2019-09-23 11:59:45    mariaaa_carmen    We break the wheel together.\n\n#GameofThrones has been awarded 12 #Emmys, the most of any program this year. https://t.co/gTYq8JWCtD    
881880538461618176    1176103856163434497    2019-09-23 11:59:44    _valkyriez        The #Emmys had their chance with Lena for Seasons 5 &amp; 6 and they blew it. It happens. However, the work Lena Heady brought to the role of Cersei Lannister will never go unnoticed in our hearts &amp; memories. One of the great villains &amp; characters in TV history. #GameOfThrones https://t.co/vpznpzAMsP    
521127287             1176103856075431936    2019-09-23 11:59:44    Nudeus            Congrats to #GameofThrones (60%), the most nominated show in a single season. It wins this year’s #Emmy for Outstanding Drama Series. https://t.co/lSoQE6PjDY https://t.co/IUR6kkI5FL
Analisi dei dati dei social media in R

Estrai dati da Twitter: get_timeline()

  • get_timeline() estrae i tweet pubblicati da un utente Twitter specifico
  • Restituisce fino a 3.200 tweet
# Extract tweets of Katy Perry using get_timeline()
gt_katy <- get_timeline("@katyperry", n = 3200)
Analisi dei dati dei social media in R

Estrai dati da Twitter: get_timeline()

# View the output
head(gt_katy)
user_id         status_id               created_at        screen_name                    text
<chr>             <chr>                <S3: POSIXct>          <chr>                      <chr>
21447363    1175132444103565312    2019-09-20 19:39:42     katyperry    My baby angel @cynthialovely is a MOOD. #MoodSwing EP is out now! 👼Angel’s👼 my favorite - which one is yours? https://t.co/VDgri3RYQv https://t.co/XhgCHTJG2o        
21447363    1175033932355649536    2019-09-20 13:08:15     katyperry    CHICAGO! I’m going to make it a Cozy Little Christmas with you (and @Camila_Cabello, @marshmellomusic, @Normani, @OfficialMonstaX, @liltecca, @ajmitchell, and @NCTsmtown_127) when I see you at the @B96Chicago #JingleBash on December 7! Get your 🎟 here: https://t.co/gBEaNYiZyR https://t.co/Qc5FjR28ti    
21447363    1174461907656273920    2019-09-18 23:15:13     katyperry    I still dress like a child to offset adulting 😩😩😩 https://t.co/dvzJBTL5G6        
21447363    1174428616735756288    2019-09-18 21:02:56     katyperry    watch me perform 🎶Small Talk🎶 on theellenshow today for clear skin ✨ @ The Ellen Show https://t.co/WpLUl33YiA        
21447363    1174381476227338240    2019-09-18 17:55:37     katyperry    🎶 #SmallTalk 🎶 with my friend @TheEllenShow TODAY. Ch    
21447363    1174061536580497409    2019-09-17 20:44:17     katyperry    Make a 🌈 connection with @katyperrycollections this #Shoe
Analisi dei dati dei social media in R

Ayo berlatih!

Analisi dei dati dei social media in R

Preparing Video For Download...