Gestroomlijnde data-inname met pandas
Amany Mahfouz
Instructor



requests.get() om data van een URL op te halen
requests.get(url_string) om data van een URL op te halenparams: neemt een dictionary met parameters en waarden om de API-request aan te passenheaders: neemt een dictionary, kan worden gebruikt voor gebruikersauthenticatie bij de APIresponse-object met data en metadataresponse.json() geeft alleen de JSON-data terugresponse.json() geeft een dictionary terugread_json() verwacht strings, geen dictionariespd.DataFrame()read_json() geeft een fout!





import requests import pandas as pdapi_url = "https://api.yelp.com/v3/businesses/search"# Stel de parameter-dictionary in volgens de documentatie params = {"term": "bookstore", "location": "San Francisco"}# Stel de header-dictionary in met API-sleutel volgens de documentatie headers = {"Authorization": "Bearer {}".format(api_key)}# Roep de API aan response = requests.get(api_url, params=params, headers=headers)
# Haal de JSON-data uit het response-object
data = response.json()
print(data)
{'businesses': [{'id': '_rbF2ooLcMRA7Kh8neIr4g', 'alias': 'city-lights-bookstore-san-francisco', 'name': 'City Lights Bookstore', 'image_url': 'https://s3-media1.fl.yelpcdn.com/bphoto/VRydkkpVbA3CeVLBKzs2Vw/o.jpg', 'is_closed': False,
# Laad businesses-data in een dataframe
bookstores = pd.DataFrame(data["businesses"])
print(bookstores.head(2))
alias ... url
0 city-lights-bookstore-san-francisco ... https://www.yelp.com/biz/city-lights-bookstore...
1 alexander-book-company-san-francisco ... https://www.yelp.com/biz/alexander-book-compan...
[2 rows x 16 columns]
Gestroomlijnde data-inname met pandas