Analyse de données exploratoires en Python
George Boorman
Curriculum Manager, DataCamp
sns.heatmap(planes.corr(numeric_only=True), annot=True)
plt.show()
sns.scatterplot(data=planes, x="Duration", y="Price", hue="Total_Stops")
plt.show()
![Graphique représentant le prix en fonction de la durée, en tenant compte du nombre total d'arrêts] (https://assets.datacamp.com/production/repositories/6180/datasets/9246242fed240d822415bbcfc45c4103eaebdd3c/scatterplot_of_price_vs_duration_factoring_total_stops.png = 50)
![Carte thermique avec les scores du coefficient de corrélation pour chaque nombre d'arrêts] (https://assets.datacamp.com/production/repositories/6180/datasets/4d4a4a3c4bc46bd1950356d2a6a1dd2835a8c911/heatmap_with_different_stops.jpg = 72)
![Machine à écrire affichant « Fake News » (https://assets.datacamp.com/production/repositories/6180/datasets/4ea8d0ba8ab9c9b0420b318953133cd0e6f2abc3/fake_news.jpg = 55)
Les données provenant d'une autre période donneraient-elles les mêmes résultats ?
Détecter les relations, les différences et les tendances :
Avant la collecte des données, le test d'hypothèse nécessite :
sns.barplot(data=planes, x="Airline", y="Duration")
plt.show()
![Graphique à barres représentant la durée en fonction de la compagnie aérienne] (https://assets.datacamp.com/production/repositories/6180/datasets/cf0ed6e3fb30efa5106d4e78c810fc9852561bd0/duration_vs_airline.png = 48)
sns.barplot(data=planes, x="Destination", y="Price")
plt.show()
![Graphique à barres indiquant le prix moyen (https://assets.datacamp.com/production/repositories/6180/datasets/bd29cc594b5642a909cb1e564684da0f6d78ef0c/price_by_destination.png = 50)
Concevez notre expérience
Cela implique les étapes suivantes :
Analyse de données exploratoires en Python