Korrelation

Einführung in die Statistik

George Boorman

Curriculum Manager, DataCamp

Korrelation zwischen zwei Variablen

scatter_plot_displaying_monthly_gym_costs_vs_cost_of_a_bottle_of_water.png

Einführung in die Statistik

Pearson-Korrelationskoeffizient

  • Veröffentlicht von Karl Pearson im Jahr 1896!
  • Quantifiziert die Stärke einer Korrelation zwischen zwei Variablen
  • Zahl zwischen minus eins und eins
  • Die Größe entspricht der Stärke der Korrelation
  • Das Vorzeichen (+ oder -) entspricht der Richtung der Korrelation
1 https://royalsocietypublishing.org/doi/10.1098/rsta.1896.0007
Einführung in die Statistik

Lineare Korrelationen

  • Linear = proportionale Veränderungen zwischen abhängigen und unabhängigen Variablen

scatter_plot_of_gym_vs_water_costs_with_annotations_for_observations_of_one_dollar_water_and_thirty_dollar_gym_costs_plus_one_dollar_fifty_water_and_forty_five_dollar_gym_costs_and_correlation_coefficient_equals_zero_point_three_six.png

Einführung in die Statistik

Werte = Stärke der Korrelation

0,99 (sehr starke Korrelation)

Scatterplot mit Punkten, die sehr nahe an einer unsichtbaren Linie liegen.png

Einführung in die Statistik

Werte = Stärke der Korrelation

0,99 (sehr starke Korrelation)

Scatterplot mit Punkten, die sehr nahe an einer unsichtbaren Linie liegen.png

0,75 (starke Korrelation)

Scatterplot mit Punkten, die weiter von der unsichtbaren Linie entfernt sind.png

Einführung in die Statistik

Werte = Stärke der Korrelation

0,56 (moderate Beziehung)

Scatterplot mit Punkten, die noch weiter von der unsichtbaren Linie entfernt sind.png

Einführung in die Statistik

Werte = Stärke der Korrelation

0,56 (moderate Beziehung)

Scatterplot mit Punkten, die noch weiter von der unsichtbaren Linie entfernt sind.png

0,21 (schwache Korrelation)

Scatterplot mit Punkten, die fast völlig zufällig verstreut aussehen.png

Einführung in die Statistik

Werte = Stärke der Korrelation

0,04 (keine Korrelation)

Scatterplot mit Punkten, die völlig zufällig verstreut aussehen.png

  • Der Wert von x sagt nichts über y aus
Einführung in die Statistik

Vorzeichen = Richtung

0,75: Wenn x steigt, steigt y

Scatterplot, bei dem y mit x zunimmt.png

-0,75: Wenn x steigt, sinkt y

Streudiagramm, bei dem y mit steigendem x abnimmt.png

Einführung in die Statistik

Fitnessstudiokosten vs. Wasserkosten

scatter_plot_displaying_monthly_gym_costs_vs_cost_of_a_bottle_of_water.png

Einführung in die Statistik

Hinzufügen einer Trendlinie

scatter_plot_displaying_monthly_gym_costs_vs_cost_of_a_bottle_of_water_with_trendline_and_annotated_p_equals_zero_point_three_five.png

Einführung in die Statistik

Lebenserwartung vs. Kosten für eine Flasche Wasser

scater_plot_of_life_expectancy_vs_water_bottle_cost_showing_trendline_and_p_equals_zero_point_six_one.png

Einführung in die Statistik

Korrelation ist nicht gleich Kausalität

  • Führt eine Erhöhung der Wasserkosten zu einem Anstieg der Lebenserwartung?

water_bottles.png

elderly_couple.png

  • Korrelation ist nicht gleich Kausalität
1 Bildnachweis: https://unsplash.com/@micheile; https://unsplash.com/@jon_chng
Einführung in die Statistik

Störvariablen

  • Was könnte die Lebenserwartung noch beeinflussen?

    • Eine Flasche Wasser kostet mehr in Ländern mit starker Wirtschaft
    • Diese Länder bieten im Allgemeinen Zugang zu einer hochwertigen Gesundheitsversorgung
  • Die Stärke der Wirtschaft könnte eine Störvariable sein

    • Eine Störvariable wird nicht gemessen, kann aber die Beziehung zwischen anderen Variablen beeinflussen

doctor.jpg

Einführung in die Statistik

Lass uns üben!

Einführung in die Statistik

Preparing Video For Download...