Segregatie meten: de dissimilariteitsindex

US Census-gegevens analyseren in Python

Lee Hachadoorian

Asst. Professor of Instruction, Temple University

Wat is segregatie?

Een dot-densitykaart van Chicago met witte, zwarte, Aziatische en Spaanse bevolking in vier kleuren. Dots van dezelfde kleur clusteren, wat op rassensegregatie wijst.

US Census-gegevens analyseren in Python

Formule dissimilariteitsindex

Voor twee groepen A en B:

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

US Census-gegevens analyseren in Python

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$\color{white}{D = {\frac{1}{2}\sum_i}\color{white}{\left\lvert \frac{a_i}{A} - \frac{b_i}{B} \right\rvert}}$$

  • $a_i$ = Aantal van groep A in klein gebied
  • $b_i$ = Aantal van groep B in klein gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

US Census-gegevens analyseren in Python

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$\color{white}{D = {\frac{1}{2}\sum_i}\color{white}{\left\lvert \frac{a_i}{A} - \frac{b_i}{B} \right\rvert}}$$

  • $a_i$ = Aantal van groep A in klein gebied
  • $b_i$ = Aantal van groep B in klein gebied
  • $A$ = Totaal groep A in groot gebied
  • $B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

US Census-gegevens analyseren in Python

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$\color{red}D = \frac{1}{2}\sum_i{\left\lvert \frac{{a_i}}{A} - \frac{b_i}{B} \right\rvert}$$

  • $a_i$ = Aantal van groep A in klein gebied
  • $b_i$ = Aantal van groep B in klein gebied
  • $A$ = Totaal groep A in groot gebied
  • $B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

US Census-gegevens analyseren in Python

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$D = \color{white}{\frac{1}{2}\sum_i}\color{white}{\left\lvert \color{red}{\frac{a_i}{A}} \color{white}{- \frac{b_i}{B}} \right\rvert}$$

  • $a_i$ = Aantal van groep A in klein gebied
  • $b_i$ = Aantal van groep B in klein gebied
  • $A$ = Totaal groep A in groot gebied
  • $B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

US Census-gegevens analyseren in Python

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$D = \color{white}{\frac{1}{2}\sum_i}\color{white}{\left\lvert \frac{a_i}{A} - \color{red}{\frac{b_i}{B}} \right\rvert}$$

  • $a_i$ = Aantal van groep A in klein gebied
  • $b_i$ = Aantal van groep B in klein gebied
  • $A$ = Totaal groep A in groot gebied
  • $B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

US Census-gegevens analyseren in Python

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$D = \color{white}{\frac{1}{2}\sum_i}\color{red}{\left\lvert \frac{a_i}{A} - \frac{b_i}{B} \right\rvert}$$

  • $a_i$ = Aantal van groep A in klein gebied
  • $b_i$ = Aantal van groep B in klein gebied
  • $A$ = Totaal groep A in groot gebied
  • $B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

US Census-gegevens analyseren in Python

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$D = \color{white}{\frac{1}{2}}\color{red}{\sum_i}{\left\lvert \frac{a_i}{A} - \frac{b_i}{B} \right\rvert}$$

  • $a_i$ = Aantal van groep A in klein gebied
  • $b_i$ = Aantal van groep B in klein gebied
  • $A$ = Totaal groep A in groot gebied
  • $B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

US Census-gegevens analyseren in Python

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$D = \color{red}{\frac{1}{2}}\sum_i{\left\lvert \frac{a_i}{A} - \frac{b_i}{B} \right\rvert}$$

  • $a_i$ = Aantal van groep A in klein gebied
  • $b_i$ = Aantal van groep B in klein gebied
  • $A$ = Totaal groep A in groot gebied
  • $B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

US Census-gegevens analyseren in Python

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$D = \frac{1}{2}\sum_i{\left\lvert \frac{a_i}{A} - \frac{b_i}{B} \right\rvert}$$

  • $a_i$ = Aantal van groep A in klein gebied
  • $b_i$ = Aantal van groep B in klein gebied
  • $A$ = Totaal groep A in groot gebied
  • $B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

US Census-gegevens analyseren in Python

Geschikte data

tracts.head()
  state county   tract  white  black
0    01    001  020100   1601    217
1    01    001  020200    844   1214
2    01    001  020300   2538    647
3    01    001  020400   4030    191
4    01    001  020500   8438   1418

Bron: Tabel P5 - volkstelling 2010

  • white = Niet-Spaanse witte bevolking
  • black = Niet-Spaanse zwarte bevolking
US Census-gegevens analyseren in Python

De dissimilariteitsindex (D) berekenen

# Extract California tracts using state FIPS "06"
ca_tracts = tracts[tracts["state"] == "06"]

# Define convenience variables to hold column names w = "white" b = "black"
US Census-gegevens analyseren in Python

De dissimilariteitsindex (D) berekenen

# Print the sum of Black population for all tracts in California
print(ca_tracts[b].sum())
2163804
# Print the sum of White population for all tracts in California
print(ca_tracts[w].sum())
14956253
US Census-gegevens analyseren in Python

De dissimilariteitsindex (D) berekenen

$$D = \frac{1}{2}\sum_i{\left\lvert \frac{a_i}{A} - \frac{b_i}{B} \right\rvert}$$

# Calculate Index of Dissimilarity
print(0.5 * sum(abs(
  ca_tracts[w] / ca_tracts[w].sum() - ca_tracts[b] / ca_tracts[b].sum()
  )))
0.6033425039167011
US Census-gegevens analyseren in Python

Laten we oefenen!

US Census-gegevens analyseren in Python

Preparing Video For Download...