Segregatie meten: de dissimilariteitsindex

US Census-gegevens analyseren in Python

Lee Hachadoorian

Asst. Professor of Instruction, Temple University

Wat is segregatie?

Een dot-densitykaart van Chicago met witte, zwarte, Aziatische en Spaanse bevolking in vier kleuren. Dots van dezelfde kleur clusteren, wat op rassensegregatie wijst.

Formule dissimilariteitsindex

Voor twee groepen A en B:

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$\color{white}{D = {\frac{1}{2}\sum_i}\color{white}{\left\lvert \frac{a_i}{A} - \frac{b_i}{B} \right\rvert}}$$

$a_i$ = Aantal van groep A in klein gebied
$b_i$ = Aantal van groep B in klein gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$\color{white}{D = {\frac{1}{2}\sum_i}\color{white}{\left\lvert \frac{a_i}{A} - \frac{b_i}{B} \right\rvert}}$$

$a_i$ = Aantal van groep A in klein gebied
$b_i$ = Aantal van groep B in klein gebied
$A$ = Totaal groep A in groot gebied
$B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$\color{red}D = \frac{1}{2}\sum_i{\left\lvert \frac{{a_i}}{A} - \frac{b_i}{B} \right\rvert}$$

$a_i$ = Aantal van groep A in klein gebied
$b_i$ = Aantal van groep B in klein gebied
$A$ = Totaal groep A in groot gebied
$B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$D = \color{white}{\frac{1}{2}\sum_i}\color{white}{\left\lvert \color{red}{\frac{a_i}{A}} \color{white}{- \frac{b_i}{B}} \right\rvert}$$

$a_i$ = Aantal van groep A in klein gebied
$b_i$ = Aantal van groep B in klein gebied
$A$ = Totaal groep A in groot gebied
$B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$D = \color{white}{\frac{1}{2}\sum_i}\color{white}{\left\lvert \frac{a_i}{A} - \color{red}{\frac{b_i}{B}} \right\rvert}$$

$a_i$ = Aantal van groep A in klein gebied
$b_i$ = Aantal van groep B in klein gebied
$A$ = Totaal groep A in groot gebied
$B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$D = \color{white}{\frac{1}{2}\sum_i}\color{red}{\left\lvert \frac{a_i}{A} - \frac{b_i}{B} \right\rvert}$$

$a_i$ = Aantal van groep A in klein gebied
$b_i$ = Aantal van groep B in klein gebied
$A$ = Totaal groep A in groot gebied
$B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$D = \color{white}{\frac{1}{2}}\color{red}{\sum_i}{\left\lvert \frac{a_i}{A} - \frac{b_i}{B} \right\rvert}$$

$a_i$ = Aantal van groep A in klein gebied
$b_i$ = Aantal van groep B in klein gebied
$A$ = Totaal groep A in groot gebied
$B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$D = \color{red}{\frac{1}{2}}\sum_i{\left\lvert \frac{a_i}{A} - \frac{b_i}{B} \right\rvert}$$

$a_i$ = Aantal van groep A in klein gebied
$b_i$ = Aantal van groep B in klein gebied
$A$ = Totaal groep A in groot gebied
$B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

Formule dissimilariteitsindex

Voor twee groepen A en B:

$$D = \frac{1}{2}\sum_i{\left\lvert \frac{a_i}{A} - \frac{b_i}{B} \right\rvert}$$

$a_i$ = Aantal van groep A in klein gebied
$b_i$ = Aantal van groep B in klein gebied
$A$ = Totaal groep A in groot gebied
$B$ = Totaal groep B in groot gebied

Een doos in vier kwadranten, met de aantallen van A en B in elk kwadrant.

Geschikte data

tracts.head()

  state county   tract  white  black
0    01    001  020100   1601    217
1    01    001  020200    844   1214
2    01    001  020300   2538    647
3    01    001  020400   4030    191
4    01    001  020500   8438   1418

Bron: Tabel P5 - volkstelling 2010

white = Niet-Spaanse witte bevolking
black = Niet-Spaanse zwarte bevolking

De dissimilariteitsindex (D) berekenen

# Extract California tracts using state FIPS "06"
ca_tracts = tracts[tracts["state"] == "06"]

# Define convenience variables to hold column names
w = "white"
b = "black"

De dissimilariteitsindex (D) berekenen

# Print the sum of Black population for all tracts in California
print(ca_tracts[b].sum())

# Print the sum of White population for all tracts in California
print(ca_tracts[w].sum())

14956253

De dissimilariteitsindex (D) berekenen

$$D = \frac{1}{2}\sum_i{\left\lvert \frac{a_i}{A} - \frac{b_i}{B} \right\rvert}$$

# Calculate Index of Dissimilarity
print(0.5 * sum(abs(
  ca_tracts[w] / ca_tracts[w].sum() - ca_tracts[b] / ca_tracts[b].sum()
  )))

0.6033425039167011

Laten we oefenen!

US Census-gegevens analyseren in Python

Preparing Video For Download...