Feature Engineering voor NLP in Python
Rounak Banik
Data Scientist
| Reading Ease-score | Leerjaar |
|---|---|
| 90-100 | 5 |
| 80-90 | 6 |
| 70-80 | 7 |
| 60-70 | 8-9 |
| 50-60 | 10-12 |
| 30-50 | Universiteit |
| 0-30 | Afgestudeerde |
| Fog-index | Leerjaar |
|---|---|
| 17 | Afgestudeerde |
| 16 | Laatstejaars universiteit |
| 15 | Derdejaars universiteit |
| 14 | Tweedejaars universiteit |
| 13 | Eerstejaars universiteit |
| 12 | Eindexamen middelbaar |
| 11 | Voorlaatste jaar middelbaar |
| Fog-index | Leerjaar |
|---|---|
| 10 | Tweede jaar middelbaar |
| 9 | Eerste jaar middelbaar |
| 8 | Brugklas/achtste groep |
| 7 | Groep 7 |
| 6 | Groep 6 |
# Download nltk punkt module
import nltk
nltk.download('punkt_tab')
# Import the Readability class from readability import Readability# Create a Readability Object readability_scores = Readability(text)# Generate scores gf = readability_scores.gunning_fog() print(gf.score())
16.26
Feature Engineering voor NLP in Python