Inhaltsverzeichnis
Loader
Document
Plugin - Words
Loader
Begrenzung Redirects
Begrenzung Dokument-Größe
dazu muss wohl per Hand iterativ geladen werden + selbst geprüft werden
es gibt keine eingebaute Größenbegrenzung
Document
das Document muss bereits vor dem Request existieren
bestimmte Eigenschaften (tags) können bereits vorher existieren
Plugin - Words
Wörter zerlegen
eventuell zusätzlich in
eventuell nltk benutzen
nltk.word_tokenizer → das Ding tagged die Wörter