===== Loader ===== * Begrenzung Redirects * Begrenzung Dokument-Größe * dazu muss wohl per Hand iterativ geladen werden + selbst geprüft werden * es gibt keine eingebaute Größenbegrenzung ===== Document ===== * das Document muss bereits vor dem Request existieren * bestimmte Eigenschaften (tags) können bereits vorher existieren ===== Plugin - Words ====== * Wörter zerlegen * eventuell zusätzlich in * eventuell nltk benutzen * nltk.word_tokenizer -> das Ding tagged die Wörter