Benutzer-Werkzeuge

Webseiten-Werkzeuge


noise2:todo

Inhaltsverzeichnis

Loader

  • Begrenzung Redirects
  • Begrenzung Dokument-Größe
    • dazu muss wohl per Hand iterativ geladen werden + selbst geprüft werden
    • es gibt keine eingebaute Größenbegrenzung

Document

  • das Document muss bereits vor dem Request existieren
    • bestimmte Eigenschaften (tags) können bereits vorher existieren

Plugin - Words

  • Wörter zerlegen
  • eventuell zusätzlich in
  • eventuell nltk benutzen
  • nltk.word_tokenizer → das Ding tagged die Wörter
noise2/todo.txt · Zuletzt geändert: 2022/03/03 20:51 von root