Kurze Meldung: 
ich bin auch mit dabei, habe gerade testweise mal das Skript (Version 1)
gestartet, und kann gerne in den nächsten Tagen ein paar Daten sammeln.

Zur Auswertung: Es dürfte ja einen großen Unterschied geben, ob man
einen existierenden Text abschreibt, oder selber einen Text entwirft. 
Im ersten Fall (der bei mir tatsächlich recht häufig ist), ist die
Optimierung der n-Gramme inklusive . und , viel wichtiger als im zweiten
Fall, bei dem man ja vermutlich häufiger an diesen Stellen
Gedanken-Pausen macht.
Aber das Skript kann diesen Unterschied ja gar nicht erkennen? Siehst du
irgendeine Möglichkeit, mit abzufragen, ob ein Text abgeschrieben wurde
oder frisch entstanden ist?

LG
Nora


Am 20.08.2025 um 11:18 schrieb Florian Thaler:
> Hi, nach qwertfisches Anregung eröffne ich hiermit einen neuen Thread! :)
>
>
> Hier geht es um ein Skript, mit dem wir feststellen wollen, welche Bi- 
> und vor allem Trigramme potentielle Gedankenpausen darstellen.
>
>
> Zum Feedback:
>
> > Wenn du es mit
> >
> > #!/usr/bin/env python3
> >
> > startest, kann es auf Linux einfach als Programm gestartet werden -- nach
> > chmod +x neo_ngram_duration_logger.py
> Danke, hab ich hinzugefügt!
>
> > Wäre vielleicht sinnvoll, als Standard-Speicherort was wie
> >
> >    ~/.local/var/lib/ngramlogger/individual_runs
> >
> > zu nutzen.
> Ich glaube, ich hätte es jetzt einmal so gelassen wie es ist, wegen 1. 
> möglichen unterschiedlichen OS-Konventionen und 2. weil es auch für 
> nicht-Techniker möglichst einfach sein soll :)
> Du kannst aber mit --output-dir den Standard-Speicherort einstellen.
>
> > eval(durations_str) sieht irgendwie gefährlich aus 🙂
> > ich hätte eher was wie durations_str.split(",") erwartet.
> Guter Punkt, hab ich angepasst und verwende jetzt json.dumps (das sollte 
> auch später erleichtern, dass ich die Daten in R einlesen kann).
>
> > key_buffer[-2] + "→" + prev_key
> >
> > existiert doch gar nicht im dictionary. Die Variable wird doch wie 
> > folgt zusammengesetzt in Zeile 127:
> >
> > bigram = prev_key + key_str
> >
> > Der Pfeil kommt nicht vor, nur in der Printausgabe in Zeile 124.
> Ups, du hast absolut recht! Da habe ich wohl beim umschreiben etwas 
> übersehen! Sollte jetzt korrigiert sein!
>
> Diese und andere Änderungen sind hier zu finden: 
> https://github.com/Glitchy-Tozier/neo_ngram_duration_logger
>
>
> Bitte noch einmal um Feedback (siehe GitHub), dann würde ich das finale 
> Skript ausschicken!
>
> Liebe Grüße,
> Florian
> _______________________________________________
> Diskussion mailing list -- [email protected]
> To unsubscribe send an email to [email protected]

_______________________________________________
Diskussion mailing list -- [email protected]
To unsubscribe send an email to [email protected]

Antwort per Email an