Follow

sammelt für das Spracherkennungs-Projekt Sprachproben. Jetzt auch auf Deutsch - und Du kannst mitmachen.
Entweder sprichst Du ein paar vorgegebene Sätze ein oder Du bestätigst die Beiträge anderer User: voice.mozilla.org/de

@kaffeeringe Ich werde da auf jeden Fall mitmachen, alleine schon weil meine Sprache etwas anders ist als der Normalfall. Viel zu viele ML-Systeme sind nur mit Repräsentation der Mehrheitsgesellschaft gefüttert, Minderheiten spielen keine Rolle. So werden zum Beispiel schwarze Menschen auch viel schlechter von Bilderkennungsalgorithmen erkannt.

@thalon
Ja, das ist absolut richtig und wichtig. Habe mal ein paar der Aufzeichnungen überprüft, und das Probematerial scheint ausschließlich von Männern mittleren Alters mit klarer Aussprache eingesprochen zu sein. Wenn das System so trainiert wird, ist der Bias schon fix drin. Also, alle die nicht dieser Gruppe angehören, macht mit, sofern ihr mit der Veröffentlichung eurer Stimmdaten einverstanden seid!
@kaffeeringe

@kaffeeringe

Mich würde da mal interessieren, wo werden diese Daten gespeichert? Wer hat Zugriff?

Vielleicht ist das alles nur eine Maßnahme, um an Sprachproben heranzukommen - lässt sich über die IP, Uhrzeit des Zugriffs, verwendetes Betriebssystem bzw. genutzter Browser und weiterer Daten etc. doch wunderbar zuordnen, von wem welche Sprachprobe ist...

@Urmeline @kaffeeringe Skepsis ist angebracht, wenn Daten gesammelt werden. Auch bei Mozilla. Aber in diesem Fall schätze ich es legitim ein. Schau auf die Webseite! Die Daten werden anonymisiert zum Download angeboten unter einer freien Lizenz. Die Software ist open source. Welche Daten erhoben werden kannst du also im Code nachsehen.

Sign in to participate in the conversation
Mastodon

One of the first Mastodon instances, there is no specific topic we're into, just enjoy your time!