Innerhalb der letzten Jahrzehnte konnte die Forschung an großen Sprachmodellen die maschinelle Sprachverarbeitung signifikant verbessern und frühere Techniken und Anwendungen damit in den Schatten stellen. Diese Fortschritte werden vor allem im täglichen Leben sichtbar: beispielsweise bei der Nutzung von Sprachassistenten, die auf Basis von riesigen Datenmengen lernen, unsere Alltagssprache zu verstehen, und uns bei verschiedensten Tätigkeiten unterstützen. Die Sammlung großer Mengen von Sprachdaten ist allerdings mit Risiken für Privatsphäre und Datensicherheit verbunden. Wir werden in diesem Artikel die Entwicklung kommerzieller Sprachassistenz beleuchten und sowohl erörtern, woher die große Menge an Sprachdaten kommt, als auch die damit einhergehenden Risiken der Datensammlung und die Auswirkungen auf den Datenschutz.