Anthropic Claude
Beste Schreib-Qualität, lange Kontexte, Prompt-Caching senkt Folgekosten. Empfehlung: Claude Haiku 4.5 — schnell und günstig.
~0,001 € pro Diktat
Key bei console.anthropic.com →
Lokales Voice-Dictation für WindowsTrigger-Wort sagen, sprechen — der Text landet automatisch am Cursor. In Slack, Mail, Notion, ChatGPT, überall. Audio bleibt auf deinem Rechner.
Anna K. · 14:21
Hey, hast du schon die finale Version?
Was neu ist
Sprachaktivierung, smarter Auto-Stopp und ein Overlay, das mitwandert.
Sprachaktivierung
Kein Tastendruck, kein Klick. Trigger-Wort sagen, sprechen, fertig. Die Aufnahme startet automatisch — mitten im Tippen.
„heymeta, sende eine kurze Zusammenfassung an Anna."
Smarter Auto-Stopp
Pausen-Erkennung stoppt nach ~1.6 s Stille. Kein Cut mitten im Satz, keine Wartezeit nach dem letzten Wort. Hard-Cap bei 30 s.
Vorher: starre 8-Sekunden-Aufnahme. Jetzt: so lang wie du sprichst.
Schwebendes Overlay
Das Status-Pill erscheint direkt am Cursor des aktiven Fensters — kein Wechsel des Blickfelds, kein Suchen.
Frosted Glass · Live Audio-Bars · weicher Crossfade zwischen States.
100% lokal. Audio verlässt deinen Rechner nie.
Spracherkennung via faster-whisper offline. Optionaler AI-Cleanup (Claude, OpenAI, Gemini, Groq oder Custom Endpoint) sendet nur den fertigen Text — nie das Audio.
Geschätzt von Teams bei …
Du tippst 45 Wörter pro Minute — die meisten Menschen jedenfalls. Sprechen sind 200+.
Du kopierst dauernd hin und her zwischen Diktat-Tool und der App, in der du eigentlich schreibst.
Cloud-Tools schicken dein Audio an Drittanbieter. Vertraulich? Nicht wirklich.
So funktioniert SpeakingLoud
Drück F9 (oder deine Wunschtaste) und halt sie.
Sag was du tippen würdest. Auf Deutsch, Englisch, mit Pausen, mit Füllwörtern.
Text erscheint direkt am Cursor. In jeder App. Saubere Satzzeichen, keine Ähms.
Spoiler: der Unterschied ist gewaltig.
Schnell, lokal, in jeder App. Ohne Schnickschnack.
Whisper-Spracherkennung läuft auf deinem Rechner. Audio verlässt das Gerät nie. DSGVO-konform by design.
Outlook, Slack, VS Code, Browser, ChatGPT, Word, Notion — überall wo du tippen kannst.
Provider-Wahl: Claude, OpenAI, Gemini, Groq oder eigener Endpoint. Bring deinen Key mit oder bleib bei der reinen lokalen Variante — 0 €.
Trage Firmen-, Produkt- oder Personennamen ein. Whisper erkennt sie dann zuverlässig.
Deutsch und Englisch, umschaltbar. Auto-Detect für gemischte Diktate.
Push-to-talk oder Toggle, beliebiger Hotkey, Overlay an/aus — alles in einem schönen Settings-Dialog.
AI-Cleanup · Provider-Wahl
heymeta funktioniert mit jeder modernen AI-API. Bring deinen eigenen Key mit, zahl, was du tatsächlich nutzt, und wechsle jederzeit den Anbieter — Einstellung dauert 10 Sekunden.
Beste Schreib-Qualität, lange Kontexte, Prompt-Caching senkt Folgekosten. Empfehlung: Claude Haiku 4.5 — schnell und günstig.
~0,001 € pro Diktat
Key bei console.anthropic.com →Standard-Schnittstelle der Branche. GPT-4o-mini ist sehr günstig, GPT-4o reicht in Reichweite an Claude heran.
~0,0005 € pro Diktat (mini)
Key bei platform.openai.com →Gemini 1.5 Flash hat eine großzügige kostenlose Free-Tier — ideal zum Testen ohne Kreditkarte. Performance auf Augenhöhe mit GPT-4o-mini.
0 €/Diktat im Free-Tier
Key bei aistudio.google.com →Schnellste Inferenz weltweit. Llama 3.3 70B auf Groq antwortet in 300–500 ms — kaum spürbar. Sehr günstig, faire Free-Tier.
~0,0001 € pro Diktat
Key bei console.groq.com →Jede OpenAI-kompatible API: DeepSeek, OpenRouter, Mistral, Together AI, lokales Ollama. Du gibst Base-URL und Key — heymeta spricht das gleiche Protokoll.
abhängig vom Anbieter
Setup-Doku öffnen →Roh-Transkript wird ohne Cloud-Schritt direkt eingefügt. Kein API-Key, kein Cent, kein Daten-Transfer nach außen. Die Standardoption für den Start.
0 € · 100 % lokal
Audio verlässt deinen Rechner nie.
Die Spracherkennung läuft komplett offline via faster-whisper. Erst der bereits in Text verwandelte Inhalt geht an deinen gewählten Anbieter — und das nur, wenn du AI-Cleanup einschaltest.
Wechsel jederzeit den Anbieter.
Provider in den Einstellungen umschalten dauert 10 Sekunden. Keine Datenmigration, keine Re-Aktivierung. Heute Claude, morgen Gemini — alles deine Entscheidung.
Schieb mal — du wirst überrascht sein.
Annahme: 5 Arbeitstage/Woche, 48 Arbeitswochen/Jahr, 220 WPM Sprech-Tempo. Stundensatz exemplarisch 50 € — deiner ist vielleicht höher.
Meeting-Notizen in Notion direkt nach dem Call diktieren.
Mandantenschreiben dreimal schneller fertigstellen.
Code-Kommentare und PR-Beschreibungen einsprechen statt tippen.
Erstentwürfe als Sprachgedanken-Strom, ohne Block-Schreibhemmung.
Du musst dir keine Sorgen um Kompatibilität machen.
… und buchstäblich jede andere App. Wir nutzen die Windows-Zwischenablage und simulieren Strg+V — das funktioniert systemweit.
SpeakingLoud entsteht bei der heymeta GmbH in Heilbronn — einem kleinen Team, das B2B-Software für Wissensarbeiter baut. Wir hatten die Schnauze voll davon, dass Diktiersoftware entweder unsere Audios in die Cloud schickt oder unsere Hände belastet.
Also haben wir uns selbst gebaut, was wir brauchten: ein Tool, das systemweit funktioniert, lokal bleibt und einfach klappt. Heute teilen wir's mit anderen, denen es genauso geht.

Sprich los — keine Hotkeys, kein Klick. Endlos-Loop, lass es einmal durchlaufen.
Anna · 14:18
Brauchen wir noch Feedback zu den Folien?
Du · 14:20
Schau ich gleich nach…
Aufnahme läuft
Sprich frei — stoppt automatisch bei Pause
Ehrlicher Vergleich. Keine Tricks. Wir gewinnen, weil's so ist.
| Feature | SpeakingLoud | Premium Cloud-Diktier-Apps | Profi-Diktiersoftware (Dragon-Klasse) | Bordmittel & kostenlose Tools |
|---|---|---|---|---|
| Preis | 49 € einmalig | ~12 €/Monat (~144 €/Jahr) | 150–500 € einmalig | 0 € |
| Kostenmodell | Einmal-Kauf | Abo | Einmal-Kauf | Gratis |
| Kosten nach 3 Jahren | 49 € | ~432 € | 150–500 € | 0 € |
| 100% offline (Audio bleibt lokal) | ✅ | ❌ | ✅ | ✅ |
| Systemweit in jeder App | ✅ | ✅ | ❌ | ❌ |
| Hochwertige deutsche Erkennung | ✅ | ✅ | ✅ | ❌ |
| AI-Cleanup (Füllwörter, Satzzeichen) | ✅ | ✅ | ❌ | ❌ |
| Fachbegriffe / Custom Vocabulary | ✅ | ⚠️ | ✅ | ❌ |
| DSGVO ohne AV-Vertrag | ✅ | ❌ | ✅ | abhängig |
| Kein Account-Lock-in | ✅ | ❌ | ✅ | — |
| Setup-Aufwand | 5 Min | 5 Min | 30 Min+ | <5 Min |
| macOS-Version | später (Roadmap) | meist ✅ | meist ✅ | macOS hat eigenes Diktat |
Wir nennen bewusst keine Wettbewerber-Namen — vergleich selbst, du wirst die Kategorien wiedererkennen.
Erst 5 Tage gratis testen. Dann 14 Tage Geld-zurück-Garantie.
Volle Funktion. Keine Kreditkarte. Kein Abo. Nach 5 Tagen bittet die App um deinen Lizenz-Schlüssel — oder beendet sich.
Nicht zufrieden? Eine kurze Mail genügt. Geld kommt zurück. Keine Begründung nötig, keine versteckten Bedingungen.
Lizenz-Schlüssel bleibt deiner — auch bei Hardware-Wechsel. Diktate bleiben auf deinem Rechner, du hast die volle Kontrolle.
Kein Abo. Keine versteckten Kosten. Updates inklusive für 1 Jahr.
Für Einzelpersonen
Für kleine Teams
Für Abteilungen
Alle Preise inkl. 19% USt. · 14 Tage Geld-zurück-Garantie · Auch per Rechnung
Größere Lizenz benötigt? Schreib uns →
Ja. Nach jedem Kauf erhältst du automatisch per E-Mail eine gültige Rechnung mit 19% Umsatzsteuer ausgewiesen. Reverse-Charge für EU-Geschäftskunden ist möglich — gib einfach deine USt-IdNr. beim Checkout an.
Schreib uns eine kurze Mail an hello@speakingloud.app — wir entkoppeln die Lizenz von deinem alten Gerät innerhalb von 24 Stunden, und du kannst sie auf dem neuen aktivieren. Kein Aufpreis.
Ja. Ab 50 Lizenzen ~20%, ab 100 Lizenzen ~30%. Schreib uns für ein individuelles Angebot — wir antworten meist am selben Werktag.
Ja, 30% Rabatt mit kurzem Nachweis (Immatrikulation, Vereinsregistereintrag). Sprich uns einfach an.
Deine Version läuft unbegrenzt weiter — keine Selbst-Zerstörung, keine Server-Abhängigkeit. Major-Upgrades (z.B. 2.0) kosten 50% des dann aktuellen Listenpreises. Minor-Updates und Bugfixes sind immer kostenlos.
Wir bieten Volumen-Rabatte ab 50 Lizenzen, individuelle Onboarding-Workshops und maßgeschneiderte Lizenzbedingungen für Enterprise-Kunden. Auch Rechnung auf 30 Tage Ziel möglich.
⚠️ Platzhalter — werden mit echten Stimmen nach den ersten Verkäufen ersetzt.
„<TESTIMONIAL_1_QUOTE>"
„<TESTIMONIAL_2_QUOTE>"
„<TESTIMONIAL_3_QUOTE>"
Du kaufst nicht nur was Heutiges, sondern auch was Morgiges.
Releases ohne Aufpreis im ersten Update-Jahr nach Kauf. Roadmap ohne Gewähr — aber mit ehrlicher Absicht.
Nein, die Spracherkennung läuft komplett offline. Internet brauchst du nur, falls du den optionalen AI-Cleanup über deinen Anbieter (Claude, OpenAI, Gemini, Groq oder Custom Endpoint) nutzen willst.
Windows 10 oder 11, 64-Bit. Mindestens 8 GB RAM. Eine moderne CPU (Intel i5 ab 8. Gen oder Ryzen 5 ab 3000er). Eine dedizierte GPU ist nicht erforderlich.
Ja, aber Bluetooth-Headsets sind unter Windows nicht immer zuverlässig für Mikrofon-Input. Wir empfehlen ein USB- oder eingebautes Mikrofon.
Die Single-Lizenz ist an eine Hardware gebunden. Falls du den Rechner wechselst, schreib uns eine kurze Mail — wir entkoppeln die Lizenz und du kannst sie auf der neuen Maschine aktivieren.
Nein. Audio wird direkt nach der Transkription verworfen. Es gibt keine Aufnahme-Historie, keinen Cloud-Sync, keine Telemetrie. Du kannst die gesamte App-Kommunikation in deiner Firewall blockieren — sie würde weiterlaufen.
Via Windows-Zwischenablage und simuliertem Strg+V. Das funktioniert in praktisch jeder Anwendung — wir haben kein App-Whitelist.
Single-Lizenz: 1 Jahr kostenlose Updates ab Kauf. Team-25: 2 Jahre. Danach bleibt deine Version voll funktionsfähig; Upgrades auf Major-Versionen kosten 50% des Listenpreises.
14 Tage volles Rückgaberecht ohne Begründung, wenn du Privatkunde bist. Schreib uns eine Mail, Geld kommt zurück.
5 Tage Vollzugriff. Keine Kreditkarte. Kein Risiko.