Back to all articles
Taylor Brooks

Descript-Preise: Alte Minuten in aktuelle Kosten umrechnen

Erfahre, wie du alte Minuten in exakte Descript-Preise umrechnest – ideal für Podcaster, Kreative und Transkriptoren.

Einführung

Für unabhängige Podcaster, Solo-Creator und freiberufliche Transkriptoren ist die Umstellung von „Transkriptionsminuten“ auf „Medienminuten + KI‑Credits” bei Plattformen wie Descript weit mehr als nur eine kosmetische Preisänderung – sie verändert grundlegend, wie man Kosten kalkuliert, Rechnungen prognostiziert und Arbeitsabläufe plant. Wer bislang einfach grob die monatlichen Transkriptionsstunden addiert hat, braucht nun ein neues System, um diese alten Zahlen in die neuen Einheiten zu übersetzen. Besonders bei transkriptlastigen Workflows kann jeder Dateiupload, jede Neuimportierung und jede abgeleitete Exportversion den Verbrauch ansteigen lassen – in einem Maße, das bisher gar nicht in Rechnung gestellt wurde.

In diesem Leitfaden zeigen wir praxisnah, wie sich bisherige Transkriptionswerte in das neue Abrechnungsmodell übertragen lassen. Wir analysieren typische Szenarien – etwa einen Monat mit fünf Podcast­folgen, eine Interview­serie und einen Mixed-Media-Kurs – und berechnen genau, wie viele Medienminuten und KI‑Credits jeweils anfallen. Außerdem gehen wir auf transkriptspezifische Arbeitsweisen ein, die die Rechnung in die Höhe treiben können, und erklären, wie sich mit einer „Transcript-First“-Strategie (und Tools wie sauberer, strukturierter Transkripterstellung von SkyScribe) Ressourcen sparen und Kosten stabil halten lassen.


Das neue Descript-Preismodell verstehen

Früher wurde nach „Transkriptionsminuten“ abgerechnet: Eine einstündige Audioaufnahme bedeutete 60 abrechenbare Minuten.

Das neue Modell unterscheidet jetzt zwei verbundene Einheiten:

  1. Medienminuten – Die gesamte Spieldauer der hochgeladenen Datei, egal wie sie anschließend genutzt wird. Ein 60‑Minuten-Video zählt also immer als 60 Medienminuten – ob Sie nur den Ton extrahieren oder den Text erfassen.
  2. KI‑Credits – Werden fällig, sobald KI-gesteuerte Verarbeitungsschritte nach dem Upload erfolgen. Dazu gehören z. B. erneute Transkriptexporte, Textbereinigung, Zusammenfassungen oder Untertitel.

Diese Änderung spiegelt den höheren Rechenaufwand auf der Plattform wider – bedeutet aber auch, dass bestimmte Handlungen, wie z. B. erneutes Hochladen zu Testzwecken, nun doppelt kosten können.

Für Podcaster mit 5–10 Folgen im Monat entsteht so das Risiko eines „versteckten Verbrauchs“: auf den ersten Blick kleine Anpassungen wie Re‑Exporte oder neue Segmentierungen führen jetzt zu abrechenbaren Credits.


Alte Transkriptionsminuten auf neue Einheiten umrechnen

Um künftige Kosten einzuschätzen, ermitteln Sie den Durchschnitt der verarbeiteten Stunden aus den letzten 3–6 Monaten. Wandeln Sie diese dann in Medienminuten um und schätzen Sie den KI‑Credit‑Verbrauch.

Eine solide Basisformel ist:

  • Medienminuten: Alte Transkriptionsminuten × 1,4 (dadurch wird berücksichtigt, dass die gesamte Mediendatei gezählt wird, nicht nur der gesprochene Teil)
  • KI‑Credits: Medienminuten × 0,3 (für Sprecher­erkennung, Bereinigung und abgeleitete Exporte)

Beispiel: Aus 300 Transkriptionsminuten im alten Modell werden ca. 420 Medienminuten und rund 126 KI‑Credits im neuen. Das hebt die Grundkosten – selbst bei unveränderten Arbeitsgewohnheiten.


Szenario 1: Fünf Podcastfolgen im Monat

Wöchentliche Interviewshow, Ø 45 Minuten pro Folge.

  • Medienminuten: 5 × 45 min = 225
  • KI‑Credits:
  • Sprecher­erkennung beim Import: 225 × 0,1 = 22,5
  • Untertitel für YouTube: 225 × 0,2 = 45
  • Zusammenfassung für Shownotes: 225 × 0,1 = 22,5 Gesamt: ca. 90 Credits

Früher wurden dafür 225 Minuten berechnet; nun bleiben die Medienminuten gleich, aber die Credits kommen obendrauf.

Kosten senken lässt sich durch multifunktionale Exporte aus nur einem Transkript. SkyScribe etwa liefert präzise beschriftete Transkripte mit Zeitsynchronisierung, aus denen sich offline Untertitel und Zusammenfassungen generieren lassen – ohne mehrfach Credits zu verbraten.


Szenario 2: Zehn Interviews à 30 Minuten

Freelancer transkribiert 10 Interviews für verschiedene Auftraggeber.

  • Medienminuten: 10 × 30 min = 300
  • KI‑Credits:
  • Bereinigte Textversion: 300 × 0,15 = 45
  • SRT‑Untertitel: 300 × 0,15 = 45
  • Kleinere Sprecherkorrekturen: 300 × 0,05 = 15 Gesamt: ca. 105 Credits

Ein häufiger Kostenfresser: jede Korrekturversion neu hochladen. Das wären erneut 300 Medienminuten pro Upload. Besser: ein Mastertranskript erstellen, einmal bereinigen und Varianten lokal anpassen. Mit Tools wie automatischer Resegmentierung in SkyScribe lassen sich Texte in Untertitel- oder Absatzeinheiten aufteilen, ohne neue Medienminuten zu verbrauchen.


Szenario 3: Produktion eines Mixed‑Media‑Kurses

Aufzeichnungen: 2 Stunden Videovorlesungen + 6 × 20 Minuten Q&A.

  • Medienminuten: 120 + 120 = 240
  • KI‑Credits:
  • Kapitelzusammenfassungen: 240 × 0,15 = 36
  • Mehrsprachige Untertitel: 240 × 0,3 = 72
  • Sprechertrennung im Q&A: 120 × 0,15 = 18 Gesamt: ca. 126 Credits

Gerade bei Video häufen sich die Medienminuten, weil die gesamte Laufzeit abgerechnet wird. Dazu summieren sich KI‑Credits für jede Variante. Mehrsprachige Untertitel können den Verbrauch sofort verdoppeln. Wer Übersetzungen im Transkript mit Zeitsynchronisierung erstellt, stellt sicher, dass alle Credits in fertige Assets fließen – statt in Testversionen.


Versteckte Kostenfallen erkennen

Typische Treiber für steigende Kosten im neuen Modell:

  • Mehrfachuploads derselben Datei – Jeder zählt voll, auch wenn identisch.
  • Überflüssige Exporte – z. B. für interne Tests.
  • Feinsegmentierung in mehreren Durchläufen – gleiche Inhalte mehrfach in Untertitellänge aufteilen.
  • Direkter Video‑Export – Untertitel oder Edits ohne vorherige Transkriptkontrolle.

Jeder Schritt, der KI‑Verarbeitung anstößt, kostet Credits. Wer mehrfach für Untertitel, Sprecher­anpassung und Zusammenfassung importiert, häuft schnell einen hohen Verbrauch an.


Transcript-First: Erst Transkript, dann alles andere

Bei einer „Transcript‑First“-Strategie wird das Transkript sofort nach Upload erstellt, bereinigt und strukturiert – und dient als Ausgangsbasis für sämtliche Folgeformate. So lassen sich Mehrfach-Uploads und -Verarbeitung vermeiden.

Konkrete Maßnahmen:

  1. Nur einmal hochladen und sofort Sprecherlabels sowie Zeitmarken prüfen.
  2. Früh bereinigen – Interpunktion, Großschreibung, Füllwörter vor weiteren Formaten korrigieren.
  3. Ableitungen gebündelt exportieren – Untertitel, Zusammenfassungen, Highlights in einer Sitzung erstellen.
  4. Lokal anpassen statt neu hochladen.

Plattformen wie SkyScribe erleichtern das, da bereits beim Import saubere, gelabelte Transkripte mit Zeitstempeln entstehen, aus denen sich alle Varianten ableiten lassen – ohne erneut Medienminuten zu verbrauchen.


Faustregeln für die erste Kostenprognose

Bis echte Nutzungsberichte vorliegen, helfen folgende Anhaltswerte:

  • Alte Transkriptionsminuten × 1,4 = erwartete Medienminuten
  • Medienminuten × 0,3 = Grundverbrauch an Credits für Edit/Export
  • 20–25 % Puffer einplanen, wenn oft Formate geändert oder übersetzt werden

Beispiel: Alter Durchschnitt 400 Minuten:

  • Medienminuten = 400 × 1,4 = 560
  • Credits = 560 × 0,3 = 168
  • Mit 25 % Puffer ≈ 210 Credits

So entsteht vorab ein realistischer Rahmen.


Fazit

Der Wechsel von Descript zu Medienminuten + KI‑Credits ist mehr als eine Rechenänderung – er verändert die Produktionsgewohnheiten. Wer iterativ arbeitet und viele Exporte erzeugt, muss mit höherem Verbrauch und schwankenden Kosten rechnen. Durch Umrechnung alter Werte, das Erkennen von Kostenfallen und die Umsetzung einer Transcript‑First‑Routine lassen sich Ausgaben im Griff behalten.

Und: Mit klarer Planung kann das neue Modell auch für kleinere Budgets funktionieren – besonders mit Tools wie SkyScribe, die saubere, getaggte Transkripte sofort erzeugen. Mit den hier vorgestellten Umrechnungs­formeln behalten Sie den Überblick und vermeiden böse Überraschungen bei der Anpassung an die neue Preislogik.


FAQ

1. Worin unterscheiden sich „Medienminuten“ und „Transkriptionsminuten“? Medienminuten zählen die gesamte Spieldauer der hochgeladenen Datei (inkl. Video), Transkriptionsminuten im alten Modell nur den transkribierten Audioteil.

2. Was genau ist ein KI‑Credit? Ein Credit wird bei jeder KI‑gestützten Aktion verbraucht – z. B. Sprecher­erkennung, Zusammenfassung, Untertitel- oder Übersetzungsexport.

3. Warum sind Mixed‑Media‑Projekte teurer? Bei Video werden alle Laufminuten berechnet, und jede anschließende KI‑Verarbeitung – etwa Sprechertrennung – kostet zusätzlich Credits.

4. Was ist eine Transcript‑First‑Strategie und warum spart sie Geld? Erstellung und Fertigstellung des Transkripts direkt nach dem ersten Upload; alle Folgeformate basieren auf dieser Version. So vermeiden Sie erneute Uploads und zusätzliche KI‑Verarbeitung.

5. Wie hilft SkyScribe, Kosten zu senken? SkyScribe erstellt beim Upload saubere, gelabelte Transkripte, ermöglicht Resegmentierung ohne erneutes Hochladen und bietet Übersetzungen mit Zeitstempeln – das reduziert wiederholte Medienminuten-Abrechnung deutlich.

Agent CTA Background

Starte mit vereinfachter Transkription

Gratis-Plan verfügbarKeine Kreditkarte nötig