Oggi lanciamo DenkHub Transcriber, un'app desktop gratuita e open source per trascrivere file audio e video usando l'intelligenza artificiale, direttamente sul tuo computer. Nessun dato viene inviato a server esterni, nessun account richiesto, nessun abbonamento. Dopo il primo avvio, funziona anche senza internet.
L'app è basata su Whisper, il modello di riconoscimento vocale di OpenAI addestrato su 680.000 ore di audio in 99 lingue, nella sua versione ottimizzata in C++ che lo rende eseguibile su qualsiasi computer, senza GPU dedicata. Noi ci abbiamo costruito sopra un'interfaccia semplice: trascini un file, premi un bottone, leggi il testo.
Scarica gratis per macOS e Windows
Cosa fa
Trascrive audio e video in testo, con precisione che varia in base al modello AI scelto, dal Tiny (75 MB, velocissimo) al Large v3-turbo (3.1 GB, precisione paragonabile ai servizi cloud a pagamento). I modelli si scaricano on-demand: parti con quello leggero, e se ti serve più qualità scarichi quello più potente.
L'app accetta tutti i formati principali: MP3, WAV, OGG, M4A, OPUS per l'audio. MP4, MOV, AVI, MKV per il video, l'audio viene estratto automaticamente. Supporta italiano, inglese, francese, spagnolo e tedesco con rilevamento automatico della lingua.
Un dettaglio che ci piace: supporta il formato OPUS di WhatsApp. I messaggi vocali che non hai mai voglia di ascoltare? Li trascini nell'app e li leggi.
Le cose che abbiamo curato
Whisper fa il lavoro pesante. Quello che abbiamo cercato di fare noi è costruire un'esperienza d'uso che renda la trascrizione comoda, non solo possibile.
Il testo è sincronizzato con l'audio. Ogni parola è cliccabile: un click e la riproduzione parte da quel punto esatto. Il player supporta velocità 1x, 1.5x, 2x.
La correzione è inline. Whisper sbaglia un nome proprio o un termine tecnico? Click destro, correggi, salvato. Undo e redo funzionano come in qualsiasi editor.
Tutto si salva automaticamente in una cronologia con ricerca full-text. Hai fatto trenta trascrizioni e ti serve ritrovare un passaggio specifico? Scrivi una parola e l'app cerca in tutte le trascrizioni passate. Non devi organizzare niente, è già tutto indicizzato.
L'esportazione è un click. Copia negli appunti o esporta come .txt.
Cinque modelli, tu scegli
- Tiny (75 MB) - velocissimo, trascrive 5 minuti di audio in circa 30 secondi
- Base (142 MB) - buon compromesso per uso quotidiano
- Small (466 MB) - precisione buona, tempi ragionevoli
- Medium (1.5 GB) - alta precisione per contenuti importanti
- Large v3-turbo (3.1 GB) - il migliore, compete con servizi da 15-30 euro al mese
Scarichi solo quelli che ti servono. Se cambi idea, li rimuovi e ne scarichi altri.
Tutto in locale, tutto tuo
Ne abbiamo parlato a lungo nel nostro articolo su Perplexity e la privacy: quando un servizio cloud ti dice "i tuoi dati sono al sicuro", ti sta chiedendo un atto di fede. Con DenkHub Transcriber la questione non si pone.
Non c'è un server dove i file vengono caricati. Non c'è telemetria. Non c'è un backend cloud. L'unica connessione avviene quando scarichi un modello AI. Dopo, puoi staccare il WiFi e l'app funziona uguale. Le trascrizioni stanno in un database SQLite sul tuo disco. I modelli stanno dove decidi tu. Se disinstalli l'app, non resta niente da nessuna parte che non sia il tuo computer.
A chi è pensata
Giornalisti che trascrivono interviste e preferiscono che restino sul loro computer. Ricercatori che lavorano con interviste qualitative e focus group. Studenti che vogliono trasformare lezioni registrate in appunti cercabili. Podcaster che hanno bisogno di sottotitoli. Avvocati che trascrivono verbali e deposizioni. Chiunque riceva troppi vocali su WhatsApp e preferisca leggerli.
Requisiti e installazione
L'installer pesa circa 124 MB su macOS e 100 MB su Windows. I modelli AI si scaricano a parte. Zero dipendenze: non serve Python, non serve una GPU.
Funziona su macOS 12+ (Apple Silicon) e Windows 10+ (64-bit). Servono almeno 4 GB di RAM, 8 consigliati per i modelli più grandi.
Al primo avvio un wizard ti guida nella configurazione: scegli dove salvare i modelli, dove salvare le trascrizioni, scarichi il primo modello. Cinque minuti e sei operativo.
Nota: l'app non è firmata con certificati Apple o Microsoft, normale per software open source indipendente. Il sistema operativo mostra un avviso al primo avvio che si supera in un click.
Open source, licenza MIT
Il codice è pubblico e ispezionabile su GitHub: github.com/denkhub-io/denkhub-transcriber. Il progetto è rilasciato sotto licenza MIT. Tutto quello su cui è costruito è software libero: Whisper, whisper.cpp, Electron, FFmpeg, SQLite.
Puoi leggere il codice, fare una fork, proporre modifiche, segnalare bug. Nessun costo nascosto. Nessun piano premium. Nessun "gratis per 7 giorni".
Cos'è il Playground di DenkHub
DenkHub Transcriber è un progetto del nostro Playground, una sezione di DenkHub dove pubblichiamo progetti gratuiti e open source che chiunque può usare, modificare e migliorare. Non sono prodotti commerciali, non hanno piani a pagamento. Sono esperimenti costruiti per essere utili: li mettiamo a disposizione e chi vuole può prenderli, studiarli, farli propri.
L'idea è che la tecnologia più interessante oggi è accessibile: i modelli sono open source, gli strumenti ci sono, le librerie pure. Quello che manca spesso è qualcuno che metta insieme i pezzi e li renda utilizzabili senza dover essere sviluppatori. Il Playground esiste per questo.
Transcriber è il primo progetto. Non sarà l'ultimo.
