概要

Parakeet V3sherpa-onnx経由)による内蔵音声入力。完全にローカルで動作 — APIキー不要、データは外部に送信されません。

使い方

  • プッシュトゥトーク: Ctrl+Altを押しながら話し、離すと文字起こし
  • マイクボタン: 画面右下のマイクアイコンをクリック

仕組み

  1. Web Audio APIで音声をキャプチャ(webm/opus)
  2. 16kHzモノラルFloat32に変換
  3. 別プロセスのParakeet V3で処理
  4. 文字起こしテキストをアクティブターミナルに送信

パフォーマンス

  • モデルサイズ: 約300MB(インストーラーにバンドル)
  • 初回: 数秒(モデル読み込み)、以降: ほぼ即座
  • CPUのみ — GPU不要

プラン制限

  • Free: 30分付き
  • Pro / Lifetime: 無制限