🎉 サイト公開!トライアル期間中は全機能を無料提供。料金プランは近日公開予定です。

よくある質問

一般的な質問への回答

音声の内容を自動でテキストに変換する技術です。録音、会議記録などの音声を素早く編集可能なテキストにできます。

アカウント登録後、ニーズに合うプランを選ぶだけで利用開始できます。直感的なUIで音声を簡単にアップロードし、結果を取得できます。

MP3、WAV、M4A、AAC など一般的な形式に対応しています。特殊な形式が必要な場合はサポートにお問い合わせください。

標準的な環境では98%以上の精度を達成しています。アクセントや雑音の多い音声では精度が低下する場合があります。

当社はデータの安全性を最優先しています。変換後はサーバー上の音声を自動削除し、保存データは業界最高水準の暗号化で保護します。不要な場合はいつでも手動削除できます。

変換時間は音声ファイルの長さによって異なります。一般的に、1分の音声あたり約10秒の変換時間がかかります。長い音声ファイルの場合、変換時間が長くなる場合があります。1時間のような長い音声ファイルは、変換に10分かかる場合があります。

3つの転写モードを提供しています:最速、バランス、正確。高品質の音声の場合、最速またはバランスモードを推奨します。どちらも信頼性の高い精度で迅速な結果を提供するためです。一般的な録音の場合、バランスモードが最適なオールラウンドオプションです。音声に背景ノイズ、複数の話者、または最高の精度が必要な場合は、正確モードを選択してください。

ごみ箱に移動された転写ファイルは最大30日間保持されます。30日の保持期間後、自動的に永続的に削除されます。いつでもごみ箱から手動で永続的に削除することもできます。

話者認識機能は、音声ファイル内の話者を識別するために使用されます。「話者認識を有効にする」ボタンをクリックして話者認識機能を有効にできます。有効にすると、話者認識機能が音声ファイル内の話者を識別するために使用されます。

「話者を認識」オプションにより、AIが音声内の異なる話者を識別して分離できます。話者の数を指定すると、AIはこの情報を使用して話者の分離とラベリングの精度を向上させることができます。数を選択しない場合、システムは自動的に話者を検出して分類します。最終結果は、選択した数に厳密に従わない場合があることに注意してください。AIは実際の音声特性に基づいて話者検出を最適化するためです。

「シナリオ」オプションにより、システムは音声の特定の環境に基づいて技術パラメータを調整できます。異なるシナリオは、ノイズ低減レベル、音声強化、背景フィルタリングなどの異なるAI設定を使用して、複雑なオプションを手動で設定する必要なく、より良い転写精度を実現します。ほとんどの場合、「一般」シナリオは最もバランスの取れたパフォーマンスを提供し、典型的な録音に適しています。

「セグメント長」は、AI転写中に生成される各テキストセグメントのサイズまたは持続時間を指します。転写されたテキストの各チャンクの長さを制御します。短いセグメントはより頻繁な中断とより細かいタイムスタンプを作成し、長いセグメントはより大きなテキストブロックを生成します。この設定は最終的な転写の構造に影響しますが、転写の実際の精度は変更しません。