常見問題

語音轉文字服務是一種將語音內容自動轉換為文字的技術。它可以幫助您快速將語音錄音、會議紀要等音頻內容轉換為可編輯的文字格式。

只需註冊一個賬戶，選擇適合您需求的套餐，就可以開始使用我們的服務。我們提供用戶友好的界面，讓您可以輕鬆上傳音頻文件並獲得轉換結果。

我們支持各種常見的音頻格式，包括MP3、WAV、M4A、AAC等。如果您有特殊格式要求，請聯繫我們的客服團隊。

我們的語音識別技術採用先進的AI算法，在標準普通話環境下可以達到98%以上的準確率。對於有口音或背景噪音的音頻，準確率可能會稍低。

我們非常重視用戶數據安全。音頻文件在轉換完成後會從服務器自動刪除，您的語音數據保存在安全平台上，採用行業領先的加密技術。您也可以隨時手動刪除音頻文件。

轉換時間取決於音頻文件的長度。一般來說，每分鐘音頻大約需要10秒的轉換時間。對於較長的音頻文件，轉換時間可能會更長。例如，1小時的音頻文件可能需要10分鐘來轉換。

我們提供三種轉錄模式：最快、平衡和準確。對於高質量音頻，推薦使用最快或平衡模式，因為兩者都能快速提供可靠準確的結果。對於一般錄音，平衡模式是最佳選擇。如果您的音頻包含背景噪音、多個說話者或需要最高精度，請選擇準確模式。

移動到回收站的轉錄文件將保留最多30天。在30天保留期後，它們將被自動永久刪除。您也可以隨時從回收站手動永久刪除它們。

說話人識別功能用於識別音頻文件中的說話者。您可以通過點擊"啟用說話人識別"按鈕來啟用說話人識別功能。啟用後，說話人識別功能將用於識別音頻文件中的說話者。

"識別說話人"選項使AI能夠識別和分離音頻中的不同說話者。如果您指定說話者數量，AI可以使用此信息來提高說話人分離和標記的準確性。如果您不選擇數量，系統將自動為您檢測和分類說話者。請注意，最終結果可能不會嚴格遵循您選擇的數字，因為AI仍會根據實際音頻特徵優化說話人檢測。

"場景"選項讓系統根據音頻的具體環境調整技術參數。不同場景使用不同的AI設置（如降噪級別、語音增張和背景過濾），以實現更好的轉錄準確性，而無需您手動配置複雜選項。在大多數情況下，"通用"場景提供最平衡的性能，適合典型的錄音。

"分段長度"是指在AI轉錄過程中生成的每個文本段的大小或持續時間。它控制每個轉錄文本塊的長度。較短的分段創建更頻繁的中斷和更精細的時間戳，而較長的分段產生更大的文本塊。此設置影響最終轉錄的結構，但不會改變轉錄的實際準確性。