常見問題
找到常見問題的答案
語音轉文字服務是一種將語音內容自動轉換為文字的技術。它可以幫助您快速將語音錄音、會議紀要等音頻內容轉換為可編輯的文字格式。
只需註冊一個賬戶,選擇適合您需求的套餐,就可以開始使用我們的服務。我們提供用戶友好的界面,讓您可以輕鬆上傳音頻文件並獲得轉換結果。
我們支持各種常見的音頻格式,包括MP3、WAV、M4A、AAC等。如果您有特殊格式要求,請聯繫我們的客服團隊。
我們的語音識別技術採用先進的AI算法,在標準普通話環境下可以達到98%以上的準確率。對於有口音或背景噪音的音頻,準確率可能會稍低。
我們非常重視用戶數據安全。音頻文件在轉換完成後會從服務器自動刪除,您的語音數據保存在安全平台上,採用行業領先的加密技術。您也可以隨時手動刪除音頻文件。
轉換時間取決於音頻文件的長度。一般來說,每分鐘音頻大約需要10秒的轉換時間。對於較長的音頻文件,轉換時間可能會更長。例如,1小時的音頻文件可能需要10分鐘來轉換。
我們提供三種轉錄模式:最快、平衡和準確。對於高質量音頻,推薦使用最快或平衡模式,因為兩者都能快速提供可靠準確的結果。對於一般錄音,平衡模式是最佳選擇。如果您的音頻包含背景噪音、多個說話者或需要最高精度,請選擇準確模式。
移動到回收站的轉錄文件將保留最多30天。在30天保留期後,它們將被自動永久刪除。您也可以隨時從回收站手動永久刪除它們。
說話人識別功能用於識別音頻文件中的說話者。您可以通過點擊"啟用說話人識別"按鈕來啟用說話人識別功能。啟用後,說話人識別功能將用於識別音頻文件中的說話者。
"識別說話人"選項使AI能夠識別和分離音頻中的不同說話者。如果您指定說話者數量,AI可以使用此信息來提高說話人分離和標記的準確性。如果您不選擇數量,系統將自動為您檢測和分類說話者。請注意,最終結果可能不會嚴格遵循您選擇的數字,因為AI仍會根據實際音頻特徵優化說話人檢測。
"場景"選項讓系統根據音頻的具體環境調整技術參數。不同場景使用不同的AI設置(如降噪級別、語音增張和背景過濾),以實現更好的轉錄準確性,而無需您手動配置複雜選項。在大多數情況下,"通用"場景提供最平衡的性能,適合典型的錄音。
"分段長度"是指在AI轉錄過程中生成的每個文本段的大小或持續時間。它控制每個轉錄文本塊的長度。較短的分段創建更頻繁的中斷和更精細的時間戳,而較長的分段產生更大的文本塊。此設置影響最終轉錄的結構,但不會改變轉錄的實際準確性。