微軟Word推出語音文本轉錄功能對抗谷歌Docs
微軟的Word轉錄功能能夠在對話中檢測不同的揚聲器
微軟的Word在網上已經增加了一個音頻轉錄功能,讓您輕松地生成您以前錄制的對話的抄本,或實時轉錄正在進行的對話。這項名為Transcribe in Word的新功能使用Azure認知服務來幫助在微軟Word的在線版本中直接提供轉錄,它能夠檢測不同的揚聲器并為您提供帶有時間戳的音頻。微軟的目標用戶是記錄采訪的記者、學生以及記錄焦點小組會議的研究人員,還有記錄非正式討論的秘書。
Transcribe in Word對所有微軟365的訂閱者免費開放,目前可以通過微軟的Word在新的微軟Edge或Chrome瀏覽器中訪問網絡,不過微軟計劃在今年年底之前將其推廣到Android和iOS應用程序中。
在microsoftword的在線版本中,單擊命令圖標旁邊的下拉按鈕,然后選擇Transcribe選項在Word中進行轉錄,這將帶來一個側邊欄,允許您通過上傳WAV、MP4或MP3格式的音頻文件來生成文本,或者直接在文字處理程序中開始錄制對話。對于上傳的錄音,每個月有5小時或300分鐘的限制——每個上傳的錄音的大小不超過200MB,但是如果你使用內置的音頻錄制選項來轉錄對話,情況就不是這樣了。
微軟通過Azure認知服務使用人工智能(AI)來實現單詞的轉錄,然而,它不像一個常規的語音識別程序,它能夠在一次對話中檢測多個說話者,用戶還可以選擇通過帶時間戳的音頻重新訪問他們的部分錄音,還可以選擇手動編輯文本,以幫助在Microsoft Word中進行更改,一旦您完成了轉錄,您可以通過單擊轉錄工具條中的“添加所有到文檔”按鈕將轉錄的文本添加到Word文檔中。
微軟最初啟用了Transcribe in Word in English (EN-US)功能,不過考慮到該公司在啟用其他語言的經驗方面的成功,它將在未來支持其他一些語言。
Transcribe in Word的到來可以幫助微軟吸引記者、學生和研究人員,他們積極地尋找一個完美的解決方案來轉錄對話,這可能會給在在線文字處理領域占據主導地位的谷歌Docs帶來一場硬仗。此外,由于微軟365的訂閱用戶有轉錄支持,雷德蒙德公司給像Otter這樣的公司制造了麻煩,人工智能是目前為止在使用人工智能和機器學習算法生成書面轉錄領域很流行的一種人工智能。
值得注意的是,Transcribe in Word并不是微軟為用戶提供轉錄功能的第一步,事實上該公司已經在語音到文本的開發上工作了很長一段時間,早在2018年該公司就展示了使用Azure語音服務和錐形硬件的高級語音識別的初始模型,并于去年宣布會話轉錄服務作為其設備不可知的會議實時對話模型。
在帶來轉錄支持的同時,微軟已經提升了它的命令功能上的字與網絡語音命令,這個新添加的功能允許用戶通過“開始列表”或“最后一句話加粗”等命令來修改文檔而不需要使用鍵盤,你也可以使用語音命令來添加符號,如“&”或“百分號”,或者添加標點符號,如省略號,自然地稱它們為“點,點,點”,此外,語音命令還可以用來給你的信息添加表情符號。
口述語音命令最初可以通過網絡和辦公移動應用程序的Word訪問,不過微軟將在今年年底為所有微軟365的用戶提供語音指令,包括Word桌面和Mac應用程序的Word。