![]()
這段時間比較火的AI硬件,有一個就是豆包與努比亞打造的三萬多臺M153工程樣機。
![]()
利用跟系統的深度合作,讓AI控制手機自動完成各種任務!因為效果太過離譜,可以在多個APP之間進行復雜聯動,這引起了大家對隱私的擔憂,這些以前需要專業自動化測試工具的任務,以AI的形式呈現了出來。
![]()
也因為可以用于各種用途,也被各家APP視為統一敵人,軟件型大廠不太歡迎這類工具。
這個事之后,智譜家的AutoGLM也宣布開源,這個工具走的也是AI控制手機的路子,但不同的是它是軟件級工具,需要利用系統的無障礙權限來完成任務,運行任務的時候不能在后臺處理。
![]()
所以搭配了云手機來完成各種操作,也算是開辟了新玩法。
![]()
選擇開源之后可以讓大眾探索更多類似工具,也算是一種先讓大家探索,逐漸適應這類軟件的一種辦法了。
你聽果核說了這么多,你會問,不是說輸入法嗎?在哪...
別急,往下翻,就來了,他居然,搞了一個輸入法。主打就算語音識別功能。
![]()
也不知道是不是之前豆包推出輸入法,大家都著急了。微信輸入法立馬作出反應更新了3.0版本,而智譜,直接從模型里面扣了個出來。
不過不知道是不是時間緣故,知道手機上的競爭激烈,一時半會弄不出來,智譜這個輸入法先出的是電腦版,主打電腦上的AI語音輸入,目前已經可以下載體驗。
![]()
AutoGLM輸入法一上來會讓你測試效果,通過幾個小示例可以知道它的用法,可以自動去除語氣助詞,說錯的話,以及執行一些快捷指令,生成各種文本向的內容。
![]()
![]()
但是,果核下載體驗以后,我緩緩的打出來一個問號。
因為,他并沒有輸入法的界面,不是一個真正的的輸入法,更像是一個輸入輔助工具,不會影響你現有使用的輸入法,要使用的時候長按鍵盤右邊的Ctrl鍵,就會在屏幕上出現一個正在識別的圖標。
![]()
之后說什么就會轉錄成文字,還是挺方便的,如果識別一些專業和冷門的詞匯,也可以手動在它的詞典界面進行編輯。
![]()
像是輸入果核剝殼,之后再語音識別果核剝殼的時候,就會減少識別錯誤的情況。
![]()
除了平常輸入內容,AutoGLM輸入法的另一個特點就是這個人設功能,可以提前預設好提示詞,控制輸出內容(選中的內容相當于輸入)。
![]()
日常使用的時候可以按下ALT+數字來切換人設。
![]()
之后就可以在輸入的時候實現對應功能了,輸出代碼和命令行的內容也可以做的,一些常用命令就不用寄了,說一下清除網絡緩存的Windows命令,它會自己生成。
![]()
在面對不同的人,它會出現不同的結果,效果大致如下:
![]()
雖然看起來很好,感覺能用來替代不少寫作的內容,但是實際用起來還不是很理想。
首先也是最重要的識別準確度的問題,如果命令都識別不準確,那出來的內容再多再詳細也是錯的,AutoGLM輸入法說實話沒有豆包輸入法那種準確度,中英文同時說都困難。
像是問他,小凹,1T等于多少兆?這種相對簡單的問題。
![]()
不是識別成1ET的純文字內容,就是識別成了“一體”,結果非常隨機。
給人的感覺是它并非對輸入環節進行了整體優化,來準確理解當前的輸入意圖,更像是語音識別+AI云端處理+返回結果的拼合處理,更接近一個文本處理工具。
![]()
傳統輸入法的全拼雙拼,智能拼寫,顏文字,符號自動補全,常用語甚至是文字備選項統統是沒有的。
而且也無法在系統的輸入法管理切換,安裝之后的名字,他們自己都沒有叫作AutoGLM輸入法,就是一個AutoGLM,只在軟件界面解釋說相當于AutoGLM輸入法,可見他們自己也是清楚這個問題。
![]()
另外在測試的時候,它會自己莫名其妙地激活很長時間,一直在收集錄音,然后在轉錄階段卡死,實際用起來處于一個比較糟心的狀態。
![]()
當然也不知道后續的更新里會不會加入更多功能~但也正是因為它可以和其他輸入法結合的特性,讓人眼前一亮,還能進行多種輸入結果,如果后續再改進一下,可以選擇多種輸出結果對比,優化一下語音識別準確率。
那就非常Nice了!
當然,果核還是希望速度把打字功能端出來,不然叫輸入法,還是億點奇怪的。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.