无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

AI“帶火”語音辦公:打工人開始對著電腦嘀嘀咕咕

打工人開始對著電腦嘀嘀咕咕

0
分享至



記者 鄭晨燁

淘寶上最近流行起了一種鍵盤產品,但它只有4個按鍵、1個撥桿和1個麥克風接口,沒有字母鍵,不能打字,售價269元起,搭配大疆麥克風的版本售價400多元。這個產品叫AhaKey-X1,由南京錦心灣科技有限責任公司(下稱AhaKey)開發,今年春節前后才上線。

它的用途很簡單:方便用戶對AI說話。

用戶只需按下語音鍵,對著麥克風口述工作指令,AI將語音轉成文字后發送給Claude、ChatGPT、DeepSeek、Cursor等AI工具執行。不管是寫代碼、改方案還是整理會議紀要,用戶都不需要打字,說出來就行,AI會自動把口語化的表達整理成結構化的文本。

AhaKey聯合創始人兼CTO張心陽告訴經濟觀察報記者,自產品上線以來,每月銷量翻倍增長,“6?18”期間公司備貨量已近1000臺,目前正和多家產業資本及投資機構接洽融資。

一個沒有字母鍵的鍵盤能賣得好,是因為越來越多的人開始用語音代替打字對AI下達工作指令。這種辦公方式最早在程序員中流行,他們用語音向AI描述需求,AI生成代碼。但現在,產品經理、律師、內容創作者也開始這樣做。

張心陽告訴經濟觀察報記者,有一個令他印象很深的用戶,是一個40多歲的律師,“他連Windows電腦用得都不是特別順”,但買了AhaKey之后,不需要打字就能和AI對話完成工作。張心陽說,這讓他和團隊意識到,AI時代的語音辦公需求可能遠比他們預想的要大。

實際上,語音輸入并不是什么很新鮮的玩意兒。早在1997年,IBM就推出了商用中文語音識別系統ViaVoice,標稱最高識別率95%,預裝在當時的主流PC上。此后近三十年,科大訊飛、搜狗、百度等公司在語音輸入領域持續投入,產品從PC端延伸到手機端,但語音始終沒有成為主流的輸入交互方式。

張心陽認為,變化發生在AI大模型成熟之后。“過去語音輸入解決的是轉文字的問題,沒有解決理解語言的問題。”他說,過去的語音輸入法是把你說的話逐字記錄下來,錯一個字就得手動改,輸出的文字是口語態的,人讀起來費勁,但AI大模型改變了接收端,哪怕你說得斷斷續續,夾著口誤,AI依然能理解你的意思,再輸出一段通順的文字。

或者說,當語音輸入的接收方從人變成AI,對識別準確率的要求大幅降低,語音辦公才真正可以實現。

根據經濟觀察報記者的不完全統計,截至2026年第一季度末,全球語音AI方向的初創公司融資總額已超過70億美元。

目前,海外語音聽寫應用Wispr正在進行新一輪融資,目標估值接近20億美元,而在半年前這個數字還是7億美元;5月12日,Google把AI聽寫功能Rambler內置進默認鍵盤Gboard,覆蓋數億臺Android手機,免費使用;國內,5月7日,阿里千問在PC端上線AI語音輸入功能;5月28日,科大訊飛(002230.SZ)發布AI眼鏡,其搭載的智能體可以將口語化表達自動整理成結構化文本。

過去二十年來,語音輸入一直是輸入法中一個不太好用的附屬功能,現在,AI大模型正在把它變成一種新潮的辦公方式。

“AI感受不到痛苦”

即便如今各類語音輸入工具的識別準確率已經很高,同聲傳譯、多語種翻譯等功能也陸續上線,但語音輸入始終沒有成為一種主流的交互方式。大多數人在線上交流、辦公或日常交互時仍然選擇打字,問題顯然不在識別準確率上。

科大訊飛穿戴設備業務部總經理林會杰在接受經濟觀察報記者采訪時提到,傳統語音輸入有一個明顯的問題——語音轉寫完成后,“你是沒有辦法直接發過去的,因為別人一看就知道,你這就是語音打字出來的,觀感不好,雖然說方便了你自己,但是痛苦了別人”。

中文語速通常是打字速度的三倍左右,速度優勢明確,但“快”只解決了發送端的效率。一段口語化的文字,夾著語氣詞、重復和跳躍的邏輯,對讀的人來說是負擔。比如,微信里收到60秒語音消息會讓人頭疼,原因也在這里——說的人痛快,聽的人痛苦。

這是傳統語音輸入法面對的一個共同問題:哪怕識別準確率做到了99%,輸出的文字依然是口語態的,沒有標點,沒有段落,時常也會夾著“嗯”“啊”或半句廢話,人讀起來費勁。

但AI感受不到這種痛苦——對人來說難以忍受的口語化文字,對AI來說沒有任何理解障礙,人說得再亂再碎,它都能從中提取意圖。語音輸入“方便了自己,痛苦了別人”的問題,在接收方變成AI的那一刻起就消失了。

于是,語音辦公在兩類場景中快速鋪開。第一類場景是,用戶對著Claude、DeepSeek或ChatGPT說話下達指令,AI直接理解意圖并執行任務,整個過程不需要產出一段通順的文字給人看。這是語音輸入在過去幾十年都沒有遇到過的局面:當接收方從人變成AI,對語言表達的規范性要求大幅度下降。

用張心陽的話說就是,“理解意圖比逐字準確更重要”。

程序員是最早大規模進入這個模式的群體。OpenAI聯合創始人Andrej Karpathy在2025年2月公開提出“vibe coding”(氛圍編程)的概念——開發者用自然語言描述需求,AI生成代碼,開發者審核和修改。Karpathy當時就提到,他使用語音聽寫工具SuperWhisper向AI口述編程指令。到了2025年12月,Karpathy已經完全停止打字寫代碼,100%依賴語音輸入。

2026年2月底至3月初,OpenAI旗下的編程智能體Codex和Anthropic旗下的編程智能體Claude Code在相隔不到一周的時間里先后上線原生語音模式,開發者按住空格鍵說話,AI就能接收編程指令。

AhaKey-X1就是為這個工作流設計的。張心陽說,用Claude Code等AI編程工具時,AI會頻繁要求用戶批準操作,撥桿推上去是自動批準,撥下來是逐一確認,“像自動擋一樣,所有需要批準的就自動批準掉了”。4個按鍵中的3個按鍵分別對應說話、確認、拒絕,第4個鍵留給用戶自定義。

據張心陽介紹,團隊最初自己在用AI辦公時發現一個問題:正襟危坐在電腦前打字,有時候反而限制想法,“很多點子是靈光一現出來的,可能是在你躺在書房沙發上的時候”。那么,既然和AI交流已經變成說話了,為什么一定要坐在電腦前?

于是,他們先做了一個開源項目放在開源社區GitHub上,有人看到后就來買元器件和套件,再后來就有人希望直接收到組裝好的成品。“是用戶推著我們往前走的。”張心陽說。在小紅書上,也已經有不少用戶自己花69元錢買三鍵小鍵盤、配一個麥克風,手搓出類似的設備。

語音辦公快速鋪開的第二類場景是,即便最終還是需要產出文字給人看,AI也在語音轉寫之后增加了一層語義處理:自動刪除語氣詞,修正語法,理順邏輯,調整句式,輸出一段可以直接使用的通順文字。這個過程造成的延遲通常只有一兩秒鐘。

“哪怕你前面說的內容有錯誤,后面又糾正過來了,AI都可以幫你完整梳理出來,形成一個有效的文案內容。”林會杰這樣告訴記者。這也意味著,過去的語音輸入需要極高的識別準確率才勉強可用,現在的語音輸入即便準確率一般,大模型憑借理解能力也能輸出比逐字轉寫更好的結果。

事實上,過去兩年,一批圍繞AI語音聽寫的創業公司在快速成長,其中估值最高的是位于美國舊金山的Wispr公司。這家公司2021年成立,最初做腦機接口腕帶(用于無聲語音輸入),2024年年中轉型做語音聽寫軟件。

公開信息顯示,截至2026年初,Wispr累計完成約8100萬美元融資。根據Wispr披露的數據,持續使用產品超過6個月的用戶,日常輸入中72%的字符通過語音而非鍵盤完成;產品上線至今,用戶規模同比增長超過100倍,使用滿12個月的用戶中有70%仍在活躍使用。

2025年9月,LinkedIn聯合創始人Reid Hoffman在社交媒體上宣稱自己被“voicepilled”(語音覺醒),稱這是“一種全新的能力放大方式”。

截至2026年5月,Wispr的目標估值已接近20億美元,半年內上漲了近三倍。一個聽寫應用估值20億美元,資本市場顯然在押注語音替代一部分鍵盤輸入的場景。

訊飛輸入法也在跟進這個方向。2025年底,訊飛輸入法在鍵盤界面新增了一個AI鍵,用戶長按該鍵即可用語音直接向AI下達指令,不需要切換到其他應用。科大訊飛2025年年報披露,訊飛輸入法大模型服務用戶滲透率提升900%,輸入效率提升77%。

這或許可以說明,語音辦公的需求正在從極客圈向更廣泛的職場人群滲透。

“悄悄說話!”

語音辦公的速度優勢很明確,但辦公不只是追求速度。寫一封措辭謹慎的郵件、改一段邏輯復雜的代碼、打磨一份給客戶的方案,這些場景需要的是精確控制,而不是快速表達。能不能覆蓋這些場景,是語音辦公能走多遠的關鍵問題之一。

經濟觀察報記者在采訪中問張心陽:有人認為用鍵盤打出來的提示詞更有條理,打字過程本身會幫你整理思路,語音輸入能取代這個過程嗎?對此,張心陽的回答是,“打字的價值永遠存在”。

他把兩者分得很清楚:語音在表達那一側,鍵盤在整理那一側,“你要修改某個東西的時候,思考過程本身對你是有價值的”。語音解決的是把想法快速“倒”出來,編輯和深度思考仍然需要鍵盤。

張心陽還提到一個變化:兩年前,“提示詞工程師”是熱門招聘崗位,用戶需要精心設計輸入格式才能讓AI給出滿意的結果。但現在,這個崗位基本消失了,AI自己就能把零散的口語化輸入進行結構化、拆解、調度,“純從效果方面看,已經不需要人再去編輯打字了”。

AI對輸入格式的容忍度越來越高,用什么方式給AI下指令變得越來越不重要。在這個前提下,速度最快、認知負擔最低的輸入方式自然會勝出,而且說話時不需要把想法先翻譯成書面語。或者說,AI對自然語言的理解能力到了今天這個水平,以語音為核心交互方式的辦公產品第一次具備了成立的條件。

但實際上,用語音操作電腦的想法比AI大模型出現得更早。

2018年5月15日,錘子科技在北京鳥巢舉辦發布會,創始人羅永浩彼時在臺上演示了堅果TNT工作站。TNT全稱Touch and Talk,主打語音加觸控操作桌面電腦,用戶對著屏幕說話就能完成搜索、編輯文檔、發送郵件等操作。這樣一個被錘子科技定義為跨時代的產品,卻在發布會后被大范圍嘲諷,網友調侃的“安靜!你吵到我用TNT了!”一度成為彼時互聯網流傳甚廣的“名梗”。

網友們嘲諷TNT的核心原因是羅永浩在現場演示的語音交互體驗不好。2018年的語音識別技術雖然已經能做到較高的準確率,但沒有大模型理解意圖,每一個識別錯誤都是一個需要用戶手動糾正的摩擦點——用戶必須說得字正腔圓、邏輯清晰,機器才能給出正確響應,稍有含糊,體驗就會崩掉。

或者說,2018年語音交互的接收方是一套傳統軟件系統,它需要精確的輸入才能運行,對口語化表達缺乏容忍度。哪怕語音識別本身的準確率已經達到95%以上,剩下那5%的錯誤在沒有大模型兜底的情況下,每一個都會變成用戶體驗的斷裂點。

在當時的技術條件下,一個以語音為主要操作方式的桌面電腦,無法兌現它的承諾,也無法帶來想象中的體驗。如果TNT搭載的是一個能理解自然語言的大模型,并且在今天發布,它面對的將是另一種情形。

大模型解決了“聽不懂”的問題,但“不方便說”的問題仍然存在。在張心陽看來,語音辦公在實際推廣中面對的第一個問題就是噪聲,“在開放式辦公室里,七八個人同時對著電腦嘟囔,哪怕每個人都在壓低音量,匯在一起也夠讓人頭疼的”。

美國人力資源軟件公司Gusto的聯合創始人Edward Kim近期在接受媒體采訪時也表示,他在公司內部推廣語音辦公工具,自己“現在幾乎一直在對著電腦說話”,但在辦公室里持續這樣做“確實有點尷尬”。

張心陽介紹,AhaKey搭配大疆麥克風可以做到低聲識別,在20分貝的音量下仍能保持99%的準確率,20分貝大約相當于深夜臥室里的耳語,坐在旁邊的同事幾乎聽不到你在說什么。

當然,在這個問題上也有另外的技術解決方案。5月28日,科大訊飛研究院語音翻譯條線總監孔常青在接受經濟觀察報記者采訪時介紹,訊飛最新發布的AI眼鏡采用了唇動識別結合麥克風陣列的多模態降噪方案,在展會、地鐵、餐廳等高噪音場景下,識別準確率可以提升30%到40%。

唇動識別和低聲識別是兩種不同的技術路徑,但面對的是同一個市場需求:在人多嘈雜的環境里也能用語音辦公。“尤其是對于一些以前完全不可用的特別吵的場景,(唇動識別)基本上已經達到了使用的門檻。”孔常青說。

語音辦公面臨的第二個問題是隱私——口述內容變成聲波,郵件內容、代碼邏輯、商業想法,周圍的人都能聽到;另外,云端處理的語音數據也讓人有安全顧慮。

2025年11月,有用戶在社區論壇上發現,AI語音聽寫軟件Wispr Flow在宣稱“零數據留存”的同時,實際上在存儲用戶的屏幕截圖并上傳至服務器。該事件迅速發酵,Wispr CEO Tanay Kothari隨后公開道歉并更新了隱私策略。Google在2026年5月發布AI語音聽寫功能Rambler時也特別強調,“不存儲語音錄音,音頻僅用于轉寫”。

噪音和隱私的問題還沒有完全解決,但這并沒有阻止硬件廠商的快速入場——從錄音卡片、耳機到眼鏡、鍵盤,圍繞語音和AI的辦公硬件正在密集出現,品類和價格帶也在快速拓寬。

比如,2025年8月,釘釘發布首款AI硬件DingTalk A1,售價分799元和499元兩個版本,搭載6顆麥克風陣列,支持120多種語言轉寫;2026年1月,飛書聯合安克創新發布AI錄音豆,重量10克,售價899元;此外,科大訊飛、360公司也推出了類似產品。

對此,林會杰的感受很直接:“對著鍵盤空流淚。我能想到是什么,也能說出來是什么,但打字打出來的時候就很痛苦。”他認為,在想法和文字之間始終隔著一層翻譯,從腦子里的念頭到手指在鍵盤上敲出的字符,中間既有信息損耗,也有時間損耗,但AI大模型正在改變這種狀況。據其介紹,訊飛的GlassClaw智能體可以把口語化表達自動整理成通順文本,“一句話即可完成從查詢信息到撰寫方案到發送郵件的全流程”。

張心陽亦稱,其團隊正在探索本地Agent與隱私計算能力。如果這個方向成立,語音加AI的組合將有可能催生一個獨立于PC和手機之外的新辦公硬件品類。當然,鍵盤依然會存在,但它的角色會發生變化——從主要輸入工具變為編輯工具。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
古巴8個鮮為人知的事實:曾迫使數萬華人流亡,從富裕國家滑落至極度困難

古巴8個鮮為人知的事實:曾迫使數萬華人流亡,從富裕國家滑落至極度困難

三言四拍
2026-05-30 13:05:06
扎哈羅娃:俄將對羅馬尼亞迅速采取報復措施

扎哈羅娃:俄將對羅馬尼亞迅速采取報復措施

參考消息
2026-05-30 11:58:56
三花智控高管“為孩子教育”減持套現,兩千億巨頭陷熱門概念敘事與資本套現割裂

三花智控高管“為孩子教育”減持套現,兩千億巨頭陷熱門概念敘事與資本套現割裂

每日經濟新聞
2026-05-30 14:41:08
“結婚22年后發現兩兒子均非親生”當事人發聲:我對他們恨之入骨!

“結婚22年后發現兩兒子均非親生”當事人發聲:我對他們恨之入骨!

新民周刊
2026-05-30 17:32:14
兩名9歲女孩被困電梯近2小時!求救幾十次后,保安回應:不要再按電梯玩了

兩名9歲女孩被困電梯近2小時!求救幾十次后,保安回應:不要再按電梯玩了

上觀新聞
2026-05-30 19:34:29
俄烏戰爭,如果俄羅斯最終贏了,你我在有生之年很可能會親歷戰爭

俄烏戰爭,如果俄羅斯最終贏了,你我在有生之年很可能會親歷戰爭

混沌錄
2026-05-29 23:26:12
重磅:烏克蘭擊毀俄羅斯兩架圖142!打掉伊斯坎德爾系統

重磅:烏克蘭擊毀俄羅斯兩架圖142!打掉伊斯坎德爾系統

項鵬飛
2026-05-30 16:28:01
西決搶七大戰裁判出爐:戴維斯擔任主裁 三人執哨兩隊勝率曝光

西決搶七大戰裁判出爐:戴維斯擔任主裁 三人執哨兩隊勝率曝光

羅說NBA
2026-05-30 21:26:04
央視曝光!涉事品牌:全部下架!天熱很多人愛喝

央視曝光!涉事品牌:全部下架!天熱很多人愛喝

蓬勃新聞
2026-05-29 14:53:17
打虎!王益華被查

打虎!王益華被查

新京報
2026-05-30 20:29:17
41歲夫妻因“房事頻繁”雙雙入院,醫生提醒:每周不應超過一個數

41歲夫妻因“房事頻繁”雙雙入院,醫生提醒:每周不應超過一個數

醫學原創故事會
2026-05-29 23:34:07
伊朗濃縮鈾材料將被挖出銷毀,特朗普就伊朗戰事最新表態

伊朗濃縮鈾材料將被挖出銷毀,特朗普就伊朗戰事最新表態

上游新聞
2026-05-29 23:35:03
D1804次列車受電弓遭異物擊打,被困隧道內超2小時,乘客稱全車停電悶熱異常,身上像從水里撈出來的,備用列車已到現場并開始轉運

D1804次列車受電弓遭異物擊打,被困隧道內超2小時,乘客稱全車停電悶熱異常,身上像從水里撈出來的,備用列車已到現場并開始轉運

臺州交通廣播
2026-05-30 13:47:54
耿同學再下一城!南開免去陳某院長職務,14張圖表確認學術不端

耿同學再下一城!南開免去陳某院長職務,14張圖表確認學術不端

聽心堂
2026-05-30 20:24:06
中方代表:日本沒有資格談國際防務合作 須警惕軍國主義思潮借機復活

中方代表:日本沒有資格談國際防務合作 須警惕軍國主義思潮借機復活

環球網資訊
2026-05-30 19:36:11
禁投美股,難得全球大國中惟一正確

禁投美股,難得全球大國中惟一正確

家傳編輯部
2026-05-30 12:24:47
海南一三甲醫院空調外機安在室內走廊,患者吐槽“看病比室外還熱”,院方回應

海南一三甲醫院空調外機安在室內走廊,患者吐槽“看病比室外還熱”,院方回應

上游新聞
2026-05-30 16:05:05
中建八局資質被正式撤銷,給全行業敲響警鐘,考公需要注意了。

中建八局資質被正式撤銷,給全行業敲響警鐘,考公需要注意了。

解說阿洎
2026-05-29 12:34:21
最新!債務突破100萬億!

最新!債務突破100萬億!

葉初七
2026-05-30 10:28:14
網紅狗被偷后續:男子被帶走,老婆還在哺乳期,收狗人曝更多內情

網紅狗被偷后續:男子被帶走,老婆還在哺乳期,收狗人曝更多內情

閱微札記
2026-05-30 11:47:19
2026-05-31 00:19:00
經濟觀察報 incentive-icons
經濟觀察報
經濟觀察報是專注于財經新聞與經濟分析的全國性綜合財經類媒體。聚焦商道、商技和商機。
114850文章數 1606954關注度
往期回顧 全部

科技要聞

車圈大佬發聲:價格戰遠去,但競爭仍殘酷

頭條要聞

兩名9歲女孩被困電梯近2小時 求救幾十次物業無動于衷

頭條要聞

兩名9歲女孩被困電梯近2小時 求救幾十次物業無動于衷

體育要聞

歲月不饒人!39歲德約鏖戰近5小時拼到嘔吐

娛樂要聞

張碧晨《歌手》 “活人微死” 自嘲

財經要聞

雙匯管不住一頭豬

汽車要聞

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態度原創

親子
時尚
數碼
本地
軍事航空

親子要聞

今天我們吃公主糖果玩公主裝扮游戲

美回巔峰的她們,帶火的這些爆款真的好用嗎

數碼要聞

消息稱微軟下周發布英偉達處理器Windows PC,戴爾也會跟進

本地新聞

用剪紙的方式,打開江蘇揚州

軍事要聞

美防長參加"香會" 就美中關系最新表態

無障礙瀏覽 進入關懷版