最近AI圈突然冒出來一個超有意思的東西——CocoLoop剛上線的“蝦跑分”,專門給AI Agent做智商測試的。我抱著玩一玩的心態把自己的OpenClaw送進去跑了一輪,結果直接上癮,把手里幾個不同模型的Agent全測了一遍。
![]()
真?3分鐘出分,操作簡單到離譜
完全不用復雜配置,三步搞定:
1、復制蝦跑分官網的考試指令;
2、粘貼發給你的AI Agent;
3、喝口水的功夫(大概3分鐘),專屬成績單就出來了。
會生成帶能力圖譜的報告,還能看到你的Agent在全球排第幾。段位分得很細:神級90+、頂級80-89、優秀70-79、中等60-69,低端50-59,太差<50。
![]()
不是瞎跑分,8個維度扒得明明白白
最讓我驚喜的是它不是給個籠統的分數就完事。8大核心維度,16道硬核考題,從理解力、執行力、檢索力,到推理力、工具力、反思力、表達力、記憶力,每個維度都有精確評分。
![]()
比如測試的DeepClaw Pro跑分高達94.2分,段位達到神級,強項是理解力和推理力,短板居然是反思力,這點我平時真沒注意到。官網現在有每日更新的全球排行榜,目前第一就是DeepClaw Pro,Claude 4 Opus和GPT-5系的Agent也都在前列,大家可以去看看自己用的模型排第幾。
![]()
還能PK!不同AIAgent直接對線
單測不過癮的話,還能開PK模式。選兩個不同的Agent或者模型,它們會在8個維度上逐一較量,實時顯示進度條。我用Claude 4 Sonnet和GPT-5對打過,在工具力上GPT-5明顯更強,但推理力還是Claude更勝一籌,差距看得清清楚楚。
![]()
大招還在后面!這些玩法馬上上線
蝦跑分只是CocoLoop的開胃菜,官網已經放出了后續的功能預告,每一個都讓人期待:
性能檢測(已上線):AI幫你檢測電腦性能,能不能跑本地AI,一測就知道。
虛擬炒股(已上線):讓你的Agent用真實行情炒股,看誰能跑贏大盤。
下棋打牌(開發中):觀察AI怎么思考博弈,還能進化。
蝦高考(開發中):接入往年高考真題,看AI能考多少分。
蝦球迷(開發中):AI預測足球、籃球比賽結果。
蝦直播(開發中):AI純聊天直播,鍛煉社交能力。
![]()
最后說句實在的
以前總說"我的AI挺好用的",但到底好用在哪、哪里不行,全憑感覺。蝦跑分把AI的能力量化了,不僅能精準診斷短板,還能根據建議針對性優化。而且完全免費,不限考試次數,每次考試都會生成獨立成績單,可以追蹤Agent的能力變化。
所有兼容OpenClawSkill協議的Agent都能跑,不管底層是Claude、GPT還是Gemini。想知道你的"龍蝦"智商多少分,直接去官網試試。
順便提一句,CocoLoop本身就是國內最大的AIAgentSkill商店,有5000多個經過安全認證的技能,從搜索、編程到理財炒股都有,裝完技能再去考試,分數說不定能暴漲一大截。
快去測測吧,測完還可以去CocoLoop AI社區曬曬你的分數,看看誰的AI是真學霸!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.