如果你關注AI技術圈的話,應該會知道Simon Willison(下文簡稱西蒙)。
![]()
他的博客(simonwillison.net)的文章在 Hacker News、Reddit,GitHub 社區經常被引用或討論,影響力經常排名第一,可以說是遙遙領先。
![]()
西蒙的博客有個非常顯著的特征:非常高產!
僅在2025年,他就寫了1000多篇博文!但其中只有118篇是完整的文章(僅此而已)。
西蒙經常在一些封閉的平臺(例如 TikTok、Twitter)中發現靈感,然后將其帶到開放的網絡上(如Hacker News)。
他一些最受歡迎的帖子只是簡單的引語或者鏈接,并附上評論,例如:
“我擔心他們在Excel中加入Copilot功能”
“電腦永遠無法被追責”。
西蒙曾表示,這類文章寫起來容易,但價值很高。
分享有趣的鏈接并附上評論,是一種投入少、價值高的方式,可以為互聯網生活做出貢獻。——西蒙·威利森,“ 我運營鏈接博客的方法 ”
如果你也想學他這么玩兒,恐怕大概率要失敗,西蒙能做得這么成功,本質原因還是因為他是個有著敏銳洞察力,非常優秀的程序員。
他是著名開源軟件Django,Datasette,llm的創始人,更夸張的是,在GitHub上,他維護的開源項目竟然有962個!
![]()
今天咱們來聊聊西蒙的故事。
01
一次偉大的實習
西蒙是個英國人,2001年進入巴斯大學讀計算機。
![]()
在讀書期間,他開始運營自己的個人主頁,在上面分享關于 Web 標準、CSS、PHP 和網頁開發的知識。
在那個時代,優秀的技術網站不多,西蒙的網站很快被遠在美國肯薩斯州的一個叫Adrian Holovaty程序員(也就是后來的 Django 聯合創始人)注意到了,被他的技術實力所吸引。
巴斯大學非常重視實踐,他們的本科學制有一種非常有特色的 4 年制的“三明治”課程:
前兩年在學校上學,第三年讓學生去企業全職實習一整年(稱為 Placement Year),第四年再回到學校完成畢業設計和學業。
當Adrian得知西蒙正在找實習的時候,立刻向他拋來了橄欖枝,邀請他來美國堪薩斯州的勞倫斯小鎮實習,開發新聞網站 《勞倫斯日報》。
2003 年秋天,Simon 來到堪薩斯州,與 Adrian Holovaty 以及后來加入的 Jacob Kaplan-Moss 組成了新聞網站的開發鐵三角。
由于新聞行業的節奏極快,往往上午提需求、下午網頁就要上線,現有的工具根本不夠用。
三人迫于壓力,不得不想辦法提煉出一套能讓“即使是新手也能快速搭建應用”的工具,這樣就可以在緊迫的時間內把活兒干完。
西蒙和同事結對編程開發了一些核心功能:請求/響應對象,URL解析,模板語言,ORM等。
2004 年 ,Simon 結束實習回到巴斯大學,而這套被他們留在報社的框架,在 2005 年被正式開源。
這就是今天大名鼎鼎的 Django(因勞倫斯當地人喜歡爵士吉他手 Django Reinhardt 而得名)。
Django 在 Web 開發史上具有里程碑式的地位,它確立了“大而全”的框架標準:內置了從 ORM(對象關系映射)、身份驗證、后臺管理界面(Admin)到安全防護、緩存的一整套方案,這種高度集成的方式極大地提升企業級應用的生產力。
曾經采用Django開發系統的著名網站包括:Instagram,Pinterest,Reddit,Dropbox,Mozilla ,Disqus、華盛頓郵報,衛報等。
Django是如此流行,以至于Google 一搜 Django,全是Django的框架,搶了原本那個吉他手的 SEO 排名……
02
淋浴時頓悟
2005年西蒙大學畢業后,加入了當時如日中天的Yahoo!(雅虎) 核心技術開發團隊,干了兩年后,他他轉型做了一段時間的獨立技術顧問,致力于OpenID的推廣,幫助各大傳統媒體和網站構建去中心化的賬戶登錄體系。
![]()
這讓他引起了新聞界的注意,2008 年,他被英國老牌大報 《衛報》(The Guardian) 挖走,出任軟件架構師(Software Architect)。
在《衛報》期間,他參與了一個數據可視化的項目,使用的是Google Sheets這樣的工具,來發布《衛報》新聞發報道背后的數據。
Google Sheets號稱云端版Excel,用起來很方便,但是西蒙看到了一些局限,例如無法進行復雜查詢,性能瓶頸,尤其是缺乏 API 深度支持,雖然它有 API,但對于想要基于這些數據快速構建一個小工具的開發者來說,Google Sheets 的接口并不夠“開發者友好”。
所以西蒙渴望找到一種更好的辦法來發布和查詢這些數據。
幾年后,在一次淋浴的時候,西蒙迎來了自己的“頓悟”時刻:把SQLite 數據庫變成一個可以瀏覽、查詢、分享的只讀網站。
這就是Datasette。
![]()
Datasette非常有意思,比如你有一個 SQLite 文件 data.db,里面有一張表 users
運行命令:
datasette data.db
瀏覽器里你會直接看到:
/data/users → 表格瀏覽
/data/users.json → API
/data?sql=select * from users → SQL 查詢
相當于給SQLite的.db文件裝上了一個網頁外殼,沒有后端開發,沒有ORM,沒有API設計,直接可用。
Datasette看起來非常簡單,但是對于那些“任何有數據、想公開的人”非常有用。
例如一些新聞機構、科研機構,政府等,它們有數據,讓想別人訪問,Datasette就是最低成本的發布工具。
03
華麗轉型
2023年,ChatGPT爆發,西蒙開始轉型了。
當然,他并沒有轉型去做一個大模型訓練者,更沒有去賣課,而是不斷地嘗試GPT的能力,讓它去生成代碼、操作數據、調用外部系統。
他經常提到的一個案例:自然語言 → SQL → 數據分析流水線
例如你有一個 SQLite 數據庫,里邊記錄了用戶行為日志、網站訪問記錄、API 調用數據。
傳統方式做分析的話,需要寫SQL,用Python pandas之類的庫來分析。
西蒙的工作方式是:
(1) 用戶問題
“幫我分析最近一周哪個 API 錯誤最多,并給出原因”
(2) LLM 生成 SQL
SELECT api, count(*)
FROM logs
WHERE date > now()-7
GROUP BY api
ORDER BY count DESC;
(3) SQLite 執行,返回結果集
/api/login 1200
/api/pay 300
(4) LLM 總結結果。
login 接口錯誤最多,可能原因是認證服務不穩定…
現在看來,這種方式沒啥,但放在2023年那個時間點,這是讓人耳目一新的工作方式。
尤其是國內還在賣賬號,賣課程的時候,西蒙已經遠遠地跑在前面了。
西蒙反復在博客中強調一件事情:LLM 最有價值的用途之一,是作為“工具的接口”(tool interface),這種理念最終發展成了一個叫做llm的開源項目。
![]()
llm把 GPT 這種大模型,變成了 Unix 風格的命令行工具,你可以像用 grep、awk 一樣用 LLM。
例如:
cat test.py | llm "解釋這段代碼"cat log.txt | llm "總結錯誤"cat report.txt | llm -m gpt-4 --system "以法律語氣總結"在llm工具出現之前,大眾的認知是 AI可以聊天、可以寫作。
在llm之后,一部分人開始意識到:AI = 可以接入系統的數據處理節點
這個影響是非常深遠的,后續的Tool Calling ,Function Calling , RAG,都是這種思想,讓大模型不只是回答問題,而是參與執行任務。
想想現在火熱的Cluade Code,西蒙在2023年就開發出的llm工具,是不是洞察力超越常人?
西蒙不僅開發工具,寫博客也是一把好手,他的博客沒有花里胡哨的界面,非常樸實,接地氣,極少空談概念,每篇都有代碼,每個例子都可以復制運行,開始在各個社區自發傳播,最終爆火。
04
你很容易脫穎而出
西蒙在一篇文章中寫道:
我曾經面試過數百人,但是我發現很多優秀的人才把所有的精力都花在了給公司寫代碼上,而不注意經營自己的個人品牌。
實際上,你只需付出相對較少的努力,就能直接躍升到招聘經理的首選名單前列(甚至可能他們都沒注意到)。
這些努力包括:
(1)開個博客,每年發布一兩篇有趣的科技文章,可以是你的新發現、修復的漏洞,或是解決的問題。
(2)創建一個小型個人項目,將代碼上傳到 GitHub,同時附上一個 README 文件,詳細描述項目并附上運行截圖,幾乎沒有人這樣做,這只需要額外花費幾個小時,卻能極大地提升你的項目在招聘經理眼中的影響力。
這絕對是西蒙這個過來人的經驗之談,如果你還沒有這兩樣,強烈建議你去做一下。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.