无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

<source id="rrx1q"><optgroup id="rrx1q"></optgroup></source>

<style id="rrx1q"></style>

<sup id="rrx1q"><noframes id="rrx1q"></noframes></sup>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

使用Python在Neo4j中創建圖數據庫

2024-07-25 15:15:09　來源: 小鋒情報站

江西舉報

0

分享至

本文將展示如何使用Python生成的數據來填充數據庫。我還將向你展示如何使用Neo4j沙箱，這樣就可以使用不同的Neo4j數據庫設置。

可以在這里找到一個谷歌Colab筆記本：https://colab.research.google.com/drive/1J9__HotNoINHpucoipLH-4qWc48GALAk?usp=sharing

里面有這篇文章的代碼。(那本筆記本上有如何連接Colab和Kaggle的說明，可以讓你更快地下載數據。)

現在我們可以開始用Python做一些數據處理了。

為了寫這篇文章，我們將使用在Kaggle上找到的arXiv數據集，其中包含超過170萬篇STEM學術論文。(在寫這篇文章的時候，已經是第18版了。)你可以將數據下載到本地機器

https://www.kaggle.com/Cornell-University/arxiv

現在進入筆記本，我們可以開始查看數據。我通過以下方式加載數據:

(你不必使用tqdm，但我發現在文件大小超過179萬個條目時檢查進度很有幫助。)

可以通過df看到，我們的數據結構為:

假設我們想用這個數據框構建一個圖，我們想知道哪些作者發表了哪些論文，以及這些論文與哪些類別相關聯。

然后，我們希望有三種不同的節點類型與之對應:作者、論文和類別。

每個節點類型都有一兩個屬性。對于作家來說，有作者的名字。論文可以有ID和標題。最后，類別有自己的名稱。我們也有一些關系:作者和作者，論文和論文。

因此，我們的目標是擁有以下數據模型(用arrows.app繪制):

有一些列對我們很有用。例如，我打算保留id，這樣我們就可以使用它作為每個論文的唯一索引。之后，我想要得到每個作者的個人列表。此外，authors_parsed列為我們提供了一個更清晰的所有作者列表。當然，我們將保留標題欄作為論文的主要屬性。最后，我想保留categories列。

下一步是稍微清理一下數據，這樣數據幀的每行有一個作者，每行有一個類別。例如，我們看到authors_parsed列給出了一個列表，其中每個條目在名稱后面都有一個多余的逗號。

如果我們簡單地將其導入到數據庫中，我們將得到author節點，如(顯示一個小示例):

由于這不是一件令人愉快的事情(并且會導致查詢不是最優雅的)，我們需要稍微清理一下。我們還看到categories列可以有一個單獨的類別，也可以有幾個不采用傳統列表格式的類別(如本示例的最后一行所示):

我們可以在Cypher中這樣做，但為了這篇文章的目的，我們將在Python中做清理，以便說明。

創建兩個幫助函數來清理這兩列:

得到的數據幀:

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

媒體：中國"兩箭齊發"反制美國不賣了也不買了

現代快報 2026-06-22 22:18:09
4853 跟貼 4853
男子16萬余元購入路虎攬勝極光L，指導價近43萬元，因成交價過低，原本1萬多元購置稅可能要翻倍；4S店：等待溝通結果

封面新聞 2026-06-23 10:34:27
14794 跟貼 14794

哈蘭德再度梅開二度，挪威3比2塞內加爾

澎湃新聞 2026-06-23 10:00:27
2523 跟貼 2523

38℃，江蘇天氣即將反轉

微泰州 2026-06-23 19:46:41
117 跟貼 117
連扳兩球！阿爾及利亞2-1逆轉約旦

澎湃新聞 2026-06-23 13:02:28
1767 跟貼 1767

上海市2026年普通高校招生本科各批次錄取控制分數線確定

央視新聞客戶端 2026-06-23 17:47:22
1171 跟貼 1171

商家：今年吃楊梅的都賺到了！福建“泡藥楊梅”事件后，一箱浙江楊梅從138元跌到110元

第一財經資訊 2026-06-23 16:47:29
673 跟貼 673
波士頓大學回復鐘美美：歡迎加入BU大家庭，此前鐘美美發文被波士頓大學錄取

大象新聞 2026-06-23 13:02:38
156 跟貼 156

七旬老人命令女孩讓座遭拒后強行拽拉媽媽護孩子怒懟出手

閃電新聞 2026-06-23 00:21:27
601 跟貼 601
“壓力又給到C羅了”！葡萄牙賽前海報C羅缺席，主帥回應C羅是否首發

大象新聞 2026-06-23 21:29:02
13 跟貼 13
遼寧艦完成迄今時間最長遠海訓練有四大看點

澎湃新聞 2026-06-23 07:12:29
127 跟貼 127
屋頂光伏度苦夏

界面新聞 2026-06-23 15:46:15
26 跟貼 26
楊瀚森回歸首秀表現一般，中國男籃險勝荷蘭隊

北青網-北京青年報 2026-06-23 22:23:08
3 跟貼 3
網友吐槽“被WPS背刺了”，公司回應

南方都市報 2026-06-23 20:17:09
353 跟貼 353
日韓股市集體收跌韓國綜指跌超9%

每日經濟新聞 2026-06-23 14:33:06
807 跟貼 807
工人日報：游客帶20寸登機箱被告知超標，廉航“行李刺客”引質疑

澎湃新聞 2026-06-23 07:34:39
180 跟貼 180
小鵬副總裁深夜怒懟：“強制激光雷達”是徹頭徹尾的假新聞；為什么每次都因為激光雷達吵起來？

極目新聞 2026-06-23 15:42:43
189 跟貼 189
流浪貓“模仿”人類端正坐姿，乖乖守餐桌旁等食物，攤主投喂1月

星視頻 2026-06-23 12:55:49
429 跟貼 429
創業板指跌逾4%

財聯社 2026-06-23 14:37:17
439 跟貼 439
中國海軍83艦編隊抵達俄羅斯進行友好訪問

新華社 2026-06-23 10:47:04
45 跟貼 45
2026高考成績今起陸續可查多地公布志愿填報安排

中國網 2026-06-23 01:09:50
342 跟貼 342
微信迎來史上最大更新

浙江之聲 2026-06-23 16:11:13
25 跟貼 25
俄白呼吁共同銘記歷史捍衛真相

新華社 2026-06-23 12:30:03
72 跟貼 72
端午假期第二天北京市屬公園迎客超38萬人次

北青網-北京青年報 2026-06-20 14:47:09
132 跟貼 132
撞傷3行人黃牛“被注水”？官方回應

中國新聞周刊 2026-06-23 22:53:04
0 跟貼 0
721分（滿分800分），“山西挖眼案”受害男孩成為全國同專業第一名的雙學位大學生

極目新聞 2026-06-23 21:32:14
0 跟貼 0
一電動車“掛”線纜上

新浪財經 2026-06-23 22:57:40
0 跟貼 0
13歲男孩和家人吵架后從小區26層公共走廊跳下墜亡家人把物業告上了法庭獲賠20多萬元

閃電新聞 2026-06-23 22:59:01
0 跟貼 0
女子草率再婚嫁賭徒，連累親弟被丈夫殺害，人間悲劇

子芫伴你成長 2026-06-23 22:58:15
0 跟貼 0

本屆第3次執法 47歲馬寧任法國VS挪威焦點戰第4官員聯手英超名哨

本屆第3次執法 47歲馬寧任法國VS挪威焦點戰第4官員聯手英超名哨

我愛英超

2026-06-23 21:00:51

2026年世界杯美國根本不靠門票賺錢，這套玩法我們很難復制

2026年世界杯美國根本不靠門票賺錢，這套玩法我們很難復制

老特有話說

2026-06-23 14:08:03

終于有經濟學家批評體制內退休金太高、加劇代際矛盾，評論區炸鍋

終于有經濟學家批評體制內退休金太高、加劇代際矛盾，評論區炸鍋

慧翔百科

2026-06-23 08:47:02

成本近3億，總票房僅6000多萬，韓紅喊話：能不能給馮小剛走個面

成本近3億，總票房僅6000多萬，韓紅喊話：能不能給馮小剛走個面

星宿影視鴨

2026-06-23 11:58:28

為什么我不會看電影《抓特務》？

為什么我不會看電影《抓特務》？

十柱

2026-06-23 16:07:19

廣德車禍事件：肇事者事后冷漠與傲慢。其閨蜜還發文，說肇事者也是受害者。

廣德車禍事件：肇事者事后冷漠與傲慢。其閨蜜還發文，說肇事者也是受害者。

貼小君

2026-06-23 13:28:51

“他是我們家的參天大樹！”外孫患病只剩18個月，特效藥70萬一針，外公悉心照顧“續命”9年：女兒剛40歲，頭發白了大半，能幫一把是一把

“他是我們家的參天大樹！”外孫患病只剩18個月，特效藥70萬一針，外公悉心照顧“續命”9年：女兒剛40歲，頭發白了大半，能幫一把是一把

都市快報橙柿互動

2026-06-23 02:51:06

全球排名更新！浙江大學，世界第一

全球排名更新！浙江大學，世界第一

EOL教育在線

2026-06-22 17:56:40

字母哥交易最大犧牲品！26歲當打之年，老大位置沒了，大合同沒了

字母哥交易最大犧牲品！26歲當打之年，老大位置沒了，大合同沒了

球毛鬼胎

2026-06-23 15:47:38

二婚帶娃女子要了40萬彩禮、116克黃金和80萬婚房，現在不結婚也不退錢！在杭打工父子求助都市快報：怎么辦？

二婚帶娃女子要了40萬彩禮、116克黃金和80萬婚房，現在不結婚也不退錢！在杭打工父子求助都市快報：怎么辦？

都市快報橙柿互動

2026-06-23 01:56:17

蔡磊回應“為自救傾家蕩產，自私到老婆孩子都不顧”：任何生命為了活下去都會拼盡全力，生病前的40年里一直努力，有能力承擔家庭責任

蔡磊回應“為自救傾家蕩產，自私到老婆孩子都不顧”：任何生命為了活下去都會拼盡全力，生病前的40年里一直努力，有能力承擔家庭責任

大象新聞

2026-06-23 10:45:40

殺人誅心：烏軍網上公開俄軍武器全部弱點，32國實驗室連夜抄作業

殺人誅心：烏軍網上公開俄軍武器全部弱點，32國實驗室連夜抄作業

咣當地球

2026-06-23 15:59:08

世界杯淘汰賽4隊落位！阿根廷死亡半區，或連戰西班牙葡萄牙法國

世界杯淘汰賽4隊落位！阿根廷死亡半區，或連戰西班牙葡萄牙法國

蘭亭墨未干

2026-06-23 18:42:43

世界杯奪冠走勢越來越明朗了，這六支隊之外，基本可以洗洗睡

世界杯奪冠走勢越來越明朗了，這六支隊之外，基本可以洗洗睡

觀星娛記

2026-06-23 11:45:26

越扒越有！娜然坐霍家主桌僅48小時，再迎2大噩耗，大房早已表態

越扒越有！娜然坐霍家主桌僅48小時，再迎2大噩耗，大房早已表態

趣文說娛

2026-06-23 18:39:52

火出圈！哈蘭德世界杯“偷喝”對手門將水帶頭劃船慶祝太燃

火出圈！哈蘭德世界杯“偷喝”對手門將水帶頭劃船慶祝太燃

醉臥浮生

2026-06-23 11:30:44

世界杯32強決出6席！阿根廷進天堂半區，避開5大前冠軍，4強穩了

世界杯32強決出6席！阿根廷進天堂半區，避開5大前冠軍，4強穩了

球場沒跑道

2026-06-23 17:17:48

金靴爭奪白熱化！3人進球4+，72年第一次，壓力給到凱恩C羅

金靴爭奪白熱化！3人進球4+，72年第一次，壓力給到凱恩C羅

奧拜爾

2026-06-23 10:40:22

ESPN記者：拿下字母哥后，熱火已將其老隊友米德爾頓視為目標

ESPN記者：拿下字母哥后，熱火已將其老隊友米德爾頓視為目標

懂球帝

2026-06-23 21:32:06

澤連斯基發出最后通牒，莫斯科擺明要袖手旁觀：盧卡申科大概藥丸

澤連斯基發出最后通牒，莫斯科擺明要袖手旁觀：盧卡申科大概藥丸

鷹眼Defence

2026-06-23 17:02:51

小鋒情報站

聚焦科技，解密世界

88文章數 0關注度

往期回顧全部

科技要聞

48名中國開發者聯名舉報蘋果

頭條要聞

看到熱搜新聞查了下自己男子結婚8年發現3娃均非親生

頭條要聞

看到熱搜新聞查了下自己男子結婚8年發現3娃均非親生

體育要聞

揚尼斯去了邁阿密：凱爾特人怎么辦？

娛樂要聞

內娛95后頂流格局發生潛移默化的變化

財經要聞

屋頂光伏度苦夏

汽車要聞

施鵬澤：為什么奧迪E7X強調座艙氣味安全?

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

手機

本地

房產

公開課

敵潮生存牌組構建游戲《地獄公主》7月16日推出

手機要聞

曝字節新一代豆包AI手機發布時間或延遲，主要原因與備案認證有關

本地新聞

吃一次廣東龍舟飯，才懂什么是豪華盛宴

房產要聞

洞察新局|預算不變居住升級 2026廣州置業成本觀察

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<rp id="o84kb"><meter id="o84kb"></meter></rp>

<span id="o84kb"></span>

<acronym id="o84kb"><tt id="o84kb"></tt></acronym>

<center id="o84kb"><nav id="o84kb"><code id="o84kb"></code></nav></center>