關於 pandas
開發歷史
2008 年,pandas 開發始於 AQR Capital Management。2009 年底,它已成為 開源,並由全球志同道合人士組成的社群積極支援,他們貢獻寶貴的時間和精力,讓開源 pandas 成為可能。感謝 所有貢獻者。
自 2015 年以來,pandas 一直是 NumFOCUS 贊助的專案。這將有助於確保 pandas 作為世界級開源專案的開發成功。
時間軸
- 2008 年:pandas 開發開始
- 2009 年:pandas 成為開源
- 2012 年:資料分析的 Python 第一版出版
- 2015 年:pandas 成為 NumFOCUS 贊助的專案
- 2018 年:第一次實體核心開發人員衝刺
函式庫亮點
-
一個快速且有效的 DataFrame 物件,用於資料處理,並具有整合式索引;
-
用於讀寫資料在記憶體資料結構與不同格式之間的工具:CSV 和文字檔、Microsoft Excel、SQL 資料庫,以及快速的 HDF5 格式;
-
智慧的資料對齊和遺失資料的整合處理:在運算中自動獲得基於標籤的對齊,並輕鬆地將雜亂的資料處理成有條理的形式;
-
資料集的彈性重塑和樞紐化;
-
智慧的基於標籤的切片、花式索引,以及大型資料集的子集化;
-
可以從資料結構中插入和刪除欄位以調整大小;
-
使用強大的群組依據引擎彙總或轉換資料,允許對資料集進行分割-套用-合併操作;
-
資料集的高效能合併和聯結;
-
階層軸索引提供一種直觀的方式,可以在較低維度的資料結構中處理高維度資料;
-
時間序列功能:日期範圍產生和頻率轉換、移動視窗統計、日期偏移和延遲。甚至可以建立特定領域的時間偏移,並在不遺失資料的情況下聯結時間序列;
-
高度效能最佳化,關鍵程式碼路徑以 Cython 或 C 編寫。
-
使用 pandas 的 Python 在各種學術和商業領域中使用,包括金融、神經科學、經濟學、統計學、廣告、網路分析等等。
使命
pandas 的目標是成為在 Python 中進行實際、真實世界資料分析的基本高階建構模組。此外,它還有更廣泛的目標,即成為任何語言中最強大、最靈活的開源資料分析/處理工具。
願景
一個資料分析和處理軟體的世界
- 所有人都能使用
- 使用者可以免費使用和修改
- 靈活
- 強大
- 易於使用
- 快速
價值觀
pandas 的核心是尊重和歡迎每個人,包括使用者、貢獻者和更廣泛的社群。無論經驗程度、性別、性別認同和表達、性取向、身心障礙、個人外貌、體型、種族、民族、年齡、宗教或國籍如何,都一視同仁。