關於 pandas

開發歷史

2008 年，pandas 開發始於 AQR Capital Management。2009 年底，它已成為開源，並由全球志同道合人士組成的社群積極支援，他們貢獻寶貴的時間和精力，讓開源 pandas 成為可能。感謝所有貢獻者。

自 2015 年以來，pandas 一直是 NumFOCUS 贊助的專案。這將有助於確保 pandas 作為世界級開源專案的開發成功。

時間軸

2008 年：pandas 開發開始
2009 年：pandas 成為開源
2012 年：資料分析的 Python 第一版出版
2015 年：pandas 成為 NumFOCUS 贊助的專案
2018 年：第一次實體核心開發人員衝刺

函式庫亮點

一個快速且有效的 DataFrame 物件，用於資料處理，並具有整合式索引；
用於讀寫資料在記憶體資料結構與不同格式之間的工具：CSV 和文字檔、Microsoft Excel、SQL 資料庫，以及快速的 HDF5 格式；
智慧的資料對齊和遺失資料的整合處理：在運算中自動獲得基於標籤的對齊，並輕鬆地將雜亂的資料處理成有條理的形式；
資料集的彈性重塑和樞紐化；
智慧的基於標籤的切片、花式索引，以及大型資料集的子集化；
可以從資料結構中插入和刪除欄位以調整大小；
使用強大的群組依據引擎彙總或轉換資料，允許對資料集進行分割-套用-合併操作；
資料集的高效能合併和聯結；
階層軸索引提供一種直觀的方式，可以在較低維度的資料結構中處理高維度資料；
時間序列功能：日期範圍產生和頻率轉換、移動視窗統計、日期偏移和延遲。甚至可以建立特定領域的時間偏移，並在不遺失資料的情況下聯結時間序列；
高度效能最佳化，關鍵程式碼路徑以 Cython 或 C 編寫。
使用 pandas 的 Python 在各種學術和商業領域中使用，包括金融、神經科學、經濟學、統計學、廣告、網路分析等等。

使命

pandas 的目標是成為在 Python 中進行實際、真實世界資料分析的基本高階建構模組。此外，它還有更廣泛的目標，即成為任何語言中最強大、最靈活的開源資料分析/處理工具。

願景

一個資料分析和處理軟體的世界

所有人都能使用
使用者可以免費使用和修改
靈活
強大
易於使用
快速

價值觀

pandas 的核心是尊重和歡迎每個人，包括使用者、貢獻者和更廣泛的社群。無論經驗程度、性別、性別認同和表達、性取向、身心障礙、個人外貌、體型、種族、民族、年齡、宗教或國籍如何，都一視同仁。