資料框#
建構函式#
|
二維、大小可變、潛在異質的表格資料。 |
屬性和基礎資料#
軸
DataFrame 的索引(列標籤)。 |
|
DataFrame 的欄位標籤。 |
傳回 DataFrame 中的資料類型。 |
|
|
列印 DataFrame 的簡潔摘要。 |
|
根據欄位資料類型傳回 DataFrame 欄位的子集。 |
傳回 DataFrame 的 Numpy 表達式。 |
|
傳回表示 DataFrame 軸的清單。 |
|
傳回表示軸/陣列維度的整數。 |
|
傳回表示此物件中元素數量的整數。 |
|
傳回表示 DataFrame 維度的元組。 |
|
|
傳回每個欄位以位元組為單位的記憶體使用量。 |
指示 Series/DataFrame 是否為空。 |
|
|
傳回具有更新旗標的新物件。 |
轉換#
|
將 pandas 物件轉換為指定的資料型態 |
|
使用支援 |
|
嘗試推斷物件欄位的更佳資料型態。 |
|
複製此物件的索引和資料。 |
(已棄用) 傳回單一元素 Series 或 DataFrame 的布林值。 |
索引、反覆運算#
|
傳回前 n 列。 |
存取單一值,搭配列/欄位標籤對。 |
|
透過整數位置存取單一值,搭配列/欄位對。 |
|
透過標籤或布林陣列存取一組列和欄位。 |
|
(已棄用) 純粹基於整數位置的索引,透過位置選擇。 |
|
|
在指定位置插入欄位至 DataFrame。 |
迭代資訊軸。 |
|
迭代 (欄位名稱、Series) 成對。 |
|
取得「資訊軸」(詳細資訊請參閱索引)。 |
|
迭代 DataFrame 列為 (索引、Series) 成對。 |
|
|
迭代 DataFrame 列為 namedtuples。 |
|
傳回項目並從框架中刪除。 |
|
傳回最後 n 列。 |
|
從 Series/DataFrame 傳回橫截面。 |
|
從物件取得指定金鑰的項目(例如:DataFrame 欄位)。 |
|
DataFrame 中的每個元素是否包含在值中。 |
|
替換條件為 False 的值。 |
|
取代條件為 True 的值。 |
|
使用布林表達式查詢 DataFrame 的欄。 |
有關 .at
、.iat
、.loc
和 .iloc
的詳細資訊,請參閱 索引文件。
二元運算子函式#
|
取得 DataFrame 和其他資料的加總,逐欄。 |
|
取得資料框和另一個資料的加總,逐元素(二元運算子 add)。 |
|
取得資料框和另一個資料的減法,逐元素(二元運算子 sub)。 |
|
取得資料框和其它資料的乘法,逐元素(二元運算子 mul)。 |
|
取得資料框和其它資料的浮點除法,逐元素(二元運算子 truediv)。 |
|
取得資料框和其它資料的浮點除法,逐元素(二元運算子 truediv)。 |
|
取得資料框和其它資料的整數除法,逐元素(二元運算子 floordiv)。 |
|
取得資料框和其它資料的模數,逐元素(二元運算子 mod)。 |
|
取得資料框和其它資料的指數冪,逐元素(二元運算子 pow)。 |
|
計算 DataFrame 與 other 之間的矩陣乘法。 |
|
取得 dataframe 與 other 的加法,逐元素(二元運算子 radd)。 |
|
取得 dataframe 與 other 的減法,逐元素(二元運算子 rsub)。 |
|
取得 dataframe 與 other 的乘法,逐元素(二元運算子 rmul)。 |
|
取得 dataframe 與 other 的浮點除法,逐元素(二元運算子 rtruediv)。 |
|
取得 dataframe 與 other 的浮點除法,逐元素(二元運算子 rtruediv)。 |
|
取得 dataframe 與 other 的整數除法,逐元素(二元運算子 rfloordiv)。 |
|
取得資料框和其他元素的模數,逐元素(二元運算子 rmod)。 |
|
取得資料框和其他元素的指數冪,逐元素(二元運算子 rpow)。 |
|
取得資料框和小於其他元素,逐元素(二元運算子 lt)。 |
|
取得資料框和比其他元素大,逐元素(二元運算子 gt)。 |
|
取得資料框和小於或等於其他元素,逐元素(二元運算子 le)。 |
|
取得資料框和比或等於其他元素大,逐元素(二元運算子 ge)。 |
|
取得資料框與其他資料不相等的元素,逐一元件(二元運算子 ne)。 |
|
取得資料框與其他資料相等的元素,逐一元件(二元運算子 eq)。 |
|
與另一個資料框執行逐欄合併。 |
|
使用 other 中相同位置的值更新空值元素。 |
函式應用、GroupBy 和視窗#
|
沿著資料框的軸線套用函式。 |
|
逐一元件對資料框套用函式。 |
|
(已棄用)將函式套用至資料框元素。 |
|
套用可預期序列或資料框的可鏈結函式。 |
|
使用指定軸上的多個運算進行彙總。 |
|
使用指定軸上的多個運算進行彙總。 |
|
對 self 呼叫 |
|
使用對應器或一組欄位序列來群組資料框。 |
|
提供滾動視窗計算。 |
|
提供擴充視窗計算。 |
|
提供指數加權 (EW) 計算。 |
運算 / 描述性統計#
傳回一個 Series/DataFrame,其中包含每個元素的絕對數值。 |
|
|
傳回是否所有元素都是 True,可能透過一個軸。 |
|
傳回是否有任何元素是 True,可能透過一個軸。 |
|
在輸入閾值修剪值。 |
|
計算欄位的成對關聯性,排除 NA/null 值。 |
|
計算成對關聯性。 |
|
計算每欄或每列的非 NA 儲存格。 |
|
計算欄位的成對共變異數,排除 NA/null 值。 |
|
傳回 DataFrame 或 Series 軸上的累積最大值。 |
|
傳回 DataFrame 或 Series 軸上的累積最小值。 |
|
傳回 DataFrame 或 Series 軸上的累積乘積。 |
|
傳回 DataFrame 或 Series 軸上的累積總和。 |
|
產生描述性統計資料。 |
|
元素的第一個離散差分。 |
|
評估描述 DataFrame 欄位運算的字串。 |
|
傳回所要求軸上的無偏峰度。 |
|
傳回所要求軸上的無偏峰度。 |
|
傳回請求軸上數值的最大值。 |
|
傳回請求軸上數值的平均值。 |
|
傳回請求軸上數值的中位數。 |
|
傳回請求軸上數值的最小值。 |
|
取得選取軸上每個元素的眾數。 |
|
當前元素與先前元素之間的分數變化。 |
|
傳回在要求軸上值的乘積。 |
|
傳回在要求軸上值的乘積。 |
|
傳回在要求軸上給定分位數的值。 |
|
計算沿著軸的數值資料等級(1 到 n)。 |
|
將 DataFrame 四捨五入到變數小數位數。 |
|
傳回在要求軸上平均數的無偏標準誤差。 |
|
傳回在要求軸上的無偏斜度。 |
|
傳回在要求軸上值的總和。 |
|
傳回在要求軸上的樣本標準差。 |
|
傳回請求軸上的無偏方差。 |
|
計算指定軸中不同元素的數量。 |
|
傳回包含 Dataframe 中每個不同列頻率的 Series。 |
重新索引/選取/標籤操作#
|
使用字串 prefix 為標籤加上字首。 |
|
使用字串 suffix 為標籤加上字尾。 |
|
使用指定的合併方法在軸上對齊兩個物件。 |
|
選取一天中特定時間(例如上午 9:30)的值。 |
|
選取特定時間範圍內的數值(例如,早上 9:00-9:30)。 |
|
從列或欄中刪除指定的標籤。 |
|
傳回已移除重複列的 DataFrame。 |
|
傳回表示重複列的布林序列。 |
|
測試兩個物件是否包含相同的元素。 |
|
根據指定的索引標籤對資料框列或欄進行子集處理。 |
|
(已棄用)根據日期偏移量選取時間序列資料的初始期間。 |
|
傳回前 n 列。 |
|
傳回在請求軸上最大值的第一次出現的索引。 |
|
傳回在要求軸上最小值第一次出現的索引。 |
|
(已棄用)根據日期偏移選取時間序列資料的最後幾個週期。 |
|
將 DataFrame 調整為新的索引,並使用可選的填補邏輯。 |
|
傳回一個與其他物件索引相符的物件。 |
|
重新命名欄位或索引標籤。 |
|
設定索引或欄位的軸名稱。 |
|
重設索引,或其一個層級。 |
|
傳回物件軸上隨機取樣項目。 |
|
指定想要的索引至給定軸。 |
|
使用現有欄位設定 DataFrame 索引。 |
|
傳回最後 n 列。 |
|
傳回沿著軸上給定位置索引的元素。 |
|
在某個索引值之前和之後截斷 Series 或 DataFrame。 |
遺失資料處理#
|
(已棄用)使用下一個有效觀察值填補 NA/NaN 值以填補空白。 |
|
使用下一個有效觀察值填補 NA/NaN 值以填補空白。 |
|
移除遺失值。 |
|
將 NA/NaN 值填滿,方法是將上一個有效觀察值傳播到下一個有效值。 |
|
使用指定的方法填滿 NA/NaN 值。 |
|
使用內插方法填滿 NaN 值。 |
偵測遺失值。 |
|
DataFrame.isnull 是 DataFrame.isna 的別名。 |
|
偵測現有(非遺失)值。 |
|
DataFrame.notnull 是 DataFrame.notna 的別名。 |
|
|
(已棄用)將 NA/NaN 值填滿,方法是將上一個有效觀察值傳播到下一個有效值。 |
|
將 to_replace 中給定的值替換為 value。 |
重新塑形、排序、轉置#
|
傳回已移除要求索引/欄位層級的 Series/DataFrame。 |
|
傳回已由指定的索引/欄位值重新整理的 DataFrame。 |
|
建立試算表樣式的樞紐資料表,作為 DataFrame。 |
|
使用輸入順序重新排列索引層級。 |
|
依據任一軸的值進行排序。 |
|
依據標籤對物件進行排序(沿著軸)。 |
|
傳回依據 欄位 以遞減順序排序的前 n 列。 |
|
傳回由 columns 依序排列的前 n 列。 |
|
在 |
|
將指定的層級從欄位堆疊到索引。 |
|
樞紐化(necessarily hierarchical)索引標籤的層級。 |
|
(已棄用)交換軸並適當地交換值軸。 |
|
將 DataFrame 從寬式格式轉換為長式格式,並選擇性地保留已設定的識別碼。 |
|
將類清單的每個元素轉換為一列,並複製索引值。 |
|
將 1 維軸物件壓縮成純量。 |
從 pandas 物件傳回一個 xarray 物件。 |
|
DataFrame 的轉置。 |
|
|
轉置索引和欄位。 |
合併/比較/加入/合併#
|
指定 DataFrame 的新欄位。 |
|
與另一個 DataFrame 比較並顯示差異。 |
|
加入另一個 DataFrame 的欄位。 |
|
使用資料庫樣式加入合併 DataFrame 或命名 Series 物件。 |
|
使用另一個 DataFrame 中的非 NA 值就地修改。 |
旗標#
旗標指的是 pandas 物件的屬性。資料集的屬性(例如記錄日期、存取的 URL 等)應儲存在 DataFrame.attrs
中。
|
適用於 pandas 物件的旗標。 |
元資料#
DataFrame.attrs
是用於儲存此 DataFrame 的全域元資料的字典。
警告
DataFrame.attrs
被視為實驗性質,可能會在未警告的情況下變更。
此資料集的全域屬性字典。 |
繪製#
DataFrame.plot
同時是一個可呼叫方法和一個命名空間屬性,用於特定繪製方法,其形式為 DataFrame.plot.<kind>
。
|
DataFrame 繪製存取器和方法 |
|
繪製堆疊面積圖。 |
|
垂直長條圖。 |
|
繪製水平長條圖。 |
|
繪製 DataFrame 欄位的箱型圖。 |
|
使用高斯核產生核密度估計圖。 |
|
產生六角形分組圖。 |
|
繪製 DataFrame 欄位的直方圖。 |
|
使用高斯核產生核密度估計圖。 |
|
將 Series 或 DataFrame 繪製成線條圖。 |
|
產生圓餅圖。 |
|
建立散佈圖,並變更標記點的大小和顏色。 |
|
從 DataFrame 欄位建立箱型圖。 |
|
建立 DataFrame 欄位的直方圖。 |
稀疏存取器#
稀疏資料型態的特定方法和屬性會提供在 DataFrame.sparse
存取器中。
非稀疏點與總 (稠密) 資料點的比率。 |
|
從 scipy 稀疏矩陣建立新的 DataFrame。 |
傳回框架的內容,作為稀疏的 SciPy COO 矩陣。 |
|
將具有稀疏值的 DataFrame 轉換為稠密。 |
序列化/IO/轉換#
|
從陣列相似或字典的字典建立 DataFrame。 |
|
將結構化或記錄的 ndarray 轉換為 DataFrame。 |
|
將 DataFrame 寫入 ORC 格式。 |
|
將 DataFrame 寫入二進制 Parquet 格式。 |
|
將物件序列化為檔案。 |
|
將物件寫入逗號分隔值 (csv) 檔案。 |
|
使用 HDFStore 將包含的資料寫入 HDF5 檔案。 |
|
將儲存在 DataFrame 中的記錄寫入 SQL 資料庫。 |
|
將 DataFrame 轉換為字典。 |
|
將物件寫入 Excel 試算表。 |
|
將物件轉換為 JSON 字串。 |
|
將 DataFrame 呈現為 HTML 表格。 |
|
將 DataFrame 寫入二進位 Feather 格式。 |
|
將物件呈現為 LaTeX 表格、長表格或巢狀表格。 |
|
將 DataFrame 物件匯出為 Stata dta 格式。 |
|
(已棄用)將 DataFrame 寫入 Google BigQuery 表格。 |
|
將 DataFrame 轉換為 NumPy 記錄陣列。 |
|
將 DataFrame 呈現為友善於主控台的表格輸出。 |
|
將物件複製到系統剪貼簿。 |
|
以友善於 Markdown 的格式列印 DataFrame。 |
傳回 Styler 物件。 |
|
|
傳回實作交換通訊協定的資料框交換物件。 |