GroupBy#

pandas.api.typing.DataFrameGroupBy 和 pandas.api.typing.SeriesGroupBy 執行個體是由 groupby 呼叫 pandas.DataFrame.groupby() 和 pandas.Series.groupby() 分別傳回。

索引、反覆運算#

`DataFrameGroupBy.__iter__`()	GroupBy 反覆運算器。
`SeriesGroupBy.__iter__`()	GroupBy 反覆運算器。
`DataFrameGroupBy.groups`	字典 {群組名稱 -> 群組標籤}。
`SeriesGroupBy.groups`	字典 {群組名稱 -> 群組標籤}。
`DataFrameGroupBy.indices`	字典 {群組名稱 -> 群組索引}。
`SeriesGroupBy.indices`	字典 {群組名稱 -> 群組索引}。
`DataFrameGroupBy.get_group`(name[, obj])	從提供名稱的群組建構 DataFrame。
`SeriesGroupBy.get_group`(name[, obj])	從提供名稱的群組建構 DataFrame。

Grouper(*args, **kwargs)

Grouper 允許使用者為物件指定 groupby 指令。

函式應用程式幫手#

NamedAgg(column, aggfunc)

針對特定欄位的聚合提供協助，並控制輸出欄位名稱。

函式應用程式#

`SeriesGroupBy.apply`(func, args, *kwargs)	逐組套用函式 `func`，並將結果合併在一起。
`DataFrameGroupBy.apply`(func, *args[, ...])	逐組套用函式 `func`，並將結果合併在一起。
`SeriesGroupBy.agg`([func, engine, engine_kwargs])	使用一個或多個運算式在指定的軸向上進行聚合。
`DataFrameGroupBy.agg`([func, engine, ...])	使用一個或多個運算式在指定的軸向上進行聚合。
`SeriesGroupBy.aggregate`([func, engine, ...])	使用一個或多個運算式在指定的軸向上進行聚合。
`DataFrameGroupBy.aggregate`([func, engine, ...])	使用一個或多個運算式在指定的軸向上進行聚合。
`SeriesGroupBy.transform`(func, *args[, ...])	呼叫函數，在每個群組上產生同一個索引的 Series。
`DataFrameGroupBy.transform`(func, *args[, ...])	呼叫函數，在每個群組上產生同一個索引的 DataFrame。
`SeriesGroupBy.pipe`(func, args, *kwargs)	將具有參數的 `func` 套用至這個 GroupBy 物件，並傳回其結果。
`DataFrameGroupBy.pipe`(func, args, *kwargs)	將具有參數的 `func` 套用至這個 GroupBy 物件，並傳回其結果。
`DataFrameGroupBy.filter`(func[, dropna])	從不符合條件的群組中篩選元素。
`SeriesGroupBy.filter`(func[, dropna])	從不符合條件的群組中篩選元素。

`DataFrameGroupBy` 計算 / 描述性統計#

`DataFrameGroupBy.all`([skipna])	如果群組中所有值都為真，傳回 True，否則傳回 False。
`DataFrameGroupBy.any`([skipna])	如果群組中任何值都為真，傳回 True，否則傳回 False。
`DataFrameGroupBy.bfill`([limit])	向後填入值。
`DataFrameGroupBy.corr`([method, min_periods, ...])	計算欄位的成對相關性，排除 NA/null 值。
`DataFrameGroupBy.corrwith`(other[, axis, ...])	計算成對相關性。
`DataFrameGroupBy.count`()	計算群組的計數，排除遺失值。
`DataFrameGroupBy.cov`([min_periods, ddof, ...])	計算欄位的成對共變異數，排除 NA/null 值。
`DataFrameGroupBy.cumcount`([ascending])	對每個群組中的每個項目編號，從 0 編號到該群組的長度 - 1。
`DataFrameGroupBy.cummax`([axis, numeric_only])	每個群組的累積最大值。
`DataFrameGroupBy.cummin`([axis, numeric_only])	每個群組的累積最小值。
`DataFrameGroupBy.cumprod`([axis])	每個群組的累積乘積。
`DataFrameGroupBy.cumsum`([axis])	每個群組的累積總和。
`DataFrameGroupBy.describe`([percentiles, ...])	產生描述性統計資料。
`DataFrameGroupBy.diff`([periods, axis])	元素的第一個離散差值。
`DataFrameGroupBy.ffill`([limit])	向前填入值。
`DataFrameGroupBy.fillna`([value, method, ...])	(已棄用)使用群組內指定的方法填入 NA/NaN 值。
`DataFrameGroupBy.first`([numeric_only, ...])	計算每個群組內每個欄位的第 1 個項目。
`DataFrameGroupBy.head`([n])	傳回每個群組的前 n 列。
`DataFrameGroupBy.idxmax`([axis, skipna, ...])	傳回在請求軸上最大值第一次出現的索引。
`DataFrameGroupBy.idxmin`([axis, skipna, ...])	傳回在請求軸上最小值第一次出現的索引。
`DataFrameGroupBy.last`([numeric_only, ...])	計算每個群組中每個欄位的最後一個條目。
`DataFrameGroupBy.max`([numeric_only, ...])	計算群組值的最高值。
`DataFrameGroupBy.mean`([numeric_only, ...])	計算群組的平均值，不包括遺失值。
`DataFrameGroupBy.median`([numeric_only])	計算群組的中位數，不包括遺失值。
`DataFrameGroupBy.min`([numeric_only, ...])	計算群組值的最小值。
`DataFrameGroupBy.ngroup`([ascending])	將每個群組編號從 0 編到群組數目 - 1。
`DataFrameGroupBy.nth`	如果 n 為整數，則從每個群組中取出第 n 列，否則取出子列。
`DataFrameGroupBy.nunique`([dropna])	傳回每個位置中唯一元素的計數 DataFrame。
`DataFrameGroupBy.ohlc`()	計算群組的開盤價、最高價、最低價和收盤價，排除遺失值。
`DataFrameGroupBy.pct_change`([periods, ...])	計算群組中每個值與前一個條目的百分比變化。
`DataFrameGroupBy.prod`([numeric_only, min_count])	計算群組值的乘積。
`DataFrameGroupBy.quantile`([q, ...])	傳回給定分位數的群組值，類似於 numpy.percentile。
`DataFrameGroupBy.rank`([method, ascending, ...])	提供每個群組中值的排名。
`DataFrameGroupBy.resample`(rule, *args[, ...])	使用 TimeGrouper 時提供重新取樣。
`DataFrameGroupBy.rolling`(args, *kwargs)	傳回一個滾動群組器，提供每個群組的滾動功能。
`DataFrameGroupBy.sample`([n, frac, replace, ...])	傳回每個群組中項目的隨機樣本。
`DataFrameGroupBy.sem`([ddof, numeric_only])	計算群組平均值的標準誤差，不包括遺失值。
`DataFrameGroupBy.shift`([periods, freq, ...])	將每個群組移動 periods 個觀察值。
`DataFrameGroupBy.size`()	計算群組大小。
`DataFrameGroupBy.skew`([axis, skipna, ...])	傳回群組內部未校正的偏度。
`DataFrameGroupBy.std`([ddof, engine, ...])	計算群組的標準差，不包括遺失值。
`DataFrameGroupBy.sum`([numeric_only, ...])	計算群組值的總和。
`DataFrameGroupBy.var`([ddof, engine, ...])	計算群組的變異數，不包含遺失值。
`DataFrameGroupBy.tail`([n])	傳回每個群組的最後 n 列。
`DataFrameGroupBy.take`(indices[, axis])	傳回每個群組中給定位置索引中的元素。
`DataFrameGroupBy.value_counts`([subset, ...])	傳回包含唯一列數量的 Series 或 DataFrame。

`SeriesGroupBy` 計算 / 描述性統計#

`SeriesGroupBy.all`([skipna])	如果群組中所有值都為真，傳回 True，否則傳回 False。
`SeriesGroupBy.any`([skipna])	如果群組中任何值都為真，傳回 True，否則傳回 False。
`SeriesGroupBy.bfill`([limit])	向後填入值。
`SeriesGroupBy.corr`(other[, method, min_periods])	計算與 other Series 的相關性，排除遺失值。
`SeriesGroupBy.count`()	計算群組的計數，排除遺失值。
`SeriesGroupBy.cov`(other[, min_periods, ddof])	計算與 Series 的共變異數，排除遺失值。
`SeriesGroupBy.cumcount`([ascending])	對每個群組中的每個項目編號，從 0 編號到該群組的長度 - 1。
`SeriesGroupBy.cummax`([axis, numeric_only])	每個群組的累積最大值。
`SeriesGroupBy.cummin`([axis, numeric_only])	每個群組的累積最小值。
`SeriesGroupBy.cumprod`([axis])	每個群組的累積乘積。
`SeriesGroupBy.cumsum`([axis])	每個群組的累積總和。
`SeriesGroupBy.describe`([percentiles, ...])	產生描述性統計資料。
`SeriesGroupBy.diff`([periods, axis])	元素的第一個離散差值。
`SeriesGroupBy.ffill`([limit])	向前填入值。
`SeriesGroupBy.fillna`([value, method, axis, ...])	(已棄用)使用群組內指定的方法填入 NA/NaN 值。
`SeriesGroupBy.first`([numeric_only, ...])	計算每個群組內每個欄位的第 1 個項目。
`SeriesGroupBy.head`([n])	傳回每個群組的前 n 列。
`SeriesGroupBy.last`([numeric_only, ...])	計算每個群組中每個欄位的最後一個條目。
`SeriesGroupBy.idxmax`([axis, skipna])	傳回最大值所在列標籤。
`SeriesGroupBy.idxmin`([axis, skipna])	傳回最小值所在列標籤。
`SeriesGroupBy.is_monotonic_increasing`	傳回每個群組的值是否單調遞增。
`SeriesGroupBy.is_monotonic_decreasing`	傳回每個群組的值是否單調遞減。
`SeriesGroupBy.max`([numeric_only, min_count, ...])	計算群組值的最高值。
`SeriesGroupBy.mean`([numeric_only, engine, ...])	計算群組的平均值，不包括遺失值。
`SeriesGroupBy.median`([numeric_only])	計算群組的中位數，不包括遺失值。
`SeriesGroupBy.min`([numeric_only, min_count, ...])	計算群組值的最小值。
`SeriesGroupBy.ngroup`([ascending])	將每個群組編號從 0 編到群組數目 - 1。
`SeriesGroupBy.nlargest`([n, keep])	傳回最大的 n 個元素。
`SeriesGroupBy.nsmallest`([n, keep])	傳回最小的 n 個元素。
`SeriesGroupBy.nth`	如果 n 為整數，則從每個群組中取出第 n 列，否則取出子列。
`SeriesGroupBy.nunique`([dropna])	傳回群組中唯一元素的數目。
`SeriesGroupBy.unique`()	傳回每個群組的唯一值。
`SeriesGroupBy.ohlc`()	計算群組的開盤價、最高價、最低價和收盤價，排除遺失值。
`SeriesGroupBy.pct_change`([periods, ...])	計算群組中每個值與前一個條目的百分比變化。
`SeriesGroupBy.prod`([numeric_only, min_count])	計算群組值的乘積。
`SeriesGroupBy.quantile`([q, interpolation, ...])	傳回給定分位數的群組值，類似於 numpy.percentile。
`SeriesGroupBy.rank`([method, ascending, ...])	提供每個群組中值的排名。
`SeriesGroupBy.resample`(rule, *args[, ...])	使用 TimeGrouper 時提供重新取樣。
`SeriesGroupBy.rolling`(args, *kwargs)	傳回一個滾動群組器，提供每個群組的滾動功能。
`SeriesGroupBy.sample`([n, frac, replace, ...])	傳回每個群組中項目的隨機樣本。
`SeriesGroupBy.sem`([ddof, numeric_only])	計算群組平均值的標準誤差，不包括遺失值。
`SeriesGroupBy.shift`([periods, freq, axis, ...])	將每個群組移動 periods 個觀察值。
`SeriesGroupBy.size`()	計算群組大小。
`SeriesGroupBy.skew`([axis, skipna, numeric_only])	傳回群組內部未校正的偏度。
`SeriesGroupBy.std`([ddof, engine, ...])	計算群組的標準差，不包括遺失值。
`SeriesGroupBy.sum`([numeric_only, min_count, ...])	計算群組值的總和。
`SeriesGroupBy.var`([ddof, engine, ...])	計算群組的變異數，不包含遺失值。
`SeriesGroupBy.tail`([n])	傳回每個群組的最後 n 列。
`SeriesGroupBy.take`(indices[, axis])	傳回每個群組中給定位置索引中的元素。
`SeriesGroupBy.value_counts`([normalize, ...])

繪圖和視覺化#

`DataFrameGroupBy.boxplot`([subplots, column, ...])	從 DataFrameGroupBy 資料製作箱型圖。
`DataFrameGroupBy.hist`([column, by, grid, ...])	製作 DataFrame 欄位的直方圖。
`SeriesGroupBy.hist`([by, ax, grid, ...])	使用 matplotlib 繪製輸入系列的直方圖。
`DataFrameGroupBy.plot`	製作 Series 或 DataFrame 的圖表。
`SeriesGroupBy.plot`	製作 Series 或 DataFrame 的圖表。