GroupBy#

pandas.api.typing.DataFrameGroupBypandas.api.typing.SeriesGroupBy 執行個體是由 groupby 呼叫 pandas.DataFrame.groupby()pandas.Series.groupby() 分別傳回。

索引、反覆運算#

DataFrameGroupBy.__iter__()

GroupBy 反覆運算器。

SeriesGroupBy.__iter__()

GroupBy 反覆運算器。

DataFrameGroupBy.groups

字典 {群組名稱 -> 群組標籤}。

SeriesGroupBy.groups

字典 {群組名稱 -> 群組標籤}。

DataFrameGroupBy.indices

字典 {群組名稱 -> 群組索引}。

SeriesGroupBy.indices

字典 {群組名稱 -> 群組索引}。

DataFrameGroupBy.get_group(name[, obj])

從提供名稱的群組建構 DataFrame。

SeriesGroupBy.get_group(name[, obj])

從提供名稱的群組建構 DataFrame。

Grouper(*args, **kwargs)

Grouper 允許使用者為物件指定 groupby 指令。

函式應用程式幫手#

NamedAgg(column, aggfunc)

針對特定欄位的聚合提供協助,並控制輸出欄位名稱。

函式應用程式#

SeriesGroupBy.apply(func, *args, **kwargs)

逐組套用函式 func,並將結果合併在一起。

DataFrameGroupBy.apply(func, *args[, ...])

逐組套用函式 func,並將結果合併在一起。

SeriesGroupBy.agg([func, engine, engine_kwargs])

使用一個或多個運算式在指定的軸向上進行聚合。

DataFrameGroupBy.agg([func, engine, ...])

使用一個或多個運算式在指定的軸向上進行聚合。

SeriesGroupBy.aggregate([func, engine, ...])

使用一個或多個運算式在指定的軸向上進行聚合。

DataFrameGroupBy.aggregate([func, engine, ...])

使用一個或多個運算式在指定的軸向上進行聚合。

SeriesGroupBy.transform(func, *args[, ...])

呼叫函數,在每個群組上產生同一個索引的 Series。

DataFrameGroupBy.transform(func, *args[, ...])

呼叫函數,在每個群組上產生同一個索引的 DataFrame。

SeriesGroupBy.pipe(func, *args, **kwargs)

將具有參數的 func 套用至這個 GroupBy 物件,並傳回其結果。

DataFrameGroupBy.pipe(func, *args, **kwargs)

將具有參數的 func 套用至這個 GroupBy 物件,並傳回其結果。

DataFrameGroupBy.filter(func[, dropna])

從不符合條件的群組中篩選元素。

SeriesGroupBy.filter(func[, dropna])

從不符合條件的群組中篩選元素。

DataFrameGroupBy 計算 / 描述性統計#

DataFrameGroupBy.all([skipna])

如果群組中所有值都為真,傳回 True,否則傳回 False。

DataFrameGroupBy.any([skipna])

如果群組中任何值都為真,傳回 True,否則傳回 False。

DataFrameGroupBy.bfill([limit])

向後填入值。

DataFrameGroupBy.corr([method, min_periods, ...])

計算欄位的成對相關性,排除 NA/null 值。

DataFrameGroupBy.corrwith(other[, axis, ...])

計算成對相關性。

DataFrameGroupBy.count()

計算群組的計數,排除遺失值。

DataFrameGroupBy.cov([min_periods, ddof, ...])

計算欄位的成對共變異數,排除 NA/null 值。

DataFrameGroupBy.cumcount([ascending])

對每個群組中的每個項目編號,從 0 編號到該群組的長度 - 1。

DataFrameGroupBy.cummax([axis, numeric_only])

每個群組的累積最大值。

DataFrameGroupBy.cummin([axis, numeric_only])

每個群組的累積最小值。

DataFrameGroupBy.cumprod([axis])

每個群組的累積乘積。

DataFrameGroupBy.cumsum([axis])

每個群組的累積總和。

DataFrameGroupBy.describe([percentiles, ...])

產生描述性統計資料。

DataFrameGroupBy.diff([periods, axis])

元素的第一個離散差值。

DataFrameGroupBy.ffill([limit])

向前填入值。

DataFrameGroupBy.fillna([value, method, ...])

(已棄用)使用群組內指定的方法填入 NA/NaN 值。

DataFrameGroupBy.first([numeric_only, ...])

計算每個群組內每個欄位的第 1 個項目。

DataFrameGroupBy.head([n])

傳回每個群組的前 n 列。

DataFrameGroupBy.idxmax([axis, skipna, ...])

傳回在請求軸上最大值第一次出現的索引。

DataFrameGroupBy.idxmin([axis, skipna, ...])

傳回在請求軸上最小值第一次出現的索引。

DataFrameGroupBy.last([numeric_only, ...])

計算每個群組中每個欄位的最後一個條目。

DataFrameGroupBy.max([numeric_only, ...])

計算群組值的最高值。

DataFrameGroupBy.mean([numeric_only, ...])

計算群組的平均值,不包括遺失值。

DataFrameGroupBy.median([numeric_only])

計算群組的中位數,不包括遺失值。

DataFrameGroupBy.min([numeric_only, ...])

計算群組值的最小值。

DataFrameGroupBy.ngroup([ascending])

將每個群組編號從 0 編到群組數目 - 1。

DataFrameGroupBy.nth

如果 n 為整數,則從每個群組中取出第 n 列,否則取出子列。

DataFrameGroupBy.nunique([dropna])

傳回每個位置中唯一元素的計數 DataFrame。

DataFrameGroupBy.ohlc()

計算群組的開盤價、最高價、最低價和收盤價,排除遺失值。

DataFrameGroupBy.pct_change([periods, ...])

計算群組中每個值與前一個條目的百分比變化。

DataFrameGroupBy.prod([numeric_only, min_count])

計算群組值的乘積。

DataFrameGroupBy.quantile([q, ...])

傳回給定分位數的群組值,類似於 numpy.percentile。

DataFrameGroupBy.rank([method, ascending, ...])

提供每個群組中值的排名。

DataFrameGroupBy.resample(rule, *args[, ...])

使用 TimeGrouper 時提供重新取樣。

DataFrameGroupBy.rolling(*args, **kwargs)

傳回一個滾動群組器,提供每個群組的滾動功能。

DataFrameGroupBy.sample([n, frac, replace, ...])

傳回每個群組中項目的隨機樣本。

DataFrameGroupBy.sem([ddof, numeric_only])

計算群組平均值的標準誤差,不包括遺失值。

DataFrameGroupBy.shift([periods, freq, ...])

將每個群組移動 periods 個觀察值。

DataFrameGroupBy.size()

計算群組大小。

DataFrameGroupBy.skew([axis, skipna, ...])

傳回群組內部未校正的偏度。

DataFrameGroupBy.std([ddof, engine, ...])

計算群組的標準差,不包括遺失值。

DataFrameGroupBy.sum([numeric_only, ...])

計算群組值的總和。

DataFrameGroupBy.var([ddof, engine, ...])

計算群組的變異數,不包含遺失值。

DataFrameGroupBy.tail([n])

傳回每個群組的最後 n 列。

DataFrameGroupBy.take(indices[, axis])

傳回每個群組中給定位置索引中的元素。

DataFrameGroupBy.value_counts([subset, ...])

傳回包含唯一列數量的 Series 或 DataFrame。

SeriesGroupBy 計算 / 描述性統計#

SeriesGroupBy.all([skipna])

如果群組中所有值都為真,傳回 True,否則傳回 False。

SeriesGroupBy.any([skipna])

如果群組中任何值都為真,傳回 True,否則傳回 False。

SeriesGroupBy.bfill([limit])

向後填入值。

SeriesGroupBy.corr(other[, method, min_periods])

計算與 other Series 的相關性,排除遺失值。

SeriesGroupBy.count()

計算群組的計數,排除遺失值。

SeriesGroupBy.cov(other[, min_periods, ddof])

計算與 Series 的共變異數,排除遺失值。

SeriesGroupBy.cumcount([ascending])

對每個群組中的每個項目編號,從 0 編號到該群組的長度 - 1。

SeriesGroupBy.cummax([axis, numeric_only])

每個群組的累積最大值。

SeriesGroupBy.cummin([axis, numeric_only])

每個群組的累積最小值。

SeriesGroupBy.cumprod([axis])

每個群組的累積乘積。

SeriesGroupBy.cumsum([axis])

每個群組的累積總和。

SeriesGroupBy.describe([percentiles, ...])

產生描述性統計資料。

SeriesGroupBy.diff([periods, axis])

元素的第一個離散差值。

SeriesGroupBy.ffill([limit])

向前填入值。

SeriesGroupBy.fillna([value, method, axis, ...])

(已棄用)使用群組內指定的方法填入 NA/NaN 值。

SeriesGroupBy.first([numeric_only, ...])

計算每個群組內每個欄位的第 1 個項目。

SeriesGroupBy.head([n])

傳回每個群組的前 n 列。

SeriesGroupBy.last([numeric_only, ...])

計算每個群組中每個欄位的最後一個條目。

SeriesGroupBy.idxmax([axis, skipna])

傳回最大值所在列標籤。

SeriesGroupBy.idxmin([axis, skipna])

傳回最小值所在列標籤。

SeriesGroupBy.is_monotonic_increasing

傳回每個群組的值是否單調遞增。

SeriesGroupBy.is_monotonic_decreasing

傳回每個群組的值是否單調遞減。

SeriesGroupBy.max([numeric_only, min_count, ...])

計算群組值的最高值。

SeriesGroupBy.mean([numeric_only, engine, ...])

計算群組的平均值,不包括遺失值。

SeriesGroupBy.median([numeric_only])

計算群組的中位數,不包括遺失值。

SeriesGroupBy.min([numeric_only, min_count, ...])

計算群組值的最小值。

SeriesGroupBy.ngroup([ascending])

將每個群組編號從 0 編到群組數目 - 1。

SeriesGroupBy.nlargest([n, keep])

傳回最大的 n 個元素。

SeriesGroupBy.nsmallest([n, keep])

傳回最小的 n 個元素。

SeriesGroupBy.nth

如果 n 為整數,則從每個群組中取出第 n 列,否則取出子列。

SeriesGroupBy.nunique([dropna])

傳回群組中唯一元素的數目。

SeriesGroupBy.unique()

傳回每個群組的唯一值。

SeriesGroupBy.ohlc()

計算群組的開盤價、最高價、最低價和收盤價,排除遺失值。

SeriesGroupBy.pct_change([periods, ...])

計算群組中每個值與前一個條目的百分比變化。

SeriesGroupBy.prod([numeric_only, min_count])

計算群組值的乘積。

SeriesGroupBy.quantile([q, interpolation, ...])

傳回給定分位數的群組值,類似於 numpy.percentile。

SeriesGroupBy.rank([method, ascending, ...])

提供每個群組中值的排名。

SeriesGroupBy.resample(rule, *args[, ...])

使用 TimeGrouper 時提供重新取樣。

SeriesGroupBy.rolling(*args, **kwargs)

傳回一個滾動群組器,提供每個群組的滾動功能。

SeriesGroupBy.sample([n, frac, replace, ...])

傳回每個群組中項目的隨機樣本。

SeriesGroupBy.sem([ddof, numeric_only])

計算群組平均值的標準誤差,不包括遺失值。

SeriesGroupBy.shift([periods, freq, axis, ...])

將每個群組移動 periods 個觀察值。

SeriesGroupBy.size()

計算群組大小。

SeriesGroupBy.skew([axis, skipna, numeric_only])

傳回群組內部未校正的偏度。

SeriesGroupBy.std([ddof, engine, ...])

計算群組的標準差,不包括遺失值。

SeriesGroupBy.sum([numeric_only, min_count, ...])

計算群組值的總和。

SeriesGroupBy.var([ddof, engine, ...])

計算群組的變異數,不包含遺失值。

SeriesGroupBy.tail([n])

傳回每個群組的最後 n 列。

SeriesGroupBy.take(indices[, axis])

傳回每個群組中給定位置索引中的元素。

SeriesGroupBy.value_counts([normalize, ...])

繪圖和視覺化#

DataFrameGroupBy.boxplot([subplots, column, ...])

從 DataFrameGroupBy 資料製作箱型圖。

DataFrameGroupBy.hist([column, by, grid, ...])

製作 DataFrame 欄位的直方圖。

SeriesGroupBy.hist([by, ax, grid, ...])

使用 matplotlib 繪製輸入系列的直方圖。

DataFrameGroupBy.plot

製作 Series 或 DataFrame 的圖表。

SeriesGroupBy.plot

製作 Series 或 DataFrame 的圖表。