eland.DataFrame.quantile#

DataFrame.quantile(q: Union[int, float, List[int], List[float]] = 0.5, numeric_only: Optional[bool] = True) DataFrame#

用于计算给定 DataFrame 的分位数。

参数#

q

浮点数或类数组,默认 0.5 在 0 <= q <= 1 之间的值,要计算的分位数。

numeric_only: {True, False, None} 默认值为 True

要返回的哪种数据类型 - True: 将所有值作为 float64 返回,NaN/NaT 值将被移除 - None: 将所有值作为相同数据类型返回(如果可能),NaN/NaT 将被移除 - False: 将所有值作为相同数据类型返回(如果可能),NaN/NaT 将被保留

返回值#

pandas.DataFrame

每列的分位数值

另请参阅#

pandas.DataFrame.quantile

示例#

>>> ed_df = ed.DataFrame('http://localhost:9200', 'flights')
>>> ed_flights = ed_df.filter(["AvgTicketPrice", "FlightDelayMin", "dayOfWeek", "timestamp"])
>>> ed_flights.quantile() 
AvgTicketPrice    640.387285
FlightDelayMin      0.000000
dayOfWeek           3.000000
Name: 0.5, dtype: float64
>>> ed_flights.quantile([.2, .5, .75]) 
      AvgTicketPrice  FlightDelayMin  dayOfWeek
0.20      361.040768             0.0        1.0
0.50      640.387285             0.0        3.0
0.75      842.213490            15.0        4.0
>>> ed_flights.quantile([.2, .5, .75], numeric_only=False) 
      AvgTicketPrice  FlightDelayMin  dayOfWeek                     timestamp
0.20      361.040768             0.0        1.0 2018-01-09 04:43:55.296587520
0.50      640.387285             0.0        3.0 2018-01-21 23:51:57.637076736
0.75      842.213490            15.0        4.0 2018-02-01 04:46:16.658119680