DataFrame#
构造函数#
|
二维可变大小的、可能是异构的表格数据结构,带有标记的轴(行和列),引用存储在 Elasticsearch 索引中的数据。 |
属性和基础数据#
返回 eland 索引,引用 Elasticsearch 字段以索引 DataFrame/Series |
|
DataFrame 的列标签。 |
|
返回 DataFrame 中的 pandas dtypes。 |
|
|
根据列 dtypes 返回 DataFrame 列的子集。 |
未实现。 |
|
确定 DataFrame 是否为空。 |
|
返回一个元组,表示 DataFrame 的维度。 |
|
根据 DataFrame 的定义返回 2 |
|
返回一个 int,表示此对象中的元素数量。 |
索引、迭代#
|
返回前 n 行。 |
返回列 |
|
|
返回最后 n 行。 |
|
从对象中获取给定键(例如:DataFrame 列)的项目。 |
|
使用布尔表达式查询 DataFrame 的列。 |
|
返回 n 个随机样本行或指定行数的指定分数 |
以 (index, pandas.Series) 对的形式迭代 eland.DataFrame 行。 |
|
|
以 namedtuples 的形式迭代 eland.DataFrame 行。 |
函数应用、GroupBy 和窗口#
注意
使用基数 (count
) 的 Elasticsearch 聚合是使用 HyperLogLog++ 算法 的精确近似值,因此可能不完全准确。
|
在指定轴上使用一个或多个操作进行聚合。 |
|
在指定轴上使用一个或多个操作进行聚合。 |
|
用于执行 groupby 操作 |
|
它保存了 |
|
用于 groupby 和聚合 |
|
用于 groupby 和聚合 |
计算每个组的计数值。 |
|
|
计算每个组的中位数绝对偏差值。 |
|
计算每个组的最大值。 |
|
计算每个组的平均值。 |
|
计算每个组的中位数。 |
|
计算每个组的最小值。 |
计算每个组的 nunique 值。 |
|
|
计算每个组的标准差值。 |
|
计算每个组的总和值。 |
|
计算每个组的方差值。 |
用于 groupby 并计算给定 DataFrame 的分位数。 |
|
|
对 |
计算/描述性统计#
计算每列的非 NA 单元格数。 |
|
生成描述性统计信息,总结数据集分布的集中趋势、离散度和形状,排除 NaN 值。 |
|
|
打印 DataFrame 的简要摘要。 |
|
返回每个数字列的最大值。 |
|
返回每个数字列的平均值。 |
|
返回每个数字列的最小值。 |
|
返回每个数字列的中位数。 |
|
返回每个数字列的标准差。 |
|
返回每个数字列的标准差。 |
|
返回每个数字列的方差。 |
|
返回每个数字列的总和。 |
返回每个字段的基数。 |
|
|
计算 DataFrame 的众数。 |
|
用于计算给定 DataFrame 的分位数。 |
|
返回请求轴上最大值的第一次出现的索引。 |
|
返回请求轴上最小值的第一次出现的索引。 |
重新索引 / 选择 / 标签操作#
|
返回一个新对象,其中请求轴上的标签已删除。 |
|
根据指定的索引标签对 DataFrame 行或列进行子集化。 |
绘图#
|
制作 DataFrame 的直方图。 |
Elasticsearch 函数#
eland DataFrame 内部结构的调试摘要。 |
|
|
使用 Elasticsearch |
|
将 Elasticsearch DSL 查询应用于当前 DataFrame。 |
返回索引中的 Elasticsearch 数据类型。 |
序列化 / 输入输出 / 转换#
|
打印 DataFrame 的简要摘要。 |
未实现。 |
|
|
将 Elasticsearch 数据写入逗号分隔值 (csv) 文件。 |
|
将 Elasticsearch 数据呈现为 HTML 表格。 |
|
将 Elasticsearch 数据写入 json 文件。 |
|
将 DataFrame 呈现为控制台友好的表格输出。 |
|
将 eland.Dataframe 转换为 pandas.Dataframe 的实用程序方法。 |