eland.Series#

class eland.Series(es_client: Optional[Elasticsearch] = None, es_index_pattern: Optional[str] = None, name: Optional[str] = None, es_index_field: Optional[str] = None, _query_compiler: Optional[QueryCompiler] = None)#

类似 pandas.Series 的 API,代理到 Elasticsearch 索引。

参数#

es_clientelasticsearch.Elasticsearch

对 Elasticsearch python 客户端的引用

es_index_patternstr

Elasticsearch 索引模式。这可以包含通配符。

es_index_fieldstr

用于系列的基础字段

备注#

如果 Elasticsearch 索引在创建此对象后被删除或索引映射发生更改,则不会重建该对象,因此可能会出现不一致。

另请参阅#

pandas.Series

示例#

>>> ed.Series(es_client='http://localhost:9200', es_index_pattern='flights', name='Carrier')
0         Kibana Airlines
1        Logstash Airways
2        Logstash Airways
3         Kibana Airlines
4         Kibana Airlines
               ...
13054    Logstash Airways
13055    Logstash Airways
13056    Logstash Airways
13057            JetBeats
13058            JetBeats
Name: Carrier, Length: 13059, dtype: object
__init__(es_client: Optional[Elasticsearch] = None, es_index_pattern: Optional[str] = None, name: Optional[str] = None, es_index_field: Optional[str] = None, _query_compiler: Optional[QueryCompiler] = None) None#

类似 pandas.DataFrame/Series 的 API,代理到 Elasticsearch 索引。

参数#

clientelasticsearch.Elasticsearch

对 Elasticsearch python 客户端的引用

方法

__init__([es_client, es_index_pattern, ...])

类似 pandas.DataFrame/Series 的 API,代理到 Elasticsearch 索引。

add(right)

返回系列和右侧的加法,逐元素(二元运算符加法)。

describe()

生成描述性统计信息,总结数据集分布的集中趋势、离散度和形状,不包括 NaN 值。

div(right)

返回系列和右侧的浮点除法,逐元素(二元运算符 truediv)。

divide(right)

返回系列和右侧的浮点除法,逐元素(二元运算符 truediv)。

es_info()

es_match(text, *[, match_phrase, ...])

使用 Elasticsearch matchmatch_phrase 查询根据给定的参数过滤数据。

filter([items, like, regex, axis])

根据指定的索引标签对数据框的行或列进行子集。

floordiv(right)

返回系列和右侧的整数除法,逐元素(二元运算符 floordiv //)。

head([n])

hist([by, ax, grid, xlabelsize, xrot, ...])

使用 matplotlib 绘制输入序列的直方图。

isin(other)

isna()

检测缺失值。

isnull()

检测缺失值。

mad([numeric_only])

返回 Series 的中位数绝对偏差

max([numeric_only])

返回 Series 值的最大值

mean([numeric_only])

返回 Series 值的平均值

median([numeric_only])

返回 Series 值的中位数

min([numeric_only])

返回 Series 值的最小值

mod(right)

返回 series 和 right 的模运算结果,逐元素计算(二元运算符 mod %)。

mode([es_size])

计算 Series 的众数

mul(right)

返回 series 和 right 的乘积,逐元素计算(二元运算符 mul)。

multiply(right)

返回 series 和 right 的乘积,逐元素计算(二元运算符 mul)。

notna()

检测现有(非缺失)值。

notnull()

检测现有(非缺失)值。

nunique()

返回 Series 中唯一值的个数

pow(right)

返回 series 和 right 的指数幂运算结果,逐元素计算(二元运算符 pow)。

quantile([q])

用于计算给定 Series 的分位数。

radd(left)

返回 series 和 left 的加法结果,逐元素计算(二元运算符 add)。

rdiv(left)

返回 series 和 left 的除法结果,逐元素计算(二元运算符 div)。

rdivide(left)

返回 series 和 left 的除法结果,逐元素计算(二元运算符 div)。

rename(new_name)

重命名 series 的名称。

rfloordiv(left)

返回 series 和 left 的整数除法结果,逐元素计算(二元运算符 floordiv //)。

rmod(left)

返回 series 和 left 的模运算结果,逐元素计算(二元运算符 mod %)。

rmul(left)

返回 series 和 left 的乘积,逐元素计算(二元运算符 mul)。

rmultiply(left)

返回 series 和 left 的乘积,逐元素计算(二元运算符 mul)。

rpow(left)

返回 series 和 left 的指数幂运算结果,逐元素计算(二元运算符 pow)。

rsub(left)

返回 series 和 left 的减法结果,逐元素计算(二元运算符 sub)。

rsubtract(left)

返回 series 和 left 的减法结果,逐元素计算(二元运算符 sub)。

rtruediv(left)

返回 series 和 left 的除法结果,逐元素计算(二元运算符 div)。

sample([n, frac, random_state])

std([numeric_only])

返回 Series 的标准差

sub(right)

返回 series 和 right 的减法结果,逐元素计算(二元运算符 sub)。

subtract(right)

返回 series 和 right 的减法结果,逐元素计算(二元运算符 sub)。

sum([numeric_only])

返回 Series 值的总和

tail([n])

to_numpy()

未实现。

to_pandas([show_progress])

to_string([buf, na_rep, float_format, ...])

渲染 Series 的字符串表示形式。

truediv(right)

返回系列和右侧的浮点除法,逐元素(二元运算符 truediv)。

unique()

返回 Series 中所有唯一值。

value_counts([es_size])

返回指定字段的值计数。

var([numeric_only])

返回 Series 的方差

属性

dtype

返回底层数据的 dtype 对象。

dtypes

返回 DataFrame 中的 pandas dtypes。

empty

判断 Series 是否为空。

es_dtype

返回底层数据的 Elasticsearch 类型。

es_dtypes

返回索引中的 Elasticsearch dtypes

es_field_name

返回 es_field_name: str 返回此 series 的 Elasticsearch 字段名

index

返回 eland 索引,引用 Elasticsearch 字段来索引 DataFrame/Series

name

ndim

根据 Series 的定义返回 1

shape

返回一个元组,表示 Series 的维数。

size

返回一个 int,表示此对象中的元素数量。