eland.Series#
- class eland.Series(es_client: Optional[Elasticsearch] = None, es_index_pattern: Optional[str] = None, name: Optional[str] = None, es_index_field: Optional[str] = None, _query_compiler: Optional[QueryCompiler] = None)#
类似 pandas.Series 的 API,代理到 Elasticsearch 索引。
参数#
- es_clientelasticsearch.Elasticsearch
对 Elasticsearch python 客户端的引用
- es_index_patternstr
Elasticsearch 索引模式。这可以包含通配符。
- es_index_fieldstr
用于系列的基础字段
备注#
如果 Elasticsearch 索引在创建此对象后被删除或索引映射发生更改,则不会重建该对象,因此可能会出现不一致。
另请参阅#
示例#
>>> ed.Series(es_client='http://localhost:9200', es_index_pattern='flights', name='Carrier') 0 Kibana Airlines 1 Logstash Airways 2 Logstash Airways 3 Kibana Airlines 4 Kibana Airlines ... 13054 Logstash Airways 13055 Logstash Airways 13056 Logstash Airways 13057 JetBeats 13058 JetBeats Name: Carrier, Length: 13059, dtype: object
- __init__(es_client: Optional[Elasticsearch] = None, es_index_pattern: Optional[str] = None, name: Optional[str] = None, es_index_field: Optional[str] = None, _query_compiler: Optional[QueryCompiler] = None) None #
类似 pandas.DataFrame/Series 的 API,代理到 Elasticsearch 索引。
参数#
- clientelasticsearch.Elasticsearch
对 Elasticsearch python 客户端的引用
方法
__init__
([es_client, es_index_pattern, ...])类似 pandas.DataFrame/Series 的 API,代理到 Elasticsearch 索引。
add
(right)返回系列和右侧的加法,逐元素(二元运算符加法)。
describe
()生成描述性统计信息,总结数据集分布的集中趋势、离散度和形状,不包括 NaN 值。
div
(right)返回系列和右侧的浮点除法,逐元素(二元运算符 truediv)。
divide
(right)返回系列和右侧的浮点除法,逐元素(二元运算符 truediv)。
es_info
()es_match
(text, *[, match_phrase, ...])使用 Elasticsearch
match
或match_phrase
查询根据给定的参数过滤数据。filter
([items, like, regex, axis])根据指定的索引标签对数据框的行或列进行子集。
floordiv
(right)返回系列和右侧的整数除法,逐元素(二元运算符 floordiv //)。
head
([n])hist
([by, ax, grid, xlabelsize, xrot, ...])使用 matplotlib 绘制输入序列的直方图。
isin
(other)isna
()检测缺失值。
isnull
()检测缺失值。
mad
([numeric_only])返回 Series 的中位数绝对偏差
max
([numeric_only])返回 Series 值的最大值
mean
([numeric_only])返回 Series 值的平均值
median
([numeric_only])返回 Series 值的中位数
min
([numeric_only])返回 Series 值的最小值
mod
(right)返回 series 和 right 的模运算结果,逐元素计算(二元运算符 mod %)。
mode
([es_size])计算 Series 的众数
mul
(right)返回 series 和 right 的乘积,逐元素计算(二元运算符 mul)。
multiply
(right)返回 series 和 right 的乘积,逐元素计算(二元运算符 mul)。
notna
()检测现有(非缺失)值。
notnull
()检测现有(非缺失)值。
nunique
()返回 Series 中唯一值的个数
pow
(right)返回 series 和 right 的指数幂运算结果,逐元素计算(二元运算符 pow)。
quantile
([q])用于计算给定 Series 的分位数。
radd
(left)返回 series 和 left 的加法结果,逐元素计算(二元运算符 add)。
rdiv
(left)返回 series 和 left 的除法结果,逐元素计算(二元运算符 div)。
rdivide
(left)返回 series 和 left 的除法结果,逐元素计算(二元运算符 div)。
rename
(new_name)重命名 series 的名称。
rfloordiv
(left)返回 series 和 left 的整数除法结果,逐元素计算(二元运算符 floordiv //)。
rmod
(left)返回 series 和 left 的模运算结果,逐元素计算(二元运算符 mod %)。
rmul
(left)返回 series 和 left 的乘积,逐元素计算(二元运算符 mul)。
rmultiply
(left)返回 series 和 left 的乘积,逐元素计算(二元运算符 mul)。
rpow
(left)返回 series 和 left 的指数幂运算结果,逐元素计算(二元运算符 pow)。
rsub
(left)返回 series 和 left 的减法结果,逐元素计算(二元运算符 sub)。
rsubtract
(left)返回 series 和 left 的减法结果,逐元素计算(二元运算符 sub)。
rtruediv
(left)返回 series 和 left 的除法结果,逐元素计算(二元运算符 div)。
sample
([n, frac, random_state])std
([numeric_only])返回 Series 的标准差
sub
(right)返回 series 和 right 的减法结果,逐元素计算(二元运算符 sub)。
subtract
(right)返回 series 和 right 的减法结果,逐元素计算(二元运算符 sub)。
sum
([numeric_only])返回 Series 值的总和
tail
([n])to_numpy
()未实现。
to_pandas
([show_progress])to_string
([buf, na_rep, float_format, ...])渲染 Series 的字符串表示形式。
truediv
(right)返回系列和右侧的浮点除法,逐元素(二元运算符 truediv)。
unique
()返回 Series 中所有唯一值。
value_counts
([es_size])返回指定字段的值计数。
var
([numeric_only])返回 Series 的方差
属性
返回底层数据的 dtype 对象。
返回 DataFrame 中的 pandas dtypes。
判断 Series 是否为空。
返回底层数据的 Elasticsearch 类型。
返回索引中的 Elasticsearch dtypes
es_field_name
返回 es_field_name: str 返回此 series 的 Elasticsearch 字段名
返回 eland 索引,引用 Elasticsearch 字段来索引 DataFrame/Series
根据 Series 的定义返回 1
返回一个元组,表示 Series 的维数。
返回一个 int,表示此对象中的元素数量。