eland.DataFrame.nunique#
- DataFrame.nunique() Series #
返回每个字段的基数。
注意,我们只能对可聚合的 Elasticsearch 字段执行此操作 - (通常)数字和关键字而不是文本字段
如果映射允许,此方法将尝试对可聚合的字段进行操作。
"customer_first_name" : { "type" : "text", "fields" : { "keyword" : { "type" : "keyword", "ignore_above" : 256 } } }
我们将使用
customer_first_name.keyword
聚合customer_first_name
列。TODO - 实现 pandas 剩余参数
返回值#
- pandas.Series
每列的基数
参见#
示例#
>>> columns = ['category', 'currency', 'customer_birth_date', 'customer_first_name', 'user'] >>> df = ed.DataFrame('http://localhost:9200', 'ecommerce', columns=columns) >>> df.nunique() category 6 currency 1 customer_birth_date 0 customer_first_name 46 user 46 dtype: int64