eland.DataFrame.nunique#

DataFrame.nunique() Series#

返回每个字段的基数。

注意,我们只能对可聚合的 Elasticsearch 字段执行此操作 - (通常)数字和关键字而不是文本字段

如果映射允许,此方法将尝试对可聚合的字段进行操作。

"customer_first_name" : {
  "type" : "text",
  "fields" : {
    "keyword" : {
      "type" : "keyword",
      "ignore_above" : 256
    }
  }
}

我们将使用 customer_first_name.keyword 聚合 customer_first_name 列。

TODO - 实现 pandas 剩余参数

返回值#

pandas.Series

每列的基数

参见#

pandas.DataFrame.nunique

示例#

>>> columns = ['category', 'currency', 'customer_birth_date', 'customer_first_name', 'user']
>>> df = ed.DataFrame('http://localhost:9200', 'ecommerce', columns=columns)
>>> df.nunique()
category                6
currency                1
customer_birth_date     0
customer_first_name    46
user                   46
dtype: int64