eland.DataFrame.count#

DataFrame.count() Series#

统计每列非 NA 单元格的数量。

统计基于对 ES 的存在查询。

这效率低下,因为它会创建 N 个查询(N 是字段数)。另一种方法是使用 value_count 聚合。但是,它们存在以下问题

  • 它们只能与可聚合字段一起使用(例如,关键字而不是文本)

  • 对于列表字段,它们返回多个统计。例如,tags=[‘elastic’, ‘ml’] 对单个文档返回 value_count=2。

TODO - 添加其他 pandas.DataFrame.count 功能

返回值#

pandas.Series

列统计汇总

另请参阅#

pandas.DataFrame.count

示例#

>>> df = ed.DataFrame('http://localhost:9200', 'ecommerce', columns=['customer_first_name', 'geoip.city_name'])
>>> df.count()
customer_first_name    4675
geoip.city_name        4094
dtype: int64