如何获取 Pandas DataFrame 的行数？

python pandas dataframe

如何获取 pandas 数据框 df 的行数？

好的，我发现，我应该调用方法而不是检查属性，所以它应该是 df.count() 没有 df.count

危险！请注意，df.count() 只会返回每列的非 NA/NaN 行数。您应该改用 df.shape[0]，它会始终正确地告诉您行数。

请注意，当数据框为空时，df.count 不会返回 int（例如，pd.DataFrame(columns=["Blue","Red").count 不是 0）

可以使用 df.info() 来获取行数（# 个条目）、每列中非空条目的数量、dtypes 和内存使用情况。 df的完整图片。如果您正在寻找一个数字，您可以通过编程方式使用 df.shape[0]。

Mateen Ulhaq

对于数据框 df，可以使用以下任何一种：

长度（df.index）

df.shape[0]

df[df.columns[0]].count() （== 第一列中非 NaN 值的数量）

https://i.stack.imgur.com/wEzue.png

重现情节的代码：

import numpy as np
import pandas as pd
import perfplot

perfplot.save(
    "out.png",
    setup=lambda n: pd.DataFrame(np.arange(n * 3).reshape(n, 3)),
    n_range=[2**k for k in range(25)],
    kernels=[
        lambda df: len(df.index),
        lambda df: df.shape[0],
        lambda df: df[df.columns[0]].count(),
    ],
    labels=["len(df.index)", "df.shape[0]", "df[df.columns[0]].count()"],
    xlabel="Number of rows",
)

在交互式工作中使用 shape 而不是 len(df) 有一个很好的理由：尝试不同的过滤，我经常需要知道还有多少项目。有了形状，我只需在过滤后添加 .shape 就可以看到这一点。使用 len()，命令行的编辑变得更加麻烦，来回进行。

不适用于 OP，但如果您只需要知道数据框是否为空，df.empty 是最佳选择。

我知道已经有一段时间了，但不是 len(df.index) 需要 381 纳秒或 0.381 微秒，df.shape 慢了 3 倍，需要 1.17 微秒。我错过了什么？ @根

(3,3) 矩阵是不好的例子，因为它没有显示形状元组的顺序

df.shape[0] 比 len(df) 或 len(df.columns) 快多少？由于 1 ns（纳秒）= 1000 µs（微秒），因此 1.17µs = 1170ns，这意味着它大约比 381ns 慢 3 倍

Peter Mortensen

假设 df 是您的数据框，那么：

count_row = df.shape[0]  # Gives number of rows
count_col = df.shape[1]  # Gives number of columns

或者，更简洁地说，

r, c = df.shape

如果数据集很大，如果您只需要行数，则 len (df.index) 比 df.shape[0] 快得多。我测试了它。

为什么我的 DataFrame 上没有 shape 方法？

@ArdalanShahgholi 可能是因为返回的是一个系列，它总是一维的。因此，只有 len(df.index) 可以工作

@Connor我需要从我的DF中获得行数和列数。在我的 DF 中，我也有一个选择，这意味着我有一张桌子，现在的问题是为什么我的 DF 上没有 SHAPE 功能？

很好的问题，将其作为一个单独的问题，分享您尝试过的内容以及您看到的结果（提供一套完整的工作代码，其他人可以轻松复制），然后在此处分享该问题的链接。我看看能不能帮忙

Dr. Jan-Philip Gehrcke

使用 len(df) :-)。

__len__() 记录在“返回索引长度”中。