ChatGPT解决这个技术问题 Extra ChatGPT

为什么可变长度数组不是 C++ 标准的一部分?

在过去的几年里,我没有经常使用 C。当我今天阅读 this question 时,我遇到了一些我不熟悉的 C 语法。

显然在 C99 中以下语法是有效的:

void foo(int n) {
    int values[n]; //Declare a variable length array
}

这似乎是一个非常有用的功能。是否曾经讨论过将其添加到 C++ 标准中,如果有,为什么将其省略?

一些潜在的原因:

编译器供应商难以实现

与标准的其他部分不兼容

可以使用其他 C++ 结构来模拟功能

C++ 标准规定数组大小必须是常量表达式 (8.3.4.1)。

是的,我当然意识到在玩具示例中可以使用 std::vector<int> values(m);,但这会从堆而不是堆栈分配内存。如果我想要一个多维数组,例如:

void foo(int x, int y, int z) {
    int values[x][y][z]; // Declare a variable length array
}

vector 版本变得相当笨拙:

void foo(int x, int y, int z) {
    vector< vector< vector<int> > > values( /* Really painful expression here. */);
}

切片、行和列也可能分布在整个内存中。

看看 comp.std.c++ 的讨论,很明显这个问题是相当有争议的,争论双方都有一些非常重量级的名字。 std::vector 总是更好的解决方案当然不是很明显。

只是出于好奇,为什么需要在堆栈上分配它?你害怕堆分配性能问题吗?
@Dimitri 不是真的,但不可否认堆栈分配会比堆分配快。在某些情况下,这可能很重要。
可变长度数组的主要优点是所有数据都靠得很近,所以当你遍历这个数组时,你会读取和写入彼此相邻的字节。您的数据被提取到缓存中,cpu 可以处理它而无需从内存中获取和发送字节。
可变长度数组也可用于用静态常量变量替换预处理器常量。同样在 C 中,您没有其他 VLA 选项,有时需要编写可移植的 C/C++ 代码(与两种编译器兼容)。
顺便说一句,clang++ 似乎允许 VLA。

Q
Quuxplusone

(背景:我有一些实现 C 和 C++ 编译器的经验。)

C99 中的可变长度数组基本上是一个失误。为了支持 VLA,C99 不得不对常识做出以下让步:

sizeof x 不再总是编译时常量;编译器有时必须生成代码以在运行时评估 sizeof 表达式。

允许二维 VLA (int A[x][y]) 需要一种新的语法来声明将二维 VLA 作为参数的函数:void foo(int n, int A[][*])。

在 C++ 世界中不太重要,但对于 C 的嵌入式系统程序员的目标受众来说却极为重要,声明 VLA 意味着在你的堆栈中任意大块地咀嚼。这是有保证的堆栈溢出和崩溃。 (任何时候你声明 int A[n],你都在暗示你有 2GB 的堆栈空间。毕竟,如果你知道“这里的 n 肯定小于 1000”,那么你只需声明 int A[1000] . 用 32 位整数 n 代替 1000 是承认您不知道程序的行为应该是什么。)

好的,现在让我们开始讨论 C++。在 C++ 中,我们在“类型系统”和“值系统”之间有着与 C89 相同的强烈区别……但我们已经真正开始以 C 没有的方式依赖它。例如:

template<typename T> struct S { ... };
int A[n];
S<decltype(A)> s;  // equivalently, S<int[n]> s;

如果 n 不是编译时常量(即,如果 A 是可变修改的类型),那么 S 的类型到底是什么? S 的类型只能在运行时确定吗?

那这个呢:

template<typename T> bool myfunc(T& t1, T& t2) { ... };
int A1[n1], A2[n2];
myfunc(A1, A2);

编译器必须为 myfunc 的某些实例化生成代码。该代码应该是什么样的?如果我们在编译时不知道 A1 的类型,我们如何静态生成该代码?

更糟糕的是,如果在运行时结果是 n1 != n2,那么 !std::is_same<decltype(A1), decltype(A2)>() 怎么办?在这种情况下,对 myfunc 的调用甚至不应该编译,因为模板类型推导应该失败!我们怎么可能在运行时模拟这种行为?

基本上,C++ 正朝着将越来越多的决策推进到编译时 的方向发展:模板代码生成、constexpr 函数评估等。同时,C99 忙于将传统的编译时 决策(例如sizeof)推入运行时。考虑到这一点,花费任何努力尝试将 C99 风格的 VLA 集成到 C++ 中真的有意义吗?

正如所有其他回答者已经指出的那样,当您真正想要传达“我不知道我可能需要多少 RAM。 " C++ 提供了一个漂亮的异常处理模型来处理不可避免的情况,即您需要的 RAM 量大于您拥有的 RAM 量。但希望 这个 答案能让您很好地了解为什么 C99 风格的 VLA 适合 C++,甚至不适合 C99。 ;)

有关该主题的更多信息,请参阅 N3810 "Alternatives for Array Extensions",Bjarne Stroustrup 于 2013 年 10 月发表的关于 VLA 的论文。 Bjarne 的 POV 和我的很不一样; N3810 更侧重于为事物找到一个好的 C++ 类似的语法,并且不鼓励在 C++ 中使用原始数组,而我更关注元编程和类型系统的含义。我不知道他是否认为元编程/类型系统的影响已解决、可解决或仅仅是无趣。

"Legitimate Use of Variable Length Arrays"(Chris Wellons,2019 年 10 月 27 日)是一篇很好的博文,其中提到了许多相同的观点。


我同意 VLA 是错误的。更广泛实施和更有用的 alloca() 应该在 C99 中标准化。 VLA 是标准委员会在实施之前跳出时发生的事情,而不是相反。
可变修改的类型系统是 IMO 的一个很好的补充,您的任何要点都没有违反常识。 (1) C 标准不区分“编译时”和“运行时”,所以这不是问题; (2) * 是可选的,您可以(并且应该)写 int A[][n]; (3) 您可以使用类型系统而无需实际声明任何 VLA。例如,一个函数可以接受可变修改类型的数组,并且可以使用不同维度的非 VLA 二维数组调用它。但是,您在帖子的后半部分提出了有效的观点。
“声明一个 VLA 意味着占用你的堆栈的任意大块。这是有保证的堆栈溢出和崩溃。(任何时候你声明 int A[n],你都在暗示你有 2GB 的堆栈可用”是凭经验的错误。我刚刚运行了一个堆栈远小于 2GB 的 VLA 程序,没有任何堆栈溢出。
'毕竟,如果你知道“这里的 n 肯定小于 1000”,那你就直接声明 int A[1000].' 就是胡说八道。例如,如果 VLA 长度在 99.99% 的函数调用中为 10,并且仅在 0.01% 的调用中达到其上限 1000,那么您基本上浪费了 1000 个字节,只要框架保留在堆栈上——如果函数在您的控制流层次结构中处于较高位置,这几乎可能一直存在。您可能认为 1000 字节并不多,但每次您的 CPU 必须进出该函数时,都要考虑所有缓存未命中!
至于嵌入式,我几乎只使用嵌入式系统,并且一直使用指向 VLA 的指针。然而,我的编码标准禁止分配 VLA 对象。但我不记得曾经在任何嵌入式系统中看到过由 VLA 引起的堆栈溢出。 “反VLA运动”似乎来自微软在前的PC人。因为如果允许 VLA,MS 将不得不从 1989 年更新他们所谓的“2019”编译器,以符合 1999 年版本的语言。
j
jchamp

最近在 usenet:Why no VLAs in C++0x 中开始了关于此的讨论。

我同意那些似乎同意必须在堆栈上创建一个潜在的大数组(通常只有很少的可用空间)不好的人的观点。论据是,如果您事先知道大小,则可以使用静态数组。如果你事先不知道大小,你会写出不安全的代码。

C99 VLA 可以提供一个小的好处,即能够在不浪费空间或为未使用的元素调用构造函数的情况下创建小数组,但它们会给类型系统带来相当大的变化(您需要能够根据运行时值指定类型 - 这在当前的 C++ 中尚不存在,除了 new 运算符类型说明符,但它们被特殊处理,因此运行时性不会超出 new 运算符的范围)。

您可以使用 std::vector,但它并不完全相同,因为它使用动态内存,并且使用自己的堆栈分配器并不容易(对齐也是一个问题)。它也不能解决同样的问题,因为向量是可调整大小的容器,而 VLA 是固定大小的。 C++ Dynamic Array 提案旨在引入基于库的解决方案,作为基于语言的 VLA 的替代方案。但是,据我所知,它不会成为 C++0x 的一部分。


+1 并接受。不过有一条评论,我认为安全论点有点弱,因为有很多其他方法会导致堆栈溢出。安全参数可以用来支持你永远不应该使用递归并且你应该从堆中分配所有对象的立场。
所以你是说因为还有其他方法会导致堆栈溢出,我们还不如鼓励更多呢?
@Andreas,同意这个弱点。但是对于递归,它需要大量的调用直到堆栈被吃掉,如果是这样的话,人们会使用迭代。不过,正如 usenet 线程上的一些人所说,这并不是在所有情况下都反对 VLA,因为有时您肯定知道上限。但在这些情况下,从我所见,静态数组同样就足够了,因为它无论如何都不会浪费太多空间(如果会,那么您实际上必须再次询问堆栈区域是否足够大)。
另请查看 Matt Austern 在该线程中的回答:VLA 的语言规范对于 C++ 可能要复杂得多,因为 C++ 中的类型匹配更严格(例如:C 允许将 T(*)[] 分配给 T(*)[N] - 在 C++ 中是不允许的,因为 C++ 不知道“类型兼容性”——它需要完全匹配)、类型参数、异常、构造函数和析构函数以及其他东西。我不确定 VLA 的好处是否真的会为所有这些工作带来回报。但是,我从来没有在现实生活中使用过 VLA,所以我可能不知道它们的好用例。
@AHelps:也许最好的方法是一种行为有点像 vector 但需要固定 LIFO 使用模式并维护一个或多个每个线程静态分配的缓冲区的类型,这些缓冲区通常根据最大的总分配进行调整该线程曾经使用过,但可以显式修剪。在一般情况下,正常的“分配”只需要指针复制、指针减法、整数比较和指针加法;取消分配只需要一个指针副本。不比 VLA 慢多少。
P
PfhorSlayer

如果您愿意,您始终可以使用 alloca() 在运行时在堆栈上分配内存:

void foo (int n)
{
    int *values = (int *)alloca(sizeof(int) * n);
}

在堆栈上分配意味着它将在堆栈展开时自动释放。

快速说明:正如 Mac OS X 的 alloca(3) 手册页中所述,“alloca() 函数依赖于机器和编译器;不鼓励使用它。”只是让你知道。


此外, alloca() 的作用域是整个函数,而不仅仅是包含变量的代码块。因此,在循环中使用它会不断增加堆栈。 VLA 没有这个问题。
但是,具有封闭块范围的 VLA 意味着它们比具有整个函数范围的 alloca() 有用得多。考虑:if (!p) { p = alloca(strlen(foo)+1); strcpy(p, foo); } 这不能用 VLA 完成,正是因为它们的块范围。
这并不能回答 OP 的 why 问题。此外,这是一个类似 C 的解决方案,而不是真正的 C++-ish。
不等价。 alloca 的语法很脏。
E
Eric

在我自己的工作中,我意识到每次我想要可变长度自动数组或 alloca() 之类的东西时,我并不真正关心内存物理上位于 cpu 堆栈上,只是它来自一些不会导致对一般堆的缓慢访问的堆栈分配器。所以我有一个每线程对象,它拥有一些内存,它可以从中推送/弹出可变大小的缓冲区。在某些平台上,我允许它通过 mmu 增长。其他平台具有固定大小(通常也伴随着固定大小的 cpu 堆栈,因为没有 mmu)。我使用的一个平台(手持游戏机)无论如何都具有宝贵的小 CPU 堆栈,因为它驻留在稀缺的快速内存中。

我并不是说永远不需要将可变大小的缓冲区推送到 cpu 堆栈上。老实说,当我发现这不是标准的时候,我很惊讶,因为这个概念似乎很适合这种语言。不过,对我来说,“可变大小”和“必须物理位于 cpu 堆栈上”的要求从来没有一起出现过。这是关于速度的,所以我制作了自己的“数据缓冲区并行堆栈”。


这具有必须手动管理该堆栈的缺点,但它通常是一种非常好的方法。
我也考虑过这个问题...您是说当您需要线程本地暂存空间时,您实际上有一个可以从任何地方获得的 thread_local std::pmr::unsynchronized_pool_resource;
B
Bengt Gustafsson

在某些情况下,与执行的操作相比,分配堆内存非常昂贵。一个例子是矩阵数学。如果您使用较小的矩阵,例如 5 到 10 个元素并进行大量算术运算,则 malloc 开销将非常显着。同时,使大小成为编译时间常数似乎非常浪费和不灵活。

我认为 C++ 本身是如此不安全,以至于“尽量不添加更多不安全的特性”的论点不是很强大。另一方面,由于 C++ 可以说是运行时效率最高的编程语言特性,因此它总是有用的:编写性能关键程序的人将在很大程度上使用 C++,他们需要尽可能多的性能。将东西从堆移动到栈就是这样一种可能性。减少堆块的数量是另一回事。允许 VLA 作为对象成员是实现此目的的一种方法。我正在研究这样的建议。诚然,实现起来有点复杂,但似乎很可行。


C
Community

似乎它将在 C++14 中可用:

https://en.wikipedia.org/wiki/C%2B%2B14#Runtime-sized_one_dimensional_arrays

更新:它没有进入 C++14。


有趣的。 Herb Sutter 在 Dynamic Arrays 下讨论了它:isocpp.org/blog/2013/04/trip-report-iso-c-spring-2013-meeting(这是维基百科信息的参考)
“运行时大小的数组和 dynarray 已移至数组扩展技术规范” 2014 年 1 月 18 日在 Wikipedia 上的 78.86.152.103 写道:en.wikipedia.org/w/…
Wikipedia 不是规范性参考 :) 该提案并未进入 C++14。
@ViktorSehr:这个 wrt C++17 的状态是什么?
@einpoklum 不知道,使用 boost::container::static_vector
a
artless noise

这被认为包含在 C++/1x but was dropped 中(这是对我之前所说的更正)。

无论如何,它在 C++ 中的用处不大,因为我们已经有 std::vector 来填补这个角色。


不,我们没有,std::vector 不在堆栈上分配数据。 :)
@MM:很公平,但实际上我们仍然不能使用 std::vector 来代替 alloca()
@einpoklum 在为您的程序获得正确输出方面,您可以。性能是实施质量问题
@MM 实施质量不可移植。如果你不需要性能,你一开始就不要使用 c++
你如何处理带有向量的多维而不需要繁琐的乘法。 C++ 只是提供了排除有用工具的借口,而它们却谎称“我们需要允许人们编写我们无法想象的东西”。如果这没用,为什么所有这些语言都支持它:en.wikipedia.org/wiki/Variable-length_array 甚至 C# 也添加了它,是的,它被称为 stackalloc....
佚名

像这样的数组是 C99 的一部分,但不是标准 C++ 的一部分。正如其他人所说,向量总是一个更好的解决方案,这可能就是为什么可变大小的数组不在 C++ 标准(或在提议的 C++0x 标准中)的原因。

顺便说一句,对于关于“为什么”C++ 标准是这样的问题,有主持的 Usenet 新闻组 comp.std.c++ 是可以去的地方。


-1 向量并不总是更好。通常,是的。总是,没有。如果您只需要一个小数组,并且在堆空间很慢的平台上,并且您的库的向量实现使用堆空间,那么如果存在此功能可能会更好。
D
Dimitri C.

为此使用 std::vector。例如:

std::vector<int> values;
values.resize(n);

内存将在堆上分配,但这只会带来很小的性能缺陷。此外,明智的做法是不要在堆栈上分配大数据块,因为它的大小相当有限。


可变长度数组的一个主要应用是评估任意次数多项式。在这种情况下,您的“小的性能缺陷”意味着“在典型情况下,代码运行速度要慢五倍”。这可不小。
为什么不简单地使用 std::vector<int> values(n);?通过在构造后使用 resize 来禁止不可移动的类型。
不等价。肮脏的语法。
J
Jingguo Yao

C99 允许 VLA。它对如何声明 VLA 设置了一些限制。详见标准6.7.5.2。 C++ 不允许 VLA。但是 g++ 允许这样做。


您能否提供指向您所指向的标准段落的链接?
t
tstanisl

VLA 是更大的可变修饰类型家族的一部分。这一系列类型非常特殊,因为它们具有运行时组件。

编码:

int A[n];

编译器将其视为:

typedef int T[n];
T A;

请注意,数组的运行时大小不绑定到变量 A,而是绑定到变量的 type

没有什么能阻止人们制作这种类型的新变量:

T B,C,D;

或指针或数组

T *p, Z[10];

此外,指针允许创建具有动态存储的 VLA。

T *p = malloc(sizeof(T));
...
free(p);

什么消除了一个流行的神话,即 VLA 只能在堆栈上分配。

回到问题。

此运行时组件不适用于类型推导,类型推导是 C++ 类型系统的基础之一。不可能使用模板、演绎和重载。

C++ 类型系统是静态的,所有类型都必须在编译期间完全定义或推导出来。 VM 类型仅在程序执行期间完成。将 VM 类型引入已经非常复杂的 C++ 的额外复杂性被认为是不合理的。主要是因为它们的主要实际应用是自动 VLA (int A[n];),它具有 std::vector 形式的替代方案。

有点难过,因为 VM 类型为处理多维数组的程序提供了非常优雅和高效的解决方案。

在 C 中可以简单地写:

void foo(int n, int A[n][n][n]) {
  for (int i = 0; i < n; ++i)
    for (int j = 0; j < n; ++j)
      for (int k = 0; k < n; ++k)
        A[i][j][k] = i * j * k;
}

...

int A[5][5][5], B[10][10][10];
foo(5, A);
foo(10, B);

现在尝试在 C++ 中提供高效和优雅的解决方案。


E
Edouard A.

如果您在编译时知道该值,则可以执行以下操作:

template <int X>
void foo(void)
{
   int values[X];

}

编辑:您可以创建一个使用堆栈分配器(alloca)的向量,因为分配器是一个模板参数。


如果您在编译时知道该值,则根本不需要模板。只需在非模板函数中直接使用 X 即可。
有时调用者在编译时知道而被调用者不知道,这就是模板的好处。当然,在一般情况下,直到运行时才有人知道 X。
你不能在 STL 分配器中使用 alloca - 当堆栈帧被销毁时,从 alloca 分配的内存将被释放 - 这就是应该分配内存的方法返回的时候。
A
Alan

我有一个实际上对我有用的解决方案。我不想分配内存,因为需要运行多次的例程存在碎片。答案是极其危险的,因此使用它需要您自担风险,但它利用了组装的优势来保留堆栈上的空间。我下面的示例使用字符数组(显然其他大小的变量需要更多内存)。

void varTest(int iSz)
{
    char *varArray;
    __asm {
        sub esp, iSz       // Create space on the stack for the variable array here
        mov varArray, esp  // save the end of it to our pointer
    }

    // Use the array called varArray here...  

    __asm {
        add esp, iSz       // Variable array is no longer accessible after this point
    } 
}

这里的危险很多,但我将解释一些: 1. 中途更改变量大小会杀死堆栈位置 2. 超出数组边界会破坏其他变量和可能的代码 3. 这在 64 位中不起作用build... 需要不同的程序集(但宏可能会解决该问题)。 4. 编译器特定(在编译器之间移动可能有问题)。我没试过所以我真的不知道。


...如果您想自己动手,也许可以使用 RAII 类?
你可以简单地使用 boost::container::static_vector 。
对于其他具有比 MSVC 更多原始程序集的编译器,这没有等效项。 VC 可能会理解 esp 已更改,并将调整其对堆栈的访问,但在例如 GCC 中,您将完全破坏它 - 至少如果您使用优化,特别是 -fomit-frame-pointer