在过去的几年里,我没有经常使用 C。当我今天阅读 this question 时,我遇到了一些我不熟悉的 C 语法。
显然在 C99 中以下语法是有效的:
void foo(int n) {
int values[n]; //Declare a variable length array
}
这似乎是一个非常有用的功能。是否曾经讨论过将其添加到 C++ 标准中,如果有,为什么将其省略?
一些潜在的原因:
编译器供应商难以实现
与标准的其他部分不兼容
可以使用其他 C++ 结构来模拟功能
C++ 标准规定数组大小必须是常量表达式 (8.3.4.1)。
是的,我当然意识到在玩具示例中可以使用 std::vector<int> values(m);
,但这会从堆而不是堆栈分配内存。如果我想要一个多维数组,例如:
void foo(int x, int y, int z) {
int values[x][y][z]; // Declare a variable length array
}
vector
版本变得相当笨拙:
void foo(int x, int y, int z) {
vector< vector< vector<int> > > values( /* Really painful expression here. */);
}
切片、行和列也可能分布在整个内存中。
看看 comp.std.c++
的讨论,很明显这个问题是相当有争议的,争论双方都有一些非常重量级的名字。 std::vector
总是更好的解决方案当然不是很明显。
(背景:我有一些实现 C 和 C++ 编译器的经验。)
C99 中的可变长度数组基本上是一个失误。为了支持 VLA,C99 不得不对常识做出以下让步:
sizeof x 不再总是编译时常量;编译器有时必须生成代码以在运行时评估 sizeof 表达式。
允许二维 VLA (int A[x][y]) 需要一种新的语法来声明将二维 VLA 作为参数的函数:void foo(int n, int A[][*])。
在 C++ 世界中不太重要,但对于 C 的嵌入式系统程序员的目标受众来说却极为重要,声明 VLA 意味着在你的堆栈中任意大块地咀嚼。这是有保证的堆栈溢出和崩溃。 (任何时候你声明 int A[n],你都在暗示你有 2GB 的堆栈空间。毕竟,如果你知道“这里的 n 肯定小于 1000”,那么你只需声明 int A[1000] . 用 32 位整数 n 代替 1000 是承认您不知道程序的行为应该是什么。)
好的,现在让我们开始讨论 C++。在 C++ 中,我们在“类型系统”和“值系统”之间有着与 C89 相同的强烈区别……但我们已经真正开始以 C 没有的方式依赖它。例如:
template<typename T> struct S { ... };
int A[n];
S<decltype(A)> s; // equivalently, S<int[n]> s;
如果 n
不是编译时常量(即,如果 A
是可变修改的类型),那么 S
的类型到底是什么? S
的类型也只能在运行时确定吗?
那这个呢:
template<typename T> bool myfunc(T& t1, T& t2) { ... };
int A1[n1], A2[n2];
myfunc(A1, A2);
编译器必须为 myfunc
的某些实例化生成代码。该代码应该是什么样的?如果我们在编译时不知道 A1
的类型,我们如何静态生成该代码?
更糟糕的是,如果在运行时结果是 n1 != n2
,那么 !std::is_same<decltype(A1), decltype(A2)>()
怎么办?在这种情况下,对 myfunc
的调用甚至不应该编译,因为模板类型推导应该失败!我们怎么可能在运行时模拟这种行为?
基本上,C++ 正朝着将越来越多的决策推进到编译时 的方向发展:模板代码生成、constexpr
函数评估等。同时,C99 忙于将传统的编译时 决策(例如sizeof
)推入运行时。考虑到这一点,花费任何努力尝试将 C99 风格的 VLA 集成到 C++ 中真的有意义吗?
正如所有其他回答者已经指出的那样,当您真正想要传达“我不知道我可能需要多少 RAM。 " C++ 提供了一个漂亮的异常处理模型来处理不可避免的情况,即您需要的 RAM 量大于您拥有的 RAM 量。但希望 这个 答案能让您很好地了解为什么 C99 风格的 VLA不 适合 C++,甚至不适合 C99。 ;)
有关该主题的更多信息,请参阅 N3810 "Alternatives for Array Extensions",Bjarne Stroustrup 于 2013 年 10 月发表的关于 VLA 的论文。 Bjarne 的 POV 和我的很不一样; N3810 更侧重于为事物找到一个好的 C++ 类似的语法,并且不鼓励在 C++ 中使用原始数组,而我更关注元编程和类型系统的含义。我不知道他是否认为元编程/类型系统的影响已解决、可解决或仅仅是无趣。
"Legitimate Use of Variable Length Arrays"(Chris Wellons,2019 年 10 月 27 日)是一篇很好的博文,其中提到了许多相同的观点。
最近在 usenet:Why no VLAs in C++0x 中开始了关于此的讨论。
我同意那些似乎同意必须在堆栈上创建一个潜在的大数组(通常只有很少的可用空间)不好的人的观点。论据是,如果您事先知道大小,则可以使用静态数组。如果你事先不知道大小,你会写出不安全的代码。
C99 VLA 可以提供一个小的好处,即能够在不浪费空间或为未使用的元素调用构造函数的情况下创建小数组,但它们会给类型系统带来相当大的变化(您需要能够根据运行时值指定类型 - 这在当前的 C++ 中尚不存在,除了 new
运算符类型说明符,但它们被特殊处理,因此运行时性不会超出 new
运算符的范围)。
您可以使用 std::vector
,但它并不完全相同,因为它使用动态内存,并且使用自己的堆栈分配器并不容易(对齐也是一个问题)。它也不能解决同样的问题,因为向量是可调整大小的容器,而 VLA 是固定大小的。 C++ Dynamic Array 提案旨在引入基于库的解决方案,作为基于语言的 VLA 的替代方案。但是,据我所知,它不会成为 C++0x 的一部分。
T(*)[]
分配给 T(*)[N]
- 在 C++ 中是不允许的,因为 C++ 不知道“类型兼容性”——它需要完全匹配)、类型参数、异常、构造函数和析构函数以及其他东西。我不确定 VLA 的好处是否真的会为所有这些工作带来回报。但是,我从来没有在现实生活中使用过 VLA,所以我可能不知道它们的好用例。
vector
但需要固定 LIFO 使用模式并维护一个或多个每个线程静态分配的缓冲区的类型,这些缓冲区通常根据最大的总分配进行调整该线程曾经使用过,但可以显式修剪。在一般情况下,正常的“分配”只需要指针复制、指针减法、整数比较和指针加法;取消分配只需要一个指针副本。不比 VLA 慢多少。
如果您愿意,您始终可以使用 alloca() 在运行时在堆栈上分配内存:
void foo (int n)
{
int *values = (int *)alloca(sizeof(int) * n);
}
在堆栈上分配意味着它将在堆栈展开时自动释放。
快速说明:正如 Mac OS X 的 alloca(3) 手册页中所述,“alloca() 函数依赖于机器和编译器;不鼓励使用它。”只是让你知道。
if (!p) { p = alloca(strlen(foo)+1); strcpy(p, foo); }
这不能用 VLA 完成,正是因为它们的块范围。
C
的解决方案,而不是真正的 C++
-ish。
在我自己的工作中,我意识到每次我想要可变长度自动数组或 alloca() 之类的东西时,我并不真正关心内存物理上位于 cpu 堆栈上,只是它来自一些不会导致对一般堆的缓慢访问的堆栈分配器。所以我有一个每线程对象,它拥有一些内存,它可以从中推送/弹出可变大小的缓冲区。在某些平台上,我允许它通过 mmu 增长。其他平台具有固定大小(通常也伴随着固定大小的 cpu 堆栈,因为没有 mmu)。我使用的一个平台(手持游戏机)无论如何都具有宝贵的小 CPU 堆栈,因为它驻留在稀缺的快速内存中。
我并不是说永远不需要将可变大小的缓冲区推送到 cpu 堆栈上。老实说,当我发现这不是标准的时候,我很惊讶,因为这个概念似乎很适合这种语言。不过,对我来说,“可变大小”和“必须物理位于 cpu 堆栈上”的要求从来没有一起出现过。这是关于速度的,所以我制作了自己的“数据缓冲区并行堆栈”。
thread_local std::pmr::unsynchronized_pool_resource;
?
在某些情况下,与执行的操作相比,分配堆内存非常昂贵。一个例子是矩阵数学。如果您使用较小的矩阵,例如 5 到 10 个元素并进行大量算术运算,则 malloc 开销将非常显着。同时,使大小成为编译时间常数似乎非常浪费和不灵活。
我认为 C++ 本身是如此不安全,以至于“尽量不添加更多不安全的特性”的论点不是很强大。另一方面,由于 C++ 可以说是运行时效率最高的编程语言特性,因此它总是有用的:编写性能关键程序的人将在很大程度上使用 C++,他们需要尽可能多的性能。将东西从堆移动到栈就是这样一种可能性。减少堆块的数量是另一回事。允许 VLA 作为对象成员是实现此目的的一种方法。我正在研究这样的建议。诚然,实现起来有点复杂,但似乎很可行。
似乎它将在 C++14 中可用:
https://en.wikipedia.org/wiki/C%2B%2B14#Runtime-sized_one_dimensional_arrays
更新:它没有进入 C++14。
这被认为包含在 C++/1x but was dropped 中(这是对我之前所说的更正)。
无论如何,它在 C++ 中的用处不大,因为我们已经有 std::vector
来填补这个角色。
std::vector
来代替 alloca()
。
像这样的数组是 C99 的一部分,但不是标准 C++ 的一部分。正如其他人所说,向量总是一个更好的解决方案,这可能就是为什么可变大小的数组不在 C++ 标准(或在提议的 C++0x 标准中)的原因。
顺便说一句,对于关于“为什么”C++ 标准是这样的问题,有主持的 Usenet 新闻组 comp.std.c++ 是可以去的地方。
为此使用 std::vector。例如:
std::vector<int> values;
values.resize(n);
内存将在堆上分配,但这只会带来很小的性能缺陷。此外,明智的做法是不要在堆栈上分配大数据块,因为它的大小相当有限。
std::vector<int> values(n);
?通过在构造后使用 resize
来禁止不可移动的类型。
C99 允许 VLA。它对如何声明 VLA 设置了一些限制。详见标准6.7.5.2。 C++ 不允许 VLA。但是 g++ 允许这样做。
VLA 是更大的可变修饰类型家族的一部分。这一系列类型非常特殊,因为它们具有运行时组件。
编码:
int A[n];
编译器将其视为:
typedef int T[n];
T A;
请注意,数组的运行时大小不绑定到变量 A
,而是绑定到变量的 type。
没有什么能阻止人们制作这种类型的新变量:
T B,C,D;
或指针或数组
T *p, Z[10];
此外,指针允许创建具有动态存储的 VLA。
T *p = malloc(sizeof(T));
...
free(p);
什么消除了一个流行的神话,即 VLA 只能在堆栈上分配。
回到问题。
此运行时组件不适用于类型推导,类型推导是 C++ 类型系统的基础之一。不可能使用模板、演绎和重载。
C++ 类型系统是静态的,所有类型都必须在编译期间完全定义或推导出来。 VM 类型仅在程序执行期间完成。将 VM 类型引入已经非常复杂的 C++ 的额外复杂性被认为是不合理的。主要是因为它们的主要实际应用是自动 VLA (int A[n];
),它具有 std::vector
形式的替代方案。
有点难过,因为 VM 类型为处理多维数组的程序提供了非常优雅和高效的解决方案。
在 C 中可以简单地写:
void foo(int n, int A[n][n][n]) {
for (int i = 0; i < n; ++i)
for (int j = 0; j < n; ++j)
for (int k = 0; k < n; ++k)
A[i][j][k] = i * j * k;
}
...
int A[5][5][5], B[10][10][10];
foo(5, A);
foo(10, B);
现在尝试在 C++ 中提供高效和优雅的解决方案。
如果您在编译时知道该值,则可以执行以下操作:
template <int X>
void foo(void)
{
int values[X];
}
编辑:您可以创建一个使用堆栈分配器(alloca)的向量,因为分配器是一个模板参数。
我有一个实际上对我有用的解决方案。我不想分配内存,因为需要运行多次的例程存在碎片。答案是极其危险的,因此使用它需要您自担风险,但它利用了组装的优势来保留堆栈上的空间。我下面的示例使用字符数组(显然其他大小的变量需要更多内存)。
void varTest(int iSz)
{
char *varArray;
__asm {
sub esp, iSz // Create space on the stack for the variable array here
mov varArray, esp // save the end of it to our pointer
}
// Use the array called varArray here...
__asm {
add esp, iSz // Variable array is no longer accessible after this point
}
}
这里的危险很多,但我将解释一些: 1. 中途更改变量大小会杀死堆栈位置 2. 超出数组边界会破坏其他变量和可能的代码 3. 这在 64 位中不起作用build... 需要不同的程序集(但宏可能会解决该问题)。 4. 编译器特定(在编译器之间移动可能有问题)。我没试过所以我真的不知道。
esp
已更改,并将调整其对堆栈的访问,但在例如 GCC 中,您将完全破坏它 - 至少如果您使用优化,特别是 -fomit-frame-pointer
。
alloca()
应该在 C99 中标准化。 VLA 是标准委员会在实施之前跳出时发生的事情,而不是相反。*
是可选的,您可以(并且应该)写int A[][n]
; (3) 您可以使用类型系统而无需实际声明任何 VLA。例如,一个函数可以接受可变修改类型的数组,并且可以使用不同维度的非 VLA 二维数组调用它。但是,您在帖子的后半部分提出了有效的观点。10
,并且仅在 0.01% 的调用中达到其上限1000
,那么您基本上浪费了 1000 个字节,只要框架保留在堆栈上——如果函数在您的控制流层次结构中处于较高位置,这几乎可能一直存在。您可能认为 1000 字节并不多,但每次您的 CPU 必须进出该函数时,都要考虑所有缓存未命中!