ChatGPT解决这个技术问题 Extra ChatGPT

C# 5 异步 CTP:为什么在 EndAwait 调用之前在生成的代码中将内部“状态”设置为 0?

昨天我正在讨论新的 C#“异步”特性,特别是深入研究生成的代码是什么样的,以及 the GetAwaiter() / BeginAwait() / EndAwait() 调用。

我们详细查看了 C# 编译器生成的状态机,有两个方面我们无法理解:

为什么生成的类包含一个 Dispose() 方法和一个 $__disposing 变量,它们似乎从未被使用过(并且该类没有实现 IDisposable)。

为什么在调用 EndAwait() 之前内部状态变量设置为 0,而 0 通常看起来意味着“这是初始入口点”。

我怀疑第一点可以通过在异步方法中做一些更有趣的事情来回答,尽管如果有人有任何进一步的信息,我会很高兴听到它。然而,这个问题更多地是关于第二点。

这是一段非常简单的示例代码:

using System.Threading.Tasks;

class Test
{
    static async Task<int> Sum(Task<int> t1, Task<int> t2)
    {
        return await t1 + await t2;
    }
}

...这是为实现状态机的 MoveNext() 方法生成的代码。这是直接从 Reflector 复制的——我还没有修复无法描述的变量名称:

public void MoveNext()
{
    try
    {
        this.$__doFinallyBodies = true;
        switch (this.<>1__state)
        {
            case 1:
                break;

            case 2:
                goto Label_00DA;

            case -1:
                return;

            default:
                this.<a1>t__$await2 = this.t1.GetAwaiter<int>();
                this.<>1__state = 1;
                this.$__doFinallyBodies = false;
                if (this.<a1>t__$await2.BeginAwait(this.MoveNextDelegate))
                {
                    return;
                }
                this.$__doFinallyBodies = true;
                break;
        }
        this.<>1__state = 0;
        this.<1>t__$await1 = this.<a1>t__$await2.EndAwait();
        this.<a2>t__$await4 = this.t2.GetAwaiter<int>();
        this.<>1__state = 2;
        this.$__doFinallyBodies = false;
        if (this.<a2>t__$await4.BeginAwait(this.MoveNextDelegate))
        {
            return;
        }
        this.$__doFinallyBodies = true;
    Label_00DA:
        this.<>1__state = 0;
        this.<2>t__$await3 = this.<a2>t__$await4.EndAwait();
        this.<>1__state = -1;
        this.$builder.SetResult(this.<1>t__$await1 + this.<2>t__$await3);
    }
    catch (Exception exception)
    {
        this.<>1__state = -1;
        this.$builder.SetException(exception);
    }
}

它很长,但这个问题的重要内容是:

// End of awaiting t1
this.<>1__state = 0;
this.<1>t__$await1 = this.<a1>t__$await2.EndAwait();

// End of awaiting t2
this.<>1__state = 0;
this.<2>t__$await3 = this.<a2>t__$await4.EndAwait();

在这两种情况下,状态都会在下一次明显观察到之前再次发生变化......那么为什么将其设置为 0 呢?如果此时再次调用 MoveNext()(直接或通过 Dispose),它将有效地再次启动异步方法,据我所知,这完全不合适... if 和 MoveNext() 没有被调用,状态的变化是无关紧要的。

这仅仅是编译器为异步重用迭代器块生成代码的副作用,它可能有更明显的解释吗?

重要免责声明

显然这只是一个 CTP 编译器。我完全希望在最终发布之前情况会发生变化——甚至可能在下一个 CTP 发布之前。这个问题绝不是试图声称这是 C# 编译器中的一个缺陷或类似的东西。我只是想弄清楚我是否错过了一个微妙的原因:)

VB 编译器产生一个类似的状态机(不知道这是否是预期的,但 VB 之前没有迭代器块)
@Rune:MoveNextDelegate 只是一个代表 MoveNext 的委托字段。我相信,它被缓存以避免每次都创建一个新的 Action 传递给等待者。
我认为答案是:这是一个 CTP。对团队来说,最重要的是把它拿出来并验证语言设计。他们做得非常快。您应该期望交付的实现(编译器的,而不是 MoveNext)会有很大的不同。我认为 Eric 或 Lucian 会给出一个答案,即这里没有任何深层次的东西,只是在大多数情况下无关紧要的行为/错误,没有人注意到。因为它是CTP。
@Stilgar:我刚刚检查了 ildasm,它确实在这样做。
@JonSkeet:请注意没有人赞成答案。我们 99% 的人都无法真正判断答案是否正确。

I
Igor Lyadov

好吧,我终于有一个真正的答案了。我有点自己解决了这个问题,但只有在团队 VB 部分的 Lucian Wischik 确认确实有充分的理由之后。非常感谢他 - 请访问 his blog(在 archive.org 上),它很震撼。

此处的值 0 只是特殊的,因为它不是正常情况下您可能处于 await 之前的有效状态。特别是,这不是状态机最终可能会在其他地方测试的状态。我相信使用任何非正值也可以正常工作:-1 不用于此,因为它逻辑上不正确,因为 -1 通常表示“完成”。我可以争辩说我们现在给状态 0 赋予了额外的含义,但最终它并不重要。这个问题的重点是找出为什么要设置状态。

如果等待以捕获的异常结束,则该值是相关的。我们最终可以再次回到相同的等待语句,但我们不能处于表示“我正要从那个等待中回来”的状态,否则所有类型的代码都会被跳过。用一个例子来说明这一点是最简单的。请注意,我现在使用的是第二个 CTP,因此生成的代码与问题中的代码略有不同。

这是异步方法:

static async Task<int> FooAsync()
{
    var t = new SimpleAwaitable();
    
    for (int i = 0; i < 3; i++)
    {
        try
        {
            Console.WriteLine("In Try");
            return await t;
        }                
        catch (Exception)
        {
            Console.WriteLine("Trying again...");
        }
    }
    return 0;
}

从概念上讲,SimpleAwaitable 可以是任何可等待的 - 可能是一个任务,也可能是其他东西。就我的测试而言,它总是为 IsCompleted 返回 false,并在 GetResult 中引发异常。

这是为 MoveNext 生成的代码:

public void MoveNext()
{
    int returnValue;
    try
    {
        int num3 = state;
        if (num3 == 1)
        {
            goto Label_ContinuationPoint;
        }
        if (state == -1)
        {
            return;
        }
        t = new SimpleAwaitable();
        i = 0;
      Label_ContinuationPoint:
        while (i < 3)
        {
            // Label_ContinuationPoint: should be here
            try
            {
                num3 = state;
                if (num3 != 1)
                {
                    Console.WriteLine("In Try");
                    awaiter = t.GetAwaiter();
                    if (!awaiter.IsCompleted)
                    {
                        state = 1;
                        awaiter.OnCompleted(MoveNextDelegate);
                        return;
                    }
                }
                else
                {
                    state = 0;
                }
                int result = awaiter.GetResult();
                awaiter = null;
                returnValue = result;
                goto Label_ReturnStatement;
            }
            catch (Exception)
            {
                Console.WriteLine("Trying again...");
            }
            i++;
        }
        returnValue = 0;
    }
    catch (Exception exception)
    {
        state = -1;
        Builder.SetException(exception);
        return;
    }
  Label_ReturnStatement:
    state = -1;
    Builder.SetResult(returnValue);
}

我必须移动 Label_ContinuationPoint 以使其成为有效代码 - 否则它不在 goto 语句的范围内 - 但这不会影响答案。

想想当 GetResult 抛出异常时会发生什么。我们将遍历 catch 块,增加 i,然后再次循环(假设 i 仍然小于 3)。我们仍处于调用 GetResult 之前的任何状态...但是当我们进入 try 块时,我们必须打印“In Try”并再次调用 GetAwaiter.. . 并且我们只会在 state 不是 1 的情况下这样做。如果没有 state = 0 分配,它将使用现有的 awaiter 并跳过 Console.WriteLine 调用。

这是一段相当曲折的代码,但这只是表明团队必须考虑的事情。我很高兴我不负责实施这个:)


@Shekhar_Pro:是的,这是一个 goto。您应该期望在自动生成的状态机中看到大量 goto 语句 :)
@Shekhar_Pro:在手动编写的代码中,它是 - 因为它使代码难以阅读和遵循。没有人会阅读自动生成的代码,除了像我这样反编译它的傻瓜:)
那么当我们在异常之后再次等待时会发生什么?我们重新开始?
@configurator:它在 awaitable 上调用 GetAwaiter,这是我期望它做的。
goto 并不总是使代码更难阅读。事实上,有时它们甚至是有意义的(我知道这是亵渎神明的说法)。例如,有时您可能需要中断多个嵌套循环。我较少使用的 goto 功能(以及 IMO 更丑的使用)是导致 switch 语句级联。另外,我记得在某个时代,goto 是某些编程语言的主要基础,因此我完全明白为什么仅仅提到 goto 就会让开发人员不寒而栗。如果使用不当,它们会使事情变得丑陋。
R
Rob

如果它保持在 1(第一种情况),您将收到对 EndAwait 的调用,而没有对 BeginAwait 的调用。如果它保持在 2 (第二种情况),你会在另一个等待者上得到相同的结果。

我猜如果调用 BeginAwait 已经启动(我的猜测),调用它会返回 false,并保留原始值以在 EndAwait 处返回。如果是这种情况,它将正常工作,而如果将其设置为 -1,则第一种情况可能会出现未初始化的 this.<1>t__$await1

然而,这假设 BeginAwaiter 实际上不会在第一次调用之后的任何调用上启动操作,并且在这些情况下它将返回 false。开始当然是不可接受的,因为它可能会产生副作用或只是给出不同的结果。它还假设 EndAwaiter 无论被调用多少次都将始终返回相同的值,并且可以在 BeginAwait 返回 false 时调用(根据上述假设)

这似乎是一种防止竞争条件的措施

this.<a1>t__$await2 = this.t1.GetAwaiter<int>();
this.<>1__state = 1;
this.$__doFinallyBodies = false;
this.<a1>t__$await2.BeginAwait(this.MoveNextDelegate)
this.<>1__state = 0;

//second thread
this.<a1>t__$await2 = this.t1.GetAwaiter<int>();
this.<>1__state = 1;
this.$__doFinallyBodies = false;
this.<a1>t__$await2.BeginAwait(this.MoveNextDelegate)
this.$__doFinallyBodies = true;
this.<>1__state = 0;
this.<1>t__$await1 = this.<a1>t__$await2.EndAwait();

//other thread
this.<1>t__$await1 = this.<a1>t__$await2.EndAwait();

如果上面的假设是正确的,那么就会完成一些不需要的工作,例如获取锯子并将相同的值重新分配给 <1>t__$await1。如果状态保持在 1,那么最后一部分将改为:

//second thread
//I suppose this un matched call to EndAwait will fail
this.<1>t__$await1 = this.<a1>t__$await2.EndAwait();

此外,如果将其设置为 2,则状态机将假定它已经获得了第一个不真实的操作的值,并且(可能)未分配的变量将用于计算结果


请记住,在赋值为 0 和赋值为更有意义的值之间实际上并没有使用状态。如果它是为了防止竞争条件,我希望有一些其他值来表明这一点,例如 -2,并在 MoveNext 开始时检查它以检测不适当的使用。请记住,一个实例实际上永远不应该被两个线程同时使用——它的目的是给人一种单一的同步方法调用的错觉,这种方法调用每隔一段时间就会“暂停”。
@Jon我同意它不应该是异步情况下的竞争条件问题,但可能在迭代块中并且可能是遗留问题
@Tony:我想我会等到下一个 CTP 或 beta 版本出来,然后检查这种行为。
G
GaryMcAllister

这可能与堆叠/嵌套的异步调用有关吗?

IE:

async Task m1()
{
    await m2;
}

async Task m2()
{
    await m3();
}

async Task m3()
{
Thread.Sleep(10000);
}

在这种情况下,movenext 代表会被多次调用吗?

真的只是一个平底船吗?


在这种情况下将有三个不同的生成类。 MoveNext() 将在它们中的每一个上调用一次。
f
fixagon

实际状态说明:

可能的状态:

0 已初始化(我认为是这样)或等待操作结束

>0 刚刚调用 MoveNext,选择下一个状态

-1 结束

这个实现是否有可能只是想确保如果从任何地方发生另一个对 MoveNext 的调用(在等待期间),它将从头开始重新评估整个状态链,以重新评估可能同时已经过时的结果?


但它为什么要从头开始呢?这几乎肯定不是你真正想要发生的——你想要抛出一个异常,因为没有其他东西应该调用 MoveNext。