这个问题在这里已经有了答案:Clearing a string buffer/builder after loop (10 answers) Closed 6 years ago。
我在循环中使用 StringBuilder,每 x 次迭代我想清空它并以空 StringBuilder
开始,但我在文档中看不到任何类似于 .NET StringBuilder.Clear 的方法,只是delete 方法似乎过于复杂。
那么在 Java 中清除 StringBuilder
的最佳方法是什么?
两种工作方式:
使用 stringBuilderObj.setLength(0)。使用 new StringBuilder() 分配一个新的,而不是清除缓冲区。请注意,对于性能关键的代码路径,这种方法可能比基于 setLength 的方法慢得多(因为需要分配具有新缓冲区的新对象,旧对象才有资格进行 GC 等)。
基本上有两种选择,使用 setLength(0)
重置 StringBuilder 或在每次迭代中创建一个新的。两者都可以根据使用情况各有利弊。
如果您事先知道 StringBuilder 的预期容量,那么每次创建一个新的应该和设置一个新的长度一样快。它也将有助于垃圾收集器,因为每个 StringBuilder 的寿命都相对较短,并且 gc 已为此进行了优化。
当您不知道容量时,重用相同的 StringBuilder 可能会更快。每次追加时超出容量,都必须分配一个新的后备数组,并且必须复制以前的内容。通过重用同一个StringBuilder,它会在一些迭代后达到所需的容量,之后不会有任何复制。
new
一个新的 StringBuffer,因为我希望 有时 我会有相当长的字符串,因此我从一个相当大的缓冲区大小(4k 或 32k)开始.因此,听起来 setLength(0) 可能会更快。但是 - 如果 StringBuffer 分配的空间永远不会缩小,我可能会耗尽内存(这是在 Android 下内存会变得紧张的情况)。
trimToSize
方法释放不需要的空间。
StringBuilder
更好?
delete
并不过分复杂:
myStringBuilder.delete(0, myStringBuilder.length());
你也可以这样做:
myStringBuilder.setLength(0);
setLength
替代方案很有趣,谢谢。
如果您查看 StringBuilder 或 StringBuffer 的源代码, setLength() 调用只会重置字符数组的索引值。恕我直言,使用 setLength 方法总是比新分配快。他们应该将方法命名为“clear”或“reset”,这样会更清晰。
我会投票给 sb.setLength(0);
,不仅因为它是一个函数调用,而且因为它实际上并没有像 sb.delete(0, builder.length());
那样将数组复制到另一个数组中。它只是将剩余的字符填充为 0 并将长度变量设置为新长度。
您可以查看他们的实现,以从 here 的 setLength
函数和 delete0
函数验证我的观点。
您应该使用 sb.delete(0, sb.length())
或 sb.setLength(0)
而不是创建新的 StringBuilder()。
有关性能,请参阅此相关帖子:Is it better to reuse a StringBuilder in a loop?
我认为这里的许多答案可能缺少StringBuilder
中包含的质量方法:.delete(int start, [int] end)
。我知道这是一个迟到的答复;但是,这应该被告知(并更彻底地解释)。
假设您有一个 StringBuilder 表 - 您希望在整个程序中动态修改它(我现在正在做的一个),例如
StringBuilder table = new StringBuilder();
如果您正在循环通过该方法并更改内容,使用该内容,然后希望丢弃该内容以“清理”StringBuilder
以进行下一次迭代,您可以删除它的内容,例如
table.delete(int start, int end).
start 和 end 是您要删除的字符的索引。不知道字符的长度并想删除整个内容?
table.delete(0, table.length());
现在,对于踢球者。 StringBuilders
,如前所述,频繁更改时会占用大量开销(并且可能导致线程方面的安全问题);因此,使用 StringBuffer
- 与 StringBuilder
相同(有一些例外) - 如果您的 StringBuilder
用于与用户交互的目的。
StringBuilder s = new StringBuilder();
s.append("a");
s.append("a");
// System.out.print(s); is return "aa"
s.delete(0, s.length());
System.out.print(s.length()); // is return 0
是简单的方法。
如果性能是主要关注点,那么在我看来,具有讽刺意味的是,用于格式化进入缓冲区的文本的 Java 构造在 CPU 上将比分配/重新分配/垃圾收集更耗时……嗯,可能不是 GC(垃圾收集),具体取决于您创建和丢弃的构建器数量。
但是简单地将复合字符串 ("Hello World of " + 6E9 + " earthlings."
) 附加到缓冲区可能会使整个问题变得无关紧要。
而且,实际上,如果涉及 StringBuilder
的实例,那么内容会比简单的 String str = "Hi";
复杂和/或更长(不管 Java 可能在后台使用构建器)。
就个人而言,我尽量不滥用 GC。因此,如果它在快速触发场景中会被大量使用——例如,编写调试输出消息——我只是假设在其他地方声明它并将其归零以供重用。
class MyLogger {
StringBuilder strBldr = new StringBuilder(256);
public void logMsg( String stuff, SomeLogWriterClass log ) {
// zero out strBldr's internal index count, not every
// index in strBldr's internal buffer
strBldr.setLength(0);
// ... append status level
strBldr.append("Info");
// ... append ' ' followed by timestamp
// assuming getTimestamp() returns a String
strBldr.append(' ').append(getTimestamp());
// ... append ':' followed by user message
strBldr.append(':').append(msg);
log.write(strBldr.toString());
}
}
strBldr.trimToSize();
将在设置长度后释放任何未使用的空间。不幸的是,如果经常使用该对象,您只会导致内存流失,因此如果您确实使用它,最好在 .setLength(0)
之前使用它,而不是之后使用它。
if (count < newLength)
,但如果newLength
为 0,则永远不会发生这种情况。