要拆分字符串,您需要使用带有字符串数组的重载:
string[] lines = theText.Split(
new string[] { Environment.NewLine },
StringSplitOptions.None
);
编辑:如果要处理文本中不同类型的换行符,可以使用匹配多个字符串的功能。这将在任一类型的换行符上正确拆分,并在文本中保留空行和间距:
string[] lines = theText.Split(
new string[] { "\r\n", "\r", "\n" },
StringSplitOptions.None
);
使用 StringReader
怎么样?
using (System.IO.StringReader reader = new System.IO.StringReader(input)) {
string line = reader.ReadLine();
}
while
循环,请参见 Steve Cooper's answer。
您应该能够很容易地拆分字符串,如下所示:
aString.Split(Environment.NewLine.ToCharArray());
尽量避免使用 string.Split 作为通用解决方案,因为在使用该函数的任何地方都会使用更多内存——原始字符串和拆分副本,两者都在内存中。相信我,当你开始扩展时,这可能是个大问题——运行一个处理 100MB 文档的 32 位批处理应用程序,你会在 8 个并发线程上搞砸。不是说我以前去过那里...
相反,使用这样的迭代器;
public static IEnumerable<string> SplitToLines(this string input)
{
if (input == null)
{
yield break;
}
using (System.IO.StringReader reader = new System.IO.StringReader(input))
{
string line;
while ((line = reader.ReadLine()) != null)
{
yield return line;
}
}
}
这将允许您围绕数据进行更高效的内存循环;
foreach(var line in document.SplitToLines())
{
// one line at a time...
}
当然,如果你想把它全部放在内存中,你可以这样做;
var allTheLines = document.SplitToLines().ToArray();
根据 Guffa 的回答,在扩展类中,使用:
public static string[] Lines(this string source) {
return source.Split(new string[] { "\r\n", "\n" }, StringSplitOptions.None);
}
对于字符串变量 s
:
s.Split(new string[]{Environment.NewLine},StringSplitOptions.None)
这使用您的环境对行尾的定义。在 Windows 上,行结尾是 CR-LF(回车、换行)或 C# 的转义字符 \r\n
。
这是一个可靠的解决方案,因为如果您使用 String.Join
重新组合这些行,这等于您的原始字符串:
var lines = s.Split(new string[]{Environment.NewLine},StringSplitOptions.None);
var reconstituted = String.Join(Environment.NewLine,lines);
Debug.Assert(s==reconstituted);
不该做什么:
使用 StringSplitOptions.RemoveEmptyEntries,因为这会破坏诸如 Markdown 之类的空行具有语法目的的标记。
在分隔符 new char[]{Environment.NewLine} 上拆分,因为在 Windows 上,这将为每一新行创建一个空字符串元素。
正则表达式也是一种选择:
private string[] SplitStringByLineFeed(string inpString)
{
string[] locResult = Regex.Split(inpString, "[\r\n]+");
return locResult;
}
"\r?\n"
。
我只是想我会添加我的两位,因为这个问题的其他解决方案不属于可重用代码分类并且不方便。
以下代码块扩展了 string
对象,以便在处理字符串时它可以作为一种自然方法使用。
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Collections;
using System.Collections.ObjectModel;
namespace System
{
public static class StringExtensions
{
public static string[] Split(this string s, string delimiter, StringSplitOptions options = StringSplitOptions.None)
{
return s.Split(new string[] { delimiter }, options);
}
}
}
您现在可以使用任何字符串中的 .Split()
函数,如下所示:
string[] result;
// Pass a string, and the delimiter
result = string.Split("My simple string", " ");
// Split an existing string by delimiter only
string foo = "my - string - i - want - split";
result = foo.Split("-");
// You can even pass the split options parameter. When omitted it is
// set to StringSplitOptions.None
result = foo.Split("-", StringSplitOptions.RemoveEmptyEntries);
要在换行符处拆分,只需将 "\n"
或 "\r\n"
作为分隔符参数传递。
评论:如果微软实现了这个重载,那就太好了。
Environment.Newline
优于硬编码 \n
或 \r\n
。
Environment.Newline
用于跨平台兼容性,不适用于使用与当前操作系统不同的行终止符的文件。 See here for more information,因此这实际上取决于开发人员正在使用什么。使用 Environment.Newline
可确保操作系统之间的行返回类型不一致,其中“硬编码”为开发人员提供了完全控制权。
.Newline
并不神奇,它只是上面提供的字符串,基于它是在 unix 上运行还是在 windows 上运行的开关。最安全的选择是首先对所有“\r\n”进行字符串替换,然后在“\n”上进行拆分。使用 .Newline
失败的地方是当您处理由其他程序保存的文件时,这些程序使用不同的换行方法。如果您知道每次读取的文件总是使用当前操作系统的换行符,它会很好地工作。
foo = foo.Replace("\r\n", "\n"); string[] result = foo.Split('\n');
。我是否正确理解这适用于所有平台?
我目前在 VB.NET 中使用此功能(基于其他答案):
Private Shared Function SplitLines(text As String) As String()
Return text.Split({Environment.NewLine, vbCrLf, vbLf}, StringSplitOptions.None)
End Function
它首先尝试在平台本地换行符上拆分,然后回退到每个可能的换行符。
到目前为止,我只在一个班级内需要这个。如果情况发生变化,我可能会制作此 Public
并将其移至实用程序类,甚至可能使其成为扩展方法。
以下是如何加入线路备份,很好的衡量标准:
Private Shared Function JoinLines(lines As IEnumerable(Of String)) As String
Return String.Join(Environment.NewLine, lines)
End Function
好吧,实际上 split 应该这样做:
//Constructing string...
StringBuilder sb = new StringBuilder();
sb.AppendLine("first line");
sb.AppendLine("second line");
sb.AppendLine("third line");
string s = sb.ToString();
Console.WriteLine(s);
//Splitting multiline string into separate lines
string[] splitted = s.Split(new string[] {System.Environment.NewLine}, StringSplitOptions.RemoveEmptyEntries);
// Output (separate lines)
for( int i = 0; i < splitted.Count(); i++ )
{
Console.WriteLine("{0}: {1}", i, splitted[i]);
}
string[] lines = text.Split(
Environment.NewLine.ToCharArray(),
StringSplitOptions.RemoveEmptyStrings);
RemoveEmptyStrings 选项将确保您没有空条目,因为 \n 在 \r 之后
(编辑以反映评论:)请注意,它也会丢弃文本中真正的空行。这通常是我想要的,但可能不是您的要求。
我不知道 Environment.Newline,但我想这是一个非常好的解决方案。
我的尝试是:
string str = "Test Me\r\nTest Me\nTest Me";
var splitted = str.Split('\n').Select(s => s.Trim()).ToArray();
附加的 .Trim 删除可能仍然存在的任何 \r 或 \n (例如,在 Windows 上但使用 os x 换行符拆分字符串时)。可能不是最快的方法。
编辑:
正如评论正确指出的那样,这也会删除行首或新换行符之前的任何空格。如果您需要保留该空格,请使用其他选项之一。
这里的例子很好,帮助我应对当前的“挑战”,将 RSA 密钥拆分为更易读的方式。基于 Steve Coopers 解决方案:
string Splitstring(string txt, int n = 120, string AddBefore = "", string AddAfterExtra = "")
{
//Spit each string into a n-line length list of strings
var Lines = Enumerable.Range(0, txt.Length / n).Select(i => txt.Substring(i * n, n)).ToList();
//Check if there are any characters left after split, if so add the rest
if(txt.Length > ((txt.Length / n)*n) )
Lines.Add(txt.Substring((txt.Length/n)*n));
//Create return text, with extras
string txtReturn = "";
foreach (string Line in Lines)
txtReturn += AddBefore + Line + AddAfterExtra + Environment.NewLine;
return txtReturn;
}
提供一个 33 个字符宽度的 RSA 密钥和引号然后简单
Console.WriteLine(Splitstring(RSAPubKey, 33, "\"", "\""));
输出:
https://i.stack.imgur.com/2CMRW.png
希望有人觉得它有用...
从 .NET 6 开始,我们可以使用新的 String.ReplaceLineEndings() 方法来规范化跨平台行尾,所以这些天我发现这是最简单的方法:
var lines = input
.ReplaceLineEndings()
.Split(Environment.NewLine, StringSplitOptions.None);
愚蠢的回答:写入一个临时文件,这样你就可以使用古老的 File.ReadLines
var s = "Hello\r\nWorld";
var path = Path.GetTempFileName();
using (var writer = new StreamWriter(path))
{
writer.Write(s);
}
var lines = File.ReadLines(path);
using System.IO;
string textToSplit;
if (textToSplit != null)
{
List<string> lines = new List<string>();
using (StringReader reader = new StringReader(textToSplit))
{
for (string line = reader.ReadLine(); line != null; line = reader.ReadLine())
{
lines.Add(line);
}
}
}
其实很简单。
VB.NET:
Private Function SplitOnNewLine(input as String) As String
Return input.Split(Environment.NewLine)
End Function
C#:
string splitOnNewLine(string input)
{
return input.split(environment.newline);
}
Environment.NewLine
。
不定期副业成功案例分享
Environment.NewLine
属性包含系统的默认换行符。例如,对于 Windows 系统,它将是"\r\n"
。\n
上拆分,在每行的末尾留下一个\r
,然后在它们之间输出带有\r\n
的行。\r
和\n
转义序列(以及其他)对 C# 编译器具有特殊含义。 VB 没有那些转义序列,因此使用了这些常量。