ChatGPT解决这个技术问题 Extra ChatGPT

将 Visual Studio 项目中的所有文件保存为 UTF-8

我想知道是否可以将 Visual Studio 2008 项目中的所有文件保存为特定的字符编码。我得到了一个混合编码的解决方案,我想让它们都一样(带有签名的 UTF-8)。

我知道如何保存单个文件,但是项目中的所有文件呢?

您应该知道 RC 编译器(至少在 Visual Studio 2008 之前)不支持 UTF8 文件 - 对于这些文件,您必须使用 UTF16。
此外,GlobalSuppressions.cs 是 UTF-16。

I
Ivan Perevezentsev

既然您已经在 Visual Studio 中,为什么不直接编写代码呢?

foreach (var f in new DirectoryInfo(@"...").GetFiles("*.cs", SearchOption.AllDirectories)) {
  string s = File.ReadAllText(f.FullName);
  File.WriteAllText (f.FullName, s, Encoding.UTF8);
}

只有三行代码!我相信你可以在不到一分钟的时间内写完这个:-)


子目录呢,例如。有很多 *.cs 文件的“属性”子目录?
“SearchOption.AllDirectories”参数是包含子目录所必需的。我已经相应地编辑了代码。
我现在已经尝试过了,效果很好。我唯一需要修改的是使用 Encoding.GetEncoding(1252)=Western European (Windows) 作为 ReadAllText 的第二个参数来保留我的瑞典字符 (åäö)。
当您可以通过此处运行此代码段时,此解决方案在 VS2015 之后会更好:查看 -> 其他 Windows -> C# Interactive
r
rubenvb

这可能会有所帮助。

由于原始参考被垃圾邮件站点破坏,链接被删除。

短版:编辑一个文件,选择文件 -> 高级保存选项。不要将 UTF-8 更改为 Ascii,而是将其更改为 UTF-8。编辑:确保选择没有字节顺序标记(BOM)的选项

设置代码页并点击确定。它似乎在当前文件之后仍然存在。


将其更改为“Unicode (UTF-8 without signature)”,否则会在文件开头添加 BOM。
也同意...有人为我们设置了 BOM。
o
orad

如果您需要在 PowerShell 中执行此操作,这是我的小举措:

Function Write-Utf8([string] $path, [string] $filter='*.*')
{
    [IO.SearchOption] $option = [IO.SearchOption]::AllDirectories;
    [String[]] $files = [IO.Directory]::GetFiles((Get-Item $path).FullName, $filter, $option);
    foreach($file in $files)
    {
        "Writing $file...";
        [String]$s = [IO.File]::ReadAllText($file);
        [IO.File]::WriteAllText($file, $s, [Text.Encoding]::UTF8);
    }
}

该文件在 Visual Studio 中保持为 UTF8-Signed 高级保存选项
Unicode 字符在执行后会丢失。例如,Ü 变为 �,© 变为 �。
对这段代码要非常小心,因为它也会破坏你的 .git 目录(就像它对我所做的那样)。我建议更改通配符 te *.cs。愚蠢的我盲目地相信代码片段。
I
Ivan Perevezentsev

我会以编程方式(在 VS 之外)转换文件,例如使用 Python 脚本:

import glob, codecs

for f in glob.glob("*.py"):
    data = open("f", "rb").read()
    if data.startswith(codecs.BOM_UTF8):
        # Already UTF-8
        continue
    # else assume ANSI code page
    data = data.decode("mbcs")
    data = codecs.BOM_UTF8 + data.encode("utf-8")
    open("f", "wb").write(data)

这假设所有不在“带有签名的 UTF-8”中的文件都在 ANSI 代码页中——这与 VS 2008 显然也假设的相同。如果您知道某些文件还有不同的编码,则必须指定这些编码是什么。


I
Ivan Perevezentsev

使用 C#:
1) 创建一个新的 ConsoleApplication,然后安装 Mozilla Universal Charset Detector
2) 运行代码:

static void Main(string[] args)
{
    const string targetEncoding = "utf-8";
    foreach (var f in new DirectoryInfo(@"<your project's path>").GetFiles("*.cs", SearchOption.AllDirectories))
    {
        var fileEnc = GetEncoding(f.FullName);
        if (fileEnc != null && !string.Equals(fileEnc, targetEncoding, StringComparison.OrdinalIgnoreCase))
        {
            var str = File.ReadAllText(f.FullName, Encoding.GetEncoding(fileEnc));
            File.WriteAllText(f.FullName, str, Encoding.GetEncoding(targetEncoding));
        }
    }
    Console.WriteLine("Done.");
    Console.ReadKey();
}

private static string GetEncoding(string filename)
{
    using (var fs = File.OpenRead(filename))
    {
        var cdet = new Ude.CharsetDetector();
        cdet.Feed(fs);
        cdet.DataEnd();
        if (cdet.Charset != null)
            Console.WriteLine("Charset: {0}, confidence: {1} : " + filename, cdet.Charset, cdet.Confidence);
        else
            Console.WriteLine("Detection failed: " + filename);
        return cdet.Charset;
    }
}

K
Konrad Viltersten

我创建了一个函数来更改用 asp.net 编写的编码文件。我搜索了很多。我还使用了这个页面的一些想法和代码。谢谢你。

这是功能。

  Function ChangeFileEncoding(pPathFolder As String, pExtension As String, pDirOption As IO.SearchOption) As Integer

    Dim Counter As Integer
    Dim s As String
    Dim reader As IO.StreamReader
    Dim gEnc As Text.Encoding
    Dim direc As IO.DirectoryInfo = New IO.DirectoryInfo(pPathFolder)
    For Each fi As IO.FileInfo In direc.GetFiles(pExtension, pDirOption)
        s = ""
        reader = New IO.StreamReader(fi.FullName, Text.Encoding.Default, True)
        s = reader.ReadToEnd
        gEnc = reader.CurrentEncoding
        reader.Close()

        If (gEnc.EncodingName <> Text.Encoding.UTF8.EncodingName) Then
            s = IO.File.ReadAllText(fi.FullName, gEnc)
            IO.File.WriteAllText(fi.FullName, s, System.Text.Encoding.UTF8)
            Counter += 1
            Response.Write("<br>Saved #" & Counter & ": " & fi.FullName & " - <i>Encoding was: " & gEnc.EncodingName & "</i>")
        End If
    Next

    Return Counter
End Function

它可以放在 .aspx 文件中,然后调用如下:

ChangeFileEncoding("C:\temp\test", "*.ascx", IO.SearchOption.TopDirectoryOnly)

k
kleopatra

如果您将 TFS 与 VS 一起使用:http://msdn.microsoft.com/en-us/library/1yft8zkw(v=vs.100).aspx 示例:

tf checkout -r -type:utf-8 src/*.aspx

B
Bart

感谢您的解决方案,此代码对我有用:

Dim s As String = ""
Dim direc As DirectoryInfo = New DirectoryInfo("Your Directory path")

For Each fi As FileInfo In direc.GetFiles("*.vb", SearchOption.AllDirectories)
    s = File.ReadAllText(fi.FullName, System.Text.Encoding.Default)
    File.WriteAllText(fi.FullName, s, System.Text.Encoding.Unicode)
Next

M
Maxime Esprit

如果你想避免这种类型的错误:

https://i.stack.imgur.com/NQmtD.png

使用以下代码:

foreach (var f in new DirectoryInfo(@"....").GetFiles("*.cs", SearchOption.AllDirectories))
            {
                string s = File.ReadAllText(f.FullName, Encoding.GetEncoding(1252));
                File.WriteAllText(f.FullName, s, Encoding.UTF8);
            }

编码编号 1252 是 Visual Studio 用于保存文件的默认 Windows 编码。


B
Bruno Zell

从 UTF-8-BOM 转换为 UTF-8

rasx's answer 的基础上,这是一个 PowerShell 函数,它假定您当前的文件已经以 UTF-8(但可能带有 BOM)编码,并将它们转换为不带 BOM 的 UTF-8,因此保留现有的 Unicode 字符。

Function Write-Utf8([string] $path, [string] $filter='*')
{
    [IO.SearchOption] $option = [IO.SearchOption]::AllDirectories;
    [String[]] $files = [IO.Directory]::GetFiles((Get-Item $path).FullName, $filter, $option);
    foreach($file in $files)
    {
        "Writing $file...";
        [String]$s = [IO.File]::ReadAllText($file, [Text.Encoding]::UTF8);
        [Text.Encoding]$e = New-Object -TypeName Text.UTF8Encoding -ArgumentList ($false);
        [IO.File]::WriteAllText($file, $s, $e);
    }
}

I
Ivan Perevezentsev

将解决方案从 VS2008 转换为 VS2015 后遇到编码问题。转换后,所有项目文件都以 ANSI 编码,但它们包含 UTF8 内容,并在 VS2015 中被识别为 ANSI 文件。尝试了许多转换策略,但只使用了这个解决方案。

 Encoding encoding = Encoding.Default;
 String original = String.Empty;
 foreach (var f in new DirectoryInfo(path).GetFiles("*.cs", SearchOption.AllDirectories))
 {
    using (StreamReader sr = new StreamReader(f.FullName, Encoding.Default))
    {
       original = sr.ReadToEnd();
       encoding = sr.CurrentEncoding;
       sr.Close();
    }
    if (encoding == Encoding.UTF8)
       continue;
    byte[] encBytes = encoding.GetBytes(original);
    byte[] utf8Bytes = Encoding.Convert(encoding, Encoding.UTF8, encBytes);
    var utf8Text = Encoding.UTF8.GetString(utf8Bytes);

    File.WriteAllText(f.FullName, utf8Text, Encoding.UTF8);
 }

Y
Yitzhak Weinberg

该项目已从 Visual Studio 2017 的菜单中删除您仍然可以通过文件->另存为->然后单击“保存”按钮上的向下箭头并单击“使用编码保存...”来访问该功能。

如果需要,您也可以通过工具->自定义->命令将其添加回文件菜单。


M
MusiGenesis

我只是在 Visual Studio 中无法自动执行此操作的情况下提供此建议(我什至不确定这是否可行):

在您的项目中创建一个名为的类或其他一些将强制 Visual Studio 编码为 UTF-8 的 unicode 文本。添加“使用 MyProject。”到每个文件的顶部。您应该能够通过执行全局操作来完成所有操作将“使用 System.Text;”替换为“使用 System.Text;使用 MyProject。”长字符串“你想使用 UTF-8 保存 X.cs 吗?”消息或其他内容。


呃,如果你真的想让它坚持下去,只需添加一个带有这些字符的评论。至少下次有人在“编辑”菜单中“删除未使用的使用”时它不会被删除。
在每个文件的顶部添加“使用 MyProject。Hacking the lame;”。-我认为问题的主要原因是,不必单独打开每个文件。
这不适用于带有德语变音符号(如 äöüß)的文件。文件内容仍将是非 UTF。