ChatGPT解决这个技术问题 Extra ChatGPT

如何递归删除所有文件的尾随空格?

如何删除整个项目的所有尾随空格?从根目录开始,并从所有文件夹中的所有文件中删除尾随空格。

另外,我希望能够直接修改文件,而不仅仅是将所有内容打印到标准输出。

哦,您是在寻找“便携式”解决方案,还是更特定于操作系统的解决方案?您使用的是什么操作系统?
我很想看到一个可以在 OS X Snow Leopard 上运行的版本,并且会忽略 .git 和 .svn 文件夹。

H
Hans Ginzel

这是一个 OS X >= 10.6 Snow Leopard 解决方案。

它忽略 .git 和 .svn 文件夹及其内容。它也不会留下备份文件。

(export LANG=C LC_CTYPE=C
find . -not \( -name .svn -prune -o -name .git -prune \) -type f -print0 | perl -0ne 'print if -T' | xargs -0 sed -Ei 's/[[:blank:]]+$//'
)

括起来的括号保留当前 shell 的 L* 变量 - 在子 shell 中执行。


您可以通过在替换字符串中使用 \+ 而不是 * 来使其更快 - 否则它会在每一行上匹配。
您可以使用 [[:blank:]] 删除制表符和空格。
在 Mountain Lion 中,这会为我返回 sed: RE error: illegal byte sequence
对于那些遇到“非法字节序列”问题的人:输入 export LANG=C 并重试
在 OS X 10.9 中,我还需要在此处找到的 export LC_CTYPE=C stackoverflow.com/questions/19242275/…
k
kenorb

利用:

find . -type f -print0 | xargs -0 perl -pi.bak -e 's/ +$//'

如果您不希望生成“.bak”文件:

find . -type f -print0 | xargs -0 perl -pi -e 's/ +$//'

作为 zsh 用户,您可以省略 find 调用,而是使用:

perl -pi -e 's/ +$//' **/*

注意:为防止破坏 .git 目录,请尝试添加:-not -iwholename '*.git*'


不要在 git repo 中尝试这个,因为它会损坏 git 的内部存储。
@mgold 太晚了,grrr;/
澄清一下,可以在 git repo 的子文件夹中运行它,而不是在包含 git repo(s) 作为后代的任何文件夹中,即不在任何具有 .git 目录的文件夹中,无论嵌套多深。
将此答案与@deepwell's 结合以避免 git/svn 问题find . -not \( -name .svn -prune -o -name .git -prune \) -type f -print0 | xargs -0 perl -pi -e 's/ +$//'
可能有更好的方法,但我通过将 repo 克隆到单独的文件夹中,然后执行 rsync -rv --exclude=.git repo/ repo2/,然后在 repo 中的本地更改也在(未损坏的)repo2 .
C
Community

两种替代方法也适用于 DOS 换行符 (CR/LF),并且在避免二进制文件方面做得很好:

Generic solution 检查 MIME 类型是否以 text/ 开头:

while IFS= read -r -d '' -u 9
do
    if [[ "$(file -bs --mime-type -- "$REPLY")" = text/* ]]
    then
        sed -i 's/[ \t]\+\(\r\?\)$/\1/' -- "$REPLY"
    else
        echo "Skipping $REPLY" >&2
    fi
done 9< <(find . -type f -print0)

Mat 的 Git repository-specific solution,它使用 git grep-I 选项跳过 Git 认为是二进制的文件:

git grep -I --name-only -z -e '' | xargs -0 sed -i 's/[ \t]\+\(\r\?\)$/\1/'

所以我真的很喜欢这个 git 解决方案。它真的应该在顶部。我不想保存回车。但我更喜欢这个,而不是我在 2010 年合并的那个。
我的 git 抱怨 -e 表达式为空,但使用 -e '.*' 效果很好
@okor 在 GNU sed 中,-i 的后缀选项是可选,但在 BSD sed 中不是。严格来说,无论如何这里都没有必要,所以我将其删除。
D
Drew Noakes

在 Bash 中:

find dir -type f -exec sed -i 's/ *$//' '{}' ';'

注意:如果您使用 .git 存储库,请尝试添加:-not -iwholename '.git'


这会为找到的每个文件生成类似的错误。 sed: 1: "dir/file.txt": 命令 a 需要 \ 后跟文本
替换';'和 \;应该管用。 (也不是严格需要 {} 周围的引号)。
要删除所有空格而不仅仅是空格,您应该在 sed 正则表达式中用 [:space:] 替换空格字符。
另一个注意事项:这仅适用于 sed 版本 >= 4,较小的版本不支持就地编辑。
这打破了我的 git :(
O
Ondra Žižka

这在 OSX 10.5 Leopard 中对我有用,它不使用 GNU sed 或 xargs。

find dir -type f -print0 | xargs -0 sed -i.bak -E "s/[[:space:]]*$//"

如果您有需要排除的文件(我做过),请小心这一点!

您可以使用 -prune 忽略某些目录或文件。对于 git 存储库中的 Python 文件,您可以使用以下内容:

find dir -not -path '.git' -iname '*.py'

你有机会澄清这一点吗?我想要一个命令,它将递归地从目录中的所有文件中删除尾随空格,同时忽略“.git”目录。我不能完全按照你的例子......
如果您使用的是 tcsh,则需要将双引号更改为单引号。否则,您将获得“非法变量名”。错误。
GNU sed 与此类似,但您使用 -i.bak 或 --in-place=.bak,最终得到完整的 find dir -not -path '.git' -iname '*.py' -print0 | xargs -0 sed --in-place=.bak 's/[[:space:]]*$//' 命令。将 dir 替换为有问题的目录作为递归的顶级目录。
sed -i .bak ?不应该是 sed -i.bak (没有空格)吗?
j
jbbuckley

Ack 就是为这种任务而设计的。

它的工作方式与 grep 类似,但它知道不要进入 .svn、.git、.cvs 等位置。

ack --print0 -l '[ \t]+$' | xargs -0 -n1 perl -pi -e 's/[ \t]+$//'

比使用 find/grep 跳过障碍要容易得多。

Ack 可通过大多数包管理器(如 ack 或 ack-grep)获得。

它只是一个 Perl 程序,因此它也有单文件版本,您只需下载并运行即可。请参阅:Ack Install


ack 很棒。多年来一直在使用它,并且几乎可以在大多数发行版的所有软件包存储库中使用。
v
vgoff

前任

尝试使用 Ex editor(Vim 的一部分):

$ ex +'bufdo!%s/\s\+$//e' -cxa **/*.*

注意:对于递归 (bash4 & zsh),我们使用 a new globbing option (**/*.*)。由 shopt -s globstar 启用。

您可以将以下函数添加到您的 .bash_profile 中:

# Strip trailing whitespaces.
# Usage: trim *.*
# See: https://stackoverflow.com/q/10711051/55075
trim() {
  ex +'bufdo!%s/\s\+$//e' -cxa $*
}

sed

要使用 sed,请检查:How to remove trailing whitespaces with sed?

寻找

找到以下脚本(例如 remove_trail_spaces.sh)从文件中删除尾随空格:

#!/bin/sh
# Script to remove trailing whitespace of all files recursively
# See: https://stackoverflow.com/questions/149057/how-to-remove-trailing-whitespace-of-all-files-recursively

case "$OSTYPE" in
  darwin*) # OSX 10.5 Leopard, which does not use GNU sed or xargs.
    find . -type f -not -iwholename '*.git*' -print0  | xargs -0 sed -i .bak -E "s/[[:space:]]*$//"
    find . -type f -name \*.bak -print0 | xargs -0 rm -v
    ;;
  *)
    find . -type f -not -iwholename '*.git*' -print0 | xargs -0 perl -pi -e 's/ +$//'
esac

从要扫描的目录运行此脚本。最后在 OSX 上,它将删除所有以 .bak 结尾的文件。

要不就:

find . -type f -name "*.java" -exec perl -p -i -e "s/[ \t]$//g" {} \;

Spring Framework Code Style 推荐的方式。


find . -type f -name "*.java" -exec perl -p -i -e "s/[ \t]$//g" {} \; 仅删除一个尾随空格而不是全部。
J
Jesper Rønn-Jensen

我最终没有使用 find 也没有创建备份文件。

sed -i '' 's/[[:space:]]*$//g' **/*.*

根据文件树的深度,这(较短的版本)可能足以满足您的需要。

注意这也需要二进制文件,例如。


对于特定文件:查找 . -name '*.rb' | xargs -I{} sed -i '' 's/[[:space:]]*$//g' {}
sed 不需要 '' 参数;或者我可能会遗漏一些东西。我对给定目录中的所有文件都进行了尝试,如下所示: sed -i 's/[[:space:]]*$//g' util/*.m
C
ChicagoBob

这里不是排除文件,而是上面明确的白名单文件的变体,基于文件扩展名,你想要剥离,随意调味:

find . \( -name *.rb -or -name *.html -or -name *.js -or -name *.coffee -or \
-name *.css -or -name *.scss -or -name *.erb -or -name *.yml -or -name *.ru \) \
-print0 | xargs -0 sed -i '' -E "s/[[:space:]]*$//"

为此,我需要添加引号:-name "*.rb*"
o
odinho - Velmont

我最终运行了这个,它是 pojo 和 adams 版本的混合。

它将清除尾随空格以及另一种形式的尾随空格,即回车:

find . -not \( -name .svn -prune -o -name .git -prune \) -type f \
  -exec sed -i 's/[:space:]+$//' \{} \;  \
  -exec sed -i 's/\r\n$/\n/' \{} \;

如果有,它不会触及 .git 文件夹。

编辑:在评论之后让它更安全一些,不允许获取带有“.git”或“.svn”的文件。但请注意,如果您有一些二进制文件,它 触及二进制文件。如果您只希望它接触例如 .py 和 .php 文件,请在 -type f 之后使用 -iname "*.py" -or -iname "*.php"

更新 2:它现在替换了行尾的各种空格(这也意味着制表符)


我不知道发生了什么,但这完全使我的 git 存储库变得混乱并弄乱了我的图像。人们,比我更小心!
是的,它会破坏二进制文件。但是,它根本不应该触及您的 git 存储库,因为它会跳过 .git 文件夹中的任何内容。但也许只有当你在同一个文件夹中时。
G
Grant Murphy

这很好用.. add/remove --include 用于特定文件类型:

egrep -rl ' $' --include *.c *  | xargs sed -i 's/\s\+$//g'

g
grosser

红宝石:

irb
Dir['lib/**/*.rb'].each{|f| x = File.read(f); File.write(f, x.gsub(/[ \t]+$/,"")) }

C
Community

1) 许多其他答案使用 -E。我不知道为什么,因为那是 undocumented BSD compatibility 选项。 -r 应改为使用。

2) 其他答案使用 -i ''。那应该只是 -i(或 -i'',如果愿意的话),因为 -i 后面有后缀。

3)Git具体解决方案:

git config --global alias.check-whitespace \
'git diff-tree --check $(git hash-object -t tree /dev/null) HEAD'

git check-whitespace | grep trailing | cut -d: -f1 | uniq -u -z | xargs -0 sed --in-place -e 's/[ \t]+$//'

第一个注册了一个 git 别名 check-whitespace,它列出了带有尾随空格的文件。第二个在它们上运行 sed

我只使用 \t 而不是 [:space:],因为我通常看不到垂直制表符、表单提要和不可破坏的空格。您的测量值可能会有所不同。


r
roedeercuco

我使用正则表达式。 4个步骤:

在编辑器中打开根文件夹(我使用 Visual Studio Code)。点击左侧的搜索图标,然后启用正则表达式模式。在搜索栏中输入“+\n”,在替换栏中输入“\n”。单击“全部替换”。

这将删除所有文件中每行末尾的所有尾随空格。您可以排除一些不符合此需求的文件。


y
yegor256

这对我有用(Mac OS X 10.8,Homebrew 安装的 GNU sed):

find . -path ./vendor -prune -o \
  \( -name '*.java' -o -name '*.xml' -o -name '*.css' \) \
  -exec gsed -i -E 's/\t/    /' \{} \; \
  -exec gsed -i -E 's/[[:space:]]*$//' \{} \; \
  -exec gsed -i -E 's/\r\n/\n/' \{} \;

删除尾随空格,用空格替换制表符,用 Unix \n 替换 Windows CRLF。

有趣的是,在所有文件得到修复之前,我必须运行 3-4 次,通过所有清理 gsed 指令。