ChatGPT解决这个技术问题 Extra ChatGPT

如何拆分分隔字符串以便访问单个项目?

使用 SQL Server,如何拆分字符串以便可以访问项目 x?

取一个字符串“Hello John Smith”。如何按空格拆分字符串并访问索引 1 处应返回“John”的项目?

自 sql server 2016 起内置msdn.microsoft.com/en-us/library/mt684588.aspx
这里的最高答案是——至少对我来说——相当过时而且相当过时。程序位点、循环、递归、CLR、函数、多行代码......阅读“活动”答案以找到更多最新方法可能会很有趣。
我添加了一个采用最新方法的新答案:stackoverflow.com/a/49669994/632604
@TimAbell,文档指出“不能保证顺序与输入字符串中子字符串的顺序相匹配”。

L
Luke Girvin

我不相信 SQL Server 有内置的拆分函数,所以除了 UDF,我知道的唯一其他答案是劫持 PARSENAME 函数:

SELECT PARSENAME(REPLACE('Hello John Smith', ' ', '.'), 2) 

PARSENAME 接受一个字符串并将其拆分为句点字符。它将一个数字作为第二个参数,该数字指定要返回的字符串的哪一段(从后到前)。

SELECT PARSENAME(REPLACE('Hello John Smith', ' ', '.'), 3)  --return Hello

明显的问题是字符串已经包含句点。我仍然认为使用 UDF 是最好的方法......还有其他建议吗?


谢谢索尔...我应该指出,这个解决方案对于真正的开发来说确实是一个糟糕的解决方案。 PARSENAME 只需要四个部分,因此使用超过四个部分的字符串会导致它返回 NULL。 UDF 解决方案显然更好。
这是一个很棒的技巧,也让我哭泣,这样的东西对于真实语言中如此简单的东西是必要的。
为了使索引以“正确”的方式工作,即从 1 开始,我使用 REVERSE 劫持了您的劫持: REVERSE(PARSENAME(REPLACE(REVERSE('Hello John Smith'), ' ', '.') , 1)) -- 返回你好
@FactorMystic First Normal Form 要求您不要将多个值放在一个字段中。这实际上是 RDBMS 的第一条规则。未提供 SPLIT() 函数,因为它鼓励糟糕的数据库设计,并且永远不会优化数据库以使用以这种格式存储的数据。 RDBMS 没有义务帮助开发人员做它设计为处理的愚蠢事情。正确的答案将始终是“像 40 年前告诉你的那样标准化你的数据库”。 SQL 和 RDBMS 都不是糟糕设计的罪魁祸首。
@BaconBits 虽然我在理论上同意,但在实践中,这样的工具在规范您之前的某人制作的糟糕设计时很有用。
N
Nhan

您可能会发现 SQL User Defined Function to Parse a Delimited String 中的解决方案很有帮助(来自 The Code Project)。

您可以使用这个简单的逻辑:

Declare @products varchar(200) = '1|20|3|343|44|6|8765'
Declare @individual varchar(20) = null

WHILE LEN(@products) > 0
BEGIN
    IF PATINDEX('%|%', @products) > 0
    BEGIN
        SET @individual = SUBSTRING(@products,
                                    0,
                                    PATINDEX('%|%', @products))
        SELECT @individual

        SET @products = SUBSTRING(@products,
                                  LEN(@individual + '|') + 1,
                                  LEN(@products))
    END
    ELSE
    BEGIN
        SET @individual = @products
        SET @products = NULL
        SELECT @individual
    END
END

为什么是 SET @p_SourceText = RTRIM( LTRIM( @p_SourceText)) SET @w_Length = DATALENGTH( RTRIM( LTRIM( @p_SourceText))) 而不是 SET @p_SourceText = RTRIM( LTRIM( @p_SourceText)) SET @w_Length = DATALENGTH( @p_SourceText)
@GateKiller此解决方案不支持Unicode,它使用硬编码数字(18,3),这不能使其成为可行的“可重用”功能。
这可行,但会分配大量内存并浪费 CPU。
从 SQL Server 2016 开始,现在有一个内置函数 STRING_SPLIT,它将拆分字符串并返回一个单列表结果,您可以在 SELECT 语句或其他地方使用该结果。
太糟糕了,我为之工作的那些家伙不在 2016 年。但是,我会记住这一点,以防他们从鞋子中脱颖而出。在此期间很好的解决方案。我将它实现为一个函数,并添加了分隔符作为参数。
v
vzczc

首先,创建一个函数(使用 CTE,通用表表达式消除了对临时表的需要)

 create function dbo.SplitString 
    (
        @str nvarchar(4000), 
        @separator char(1)
    )
    returns table
    AS
    return (
        with tokens(p, a, b) AS (
            select 
                1, 
                1, 
                charindex(@separator, @str)
            union all
            select
                p + 1, 
                b + 1, 
                charindex(@separator, @str, b + 1)
            from tokens
            where b > 0
        )
        select
            p-1 zeroBasedOccurance,
            substring(
                @str, 
                a, 
                case when b > 0 then b-a ELSE 4000 end) 
            AS s
        from tokens
      )
    GO

然后,像这样将它用作任何表(或修改它以适合您现有的存储过程)。

select s 
from dbo.SplitString('Hello John Smith', ' ')
where zeroBasedOccurance=1

更新

对于长度超过 4000 个字符的输入字符串,以前的版本会失败。此版本解决了以下限制:

create function dbo.SplitString 
(
    @str nvarchar(max), 
    @separator char(1)
)
returns table
AS
return (
with tokens(p, a, b) AS (
    select 
        cast(1 as bigint), 
        cast(1 as bigint), 
        charindex(@separator, @str)
    union all
    select
        p + 1, 
        b + 1, 
        charindex(@separator, @str, b + 1)
    from tokens
    where b > 0
)
select
    p-1 ItemIndex,
    substring(
        @str, 
        a, 
        case when b > 0 then b-a ELSE LEN(@str) end) 
    AS s
from tokens
);

GO

用法保持不变。


它很优雅,但由于递归深度的限制,仅适用于 100 个元素。
@Pking,不,默认是 100 (防止无限循环)。使用 MAXRECURSION hint 定义递归级别的数量(0327670 是“无限制” - 可能会破坏服务器)。顺便说一句,比 PARSENAME 更好的答案,因为它是通用的:-)。 +1
maxrecursion 添加到此解决方案中,请记住此问题及其答案 How to setup the maxrecursion option for a CTE inside a Table-Valued-Function
具体来说,参考 the answer by Crisfole - 他的方法稍微减慢了速度,但比大多数其他选项更简单。
次要问题,但由于您更改了列名,因此用法不一样,因此不再定义 s
A
Aaron Bertrand

这里的大多数解决方案都使用 while 循环或递归 CTE。我保证,如果您可以使用空格以外的分隔符,则基于集合的方法会更好:

CREATE FUNCTION [dbo].[SplitString]
    (
        @List NVARCHAR(MAX),
        @Delim VARCHAR(255)
    )
    RETURNS TABLE
    AS
        RETURN ( SELECT [Value], idx = RANK() OVER (ORDER BY n) FROM 
          ( 
            SELECT n = Number, 
              [Value] = LTRIM(RTRIM(SUBSTRING(@List, [Number],
              CHARINDEX(@Delim, @List + @Delim, [Number]) - [Number])))
            FROM (SELECT Number = ROW_NUMBER() OVER (ORDER BY name)
              FROM sys.all_objects) AS x
              WHERE Number <= LEN(@List)
              AND SUBSTRING(@Delim + @List, [Number], LEN(@Delim)) = @Delim
          ) AS y
        );

示例用法:

SELECT Value FROM dbo.SplitString('foo,bar,blat,foo,splunge',',')
  WHERE idx = 3;

结果:

----
blat

您还可以将所需的 idx 作为参数添加到函数中,但我将把它作为练习留给读者。

您不能使用 SQL Server 2016 中添加的 native STRING_SPLIT function 来执行此操作,因为无法保证输出将按原始列表的顺序呈现。换句话说,如果您传入 3,6,1,则结果可能会按该顺序排列,但它可能1,3,6。我已经请求社区帮助改进这里的内置功能:

请帮助改进 STRING_SPLIT

有了足够的定性反馈,他们实际上可能会考虑进行以下一些改进:

STRING_SPLIT 功能不完整

有关拆分函数的更多信息,为什么(并证明)while 循环和递归 CTE 不能扩展,以及更好的替代方案,如果拆分来自应用程序层的字符串:

以正确的方式拆分字符串 - 或次佳方式

拆分字符串:后续行动

拆分字符串:现在使用更少的 T-SQL

比较字符串拆分/连接方法

处理整数列表:我的方法

拆分整数列表:另一个综述

有关拆分列表的更多信息:自定义分隔符、防止重复和维护顺序

从 SQL Server 中的字符串中删除重复项

但是,在 SQL Server 2016 或更高版本上,您应该查看 STRING_SPLIT()STRING_AGG()

性能惊喜和假设:STRING_SPLIT()

SQL Server 2016 中的 STRING_SPLIT():后续 #1

SQL Server 2016 中的 STRING_SPLIT():后续 #2

SQL Server v.Next:STRING_AGG() 性能

使用 SQL Server 的新 STRING_AGG 和 STRING_SPLIT 函数解决老问题


最佳答案,恕我直言。在其他一些答案中,存在 SQL 递归限制为 100 的问题,但在这种情况下不是。非常快速且非常简单的实现。 +2 按钮在哪里?
我逐字尝试了这个函数的用法:select * from DBO.SplitString('Hello John smith', ' ');,产生的输出是:Value Hello ello llo lo o John ohn hn n smith mith ith th h
@AaronBertrand GateKiller 发布的原始问题涉及空格分隔符。
@user1255933 已解决。
@Michael 是的,这是真的。如果您没有 ALTER SCHEMA 权限,您也没有可供选择的表,如果您没有 SELECT 权限,您将无法从中选择您可以随时要求某人为您创建函数.或者在可以创建它的地方创建它(即使是临时的,比如在 tempdb 中)。并且在 2016+ 上,您应该使用 STRING_SPLIT() 而不是您必须自己创建的函数。
n
nathan_jr

您可以利用数字表进行字符串解析。

创建一个物理数字表:

    create table dbo.Numbers (N int primary key);
    insert into dbo.Numbers
        select top 1000 row_number() over(order by number) from master..spt_values
    go

创建包含 1000000 行的测试表

    create table #yak (i int identity(1,1) primary key, array varchar(50))

    insert into #yak(array)
        select 'a,b,c' from dbo.Numbers n cross join dbo.Numbers nn
    go

创建函数

    create function [dbo].[ufn_ParseArray]
        (   @Input      nvarchar(4000), 
            @Delimiter  char(1) = ',',
            @BaseIdent  int
        )
    returns table as
    return  
        (   select  row_number() over (order by n asc) + (@BaseIdent - 1) [i],
                    substring(@Input, n, charindex(@Delimiter, @Input + @Delimiter, n) - n) s
            from    dbo.Numbers
            where   n <= convert(int, len(@Input)) and
                    substring(@Delimiter + @Input, n, 1) = @Delimiter
        )
    go

使用情况(在我的笔记本电脑上 40 秒内输出 300 万行)

    select * 
    from #yak 
    cross apply dbo.ufn_ParseArray(array, ',', 1)

清理

    drop table dbo.Numbers;
    drop function  [dbo].[ufn_ParseArray]

这里的性能并不惊人,但调用超过一百万行表的函数并不是最好的主意。如果对多行执行字符串拆分,我会避免使用该函数。


最好的解决方案 IMO,其他的有某种限制.. 这很快并且可以解析包含许多元素的长字符串。
为什么要按降序排列?如果那里有三个项目,我们从 1 开始编号,那么第一个项目将是数字 3,最后一个项目将是数字 1。如果删除 desc 会不会给出更直观的结果?
同意,在 asc 方向上会更直观。我遵循使用 desc 的 parsename() 约定
关于它如何工作的一些解释会很棒
在对最多 3 个字段的 1 亿行进行解析的测试中,ufn_ParseArray 未在 25 分钟后完成,而来自 @NothingsImpossible 的 REVERSE(PARSENAME(REPLACE(REVERSE('Hello John Smith'), ' ', '.'), 1)) 在 1.5 分钟内完成。 @hello_earth 您的解决方案如何比较具有超过 4 个字段的较长字符串?
C
Community

这个问题不是关于字符串拆分方法,而是关于如何获取第 n 个元素。

这里的所有答案都是使用递归、CTEs、多个 CHARINDEXREVERSEPATINDEX、发明函数、调用 CLR 方法、数字表、CROSS APPLYs 进行某种字符串拆分......大多数答案涵盖了许多代码行。

但是 - 如果你真的只想要一种获取第 n 个元素的方法 - 这可以作为真正的单线来完成,没有 UDF,甚至没有子选择......并且作为额外的好处:输入安全

获取由空格分隔的第 2 部分:

DECLARE @input NVARCHAR(100)=N'part1 part2 part3';
SELECT CAST(N'<x>' + REPLACE(@input,N' ',N'</x><x>') + N'</x>' AS XML).value('/x[2]','nvarchar(max)')

当然您可以使用变量作为分隔符和位置(使用 sql:column 直接从查询值中检索位置):

DECLARE @dlmt NVARCHAR(10)=N' ';
DECLARE @pos INT = 2;
SELECT CAST(N'<x>' + REPLACE(@input,@dlmt,N'</x><x>') + N'</x>' AS XML).value('/x[sql:variable("@pos")][1]','nvarchar(max)')

如果您的字符串可能包含禁止字符(尤其是 &>< 中的一个),您仍然可以这样做。只需首先在您的字符串上使用 FOR XML PATH 以隐式地用合适的转义序列替换所有禁止字符。

如果-另外-您的分隔符是分号,这是一个非常特殊的情况。在这种情况下,我首先将分隔符替换为“#DLMT#”,最后将其替换为 XML 标记:

SET @input=N'Some <, > and &;Other äöü@€;One more';
SET @dlmt=N';';
SELECT CAST(N'<x>' + REPLACE((SELECT REPLACE(@input,@dlmt,'#DLMT#') AS [*] FOR XML PATH('')),N'#DLMT#',N'</x><x>') + N'</x>' AS XML).value('/x[sql:variable("@pos")][1]','nvarchar(max)');

SQL-Server 2016+ 的更新

遗憾的是,开发人员忘记返回带有 STRING_SPLIT 的部件索引。但是,使用 SQL-Server 2016+,有 JSON_VALUEOPENJSON

使用 JSON_VALUE,我们可以将位置作为索引数组传递。

对于 OPENJSONdocumentation 明确指出:

当 OPENJSON 解析 JSON 数组时,该函数将 JSON 文本中元素的索引作为键返回。

1,2,3 这样的字符串只需要括号:[1,2,3]
this is an example 这样的单词字符串需要是 ["this","is","an","example"]
这些是非常简单的字符串操作。试试看:

DECLARE @str VARCHAR(100)='Hello John Smith';
DECLARE @position INT = 2;

--We can build the json-path '$[1]' using CONCAT
SELECT JSON_VALUE('["' + REPLACE(@str,' ','","') + '"]',CONCAT('$[',@position-1,']'));

--查看这个位置安全的字符串拆分器(从零开始):

SELECT  JsonArray.[key] AS [Position]
       ,JsonArray.[value] AS [Part]
FROM OPENJSON('["' + REPLACE(@str,' ','","') + '"]') JsonArray

this post 中,我测试了各种方法,发现 OPENJSON 非常快。甚至比著名的“delimitedSplit8k()”方法还要快...

更新 2 - 获取类型安全的值

我们可以简单地通过使用加倍的 [[]] 来使用 数组中的数组。这允许输入 WITH 子句:

DECLARE  @SomeDelimitedString VARCHAR(100)='part1|1|20190920';

DECLARE @JsonArray NVARCHAR(MAX)=CONCAT('[["',REPLACE(@SomeDelimitedString,'|','","'),'"]]');

SELECT @SomeDelimitedString          AS TheOriginal
      ,@JsonArray                    AS TransformedToJSON
      ,ValuesFromTheArray.*
FROM OPENJSON(@JsonArray)
WITH(TheFirstFragment  VARCHAR(100) '$[0]'
    ,TheSecondFragment INT          '$[1]'
    ,TheThirdFragment  DATE         '$[2]') ValuesFromTheArray

回复:如果您的字符串可能包含禁止字符...您可以像 <x><![CDATA[x<&>x]]></x> 那样简单地包装子字符串。
@SalmanA,是的,CDATA-sections 也可以处理这个问题......但是在演员表之后它们就消失了(隐式改为转义 text())。我不喜欢 幕后的魔法,所以我更喜欢 (SELECT 'Text with <&>' AS [*] FOR XML PATH('')) - 方法。这对我来说看起来更干净并且无论如何都会发生......(更多about CDATA and XML)。
b
brendan

这是一个可以做到的UDF。它将返回一个分隔值表,尚未尝试所有方案,但您的示例工作正常。


CREATE FUNCTION SplitString 
(
    -- Add the parameters for the function here
    @myString varchar(500),
    @deliminator varchar(10)
)
RETURNS 
@ReturnTable TABLE 
(
    -- Add the column definitions for the TABLE variable here
    [id] [int] IDENTITY(1,1) NOT NULL,
    [part] [varchar](50) NULL
)
AS
BEGIN
        Declare @iSpaces int
        Declare @part varchar(50)

        --initialize spaces
        Select @iSpaces = charindex(@deliminator,@myString,0)
        While @iSpaces > 0

        Begin
            Select @part = substring(@myString,0,charindex(@deliminator,@myString,0))

            Insert Into @ReturnTable(part)
            Select @part

    Select @myString = substring(@mystring,charindex(@deliminator,@myString,0)+ len(@deliminator),len(@myString) - charindex(' ',@myString,0))


            Select @iSpaces = charindex(@deliminator,@myString,0)
        end

        If len(@myString) > 0
            Insert Into @ReturnTable
            Select @myString

    RETURN 
END
GO

你可以这样称呼它:


Select * From SplitString('Hello John Smith',' ')

编辑:更新解决方案来处理 len>1 的定界符,如:


select * From SplitString('Hello**John**Smith','**')

不适用于 select * from dbo.ethos_SplitString_fn('guy,wicks,was here',',') id part ----------- ------------ -------------------------------------------------- 1 个人 2 灯芯
注意 len(),因为如果它的参数有尾随空格,它将不会返回正确的数字。例如 len(' - ') = 2。
不适用于: select * from dbo.SplitString('foo,foo test,,,,foo',',')
修复 cbp.. 选择 @myString = substring(@mystring,@iSpaces + len(@deliminator),len(@myString) - charindex(@deliminator,@myString,0))
M
Mudassir Hasan

在这里我发布一个简单的解决方法

CREATE FUNCTION [dbo].[split](
          @delimited NVARCHAR(MAX),
          @delimiter NVARCHAR(100)
        ) RETURNS @t TABLE (id INT IDENTITY(1,1), val NVARCHAR(MAX))
        AS
        BEGIN
          DECLARE @xml XML
          SET @xml = N'<t>' + REPLACE(@delimited,@delimiter,'</t><t>') + '</t>'

          INSERT INTO @t(val)
          SELECT  r.value('.','varchar(MAX)') as item
          FROM  @xml.nodes('/t') as records(r)
          RETURN
        END

像这样执行函数

  select * from dbo.split('Hello John Smith',' ')

我喜欢这个解决方案。扩展它以根据结果中的指定列返回一个标量值。
我被字符串中的“&”烧伤了,用这个来分割
D
Damon Drake

在我看来,你们把事情弄得太复杂了。只需创建一个 CLR UDF 并完成它。

using System;
using System.Data;
using System.Data.SqlClient;
using System.Data.SqlTypes;
using Microsoft.SqlServer.Server;
using System.Collections.Generic;

public partial class UserDefinedFunctions {
  [SqlFunction]
  public static SqlString SearchString(string Search) {
    List<string> SearchWords = new List<string>();
    foreach (string s in Search.Split(new char[] { ' ' })) {
      if (!s.ToLower().Equals("or") && !s.ToLower().Equals("and")) {
        SearchWords.Add(s);
      }
    }

    return new SqlString(string.Join(" OR ", SearchWords.ToArray()));
  }
};

我想这太复杂了,因为我需要有Visual Studio,然后在服务器上启用CLR,然后创建并编译项目,最后将程序集添加到数据库中,以便使用它。但仍然是一个有趣的答案。
@ guillegr123,它不必很复杂。您只需下载并安装(免费!)SQL#,它是一个 SQLCLR 函数和过程库。您可以从 SQLsharp.com 获得它。是的,我是作者,但 String_Split 包含在免费版本中。
s
shA.t

使用 stringvalues() 语句怎么样?

DECLARE @str varchar(max)
SET @str = 'Hello John Smith'

DECLARE @separator varchar(max)
SET @separator = ' '

DECLARE @Splited TABLE(id int IDENTITY(1,1), item varchar(max))

SET @str = REPLACE(@str, @separator, '''),(''')
SET @str = 'SELECT * FROM (VALUES(''' + @str + ''')) AS V(A)' 

INSERT INTO @Splited
EXEC(@str)

SELECT * FROM @Splited

达到的结果集。

id  item
1   Hello
2   John
3   Smith

我使用了你的答案但没有用,但我修改了,这与 union all 一起使用,我使用的是 sql 2005
s
shA.t

我使用了 frederic 的答案,但这在 SQL Server 2005 中不起作用

我对其进行了修改,我将 selectunion all 一起使用,它可以工作

DECLARE @str varchar(max)
SET @str = 'Hello John Smith how are you'

DECLARE @separator varchar(max)
SET @separator = ' '

DECLARE @Splited table(id int IDENTITY(1,1), item varchar(max))

SET @str = REPLACE(@str, @separator, ''' UNION ALL SELECT ''')
SET @str = ' SELECT  ''' + @str + '''  ' 

INSERT INTO @Splited
EXEC(@str)

SELECT * FROM @Splited

结果集是:

id  item
1   Hello
2   John
3   Smith
4   how
5   are
6   you

这真的很棒,我在 sql 的东西中见过,它对我的工作很有用,我很感激,谢谢!
当我看到这个时我真的很兴奋,因为它看起来非常干净且易于理解,但不幸的是,由于 EXEC,您不能将它放入 UDF 中。 EXEC 隐式调用存储过程,您不能在 UDF 中使用存储过程。
这完美!我正在研究从这里使用一个函数(SplitStrings_Moden):sqlperformance.com/2012/07/t-sql-queries/split-strings#comments 这样做,并且在仅使用 4 个帐号时拆分数据并返回行需要一分半钟。我测试了您的版本,在表格上使用帐号数据进行了左连接,大约需要 2 或 3 秒!巨大的差异和完美的工作!如果可能的话,我会给这 20 票!
易受sql注入
j
josejuan

这种模式工作得很好,你可以概括

Convert(xml,'<n>'+Replace(FIELD,'.','</n><n>')+'</n>').value('(/n[INDEX])','TYPE')
                          ^^^^^                                   ^^^^^     ^^^^

注意字段、索引和类型。

让一些带有标识符的表

sys.message.1234.warning.A45
sys.message.1235.error.O98
....

然后,你可以写

SELECT Source         = q.value('(/n[1])', 'varchar(10)'),
       RecordType     = q.value('(/n[2])', 'varchar(20)'),
       RecordNumber   = q.value('(/n[3])', 'int'),
       Status         = q.value('(/n[4])', 'varchar(5)')
FROM   (
         SELECT   q = Convert(xml,'<n>'+Replace(fieldName,'.','</n><n>')+'</n>')
         FROM     some_TABLE
       ) Q

拆分和铸造所有零件。


这是这里唯一允许您转换为特定类型的解决方案,并且效率适中(CLR 仍然是最有效的,但这种方法在大约 9 分钟内处理 8gb、10 个令牌、10M 行表(aws m3 服务器,4k iops预置驱动器)
M
Mustafa Ekici

还有一个通过分隔符函数获得字符串的第 n 部分:

create function GetStringPartByDelimeter (
    @value as nvarchar(max),
    @delimeter as nvarchar(max),
    @position as int
) returns NVARCHAR(MAX) 
AS BEGIN
    declare @startPos as int
    declare @endPos as int
    set @endPos = -1
    while (@position > 0 and @endPos != 0) begin
        set @startPos = @endPos + 1
        set @endPos = charindex(@delimeter, @value, @startPos)

        if(@position = 1) begin
            if(@endPos = 0)
                set @endPos = len(@value) + 1

            return substring(@value, @startPos, @endPos - @startPos)
        end

        set @position = @position - 1
    end

    return null
end

和用法:

select dbo.GetStringPartByDelimeter ('a;b;c;d;e', ';', 3)

返回:

c

我喜欢这个解决方案作为返回单个子字符串的选项,而不是获取然后需要从中选择的解析表。使用表格结果有其用途,但对于我所需要的,这非常有效。
G
Gorgi Rankovski

如果您的数据库具有 130 或更高的兼容性级别,那么您可以使用 STRING_SPLIT 函数和 OFFSET FETCH 子句按索引获取特定项目。

要获取索引 N 处的项目(从零开始),您可以使用以下代码

SELECT value
FROM STRING_SPLIT('Hello John Smith',' ')
ORDER BY (SELECT NULL)
OFFSET N ROWS
FETCH NEXT 1 ROWS ONLY

要检查 compatibility level of your database,请执行以下代码:

SELECT compatibility_level  
FROM sys.databases WHERE name = 'YourDBName';

诀窍在于 OFFSET 1 ROWS,它将跳过第一项并返回第二项。如果您的索引是从 0 开始的,并且 @X 是保存您要获取的项目索引的变量,您可以确保执行 OFFSET @X ROWS
好的,以前没有使用过这个...很高兴知道...我仍然更喜欢基于 xml-split 的方法,因为它允许获取值类型安全并且不需要子查询,但是这个不错。从我这边+1
这里的问题是 STRING_SPLIT 不保证返回结果的顺序。因此,您的第 1 项可能是也可能不是我的第 1 项。
@GorgiRankovski,使用 v2016+ 的 STRING_SPLIT 要求。在这种情况下,最好使用 OPENJSONJSON_VALUE。您可能想要check my answer
S
Seibar

尝试这个:

CREATE function [SplitWordList]
(
 @list varchar(8000)
)
returns @t table 
(
 Word varchar(50) not null,
 Position int identity(1,1) not null
)
as begin
  declare 
    @pos int,
    @lpos int,
    @item varchar(100),
    @ignore varchar(100),
    @dl int,
    @a1 int,
    @a2 int,
    @z1 int,
    @z2 int,
    @n1 int,
    @n2 int,
    @c varchar(1),
    @a smallint
  select 
    @a1 = ascii('a'),
    @a2 = ascii('A'),
    @z1 = ascii('z'),
    @z2 = ascii('Z'),
    @n1 = ascii('0'),
    @n2 = ascii('9')
  set @ignore = '''"'
  set @pos = 1
  set @dl = datalength(@list)
  set @lpos = 1
  set @item = ''
  while (@pos <= @dl) begin
    set @c = substring(@list, @pos, 1)
    if (@ignore not like '%' + @c + '%') begin
      set @a = ascii(@c)
      if ((@a >= @a1) and (@a <= @z1))  
        or ((@a >= @a2) and (@a <= @z2))
        or ((@a >= @n1) and (@a <= @n2))
      begin
        set @item = @item + @c
      end else if (@item > '') begin
        insert into @t values (@item)
        set @item = ''
      end
    end 
    set @pos = @pos + 1
  end
  if (@item > '') begin
    insert into @t values (@item)
  end
  return
end

像这样测试它:

select * from SplitWordList('Hello John Smith')

我已经完成了它,这完全符合我的要求!甚至我也可以自定义它以忽略我选择的特殊字符!
s
shA.t

我在网上寻找解决方案,以下对我有用。 Ref

你这样调用函数:

SELECT * FROM dbo.split('ram shyam hari gopal',' ')

SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO

CREATE FUNCTION [dbo].[Split](@String VARCHAR(8000), @Delimiter CHAR(1))       
RETURNS @temptable TABLE (items VARCHAR(8000))       
AS       
BEGIN       
    DECLARE @idx INT       
    DECLARE @slice VARCHAR(8000)        
    SELECT @idx = 1       
    IF len(@String)<1 OR @String IS NULL  RETURN       
    WHILE @idx!= 0       
    BEGIN       
        SET @idx = charindex(@Delimiter,@String)       
        IF @idx!=0       
            SET @slice = LEFT(@String,@idx - 1)       
        ELSE       
            SET @slice = @String       
        IF(len(@slice)>0)  
            INSERT INTO @temptable(Items) VALUES(@slice)       
        SET @String = RIGHT(@String,len(@String) - @idx)       
        IF len(@String) = 0 break       
    END   
    RETURN       
END

您无法使用此功能轻松访问第 N 项。
A
Aleksandr Fedorenko

以下示例使用递归 CTE

更新 18.09.2013

CREATE FUNCTION dbo.SplitStrings_CTE(@List nvarchar(max), @Delimiter nvarchar(1))
RETURNS @returns TABLE (val nvarchar(max), [level] int, PRIMARY KEY CLUSTERED([level]))
AS
BEGIN
;WITH cte AS
 (
  SELECT SUBSTRING(@List, 0, CHARINDEX(@Delimiter,  @List + @Delimiter)) AS val,
         CAST(STUFF(@List + @Delimiter, 1, CHARINDEX(@Delimiter, @List + @Delimiter), '') AS nvarchar(max)) AS stval, 
         1 AS [level]
  UNION ALL
  SELECT SUBSTRING(stval, 0, CHARINDEX(@Delimiter, stval)),
         CAST(STUFF(stval, 1, CHARINDEX(@Delimiter, stval), '') AS nvarchar(max)),
         [level] + 1
  FROM cte
  WHERE stval != ''
  )
  INSERT @returns
  SELECT REPLACE(val, ' ','' ) AS val, [level]
  FROM cte
  WHERE val > ''
  RETURN
END

SQLFiddle 上的演示


T
T-Rex


    Alter Function dbo.fn_Split
    (
    @Expression nvarchar(max),
    @Delimiter  nvarchar(20) = ',',
    @Qualifier  char(1) = Null
    )
    RETURNS @Results TABLE (id int IDENTITY(1,1), value nvarchar(max))
    AS
    BEGIN
       /* USAGE
            Select * From dbo.fn_Split('apple pear grape banana orange honeydew cantalope 3 2 1 4', ' ', Null)
            Select * From dbo.fn_Split('1,abc,"Doe, John",4', ',', '"')
            Select * From dbo.fn_Split('Hello 0,"&""&&&&', ',', '"')
       */

       -- Declare Variables
       DECLARE
          @X     xml,
          @Temp  nvarchar(max),
          @Temp2 nvarchar(max),
          @Start int,
          @End   int

       -- HTML Encode @Expression
       Select @Expression = (Select @Expression For XML Path(''))

       -- Find all occurences of @Delimiter within @Qualifier and replace with |||***|||
       While PATINDEX('%' + @Qualifier + '%', @Expression) > 0 AND Len(IsNull(@Qualifier, '')) > 0
       BEGIN
          Select
             -- Starting character position of @Qualifier
             @Start = PATINDEX('%' + @Qualifier + '%', @Expression),
             -- @Expression starting at the @Start position
             @Temp = SubString(@Expression, @Start + 1, LEN(@Expression)-@Start+1),
             -- Next position of @Qualifier within @Expression
             @End = PATINDEX('%' + @Qualifier + '%', @Temp) - 1,
             -- The part of Expression found between the @Qualifiers
             @Temp2 = Case When @End < 0 Then @Temp Else Left(@Temp, @End) End,
             -- New @Expression
             @Expression = REPLACE(@Expression,
                                   @Qualifier + @Temp2 + Case When @End < 0 Then '' Else @Qualifier End,
                                   Replace(@Temp2, @Delimiter, '|||***|||')
                           )
       END

       -- Replace all occurences of @Delimiter within @Expression with '</fn_Split>&ltfn_Split>'
       -- And convert it to XML so we can select from it
       SET
          @X = Cast('&ltfn_Split>' +
                    Replace(@Expression, @Delimiter, '</fn_Split>&ltfn_Split>') +
                    '</fn_Split>' as xml)

       -- Insert into our returnable table replacing '|||***|||' back to @Delimiter
       INSERT @Results
       SELECT
          "Value" = LTRIM(RTrim(Replace(C.value('.', 'nvarchar(max)'), '|||***|||', @Delimiter)))
       FROM
          @X.nodes('fn_Split') as X(C)

       -- Return our temp table
       RETURN
    END


S
Stefan Steiger

您可以在不需要函数的情况下在 SQL 中拆分字符串:

DECLARE @bla varchar(MAX)
SET @bla = 'BED40DFC-F468-46DD-8017-00EF2FA3E4A4,64B59FC5-3F4D-4B0E-9A48-01F3D4F220B0,A611A108-97CA-42F3-A2E1-057165339719,E72D95EA-578F-45FC-88E5-075F66FD726C'

-- http://stackoverflow.com/questions/14712864/how-to-query-values-from-xml-nodes
SELECT 
    x.XmlCol.value('.', 'varchar(36)') AS val 
FROM 
(
    SELECT 
    CAST('<e>' + REPLACE(@bla, ',', '</e><e>') + '</e>' AS xml) AS RawXml
) AS b 
CROSS APPLY b.RawXml.nodes('e') x(XmlCol);

如果需要支持任意字符串(带有xml特殊字符)

DECLARE @bla NVARCHAR(MAX)
SET @bla = '<html>unsafe & safe Utf8CharsDon''tGetEncoded ÄöÜ - "Conex"<html>,Barnes & Noble,abc,def,ghi'

-- http://stackoverflow.com/questions/14712864/how-to-query-values-from-xml-nodes
SELECT 
    x.XmlCol.value('.', 'nvarchar(MAX)') AS val 
FROM 
(
    SELECT 
    CAST('<e>' + REPLACE((SELECT @bla FOR XML PATH('')), ',', '</e><e>') + '</e>' AS xml) AS RawXml
) AS b 
CROSS APPLY b.RawXml.nodes('e') x(XmlCol); 

C
Community

我知道这是一个老问题,但我认为有人可以从我的解决方案中受益。

select 
SUBSTRING(column_name,1,CHARINDEX(' ',column_name,1)-1)
,SUBSTRING(SUBSTRING(column_name,CHARINDEX(' ',column_name,1)+1,LEN(column_name))
    ,1
    ,CHARINDEX(' ',SUBSTRING(column_name,CHARINDEX(' ',column_name,1)+1,LEN(column_name)),1)-1)
,SUBSTRING(SUBSTRING(column_name,CHARINDEX(' ',column_name,1)+1,LEN(column_name))
    ,CHARINDEX(' ',SUBSTRING(column_name,CHARINDEX(' ',column_name,1)+1,LEN(column_name)),1)+1
    ,LEN(column_name))
from table_name

SQL FIDDLE

优点:

它用 ' ' 分隔所有 3 个子字符串分隔符。

不得使用 while 循环,因为它会降低性能。

无需旋转,因为所有生成的子字符串都将显示在一行中

限制:

必须知道总数。空格(子字符串)。

注意:该解决方案最多可以提供 N 个子字符串。

为了克服限制,我们可以使用以下 ref

但同样上面的 solution 不能在表中使用(实际上我无法使用它)。

我再次希望这个解决方案可以帮助某人。

更新:如果是记录 > 50000 不建议使用 LOOPS,因为它会降低 性能


A
Andrey Morozov

使用具有递归 CTETVF 的纯基于集合的解决方案。您可以将此函数JOINAPPLY 用于任何数据集。

create function [dbo].[SplitStringToResultSet] (@value varchar(max), @separator char(1))
returns table
as return
with r as (
    select value, cast(null as varchar(max)) [x], -1 [no] from (select rtrim(cast(@value as varchar(max))) [value]) as j
    union all
    select right(value, len(value)-case charindex(@separator, value) when 0 then len(value) else charindex(@separator, value) end) [value]
    , left(r.[value], case charindex(@separator, r.value) when 0 then len(r.value) else abs(charindex(@separator, r.[value])-1) end ) [x]
    , [no] + 1 [no]
    from r where value > '')

select ltrim(x) [value], [no] [index] from r where x is not null;
go

用法:

select *
from [dbo].[SplitStringToResultSet]('Hello John Smith', ' ')
where [index] = 1;

结果:

value   index
-------------
John    1

j
jjxtra

几乎所有其他答案都在替换正在拆分的字符串,这会浪费 CPU 周期并执行不必要的内存分配。

我在这里介绍了一种更好的字符串拆分方法:http://www.digitalruby.com/split-string-sql-server/

这是代码:

SET NOCOUNT ON

-- You will want to change nvarchar(MAX) to nvarchar(50), varchar(50) or whatever matches exactly with the string column you will be searching against
DECLARE @SplitStringTable TABLE (Value nvarchar(MAX) NOT NULL)
DECLARE @StringToSplit nvarchar(MAX) = 'your|string|to|split|here'
DECLARE @SplitEndPos int
DECLARE @SplitValue nvarchar(MAX)
DECLARE @SplitDelim nvarchar(1) = '|'
DECLARE @SplitStartPos int = 1

SET @SplitEndPos = CHARINDEX(@SplitDelim, @StringToSplit, @SplitStartPos)

WHILE @SplitEndPos > 0
BEGIN
    SET @SplitValue = SUBSTRING(@StringToSplit, @SplitStartPos, (@SplitEndPos - @SplitStartPos))
    INSERT @SplitStringTable (Value) VALUES (@SplitValue)
    SET @SplitStartPos = @SplitEndPos + 1
    SET @SplitEndPos = CHARINDEX(@SplitDelim, @StringToSplit, @SplitStartPos)
END

SET @SplitValue = SUBSTRING(@StringToSplit, @SplitStartPos, 2147483647)
INSERT @SplitStringTable (Value) VALUES(@SplitValue)

SET NOCOUNT OFF

-- You can select or join with the values in @SplitStringTable at this point.

S
Salman A

在 Azure SQL 数据库(基于 Microsoft SQL Server 但不完全相同)中,STRING_SPLIT 函数的签名如下所示:

STRING_SPLIT ( string , separator [ , enable_ordinal ] )

enable_ordinal 标志设置为 1 时,结果将包括一个名为 ordinal 的列,该列由输入字符串中子字符串从 1 开始的位置组成:

SELECT *
FROM STRING_SPLIT('hello john smith', ' ', 1)

| value | ordinal |
|-------|---------|
| hello | 1       |
| john  | 2       |
| smith | 3       |

这允许我们这样做:

SELECT value
FROM STRING_SPLIT('hello john smith', ' ', 1)
WHERE ordinal = 2

| value |
|-------|
| john  |

如果 enable_ordinal 不可用,则有一个技巧假定输入字符串的子字符串是唯一的。在这种情况下,CHAR_INDEX 可用于查找输入字符串中子字符串的位置:

SELECT value, ROW_NUMBER() OVER (ORDER BY CHARINDEX(value, input_str)) AS ord_pos
FROM (VALUES
    ('hello john smith')
) AS x(input_str)
CROSS APPLY STRING_SPLIT(input_str, ' ')

| value | ord_pos |
|-------+---------|
| hello | 1       |
| john  | 2       |
| smith | 3       |

d
dani herrera

具有服务器痛苦的递归 CTE 解决方案,test it

MS SQL Server 2008 架构设置:

create table Course( Courses varchar(100) );
insert into Course values ('Hello John Smith');

查询一:

with cte as
   ( select 
        left( Courses, charindex( ' ' , Courses) ) as a_l,
        cast( substring( Courses, 
                         charindex( ' ' , Courses) + 1 , 
                         len(Courses ) ) + ' ' 
              as varchar(100) )  as a_r,
        Courses as a,
        0 as n
     from Course t
    union all
      select 
        left(a_r, charindex( ' ' , a_r) ) as a_l,
        substring( a_r, charindex( ' ' , a_r) + 1 , len(a_R ) ) as a_r,
        cte.a,
        cte.n + 1 as n
    from Course t inner join cte 
         on t.Courses = cte.a and len( a_r ) > 0

   )
select a_l, n from cte
--where N = 1

Results

|    A_L | N |
|--------|---|
| Hello  | 0 |
|  John  | 1 |
| Smith  | 2 |

A
Andrew Hill

虽然类似于 josejuan 的基于 xml 的答案,但我发现只处理一次 xml 路径,然后进行旋转会更有效:

select ID,
    [3] as PathProvidingID,
    [4] as PathProvider,
    [5] as ComponentProvidingID,
    [6] as ComponentProviding,
    [7] as InputRecievingID,
    [8] as InputRecieving,
    [9] as RowsPassed,
    [10] as InputRecieving2
    from
    (
    select id,message,d.* from sysssislog cross apply       ( 
          SELECT Item = y.i.value('(./text())[1]', 'varchar(200)'),
              row_number() over(order by y.i) as rn
          FROM 
          ( 
             SELECT x = CONVERT(XML, '<i>' + REPLACE(Message, ':', '</i><i>') + '</i>').query('.')
          ) AS a CROSS APPLY x.nodes('i') AS y(i)
       ) d
       WHERE event
       = 
       'OnPipelineRowsSent'
    ) as tokens 
    pivot 
    ( max(item) for [rn] in ([3],[4],[5],[6],[7],[8],[9],[10]) 
    ) as data

8点30分跑

select id,
tokens.value('(/n[3])', 'varchar(100)')as PathProvidingID,
tokens.value('(/n[4])', 'varchar(100)') as PathProvider,
tokens.value('(/n[5])', 'varchar(100)') as ComponentProvidingID,
tokens.value('(/n[6])', 'varchar(100)') as ComponentProviding,
tokens.value('(/n[7])', 'varchar(100)') as InputRecievingID,
tokens.value('(/n[8])', 'varchar(100)') as InputRecieving,
tokens.value('(/n[9])', 'varchar(100)') as RowsPassed
 from
(
    select id, Convert(xml,'<n>'+Replace(message,'.','</n><n>')+'</n>') tokens
         from sysssislog 
       WHERE event
       = 
       'OnPipelineRowsSent'
    ) as data

9点20分跑


S
Savas Adar
CREATE FUNCTION [dbo].[fnSplitString] 
( 
    @string NVARCHAR(MAX), 
    @delimiter CHAR(1) 
) 
RETURNS @output TABLE(splitdata NVARCHAR(MAX) 
) 
BEGIN 
    DECLARE @start INT, @end INT 
    SELECT @start = 1, @end = CHARINDEX(@delimiter, @string) 
    WHILE @start < LEN(@string) + 1 BEGIN 
        IF @end = 0  
            SET @end = LEN(@string) + 1

        INSERT INTO @output (splitdata)  
        VALUES(SUBSTRING(@string, @start, @end - @start)) 
        SET @start = @end + 1 
        SET @end = CHARINDEX(@delimiter, @string, @start)

    END 
    RETURN 
END

并使用它

select *from dbo.fnSplitString('Querying SQL Server','')

A
Abhishek

如果有人只想获得分隔文本的一部分,可以使用它

select * from fromSplitStringSep('Word1 wordr2 word3',' ')

CREATE function [dbo].[SplitStringSep] 
(
    @str nvarchar(4000), 
    @separator char(1)
)
returns table
AS
return (
    with tokens(p, a, b) AS (
        select 
        1, 
        1, 
        charindex(@separator, @str)
        union all
        select
            p + 1, 
            b + 1, 
            charindex(@separator, @str, b + 1)
        from tokens
        where b > 0
        )
        select
            p-1 zeroBasedOccurance,
            substring(
                @str, 
                a, 
                case when b > 0 then b-a ELSE 4000 end) 
            AS s
        from tokens
  )

A
Ali CAKIL

我开发了这个,

declare @x nvarchar(Max) = 'ali.veli.deli.';
declare @item nvarchar(Max);
declare @splitter char='.';

while CHARINDEX(@splitter,@x) != 0
begin
    set @item = LEFT(@x,CHARINDEX(@splitter,@x))
    set @x    = RIGHT(@x,len(@x)-len(@item) )
     select @item as item, @x as x;
end

你唯一应该注意的是点“。” @x 的那一端总是应该在那里。


h
hello_earth

在@NothingsImpossible 解决方案的基础上,或者更确切地说,评论投票最多的答案(略低于接受的答案),我发现以下快速而简单的解决方案满足了我自己的需求 - 它具有仅在 SQL 域内的好处。

给定一个字符串“第一;第二;第三;第四;第五”,比如说,我想获得第三个令牌。这只有在我们知道字符串将有多少个标记时才有效 - 在这种情况下它是 5。所以我的行动方式是将最后两个标记切掉(内部查询),然后将前两个标记切掉(外部查询)

我知道这很丑陋并且涵盖了我所处的特定条件,但我发布它以防万一有人发现它有用。干杯

select 
    REVERSE(
        SUBSTRING(
            reverse_substring, 
            0, 
            CHARINDEX(';', reverse_substring)
        )
    ) 
from 
(
    select 
        msg,
        SUBSTRING(
            REVERSE(msg), 
            CHARINDEX(
                ';', 
                REVERSE(msg), 
                CHARINDEX(
                    ';',
                    REVERSE(msg)
                )+1
            )+1,
            1000
        ) reverse_substring
    from 
    (
        select 'first;second;third;fourth;fifth' msg
    ) a
) b

这只有在我们知道字符串将有多少个标记时才有效 - 一个突破性的限制......
A
Andre Figueiredo
declare @strng varchar(max)='hello john smith'
select (
    substring(
        @strng,
        charindex(' ', @strng) + 1,
        (
          (charindex(' ', @strng, charindex(' ', @strng) + 1))
          - charindex(' ',@strng)
        )
    ))