我正在尝试将基于 MySQL 的应用程序迁移到 Microsoft SQL Server 2005(不是选择,但这就是生活)。
在原始应用程序中,我们几乎使用了完全符合 ANSI-SQL 的语句,但有一个明显的例外——我们相当频繁地使用 MySQL 的 group_concat
函数。
顺便说一句,group_concat
是这样做的:给定一张表,例如,员工姓名和项目...
SELECT empName, projID FROM project_members;
返回:
ANDY | A100
ANDY | B391
ANDY | X010
TOM | A100
TOM | A510
...这就是您使用 group_concat 得到的结果:
SELECT
empName, group_concat(projID SEPARATOR ' / ')
FROM
project_members
GROUP BY
empName;
返回:
ANDY | A100 / B391 / X010
TOM | A100 / A510
所以我想知道的是:是否可以在 SQL Server 中编写一个用户定义的函数来模拟 group_concat
的功能?
我几乎没有使用 UDF、存储过程或类似的东西的经验,只是直接使用 SQL,所以请在解释过多的情况下犯错:)
没有真正简单的方法可以做到这一点。不过,那里有很多想法。
SELECT table_name, LEFT(column_names , LEN(column_names )-1) AS column_names
FROM information_schema.columns AS extern
CROSS APPLY
(
SELECT column_name + ','
FROM information_schema.columns AS intern
WHERE extern.table_name = intern.table_name
FOR XML PATH('')
) pre_trimmed (column_names)
GROUP BY table_name, column_names;
或者如果数据可能包含诸如 <
之类的字符,则该版本可以正常工作
WITH extern
AS (SELECT DISTINCT table_name
FROM INFORMATION_SCHEMA.COLUMNS)
SELECT table_name,
LEFT(y.column_names, LEN(y.column_names) - 1) AS column_names
FROM extern
CROSS APPLY (SELECT column_name + ','
FROM INFORMATION_SCHEMA.COLUMNS AS intern
WHERE extern.table_name = intern.table_name
FOR XML PATH(''), TYPE) x (column_names)
CROSS APPLY (SELECT x.column_names.value('.', 'NVARCHAR(MAX)')) y(column_names)
我参加聚会可能有点晚了,但这种方法对我有用,而且比 COALESCE 方法更容易。
SELECT STUFF(
(SELECT ',' + Column_Name
FROM Table_Name
FOR XML PATH (''))
, 1, 1, '')
SQL Server 2017 确实引入了一个新的聚合函数
STRING_AGG ( expression, separator)
。
连接字符串表达式的值并在它们之间放置分隔符值。分隔符不会添加到字符串的末尾。
可以通过附加 WITHIN GROUP (ORDER BY some_expression)
对连接的元素进行排序
对于 2005-2016 版本,我通常在接受的答案中使用 XML 方法。
然而,这在某些情况下可能会失败。例如,如果要连接的数据包含您看到的 CHAR(29)
FOR XML 无法序列化数据...因为它包含 XML 中不允许的字符 (0x001D)。
可以处理所有字符的更强大的方法是使用 CLR 聚合。然而,使用这种方法对连接的元素应用排序更加困难。
分配给变量的方法是 not guaranteed,在生产代码中应避免使用。
现在可能为时已晚,无法受益,但这不是最简单的做事方式吗?
SELECT empName, projIDs = replace
((SELECT Surname AS [data()]
FROM project_members
WHERE empName = a.empName
ORDER BY empName FOR xml path('')), ' ', REQUIRED SEPERATOR)
FROM project_members a
WHERE empName IS NOT NULL
GROUP BY empName
看看 Github 上的 GROUP_CONCAT 项目,我想我所做的正是您正在寻找的:
该项目包含一组 SQLCLR 用户定义的聚合函数 (SQLCLR UDA),它们共同提供与 MySQL GROUP_CONCAT 函数类似的功能。有多种功能可确保基于所需功能的最佳性能...
GROUP_CONCAT(klascode,'(',name,')' ORDER BY klascode ASC SEPARATOR ', ')
要连接具有多个项目经理的项目中的所有项目经理姓名,请编写:
SELECT a.project_id,a.project_name,Stuff((SELECT N'/ ' + first_name + ', '+last_name FROM projects_v
where a.project_id=project_id
FOR
XML PATH(''),TYPE).value('text()[1]','nvarchar(max)'),1,2,N''
) mgr_names
from projects_v a
group by a.project_id,a.project_name
使用下面的代码,您必须在部署之前在项目属性上设置 PermissionLevel=External,并通过运行“ALTER DATABASE database_name SET”将数据库更改为信任外部代码(请务必在其他地方阅读有关安全风险和替代方案 [如证书])值得信赖”。
using System;
using System.Collections.Generic;
using System.Data.SqlTypes;
using System.IO;
using System.Runtime.Serialization;
using System.Runtime.Serialization.Formatters.Binary;
using Microsoft.SqlServer.Server;
[Serializable]
[SqlUserDefinedAggregate(Format.UserDefined,
MaxByteSize=8000,
IsInvariantToDuplicates=true,
IsInvariantToNulls=true,
IsInvariantToOrder=true,
IsNullIfEmpty=true)]
public struct CommaDelimit : IBinarySerialize
{
[Serializable]
private class StringList : List<string>
{ }
private StringList List;
public void Init()
{
this.List = new StringList();
}
public void Accumulate(SqlString value)
{
if (!value.IsNull)
this.Add(value.Value);
}
private void Add(string value)
{
if (!this.List.Contains(value))
this.List.Add(value);
}
public void Merge(CommaDelimit group)
{
foreach (string s in group.List)
{
this.Add(s);
}
}
void IBinarySerialize.Read(BinaryReader reader)
{
IFormatter formatter = new BinaryFormatter();
this.List = (StringList)formatter.Deserialize(reader.BaseStream);
}
public SqlString Terminate()
{
if (this.List.Count == 0)
return SqlString.Null;
const string Separator = ", ";
this.List.Sort();
return new SqlString(String.Join(Separator, this.List.ToArray()));
}
void IBinarySerialize.Write(BinaryWriter writer)
{
IFormatter formatter = new BinaryFormatter();
formatter.Serialize(writer.BaseStream, this.List);
}
}
我已经使用如下查询对此进行了测试:
SELECT
dbo.CommaDelimit(X.value) [delimited]
FROM
(
SELECT 'D' [value]
UNION ALL SELECT 'B' [value]
UNION ALL SELECT 'B' [value] -- intentional duplicate
UNION ALL SELECT 'A' [value]
UNION ALL SELECT 'C' [value]
) X
并产生:A、B、C、D
尝试了这些,但出于我在 MS SQL Server 2005 中的目的,以下是最有用的,我在 xaprb 找到了
declare @result varchar(8000);
set @result = '';
select @result = @result + name + ' '
from master.dbo.systypes;
select rtrim(@result);
@Mark 正如您所提到的,这是给我带来问题的空格字符。
关于 J Hardiman 的回答,怎么样:
SELECT empName, projIDs=
REPLACE(
REPLACE(
(SELECT REPLACE(projID, ' ', '-somebody-puts-microsoft-out-of-his-misery-please-') AS [data()] FROM project_members WHERE empName=a.empName FOR XML PATH('')),
' ',
' / '),
'-somebody-puts-microsoft-out-of-his-misery-please-',
' ')
FROM project_members a WHERE empName IS NOT NULL GROUP BY empName
顺便说一句,“姓氏”的使用是错字还是我不理解这里的概念?
无论如何,非常感谢大家,因为它为我节省了很多时间:)
2021
@AbdusSalamAzad 的答案是正确的。
SELECT STRING_AGG(my_col, ',') AS my_result FROM my_tbl;
如果结果太大,您可能会收到错误“STRING_AGG 聚合结果超出 8000 字节的限制。使用 LOB 类型避免结果截断。” ,可以通过将查询更改为以下内容来修复:
SELECT STRING_AGG(convert(varchar(max), my_col), ',') AS my_result FROM my_tbl;
STRING_AGG
中会更好。
UPDATE 2020:SQL Server 2016+ JSON 序列化和反序列化示例
OP 提供的数据插入到名为#project_members 的临时表中
drop table if exists #project_members;
create table #project_members(
empName varchar(20) not null,
projID varchar(20) not null);
go
insert #project_members(empName, projID) values
('ANDY', 'A100'),
('ANDY', 'B391'),
('ANDY', 'X010'),
('TOM', 'A100'),
('TOM', 'A510');
如何使用包含 projID 的嵌套数组将此数据序列化为单个 JSON 字符串
select empName, (select pm_json.projID
from #project_members pm_json
where pm.empName=pm_json.empName
for json path, root('projList')) projJSON
from #project_members pm
group by empName
for json path;
结果
'[
{
"empName": "ANDY",
"projJSON": {
"projList": [
{ "projID": "A100" },
{ "projID": "B391" },
{ "projID": "X010" }
]
}
},
{
"empName": "TOM",
"projJSON": {
"projList": [
{ "projID": "A100" },
{ "projID": "A510" }
]
}
}
]'
如何将此数据从单个 JSON 字符串反序列化回其原始行和列
declare @json nvarchar(max)=N'[{"empName":"ANDY","projJSON":{"projList":[{"projID":"A100"},
{"projID":"B391"},{"projID":"X010"}]}},{"empName":"TOM","projJSON":
{"projList":[{"projID":"A100"},{"projID":"A510"}]}}]';
select oj.empName, noj.projID
from openjson(@json) with (empName varchar(20),
projJSON nvarchar(max) as json) oj
cross apply openjson(oj.projJSON, '$.projList') with (projID varchar(20)) noj;
结果
empName projID
ANDY A100
ANDY B391
ANDY X010
TOM A100
TOM A510
如何将唯一的 empName 持久化到表中并将 projID 存储在嵌套的 JSON 数组中
drop table if exists #project_members_with_json;
create table #project_members_with_json(
empName varchar(20) unique not null,
projJSON nvarchar(max) not null);
go
insert #project_members_with_json(empName, projJSON)
select empName, (select pm_json.projID
from #project_members pm_json
where pm.empName=pm_json.empName
for json path, root('projList'))
from #project_members pm
group by empName;
结果
empName projJSON
ANDY {"projList":[{"projID":"A100"},{"projID":"B391"},{"projID":"X010"}]}
TOM {"projList":[{"projID":"A100"},{"projID":"A510"}]}
如何从具有唯一 empName 和包含 projID 的嵌套 JSON 数组列的表中反序列化
select wj.empName, oj.projID
from
#project_members_with_json wj
cross apply
openjson(wj.projJSON, '$.projList') with (projID varchar(20)) oj;
结果
empName projID
ANDY A100
ANDY B391
ANDY X010
TOM A100
TOM A510
GROUP_CONCAT
行为。 GROUP_CONCAT
生成的字符串只是一个由分隔符分隔的值列表。 JSON 格式的字符串远不止这些。
对于 SQL Server 2017+,使用 STRING_AGG() 函数
SELECT STRING_AGG(Genre, ',') AS Result
FROM Genres;
样本结果:
结果
摇滚、爵士、乡村、流行、蓝调、嘻哈、说唱、朋克
对于我的 Google 同事,这是一个非常简单的即插即用解决方案,在与更复杂的解决方案苦苦挣扎一段时间后,它对我有用:
SELECT
distinct empName,
NewColumnName=STUFF((SELECT ','+ CONVERT(VARCHAR(10), projID )
FROM returns
WHERE empName=t.empName FOR XML PATH('')) , 1 , 1 , '' )
FROM
returns t
请注意,我必须将 ID 转换为 VARCHAR 才能将其连接为字符串。如果您不必这样做,这里有一个更简单的版本:
SELECT
distinct empName,
NewColumnName=STUFF((SELECT ','+ projID
FROM returns
WHERE empName=t.empName FOR XML PATH('')) , 1 , 1 , '' )
FROM
returns t
不定期副业成功案例分享