ChatGPT解决这个技术问题 Extra ChatGPT

4KB可以存储多少个字符?

当字符采用 utf-8 编码时,我可以在 4kb 中存储多少个字符?


u
user1767754

这是 1024 或 4096 的视觉提示。阅读@Jon Snyder 的消息以获得更好的理解。

1024 个字符(假设字符有 4 个字节):

拥有良好的客户服务,客户服务提供商很重要。 Aenean的好运需要痛苦。茉莉花质量。与他们的同伴一起,群山将生出羽毛和巨大的冲刺,并会诞生一只可笑的老鼠。在那之前,有多少只猫,ultricies 而不是,孩子们的足球,谁是价格,沙拉。对任何人都没有质量效应。直到足部,fringilla 或,aliquet 也,vulputate 需要,arcu。为中义,鬓如,发,自命之毒,义。没有软脚足球这样的东西。完整的键盘。明天蛋白质。生活元素总是被排除在外。 Aenean vulputate eleifend Tellus。 Aenean Leo ligula, porttitor eu, the result of life, eleifend and, for Aliquam lorem ante,dapibus in,viverra quis,feugiat a,tellus。没有对赌场 laoreet 的恐惧。每个人的妆容。埃涅阿斯将投资。即使你不做广告。 Curabitur ullamcorper ultricies 除非。因为上帝需要它。甚至美国有线电视新闻网。 Maecenas 时代,地球需要 CNN 的调味汁,永远免费的沙拉,让它成为沙拉的教学,而不是沙拉本身。现在,他恭维我

4096 个字符(假设字符有 1 个字节):

拥有良好的客户服务,客户服务提供商很重要。 Aenean的好运需要痛苦。茉莉花质量。与他们的同伴一起,群山将生出羽毛和巨大的冲刺,并会诞生一只可笑的老鼠。在那之前,有多少只猫,ultricies 而不是,孩子们的足球,谁是价格,沙拉。对任何人都没有质量效应。直到足部,fringilla 或,aliquet 也,vulputate 需要,arcu。为中义,鬓如,发,自命之毒,义。没有软脚足球这样的东西。完整的键盘。明天蛋白质。生活元素总是被排除在外。 Aenean vulputate eleifend Tellus。 Aenean Leo ligula, porttitor eu, the result of life, eleifend and, for Aliquam lorem ante,dapibus in,viverra quis,feugiat a,tellus。没有对赌场 laoreet 的恐惧。每个人的妆容。埃涅阿斯将投资。即使你不做广告。 Curabitur ullamcorper ultricies 除非。因为上帝需要它。甚至美国有线电视新闻网。 Maecenas 时代,地球需要 CNN 的调味汁,永远免费的沙拉,让它成为沙拉的教学,而不是沙拉本身。现在,奉承或哀悼 pulvinar,hendrerit id,lorem。 Maecenas 不恨,在 tincidunt 时间之前。直到生命智慧解开毒喉。之前没有人。治疗喉咙的色情也很重要。两次。但有趣的是很有趣。直到大箭的成员。但是结果,狮子要喝会员,他现在要宣传课程,谁怀了我的大宝宝。 Fusce vulputate eleifend sapien。它是纯洁的,像巧克力一样,柔软,但不似,恐惧。世界上没有网络层。明天 ultricies mi eu turpis hendrerit fringilla。在他面前首先躺在医院的喉咙里,护理床,在 ac dui quis mi consectetuer lacinia。对于高中和弓的价格。杜伊斯弓箭手,他得到他需要的东西,他不投资,他投资于目标,他自己。但这有点开玩笑。弓前的整数,accumsan a,consectetuer eget,to put as,mauris。是调教。这艘船现在正在全力以赴。现在害怕nonnummy。周末免费购物。我明天给你。 Aenean 作为 eros 和 nisles sagittis 前庭。没有爱欲,不应该满足 ultricies,nonummy id,imperdiet feugiat,pede。但是床直到亨德瑞特温柔的微笑。小船和大海只是简单的孩子。甚至资助诊所的融资。现在也没有。这艘船很痛苦,不是时间,而是作者和办公室。 Curabitur ligula sapien, tincidunt non, euismod vitae, putuere investment, 狮子座。梅塞纳斯预计。这是很多功课。但大学生活的过程是一种折磨。不要放一个粗俗的弓。他想参加一个水平的课程。在他面前首先躺在医院的喉咙里,护理床,但他们中的一些人,如果没有人计划航空公司的话,就是 Euismod 医院的开发商,而病人就是医院的床位。 Consectetuer前庭精英。埃涅斯大地恐惧,但要喝,要放,而不是在土地上,现在。促进生态环境建设十分重要。在高中。把孩子们。它很丑。 Aenean 的姿势,折磨,但 Feugiat 的过程,现在的预兆现在奉承,eu sollicitudin urna dolor dolor sagittis lacus。直到团队有空,成员没有,周末有,不接受,很丑。没有箭头。悬浮枕头,宣传员和毒酱,sem libero volutpat nibh,现在没有 pellentesque 想走路。在他面前首先躺在医院的喉咙里,护理床,让它清楚。作为一个免费的赌场游戏。船痛。 Maecenas 前庭软直径。孩子就是这样。儿童与疾病、老年和儿童生活在一起,他们正在遭受饥饿和贫困的折磨。在伟大的世界中,有必要放置前庭,及时放置作者,公正。在触发器中,预期价格是多少。既不是作者,也不是骨灰盒。 Proin sapien 他自己,porta a,作者,Euismod ut,mi Aenean 卡通步行。儿童与疾病、老年和儿童生活在一起,他们正在遭受饥饿和贫困的折磨。为了不让eleifend触发feugiat的价格。谁是我的生命?船是一个一艘大船。据说他就住在这条街上。我在湖边聊天,想装饰一下政策。关心


花了我一秒钟的时间来理解这个答案中的废话:)
看起来很傻,但这很有帮助!
m
mkobit

在 UTF-8 中,字符需要 1 到 4 个字节。因此,您可以分别在 4KB 中存储 4096 到 1024 个 UTF-8 字符。

我假设在许多用例中,您可以预期大多数字符都适合一个字节,几乎所有字符都适合 2。


展开,ASCII 中的字符只占 1 个字节,其他字符可以占更多。因此,估计 MForster 给出的范围内的位置的一种方法是问自己字符的哪一部分可能是 ASCII。如果这基本上是英文文本,偶尔带有重音字符,那么您可能可以容纳接近 4000 个字符。如果您的文本使用泰卢固语,那么每个字符通常为 3 个字节,因此您可以容纳大约 1300 个左右。
嗯,我使用的是西里尔文和英文,但它是用 base64 编码然后存储的。所以我猜base64是纯英文,这使得每个字节的e字符正确,等于4096个字符,对吗?
这是对的。 (假设您的问题是 base64 编码的字符串有多少个字符适合,而不是原始西里尔字符有多少个)。
是的,我在写完这个问题后在代码中添加了base64
@JacobMattison 感谢您的直观理解。有帮助。
J
Jon Snyder

UTF-8 字符来自 1-4 个字节,因此这取决于您要编码的字符。大多数英语对每个字符使用 1 个字节。其他西方语言使用 2 个字节。亚洲字符可以使用 4 个字节。

所以答案是从 1024 到 4096,具体取决于字符。此外,在 Windows 环境中,您可能需要在文档开头有一个 3 字节的 BOM,这将减少可以放入 4Kb 的字符数量。请参阅 wikipedia article on UTF-8