如何使用 JavaScript 将字符转换为其 ASCII 码?
例如:
从 "\n" 中得到 10。
128
代表 €
?
€
符号,它是在货币出现之前几十年创建的。 128
是它在 Windows-1252 中的编码。在随机编码之间进行转换本身就是一个问题。
"\n".charCodeAt(0);
String.prototype.charCodeAt()
可以将字符串字符转换为 ASCII 数字。例如:
"ABC".charCodeAt(0) // returns 65
相反使用 String.fromCharCode(10)
将数字转换为相等的 ASCII 字符。此函数可以接受多个数字并将所有字符连接起来然后返回字符串。例子:
String.fromCharCode(65,66,67); // returns 'ABC'
这是一个快速的 ASCII 字符参考:
{
"31": "", "32": " ", "33": "!", "34": "\"", "35": "#",
"36": "$", "37": "%", "38": "&", "39": "'", "40": "(",
"41": ")", "42": "*", "43": "+", "44": ",", "45": "-",
"46": ".", "47": "/", "48": "0", "49": "1", "50": "2",
"51": "3", "52": "4", "53": "5", "54": "6", "55": "7",
"56": "8", "57": "9", "58": ":", "59": ";", "60": "<",
"61": "=", "62": ">", "63": "?", "64": "@", "65": "A",
"66": "B", "67": "C", "68": "D", "69": "E", "70": "F",
"71": "G", "72": "H", "73": "I", "74": "J", "75": "K",
"76": "L", "77": "M", "78": "N", "79": "O", "80": "P",
"81": "Q", "82": "R", "83": "S", "84": "T", "85": "U",
"86": "V", "87": "W", "88": "X", "89": "Y", "90": "Z",
"91": "[", "92": "\\", "93": "]", "94": "^", "95": "_",
"96": "`", "97": "a", "98": "b", "99": "c", "100": "d",
"101": "e", "102": "f", "103": "g", "104": "h", "105": "i",
"106": "j", "107": "k", "108": "l", "109": "m", "110": "n",
"111": "o", "112": "p", "113": "q", "114": "r", "115": "s",
"116": "t", "117": "u", "118": "v", "119": "w", "120": "x",
"121": "y", "122": "z", "123": "{", "124": "|", "125": "}",
"126": "~", "127": ""
}
C:\> man ascii
提供 Bad command or file name
如果您只有一个字符而不是字符串,则可以使用:
'\n'.charCodeAt();
'\n'.codePointAt();
省略 0...
它曾经比 'n'.charCodeAt(0)
慢得多,但我现在已经对其进行了测试,我看不出有任何区别(在有和没有 0 的情况下执行了 100 亿次)。仅在 Chrome 和 Firefox 中进行性能测试。
虽然其他答案是正确的,但我更喜欢这种方式:
function ascii (a) { return a.charCodeAt(0); }
然后,要使用它,只需:
var lineBreak = ascii("\n");
我将其用于小型快捷方式系统:
$(window).keypress(function(event) {
if (event.ctrlKey && event.which == ascii("s")) {
savecontent();
}
// ...
});
你甚至可以在 map() 或其他方法中使用它:
var ints = 'ergtrer'.split('').map(ascii);
const ascii = a => a.charCodeAt(0);
对于那些想要获取字符串的所有 ASCII 代码总和的人:
'Foobar'
.split('')
.map(x=>x.charCodeAt(0))
.reduce((a,b)=>a+b);
或者,ES6:
[...'Foobar']
.map(char => char.charCodeAt(0))
.reduce((current, previous) => previous + current)
[...'Foobar'].reduce((i,s)=>s.charCodeAt(0)+i,0)
为确保完整的 Unicode 支持和可逆性,请考虑使用:
'\n'.codePointAt(0);
这将确保在测试超过 UTF-16 限制的字符时,您将获得它们的真实代码点值。
例如
'𐩕'.codePointAt(0); // 68181
String.fromCodePoint(68181); // '𐩕'
'𐩕'.charCodeAt(0); // 55298
String.fromCharCode(55298); // '�'
JavaScript 将字符串存储为 UTF-16
(双字节),因此如果您想忽略第二个字节,只需在 0000000011111111
(即 255)上使用按位 &
运算符将其删除:
'a'.charCodeAt(0) & 255 === 97; // because 'a' = 97 0
'b'.charCodeAt(0) & 255 === 98; // because 'b' = 98 0
'✓'.charCodeAt(0) & 255 === 19; // because '✓' = 19 39
将字符串转换为 UTF-8 的数组(流):
const str_to_arr_of_UTF8 = new TextEncoder().encode("Adfgdfs");
// [65, 100, 102, 103, 100, 102, 115]
注意:ASCII 是 UTF-8 的子集,所以这是一个通用的解决方案
要将字符串转换为累积数字:
const stringToSum = str => [...str||"A"].reduce((a, x) => a += x.codePointAt(0), 0); console.log(stringToSum("A")); // 65 console.log(stringToSum("Roko")); // 411 console.log(stringToSum("堆栈溢出")); // 1386
用例:
假设您想根据用户名生成不同的背景颜色:
const stringToSum = str => [...str||"A"].reduce((a, x) => a += x.codePointAt(0), 0); const UI_userIcon = user => { const hue = (stringToSum(user.name) - 65) % 360; // "A" = hue: 0 console.log(`Hue: ${hue}`); return `
-65
是完全可选的。由于 ASCII“A”字符数字 = 65
。 - 65 是可选的,用于获取第一个(“A”)字符作为 int 0
。
为了支持 ES6 中的所有 UTF-16(还有 non-BMP/supplementary characters),可以使用 string.codePointAt() 方法;
此方法是 charCodeAt 的改进版本,它仅支持 <65536 的 unicode 代码点(216 - 单个 16 位)。
String.prototype.codePointAt()
是 not supported by any versions of Internet Explorer。 (但它在 Edge 上受支持。)您可以获得一个 polyfill here。
您可以输入一个字符并使用此代码获取 Ascii 代码
例如输入一个像 A 这样的字符,你会得到 Ascii 代码 65
函数 myFunction(){ var str=document.getElementById("id1"); if (str.value=="") { str.focus();返回; } var a="ASCII 码是 == > "; document.getElementById("demo").innerHTML =a+str.value.charCodeAt(0); }
检查ASCII码
输入任意字符:
< button onclick="myFunction()">获取ASCII码
str.charCodeAt(index)
使用 charCodeAt()
以下示例返回 65,即 A
的 Unicode 值。
'ABC'.charCodeAt(0)
// 返回 65
如果您仅使用 128 个原始 ASCII 字符(代码 0 到 127),则扩展 Álvaro González 和其他人的评论,charCodeAt 或 codePointAt 非常好。在此范围之外,代码取决于字符集,如果您希望结果有意义,则需要在计算之前进行字符集转换。
让我们以欧元符号为例:'€'.codePointAt(0)
返回 8364
,它远远超出 0-127 范围,并且与 UTF-16(或 UTF-8)字符集相关。
我正在移植一个 Visual Basic 程序,并注意到它使用 Asc
函数来获取字符代码。显然,从它的角度来看,它会返回 Windows-1252 字符集中的字符代码。为了确保获得相同的数字,我需要转换字符串字符集,然后计算代码。
非常简单,例如在 Python 中:ord('€'.encode('Windows-1252'))
。
然而,为了在 Javascript 中实现同样的效果,我不得不求助于缓冲区和 conversion library:
iconv = require('iconv-lite');
buf = iconv.encode("€", 'win1252');
buf.forEach(console.log);
charCodeAt(0);
上面的代码在大多数情况下都有效,但是在处理单词以根据上面的代码查找排名时有一个问题。例如,aa 的排名为 97+97 = 194(实际为 1+1 = 2),而 w 的排名为 119(实际为 23),这使得 aa > w。为了解决这个从上面的结果减去 96,从 1 开始定位。
charCodeAt(0) - 96;
alphabetically first
和 later
呢?我建议不要使用字符代码的总和进行排名,而是直接比较每个字符。
对于那些想要获得具有平均值的字符串的所有 ASCII 代码总和的人:
const ASCIIAverage = (str) =>Math.floor(str.split('').map(item => item.charCodeAt(0)).reduce((prev,next) => prev+next)/str.length ) console.log(ASCIIAverage('Hello World!'))
正如其他人指出的那样,ASCII 仅涵盖 128 个字符(包括非打印字符)。为了向后兼容,Unicode 将 ASCII 作为其前 128 个字符,但它还包含更多字符。
要仅获取 ASCII 字符代码作为整数,您可以执行以下操作:
function ascii_code (character) {
// Get the decimal code
let code = character.charCodeAt(0);
// If the code is 0-127 (which are the ASCII codes,
if (code < 128) {
// Return the code obtained.
return code;
// If the code is 128 or greater (which are expanded Unicode characters),
}else{
// Return -1 so the user knows this isn't an ASCII character.
return -1;
};
};
如果您只查找字符串中的 ASCII 字符(例如,对字符串进行 slugifying),您可以执行以下操作:
function ascii_out (str) {
// Takes a string and removes non-ASCII characters.
// For each character in the string,
for (let i=0; i < str.length; i++) {
// If the character is outside the first 128 characters (which are the ASCII
// characters),
if (str.charCodeAt(i) > 127) {
// Remove this character and all others like it.
str = str.replace(new RegExp(str[i],"g"),'');
// Decrement the index, since you just removed the character you were on.
i--;
};
};
return str
};
来源
https://www.geeksforgeeks.org/ascii-vs-unicode/#:~:text=Unicode%20is%20the%20universal%20character,encoding%20standard%20for%20electronic%20communication。
https://www.w3schools.com/jsref/jsref_charcodeat.asp
String.fromCharCode(10)
。0
(第一个参数值)——只需"\n".charCodeAt()
就可以了。String.fromCharCode( asciiNumVal )
不同,stringInstance.charCodeAt( index )
不是 String 类的静态方法