开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 2884|回复: 27
打印 上一主题 下一主题
收起左侧

[易语言纯源码] Punycode编码/解码 纯js版

[复制链接]

结帖率:100% (11/11)
跳转到指定楼层
发表于 2024-3-23 00:38:58 | 只看该作者 回帖奖励 |正序浏览 |阅读模式   福建省福州市
分享源码
界面截图: -
是否带模块: -
备注说明: -
起因是今天在问答区看到个问题,提到了中文域名 我访问了一下 中文域名变成了 xn--开头的地址,然后我就去问了 文心一言,才知道了 Punycode编码这个东西
[JavaScript] 纯文本查看 复制代码
测试.测试.cc //中文域名
xn--0zwm56d.xn--0zwm56d.cc //浏览器解析的域名


但是文心一言给出的js代码真的很烂,我都说了用不了还是不改正,果然现在AI的主流还是用Python,但是用Python的话很不方便,需要搭接口调用,没有办法,自己动手丰衣足食,找到参考资料,研究算法,好吧放弃

然后在万能的CSDN找到了js,当然是没法直接运行的,稍微一修改,完工。 CSDN参考链接(这个帖子也是别人转发的):https://blog.csdn.net/weixin_33913332/article/details/94701104

本来想把帖子发到精易模块功能建议里的,想想还是算了,现在精易论坛的压力确实很大,更新频率越来越少,上一个帖子也石沉大海了,而且我还要提一下,我提供了好几条命令精易模块都收录了,就是不给,拜托真的很想要

经过测试,浏览器环境、系统环境都是正常的,但是在V8环境下会不对,当然最好的肯定就是系统环境支持,V8只是附加项


调用函数

[JavaScript] 纯文本查看 复制代码
enPunycode('测试.测试.cc')//编码

dePunycode('xn--0zwm56d.xn--0zwm56d.cc')//解码



易语言例程


Punycode编码.e (957.64 KB, 下载次数: 32)

JS代码

[JavaScript] 纯文本查看 复制代码
(function() {
    var PunycodeModule = function () {

        function IdnMapping() {
            this.utf16 = {
                decode: function (input) {
                    var output = [], i = 0, len = input.length, value, extra;
                    while (i < len) {
                        value = input.charCodeAt(i++);
                        if ((value & 0xF800) === 0xD800) {
                            extra = input.charCodeAt(i++);
                            if (((value & 0xFC00) !== 0xD800) || ((extra & 0xFC00) !== 0xDC00)) {
                                throw new RangeError("UTF-16(decode): Illegal UTF-16 sequence");
                            }
                            value = ((value & 0x3FF) << 10) + (extra & 0x3FF) + 0x10000;
                        }
                        output.push(value);
                    }
                    return output;
                },
                encode: function (input) {
                    var output = [], i = 0, len = input.length, value;
                    while (i < len) {
                        value = input[i++];
                        if ((value & 0xF800) === 0xD800) {
                            throw new RangeError("UTF-16(encode): Illegal UTF-16 value");
                        }
                        if (value > 0xFFFF) {
                            value -= 0x10000;
                            output.push(String.fromCharCode(((value >>> 10) & 0x3FF) | 0xD800));
                            value = 0xDC00 | (value & 0x3FF);
                        }
                        output.push(String.fromCharCode(value));
                    }
                    return output.join("");
                }
            }

            var initial_n = 0x80;
            var initial_bias = 72;
            var delimiter = "\x2D";
            var base = 36;
            var damp = 700;
            var tmin = 1;
            var tmax = 26;
            var skew = 38;
            var maxint = 0x7FFFFFFF;

            function decode_digit(cp) {
                return cp - 48 < 10 ? cp - 22 : cp - 65 < 26 ? cp - 65 : cp - 97 < 26 ? cp - 97 : base;
            }

            function encode_digit(d, flag) {
                return d + 22 + 75 * (d < 26) - ((flag != 0) << 5);

            }
            function adapt(delta, numpoints, firsttime) {
                var k;
                delta = firsttime ? Math.floor(delta / damp) : (delta >> 1);
                delta += Math.floor(delta / numpoints);

                for (k = 0; delta > (((base - tmin) * tmax) >> 1) ; k += base) {
                    delta = Math.floor(delta / (base - tmin));
                }
                return Math.floor(k + (base - tmin + 1) * delta / (delta + skew));
            }


            function encode_basic(bcp, flag) {
                bcp -= (bcp - 97 < 26) << 5;
                return bcp + ((!flag && (bcp - 65 < 26)) << 5);
            }

            this.decode = function (input, preserveCase) {
                // Dont use utf16
                var output = [];
                var case_flags = [];
                var input_length = input.length;

                var n, out, i, bias, basic, j, ic, oldi, w, k, digit, t, len;

                // Initialize the state: 

                n = initial_n;
                i = 0;
                bias = initial_bias;

                // Handle the basic code points: Let basic be the number of input code 
                // points before the last delimiter, or 0 if there is none, then
                // copy the first basic code points to the output.

                basic = input.lastIndexOf(delimiter);
                if (basic < 0) basic = 0;

                for (j = 0; j < basic; ++j) {
                    if (preserveCase) case_flags[output.length] = (input.charCodeAt(j) - 65 < 26);
                    if (input.charCodeAt(j) >= 0x80) {
                        throw new RangeError("Illegal input >= 0x80");
                    }
                    output.push(input.charCodeAt(j));
                }

                // Main decoding loop: Start just after the last delimiter if any
                // basic code points were copied; start at the beginning otherwise. 

                for (ic = basic > 0 ? basic + 1 : 0; ic < input_length;) {

                    // ic is the index of the next character to be consumed,

                    // Decode a generalized variable-length integer into delta,
                    // which gets added to i. The overflow checking is easier
                    // if we increase i as we go, then subtract off its starting 
                    // value at the end to obtain delta.
                    for (oldi = i, w = 1, k = base; ; k += base) {
                        if (ic >= input_length) {
                            throw RangeError("punycode_bad_input(1)");
                        }
                        digit = decode_digit(input.charCodeAt(ic++));

                        if (digit >= base) {
                            throw RangeError("punycode_bad_input(2)");
                        }
                        if (digit > Math.floor((maxint - i) / w)) {
                            throw RangeError("punycode_overflow(1)");
                        }
                        i += digit * w;
                        t = k <= bias ? tmin : k >= bias + tmax ? tmax : k - bias;
                        if (digit < t) { break; }
                        if (w > Math.floor(maxint / (base - t))) {
                            throw RangeError("punycode_overflow(2)");
                        }
                        w *= (base - t);
                    }

                    out = output.length + 1;
                    bias = adapt(i - oldi, out, oldi === 0);

                    // i was supposed to wrap around from out to 0,
                    // incrementing n each time, so we'll fix that now: 
                    if (Math.floor(i / out) > maxint - n) {
                        throw RangeError("punycode_overflow(3)");
                    }
                    n += Math.floor(i / out);
                    i %= out;

                    // Insert n at position i of the output: 
                    // Case of last character determines uppercase flag: 
                    if (preserveCase) { case_flags.splice(i, 0, input.charCodeAt(ic - 1) - 65 < 26); }

                    output.splice(i, 0, n);
                    i++;
                }
                if (preserveCase) {
                    for (i = 0, len = output.length; i < len; i++) {
                        if (case_flags) {
                            output = (String.fromCharCode(output).toUpperCase()).charCodeAt(0);
                        }
                    }
                }
                return this.utf16.encode(output);
            };


            this.encode = function (input, preserveCase) {
                //** Bias adaptation function **

                var n, delta, h, b, bias, j, m, q, k, t, ijv, case_flags;

                if (preserveCase) {
                    // Preserve case, step1 of 2: Get a list of the unaltered string
                    case_flags = this.utf16.decode(input);
                }
                // Converts the input in UTF-16 to Unicode
                input = this.utf16.decode(input.toLowerCase());

                var input_length = input.length; // Cache the length

                if (preserveCase) {
                    // Preserve case, step2 of 2: Modify the list to true/false
                    for (j = 0; j < input_length; j++) {
                        case_flags[j] = input[j] != case_flags[j];
                    }
                }

                var output = [];


                // Initialize the state: 
                n = initial_n;
                delta = 0;
                bias = initial_bias;

                // Handle the basic code points: 
                for (j = 0; j < input_length; ++j) {
                    if (input[j] < 0x80) {
                        output.push(
                            String.fromCharCode(
                                case_flags ? encode_basic(input[j], case_flags[j]) : input[j]
                            )
                        );
                    }
                }

                h = b = output.length;

                // h is the number of code points that have been handled, b is the
                // number of basic code points 

                if (b > 0) output.push(delimiter);

                // Main encoding loop: 
                //
                while (h < input_length) {
                    // All non-basic code points < n have been
                    // handled already. Find the next larger one: 

                    for (m = maxint, j = 0; j < input_length; ++j) {
                        ijv = input[j];
                        if (ijv >= n && ijv < m) m = ijv;
                    }

                    // Increase delta enough to advance the decoder's
                    // <n,i> state to <m,0>, but guard against overflow: 

                    if (m - n > Math.floor((maxint - delta) / (h + 1))) {
                        throw RangeError("punycode_overflow (1)");
                    }
                    delta += (m - n) * (h + 1);
                    n = m;

                    for (j = 0; j < input_length; ++j) {
                        ijv = input[j];

                        if (ijv < n) {
                            if (++delta > maxint) return Error("punycode_overflow(2)");
                        }

                        if (ijv == n) {
                            // Represent delta as a generalized variable-length integer: 
                            for (q = delta, k = base; ; k += base) {
                                t = k <= bias ? tmin : k >= bias + tmax ? tmax : k - bias;
                                if (q < t) break;
                                output.push(String.fromCharCode(encode_digit(t + (q - t) % (base - t), 0)));
                                q = Math.floor((q - t) / (base - t));
                            }
                            output.push(String.fromCharCode(encode_digit(q, preserveCase && case_flags[j] ? 1 : 0)));
                            bias = adapt(delta, h + 1, h == b);
                            delta = 0;
                            ++h;
                        }
                    }

                    ++delta, ++n;
                }
                return output.join("");
            }
        }

        this.toASCII = function (domain) {
            var idn = new IdnMapping();
            var domainarray = domain.split(".");
            var out = [];
            for (var i = 0; i < domainarray.length; ++i) {
                var s = domainarray;
                out.push(
                    s.match(/[^A-Za-z0-9-]/) ?
                        "xn--" + idn.encode(s) :
                        s
                );
            }
            return out.join(".");
        }

        this.toUnicode = function (domain) {
            var idn = new IdnMapping();
            var domainarray = domain.split(".");
            var out = [];
            for (var i = 0; i < domainarray.length; ++i) {
                var s = domainarray;
                out.push(
                    s.match(/^xn--/) ?
                    idn.decode(s.slice(4)) :
                        s
                );
            }
            return out.join(".");
        }
    }

    idnMapping =  PunycodeModule;
})()
 
function enPunycode (domainName){
    var idn = new idnMapping();
    var str = idn.toASCII(domainName);
    return str;
}
function dePunycode (domainName){
    var idn = new idnMapping();
    var str = idn.toUnicode(domainName);
    return str;
}



点评

好吧我是小丑,原来早就有人分享过了   福建省福州市  发表于 2024-3-25 22:43

评分

参与人数 7好评 +3 精币 +12 收起 理由
wa690602724 + 1 感谢分享,很给力!~
光影魔术 + 1 + 1 新技能已get√
kyo9766 + 1 感谢分享,很给力!~
qq1056123185 + 1 + 2 帖子是好帖子,标题上面加上“中文域名”相关字眼,是不是会被更多人搜到?.
多多帅吧 + 1 很赞同,谢谢!
ノ朽默℡ + 1 + 5 开源精神必须支持~
財財 + 1 感谢分享,很给力!~

查看全部评分


本帖被以下淘专辑推荐:

结帖率:87% (27/31)

签到天数: 4 天

26
发表于 2024-9-21 16:44:24 | 只看该作者   山东省济宁市
多谢分享~~~!
回复 支持 反对

使用道具 举报

结帖率:100% (1/1)

签到天数: 10 天

25
发表于 2024-4-8 18:03:12 | 只看该作者   四川省乐山市
回复 支持 反对

使用道具 举报

结帖率:100% (8/8)

签到天数: 5 天

24
发表于 2024-4-1 09:23:02 | 只看该作者   广东省佛山市
感谢分享,很给力!~
回复 支持 反对

使用道具 举报

签到天数: 6 天

23
发表于 2024-3-26 10:35:36 | 只看该作者   湖南省永州市
感谢分享,很给力!~
回复 支持 反对

使用道具 举报

结帖率:73% (8/11)

签到天数: 8 天

22
发表于 2024-3-26 09:22:59 | 只看该作者   河南省焦作市
感谢分享,很给力!~
回复 支持 反对

使用道具 举报

签到天数: 8 天

21
发表于 2024-3-25 00:17:50 | 只看该作者   浙江省湖州市
新技能已get√
回复 支持 反对

使用道具 举报

结帖率:80% (4/5)
20
发表于 2024-3-24 23:28:16 | 只看该作者   山东省潍坊市
已经顶贴,感谢您对论坛的支持!
回复 支持 反对

使用道具 举报

结帖率:50% (1/2)

签到天数: 9 天

19
发表于 2024-3-24 08:14:59 | 只看该作者   陕西省西安市
好多年前易论坛有过这代码,还有纯易实现的代码。。。可惜了。。。
回复 支持 反对

使用道具 举报

结帖率:96% (53/55)

签到天数: 12 天

18
发表于 2024-3-24 07:12:09 | 只看该作者   山东省青岛市
全都是大佬~
回复 支持 反对

使用道具 举报

结帖率:98% (111/113)

签到天数: 12 天

17
发表于 2024-3-24 07:07:20 | 只看该作者   山东省青岛市
感谢楼主分享!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:[email protected]
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表