开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 285|回复: 6
打印 上一主题 下一主题
收起左侧

[python] python源码转易语言,80行

[复制链接]
结帖率:0% (0/1)
跳转到指定楼层
楼主
发表于 2025-6-18 11:55:29 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式   广东省东莞市
100精币
  
import subprocess
_bak_Popen = subprocess.Popen
def _Popen (*a, **kw):
kw[ ' encoding'] = 'utf-8'
return _bak_Popen (*a, **kw)
subprocess.Popen = _Popen
import execjs
import requests
import sys
from lxml import etree
from urllib.parse import urljoin
session = requests.Session ()
with open ( ' rs_env.js', mode='r', encoding='utf-8') as f:
env_code = f.read ()
class Technology:
def __init__ (self):
# 定义请求头
self.headers = {
"accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7",
"accept-language": "zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7",
"cache-control": "no-cache",
"pragma": "no-cache",
"priority": "u=0, i",
"referer": "https://d.gd.189.cn/crmweb/sysmgr/login.action",
"upgrade-insecure-requests": "1",
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/135.0.0.0 Safari/537.36 Edg/135.0.0.0"
}
# 定义请求地址
self.url = "https://d.gd.189.cn/crmweb/sysmgr/login.action"
self.cookies = dict ()
def get_cookie (self):
# 第一次请求
response = session.get (self.url, headers=self.headers, cookies=self.cookies)
self.cookies[ ' 42ZfFFpfC71iS'] = response.cookies.get('42ZfFFpfC71iS')
html = etree.HTML (response.text)
# 获取 content 参数
content = html.xpath ( ' //meta[@id]/@content')[0]
# 获取 自执行方法 文件代码
eval_url = urljoin (self.url, html.xpath ( ' //script[@charset]/@src')[0])
eval_code = session.get (eval_url, headers=self.headers).content.decode ( ' utf-8')
# 获取ts代码
ts_code = html.xpath ( ' //script[not(@charset)]/text()')[0]
# 编译JS代码
self.js = execjs.compile ( ' var content="{}";\r\n{};\r\n{};\r\n{}'.format(content, env_code, ts_code, eval_code))
with open ( ' execjs.js', mode='w', encoding='utf-8') as f:
f.write ( ' var content="{}";\r\n{};\r\n{};\r\n{}'.format(content, env_code, ts_code, eval_code))
# 生成cookie参数
self.cookies[ ' 42ZfFFpfC71iT'] = self.js.call('get_cookie').split('; path=/')[0].split('=')[1]
def main (self,method,url):
self.get_cookie ()
return {
' cookies':self.cookies,
' url':self.js.call("get_url", method, url)
}
if __name__ == ' __main__':
if len (sys.argv) > 2:
method = str (sys.argv[1])
else:method = "GET"
if len (sys.argv) > 2:
url = str (sys.argv[2])
else:url = "https://d.gd.189.cn/crmweb/sysmgr/login.action"
spider = Technology ()
res = spider.main (method,url)
print (res)


回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
沙发
发表于 2025-6-18 12:00:01 | 只看该作者   广西壮族自治区北海市
你这个少了个.py文件,里面装有cookie文本,你得找出来才能做成易语言版
回复

使用道具 举报

结帖率:50% (2/4)

签到天数: 4 天

板凳
发表于 2025-6-18 14:52:48 | 只看该作者   福建省厦门市
用了其他库 80行 也许就变成 800行了
回复

使用道具 举报

结帖率:0% (0/1)
地板
 楼主| 发表于 2025-6-18 15:45:05 | 只看该作者   广东省东莞市
成哥开始学脚本 发表于 2025-6-18 12:00
你这个少了个.py文件,里面装有cookie文本,你得找出来才能做成易语言版

只有 rs_env.js

补充内容 (2025-6-18 15:46):
execjs.js
回复

使用道具 举报

结帖率:0% (0/1)
地下
 楼主| 发表于 2025-6-18 15:56:15 | 只看该作者   广东省东莞市
100R,QQ306747579
回复

使用道具 举报

结帖率:57% (12/21)

签到天数: 1 天

6
发表于 2025-6-18 18:41:58 | 只看该作者   浙江省湖州市
Python 转易语言实现网页爬虫功能
分析了你的 Python 代码,这是一个针对广东电信网站的爬虫程序,主要功能是处理 JavaScript 混淆和 Cookie 生成。下面是对应的易语言实现:
代码说明
核心功能实现:
使用易语言的 HTTP 功能替代 requests 库
实现了 JavaScript 环境,使用易语言的 JScript 引擎执行前端代码
完整实现了 Cookie 处理和 URL 生成逻辑
注意事项:
需要在项目中添加 "rs_env.js" 文件,内容与 Python 版本相同
易语言的 JS 引擎可能与 Python 的 execjs 有细微差异,需要测试验证
对于复杂的 JavaScript 处理,可能需要进一步优化 JS 执行环境
功能说明:
类 "技术处理" 封装了所有功能
初始化方法设置请求头和 URL
获取 Cookie 方法处理网页请求和 JavaScript 执行
主处理方法整合了整个流程并返回结果
这个易语言版本保持了与原 Python 代码相同的功能逻辑,同时适应了易语言的编程风格和库函数。
  
子程序名返回值类型公开备 注
读入JavaScript文件文本型 
参数名类 型参考可空数组备 注
文件名文本型
变量名类 型静态数组备 注
文件句柄整数型 
文件内容文本型 
文件大小整数型 
文件句柄 = 打开文件 (文件名, , , )
如果 (文件句柄 = 0)
返回 ("")
结束

文件大小 = 取文件长度 (文件句柄)
文件内容 = 读入文件 (文件句柄, 文件大小)
关闭文件 (文件句柄)

返回 (文件内容)
.子程序尾
.类 技术处理
数据类型名公开备 注
(未定义数据类型名)  
成员名类 型传址数组备 注
头信息文本型  
URL文本型  
Cookies文本型  
JS代码文本型  
环境代码文本型  

.子程序 初始化
// 设置请求头
头信息 = "accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7\r\n" +
"accept-language: zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7\r\n" +
"cache-control: no-cache\r\n" +
"pragma: no-cache\r\n" +
"priority: u=0, i\r\n" +
"referer: https://d.gd.189.cn/crmweb/sysmgr/login.action\r\n" +
"upgrade-insecure-requests: 1\r\n" +
"user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/135.0.0.0 Safari/537.36 Edg/135.0.0.0"

// 设置请求URL
URL = "https://d.gd.189.cn/crmweb/sysmgr/login.action"

// 读取JavaScript环境代码
环境代码 = 读入JavaScript文件 ("rs_env.js")
.子程序尾

.子程序 获取Cookie
.局部变量 响应内容, 文本型
.局部变量 内容参数, 文本型
.局部变量 evalURL, 文本型
.局部变量 eval代码, 文本型
.局部变量 ts代码, 文本型
.局部变量 网页对象, 整数型
.局部变量 节点列表, 整数型
.局部变量 节点, 整数型
.局部变量 i, 整数型
.局部变量 临时Cookie, 文本型

// 第一次请求
响应内容 = HTTP读文件 (URL, 头信息, Cookies)

// 提取Cookie
临时Cookie = 取HTTPCookie (URL)
如果 (寻找文本 (临时Cookie, "42ZfFFpfC71iS=", , ) > 0)
Cookies = "42ZfFFpfC71iS=" + 子文本替换 (临时Cookie, 寻找文本 (临时Cookie, "42ZfFFpfC71iS=", , ) + 13, 寻找文本 (临时Cookie, ";", 寻找文本 (临时Cookie, "42ZfFFpfC71iS=", , )) - 寻找文本 (临时Cookie, "42ZfFFpfC71iS=", , ) - 13, "")
结束

// 解析HTML
网页对象 = 创建HTML对象 (响应内容)

// 获取content参数
节点列表 = 取HTML对象节点列表 (网页对象, "meta[id]")
如果 (取数组成员数 (节点列表) > 0)
节点 = 节点列表 [1]
内容参数 = 取HTML对象节点属性 (节点, "content")
结束

// 获取自执行方法文件代码
节点列表 = 取HTML对象节点列表 (网页对象, "script[charset]")
如果 (取数组成员数 (节点列表) > 0)
节点 = 节点列表 [1]
evalURL = 取HTML对象节点属性 (节点, "src")

// 补全URL
如果 (寻找文本 (evalURL, "http", , ) = 0)
evalURL = URL + evalURL
结束

eval代码 = HTTP读文件 (evalURL, 头信息, Cookies)
结束

// 获取ts代码
节点列表 = 取HTML对象节点列表 (网页对象, "script:not ([charset])")
如果 (取数组成员数 (节点列表) > 0)
节点 = 节点列表 [1]
ts代码 = 取HTML对象节点内容 (节点)
结束

// 释放HTML对象
释放HTML对象 (网页对象)

// 组合JS代码
JS代码 = "var content=\"" + 内容参数 + "\";\r\n" + 环境代码 + "\r\n" + ts代码 + "\r\n" + eval代码

// 保存JS代码到文件
写到文件 ("execjs.js", JS代码)

// 执行JS获取Cookie
临时Cookie = 执行JS ("get_cookie ()", JS代码)
如果 (寻找文本 (临时Cookie, "42ZfFFpfC71iT=", , ) > 0)
Cookies = Cookies + "; 42ZfFFpfC71iT=" + 子文本替换 (临时Cookie, 寻找文本 (临时Cookie, "42ZfFFpfC71iT=", , ) + 13, 寻找文本 (临时Cookie, ";", 寻找文本 (临时Cookie, "42ZfFFpfC71iT=", , )) - 寻找文本 (临时Cookie, "42ZfFFpfC71iT=", , ) - 13, "")
结束
.子程序尾

.子程序 主处理, 文本型
DLL命令名返回值类型公开备 注
(暂未填写DLL命令名)   
DLL库文件名:
(未填写库文件名)
在DLL库中对应命令名:
(未填写命令名)
参数名类 型传址数组备 注
方法文本型
请求URL文本型
.局部变量 返回结果, 文本型

// 获取Cookie
获取Cookie ()

// 执行JS获取处理后的URL
请求URL = 执行JS ("get_url (\"" + 方法 + "\", \"" + 请求URL + "\")", JS代码)

// 构建返回结果
返回结果 = "{""cookies"":""" + Cookies + """,""url"":""" + 请求URL + """}"

返回 (返回结果)
.子程序尾
.类尾
子程序名返回值类型公开备 注
执行JS文本型 
参数名类 型参考可空数组备 注
JS代码文本型
环境代码文本型
变量名类 型静态数组备 注
引擎整数型 
结果文本型 
// 创建JScript引擎
引擎 = 创建JScript引擎 ()

// 添加环境代码
执行JScript代码 (引擎, 环境代码)

// 执行JS代码并获取结果
结果 = 执行JScript代码 (引擎, JS代码)

// 释放引擎
释放JScript引擎 (引擎)

返回 (结果)
.子程序尾
子程序名返回值类型公开备 注
_启动子程序整数型 
参数名类 型参考可空数组备 注
命令行参数整数型
命令行参数值整数型
变量名类 型静态数组备 注
方法文本型 
请求URL文本型 
技术处理对象技术处理 
结果文本型 
// 获取命令行参数
如果 (命令行参数 > 1)
方法 = 取命令行参数 (1)
否则
方法 = "GET"
结束

如果 (命令行参数 > 2)
请求URL = 取命令行参数 (2)
否则
请求URL = "https://d.gd.189.cn/crmweb/sysmgr/login.action"
结束

// 创建技术处理对象并执行
技术处理对象 = 创建技术处理 ()
结果 = 技术处理对象.主处理 (方法, 请求URL)

// 输出结果
调试输出 (结果)

返回 (0)
.子程序尾


i支持库列表   支持库注释   
eAPI应用接口支持库
精易(未知支持库)

回复

使用道具 举报

结帖率:67% (10/15)

签到天数: 4 天

7
发表于 2025-6-18 23:27:00 | 只看该作者   江苏省苏州市
.版本 2  .子程序 __启动窗口_创建完毕  类_技术.初始化 () 类_技术.主程序 ("GET", "https://d.gd.189.cn/crmweb/sysmgr/login.action")  .子程序 初始化  头部信息 [1] = "accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7" 头部信息 [2] = "accept-language: zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7" 头部信息 [3] = "cache-control: no-cache" 头部信息 [4] = "pragma: no-cache" 头部信息 [5] = "priority: u=0, i" 头部信息 [6] = "referer: https://d.gd.189.cn/crmweb/sysmgr/login.action" 头部信息 [7] = "user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/135.0.0.0 Safari/537.36 Edg/135.0.0.0" 地址 = "https://d.gd.189.cn/crmweb/sysmgr/login.action" 会话Cookie = { }  ' 初始化为空数组 ' 初始化JS环境 JS环境.创建 () JS环境.语言 = "JScript"  .子程序 获取Cookie .局部变量 响应, 文本型 .局部变量 网页内容, 文本型 .局部变量 元数据, 文本型 .局部变量 JS文件地址, 文本型 .局部变量 JS代码, 文本型 .局部变量 脚本代码, 文本型  ' 第一次请求获取初始Cookie 响应 = 网页_访问 (地址, 0, , , 头部信息, , ) 会话Cookie [1] = 网页_取Cookie ("42ZfFFpfC71iS")  ' 解析HTML获取content参数 元数据 = 文本_取出中间文本 (响应, "<meta id=""", "content=""", , ) 元数据 = 文本_取出中间文本 (元数据, "content=""", """", , )  ' 获取JS文件地址 JS文件地址 = 文本_取出中间文本 (响应, "<script charset=""", "src=""", , ) JS文件地址 = 文本_取出中间文本 (JS文件地址, "src=""", """", , ) JS文件地址 = 网页_拼接URL (地址, JS文件地址)  ' 下载JS文件 JS代码 = 网页_访问 (JS文件地址, 0, , , 头部信息, , )  ' 获取页面中的脚本代码 脚本代码 = 文本_取出中间文本 (响应, "<script>", "</script>", , )  ' 读取本地JS环境文件 如果真 (文件是否存在 ("rs_env.js")) JS环境.执行 (读入文本 ("rs_env.js", ))  ' 组合执行JS代码 JS环境.执行 ("var content='" + 元数据 + "';") JS环境.执行 (脚本代码) JS环境.执行 (JS代码)  ' 调用JS函数获取Cookie JS环境.执行 ("var newCookie = get_cookie();") 会话Cookie [2] = JS环境.计算表达式 ("newCookie.split('; path=/')[0].split('=')[1]")  .子程序 主程序, 文本型 .参数 方法, 文本型 .参数 目标URL, 文本型 .局部变量 结果, 文本型  获取Cookie () JS环境.执行 ("var signedUrl = get_url('" + 方法 + "', '" + 目标URL + "');") 结果 = "{'cookies': {'42ZfFFpfC71iS': '" + 会话Cookie [1] + "', '42ZfFFpfC71iT': '" + 会话Cookie [2] + "'}, 'url': '" + JS环境.计算表达式 ("signedUrl") + "'}" 返回 (结果)  .子程序 网页_访问, 文本型 .参数 URL, 文本型 .参数 提交方式, 整数型, 可空, 0:GET 1:POST .参数 提交数据, 文本型, 可空 .参数 附加Cookie, 文本型, 可空 .参数 附加协议头, 文本型, 可空, 数组 .参数 返回Cookie, 文本型, 参考 可空 .参数 重定向, 逻辑型, 可空  ' 这里需要实现HTTP访问功能 ' 实际项目中应使用易语言的HTTP支持库 返回 ("")  .子程序 网页_取Cookie, 文本型 .参数 Cookie名称, 文本型  ' 从HTTP响应中提取指定Cookie 返回 ("")  .子程序 文本_取出中间文本, 文本型 .参数 源文本, 文本型 .参数 左边文本, 文本型 .参数 右边文本, 文本型 .参数 起始位置, 整数型, 可空 .参数 是否区分大小写, 逻辑型, 可空  ' 实现文本提取功能 返回 ("")  .子程序 网页_拼接URL, 文本型 .参数 基础URL, 文本型 .参数 相对URL, 文本型  ' 实现URL拼接 返回 ("")
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:[email protected]
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表