bbcwo 发表于 2023-9-26 20:35
数据百万呢
Av0x 发表于 2023-11-19 22:48
羡慕大佬啊,谢谢开源,但是没法对比本地或者数据库的内容然后确定是否存在重复 存在就跳过 不存在就入库 ...
咸鱼666 发表于 2023-11-19 23:19
如果是自带的数据类型,直接数组_是否存在_,如果是自定义数据类型,可能需要用到YYDS的映射,映射成json ...
Av0x 发表于 2023-11-19 23:28
就是常见的文本型数组,其实就是爬chong,因为我也不知道网站里面的内容是否爬过入库过,python里面的我 ...
咸鱼666 发表于 2023-11-19 23:43
保存本地的时候最好写到数据库或者什么方式,对应详情页网址和txt文件名 ...
欢迎光临 精易论坛 (https://125.confly.eu.org/) | Powered by Discuz! X3.4 |