最近研究py。找到的一个批量处理域名成顶级域名的一个小脚本分享给各位老哥

2022-01-02 21:30:54 5 zhangzhi451 9478

最近想写个自动化工具。因为想要配合oneforall 所以必须将收集到的域名处理成顶级域名。其实是想自己写的，可真是写起来才知道还是比较难处理的。于是想着网上找找看有没有前辈写好的，找到个靠谱的小脚本，已经忘了具体出处了

这种数据处理可真是难搞啊，看了前辈写的代码才算是明白了思路了
代码直接贴出来

path=r'xxxxx' #当前路径

readfilename="indomain.txt"

writefilename="outdomain.txt"

alldomainend=(".com", ".cn", ".com.cn", ".gov", ".net", ".edu.cn", ".net.cn", ".org.cn", ".co.jp", ".gov.cn",

                                        ".co.uk", "ac.cn", ".edu", ".tv",".info", ".ac", ".ag", ".am", ".at", ".be", ".biz", ".bz",

                                        ".cc", ".de", ".es", ".eu", ".fm", ".gs", ".hk", ".in", ".info", ".io", ".it", ".jp", ".la",

                                        ".md", ".ms", ".name", ".nl", ".nu", ".org", ".pl", ".ru", ".sc", ".se", ".sg", ".sh", ".tc",

                                        ".tk", ".tv", ".tw", ".us", ".co",".uk", ".vc", ".vg", ".ws", ".il", ".li", ".nz" )



#倒叙输出字符串

def string_reverse(m):

    num = len(m)

    a = []

    for i in range(num):

        a.append(m[num - 1 - i])  # 从最后一位的元素开始往新list内添加元素

    return a



def checkTopDomain(pDomain):

    tmpDomain="".join(pDomain)

    for i in alldomainend:

        if i==tmpDomain:

            return True

    return False



def GetTopDomain(pDomain):

    tmpDomain=pDomain.decode()

    reversestr=string_reverse(tmpDomain)

    n = len(reversestr)

    i = 0

    tmpbuf=''

    for i in range(n):

        if reversestr[i] !='.':

            if reversestr[i] !='/':

                tmpbuf+=reversestr[i]

                #print( tmpbuf)

            else:

                rebuf = string_reverse(tmpbuf)

                #print(rebuf)

                return (rebuf)

        else:

            tmpbuf+='.'

            rebuf=string_reverse(tmpbuf)

            if checkTopDomain(rebuf) ==False:

                #print(rebuf[1:])

                return rebuf[1:]

    return list(tmpDomain)





print("GetTopDomain start")



rfile=open(path+readfilename,'rb')

wfile=open(path+writefilename,'a')

line=rfile.readline()

while line:

    nline = line.split( )

    rDomain=nline[0]

    strreturn="".join(GetTopDomain(rDomain))

    #print(type(strreturn))

    wfile.writelines(strreturn)

    wfile.write('\n')

    line = rfile.readline()



print("GetTopDomain end")

rfile.close()

wfile.close()

这小代码写的真挺漂亮的。可以批量的处理各式各样的域名成顶级域名，但是ip类的不行。贴给各位师傅瞧瞧。

类别安全研究

关于作者

zhangzhi4514篇文章37篇回复

#!/usr/bin/python# -*- coding: UTF-8 -*-import linecache, sys, os, tldextractreload(sys)sys.setdefaultencoding('utf-8')readfilename = linecache.getlines("{}/indomain.txt".format(sys.path[0]))writefilename = "{}/outdomain.txt".format(sys.path[0])out = []for i in readfilename: urls = tldextract.extract(i) out.append("{0}.{1}".format(urls.domain, urls.suffix))S='\n'.join(str(num) for num in out) + '\n'open(writefilename,'w').write(S)

#!/usr/bin/python # -*- coding: UTF-8 -*- import linecache, sys, os, tldextract reload(sys) sys.setdefaultencoding('utf-8') readfilename = linecache.getlines("{}/indomain.txt".format(sys.path[0])) writefilename = "{}/outdomain.txt".format(sys.path[0]) out = [] for i in readfilename: urls = tldextract.extract(i) out.append("{0}.{1}".format(urls.domain, urls.suffix)) S='\n'.join(str(num) for num in out) + '\n' open(writefilename,'w').write(S)

评论5次

要评论？请先登录或注册

TOP1

frostxxx

2022-1-3 02:56

有点水，一个tldextract库搞定的事

回复|@ta|踩(0)|顶(2)

5楼

Stardust
2022-1-13 09:52

我最近因为工作需要，在网上找到了一个提取顶级域名＋统计重复域名的脚本。正则表达式复杂，表示学不会。

回复|@ta|踩(0)|顶(0)
4楼

Cheetach
2022-1-4 11:01

https://seo.juziseo.com/tools/domain/ 这个网站可以从url中提取出主域名来

回复|@ta|踩(0)|顶(0)
3楼

王八党
2022-1-3 20:38

http://tools.bugscaner.com/urlstourls.html 这个网站很方便各种小工具，里面就有提取URL的页面。还可以指纹

回复|@ta|踩(0)|顶(0)

2楼

1楼

qazwsxe11
2022-1-3 00:45

这个py有一个专门提取顶级域名的模块，百度一下就有了，老哥还是很强！

回复|@ta|踩(0)|顶(0)

最近研究py。找到的一个批量处理域名成顶级域名的一个小脚本分享给各位老哥

关于作者

评论5次

我最近因为工作需要，在网上找到了一个提取顶级域名＋统计重复域名的脚本。正则表达式复杂，表示学不会。

https://seo.juziseo.com/tools/domain/ 这个网站可以从url中提取出主域名来

http://tools.bugscaner.com/urlstourls.html 这个网站很方便各种小工具，里面就有提取URL的页面。还可以指纹

这个py有一个专门提取顶级域名的模块，百度一下就有了，老哥还是很强！

热门文章

安全资讯Anthropic称中国AI公司利用1600万次Claude查询复制模型

安全资讯MongoDB 存在严重未经身份验证的漏洞，可通过 zlib 压缩泄露敏感数据

安全资讯2024-2025 年最新网络黑客攻击技术综合报告

安全资讯关于个人挖矿的一个案件【T00ls法律讲堂第六十一期】

安全资讯大疆扫地机被Claude Code逆向并发掘漏洞可远程控制扫地机目前已修复

最新回复

利用openclaw检查大家行为管理。监控安装 ...

不要局限于这个注入了，既然有源码看看其 ...

回复 4# redn3ck /?tp=test'+and 1=conve ...

必须立即处理！这个漏洞太危险了，攻击者 ...

大佬nb👊

精华推荐

渗透测试记一次mssql注入

代码学习驱动编程：执行过滤驱动的实现与关键代码

渗透测试一次Coldfusion艰难渗透检测

渗透测试MYSQL注入个人总结(各种骚姿势)

渗透测试windows本地hash值获取和破解详解

星巴克数据泄露——数百名用户的个人数据被泄露

Google 修复两个已在野外被利用的 Chrome 零日漏洞（影响 Skia 和 V8)

微软确认 Windows 11 24H2/25H2 版本漏洞导致无法访问系统盘 C 盘。

提权实录：通过命名管道劫持可写服务

最近研究py。找到的一个批量处理域名成顶级域名的一个小脚本分享给各位老哥

关于作者

评论5次

我最近因为工作需要，在网上找到了一个提取顶级域名＋统计重复域名的脚本。正则表达式复杂，表示学不会。

https://seo.juziseo.com/tools/domain/ 这个网站可以从url中提取出主域名来

http://tools.bugscaner.com/urlstourls.html 这个网站很方便各种小工具，里面就有提取URL的页面。还可以指纹

这个py有一个专门提取顶级域名的模块，百度一下就有了，老哥还是很强！

热门文章

安全资讯Anthropic称中国AI公司利用1600万次Claude查询复制模型

安全资讯MongoDB 存在严重未经身份验证的漏洞，可通过 zlib 压缩泄露敏感数据

安全资讯2024-2025 年最新网络黑客攻击技术综合报告

安全资讯关于个人挖矿的一个案件【T00ls法律讲堂第六十一期】

安全资讯大疆扫地机被Claude Code逆向并发掘漏洞可远程控制扫地机 目前已修复

最新回复

精华推荐

渗透测试记一次mssql注入

代码学习驱动编程：执行过滤驱动的实现与关键代码

渗透测试一次Coldfusion艰难渗透检测

渗透测试MYSQL注入个人总结(各种骚姿势)

渗透测试windows本地hash值获取和破解详解

安全资讯大疆扫地机被Claude Code逆向并发掘漏洞可远程控制扫地机目前已修复