cewl使用教程

张开发
2026/4/10 7:48:09 15 分钟阅读

分享文章

cewl使用教程
cewl 是一款专为渗透测试和密码破解设计的工具全称为 “Custom Word List Generator”自定义词表生成器。它通过爬取目标网站的内容提取有意义的单词并生成专用词表这些词表可用于密码猜测攻击如暴力破解。与通用词表相比cewl 生成的词表更具针对性因为它基于目标网站的实际内容如页面文本、标题、元数据等包含与目标相关的专业术语、品牌名、产品名等大大提高了密码破解的成功率。该工具广泛应用于安全评估中帮助测试人员评估目标系统的密码强度。二、工具参数说明基础选项参数中文说明-h, –help显示帮助信息-k, –keep保留下载的文件-d x, –depth x爬取深度默认值为 2-m, –min_word_length最小单词长度默认值为 3-x, –max_word_length最大单词长度默认不限制-o, –offsite允许爬虫访问其他网站–exclude包含需排除路径列表的文件–allowed路径必须匹配的正则表达式模式才会被爬取-w, –write将输出写入文件-u, –ua agent发送的用户代理字符串-n, –no-words不输出词表-g x, –groups x同时返回单词组–lowercase将所有解析的单词转为小写–with-numbers允许单词包含数字不仅限于字母–convert-umlauts转换常见的 ISO-8859-1Latin-1变音符号ä→ae, ö→oe, ü→ue, ß→ss数据提取选项参数中文说明-a, –meta包含元数据–meta_file file元数据的输出文件-e, –email包含电子邮件地址–email_file file电子邮件地址的输出文件–meta-temp-dir direxiftool 解析文件时使用的临时目录默认 /tmp-c, –count显示每个单词的出现次数-v, –verbose详细输出模式–debug额外的调试信息认证选项参数中文说明–auth_type认证类型Digest 或 basic–auth_user认证用户名–auth_pass认证密码代理支持选项参数中文说明–proxy_host代理主机–proxy_port代理端口默认 8080–proxy_username代理所需的用户名如需要–proxy_password代理所需的密码如需要头部选项参数中文说明–header, -H格式为 name:value 的请求头可传递多个必需参数参数中文说明url要爬取的网站 URL三、使用教程1. 基础使用方法cewl 的基本语法为cewl [选项] 目标网站URL2. 常用命令示例1基本词表生成默认设置cewl https://example.com功能以默认深度2层爬取 example.com提取长度≥3的单词并输出到终端适用场景快速生成基础词表2指定深度和输出文件cewl -d 5 -w example_words.txt https://example.com功能爬取深度设为5层将提取的单词保存到 example_words.txt 文件适用场景需要更全面的词表爬取更深层页面3设置单词长度范围cewl -m 5 -x 10 -w filtered_words.txt https://example.com功能只提取长度5-10个字符的单词保存到文件适用场景针对已知密码长度策略的目标4包含电子邮件和元数据cewl -e --email_file emails.txt -a --meta_file meta.txt https://example.com功能提取电子邮件地址保存到 emails.txt和元数据保存到 meta.txt适用场景需要收集目标网站相关邮箱或元数据信息5显示单词出现次数cewl -c -w words_with_count.txt https://example.com功能输出每个单词及其在网站中出现的次数优势可识别高频词汇这些词汇更可能被用作密码6使用代理爬取cewl --proxy_host 127.0.0.1 --proxy_port 8080 https://example.com功能通过本地代理127.0.0.1:8080爬取网站隐藏真实IP适用场景需要匿名爬取或突破网络限制7带认证的爬取cewl --auth_type basic --auth_user test --auth_pass pass123 https://example.com/protected功能使用基本认证用户名test密码pass123访问需要登录的页面适用场景目标网站存在需要认证的区域如后台8生成小写词表并包含数字cewl --lowercase --with-numbers -w lowercase_numbers.txt https://example.com功能将所有单词转为小写并允许包含数字优势生成的词表更符合常见密码习惯如小写字母数字组合3. 使用注意事项爬取礼仪避免对目标网站进行高频或深度过大的爬取可能导致对方服务器负载过高遵守网站的 robots.txt 规则尊重目标网站的爬取限制确保爬取行为符合法律法规未经允许不得爬取受保护内容词表优化生成的词表可结合其他工具如 john、hashcat进行密码破解可使用--lowercase选项统一大小写减少词表冗余结合密码规则如添加常见后缀!#123进一步扩展词表性能考虑爬取深度越大-d 参数值越高生成词表所需时间越长对大型网站建议限制爬取深度避免生成过大的词表文件特殊场景对于需要登录的网站可通过--auth_type等参数提供认证信息如需排除特定路径如/admin可使用--exclude参数指定排除列表文件

更多文章