Files
wooyun_search/README.md

159 lines
6.6 KiB
Markdown
Raw Normal View History

2016-09-15 18:55:36 +08:00
# wooyun_search
2016-09-15 18:57:37 +08:00
**乌云公开漏洞、知识库搜索**
2017-03-07 23:44:28 +08:00
![index](index.jpg)
![search](search.jpg)
2017-01-01 22:18:52 +08:00
![author](author.jpg)
2016-09-15 18:57:37 +08:00
0x00.介绍
--------
+ 灵感来源于hanc00l的github项目[wooyun_public](https://github.com/hanc00l/wooyun_public)
2017-03-07 23:35:02 +08:00
+ wooyun_public基于flask或者tornado而本项目可以布置在apache、nginx等web服务器上。
2016-09-15 18:57:37 +08:00
+ 如果你有wooyun的静态网页数据那么我们可以开始了
2017-03-07 23:35:02 +08:00
+ 整个项目包括两个部分,第一部分是索引,将网页信息存储进数据库;第二部分是搜索,从数据库中查找信息。轻量级,支持进行二次开发。
2016-09-15 18:57:37 +08:00
2017-03-07 16:35:22 +08:00
+ 静态网页网盘链接:
```
2018-07-07 03:00:05 +08:00
bugs 链接: https://pan.baidu.com/s/1n_kkUaZZxcTEa4-v6sGa9Q 密码: sg98 (20180707)
drops 链接: https://pan.baidu.com/s/1r2Y7rfntwnjglX6HtzDk6w 密码: 738f (20180707)
2017-03-07 16:35:22 +08:00
```
2017-03-07 23:35:02 +08:00
2016-09-15 18:57:37 +08:00
0x01.依赖组件及说明
--------
+ python 2.7和pip
2017-03-07 16:35:22 +08:00
+ python依赖:MySQLdblxml(推荐)
2016-09-15 18:57:37 +08:00
2017-03-07 16:35:22 +08:00
+ mysql,php及任意web服务器php需开启pdo-mysql模块
2016-09-15 18:57:37 +08:00
2017-03-07 23:35:02 +08:00
+ 将本项目放进web服务器目录下bugs目录下为漏洞库文件drops目录下为知识库文件。
2016-11-09 21:52:51 +08:00
```
文件说明:
2017-03-07 16:35:22 +08:00
app_bugs.py bugs的索引依赖lxml
app_drops.py drops的索引依赖lxml
2016-11-09 21:52:51 +08:00
index.html 搜索的主页
search.php 执行搜索的页面
2017-03-07 16:35:22 +08:00
config.php php配置文件
2016-11-09 21:52:51 +08:00
./bugs bugs静态文件的目录
./drops drops静态文件的目录
```
2016-09-15 18:57:37 +08:00
0x02.索引配置
--------
2017-03-07 16:35:22 +08:00
+ app_bugs.py为建立bugs索引的脚本app_drops为建立drops索引的脚本。
2016-09-15 18:57:37 +08:00
2017-03-07 16:35:22 +08:00
+ 因为python脚本中open()函数打开的文件名不能为中文建议将drops目录下的中文文件名改为英文(例如,安全运维-xxxx.html=>safe-xxxx.html)
2016-09-15 18:57:37 +08:00
2017-03-07 23:35:02 +08:00
+ python脚本运行前需要修改如下语句更改参数如主机、端口号、用户名、密码。
2016-09-15 18:57:37 +08:00
```bash
conn=MySQLdb.connect(host='localhost',port=3306,user='root',passwd='',db='wooyun',charset='utf8')
```
2017-03-07 23:35:02 +08:00
+ 在mysql中建立数据库wooyun数据表bugs、drops分别建立字段title,dates,author,type,corp,doc与title,dates,author,type,doc。
2016-09-15 18:57:37 +08:00
```bash
2017-03-07 23:35:02 +08:00
CREATE DATABASE `wooyun` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
2016-09-15 18:57:37 +08:00
create table bugs(title VARCHAR(500),dates DATETIME, author CHAR(255),type CHAR(255),corp CHAR(255),doc VARCHAR(200) PRIMARY KEY);
create table drops(title VARCHAR(500),dates DATETIME, author CHAR(255),type CHAR(255),doc VARCHAR(200) PRIMARY KEY);
```
2017-03-07 23:35:02 +08:00
+ 注意mysql编码如下需要为utf-8character_set_server不为utf-8要修改mysql配置文件
```bash
use wooyun;
show variables like 'character%'; #查看编码
+--------------------------+----------------------------+
| Variable_name | Value |
+--------------------------+----------------------------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
```
如果编码错误会报错,比如:
```
Warning: Incorrect string value: '\xE5\xBB\xB6\xE9\x95\xBF...' for column 'title' at row 1
cur.execute("INSERT INTO `drops`(`title`,`dates`,`author`,`type`,`doc`) VALUES(%s,%s,%s,%s,%s)", tmp)
```
在mysql里查看会发现有一堆???
2016-09-15 18:57:37 +08:00
+ 之后就可以建立索引了
```bash
2017-03-07 16:35:22 +08:00
sudo python ./app_bugs.py
sudo python ./app_drops.py
2016-09-15 18:57:37 +08:00
```
2017-03-07 23:35:02 +08:00
+ bugs数目为40280drops数目为1264
2016-09-15 18:57:37 +08:00
```bash
use wooyun;
select count(*) from bugs;
select count(*) from drops;
```
0x03.搜索配置
--------
2017-03-07 23:35:02 +08:00
+ 修改config.php中修改如下语句中参数分别是主机、端口、用户名、密码与数据库。
2017-03-07 16:35:22 +08:00
```php
$config['host'] = '127.0.0.1';
$config['port'] = '3306';
$config['user'] = 'root';
$config['passwd'] = '';
$config['database'] = 'wooyun';
```
+ index.html与search.php样式来自于前端静态资源托管库。f12进入开发者模式如果样式文件访问不到可以使用本地或cdn的样式(bootstrap3.3.7、jquery3.1.0)。只需要更改两个网页里面的如下内容。
```
2017-03-07 23:35:02 +08:00
<link href="//lib.baomitu.com/twitter-bootstrap/3.3.7/css/bootstrap.min.css" rel="stylesheet" type="text/css">
2017-03-07 16:35:22 +08:00
<script type="text/javascript" src="//lib.baomitu.com/jquery/3.1.0/jquery.min.js"></script>
<script type="text/javascript" src="//lib.baomitu.com/twitter-bootstrap/3.3.7/js/bootstrap.min.js"></script>
2016-09-15 18:57:37 +08:00
```
2017-03-07 23:35:02 +08:00
+ 为了防止因为web服务器配置不正确导致访问http(s)://example.link/bugs/或者http(s)://example.link/drops/而进入index of页面泄露所有文件在目录下放置内容为空的index.html即可。
+ linux下由于selinux可能会导致无法连接数据库可以使用如下命令
```bash
getenforce //查看selinux状态
setenforce 0 //暂时关闭selinux
```
2017-03-07 16:35:22 +08:00
2016-09-15 18:57:37 +08:00
0x04.问题
--------
2016-09-15 19:18:43 +08:00
+ drops很奇怪的会都需web目录下的js而不是本身目录里的js所以drops的页面会有些乱。开发者模式看一下缺少的js为web目录/static/drops/css与web目录/static/drops/js。新建目录再把drops下的css、js文件夹复制过去即可
2016-09-15 18:57:37 +08:00
2016-10-08 11:19:18 +08:00
0x05.更新日志
--------
2016-11-09 21:52:51 +08:00
+ 2016.10.08更新上传了bugs.py。由于bugs部分页面(约143条)的author带有js正则匹配出的信息出错所以上传了bugs.py用于修正在app.py后执行python bugs.py。(2016.11.09已修正无需执行bugs.py)
2016-10-08 11:19:18 +08:00
2016-10-10 21:04:43 +08:00
+ 2016.10.10更新重写了search.php和search.css基本适配了各种浏览器和移动端。
2016-11-09 21:52:51 +08:00
+ 2016.11.09更新匹配索引将BeautifulSoup换成了lxml运行速度更快。优化了匹配(感谢@tuola)。
2017-01-01 22:18:52 +08:00
+ 2017.01.01更新:增加了作者搜索,优化了分页逻辑。
2017-03-07 16:35:22 +08:00
+ 2017.3.7更新重写了前端优化了php代码。
2017-01-01 22:18:52 +08:00
+ 欢迎反馈问题。可以提问issue也可以通过grt1stnull@gmail.com联系我。后续也会进行其他细节优化。
2016-10-08 11:19:18 +08:00
0x06.后记
2016-09-15 18:57:37 +08:00
--------
+ 本来打算把wooyun_public布置在我的树莓派上因为一些原因失败所以萌生了自己搭建的念头
2016-09-25 22:44:21 +08:00
+ 总共搭建了十天接触了js、bootstarap、beautifulsoup、mysqldb、mysqli和pdo。虽然以前也会css与php但这是第一次真正写一个动态网页感觉很棒。
2016-09-15 18:57:37 +08:00
2016-10-08 11:19:18 +08:00
0x07.其他
2016-09-15 18:57:37 +08:00
--------
+ 本程序只用于技术研究和个人使用程序组件均为开源程序漏洞和知识库来源于乌云公开漏洞版权归wooyun.org。
+ 新浪微博:http://weibo.com/grt1st
2016-09-25 22:44:21 +08:00
+ 个人邮箱:grt1stnull@gmail.com