蓝奏云下载百度云下载 百度云提取码为:gqud,建议通过蓝奏云下载,蓝奏云如果失效可选择百度云或联系管理员补更。 - ## 开始部署
- ### 创建数据库
- 创建名为`pan`的数据库,编码设为`utf-8`。然后导入`sql`,完成表的创建。
- ### 网站部署
- 支持`nginx`,`apache` 服务器。
- __apache__ 需要开启 *mod_rewrite* 。
- __nginx__ 配置如下
- ```
- location /
- {
- index index.php;
- try_files $uri $uri/ /index.php/$uri;
- }
- location ~ [^/]\.php(/|$)
- {
- fastcgi_pass 127.0.0.1:9000;
- fastcgi_index index.php;
- include fastcgi.conf;
- include pathinfo.conf;
- }
- ```
- #### 配置文件修改
- `config.php` 文件修改网站标题,描述等信息
- `database.php` 修改数据库账号,密码等信息
- > 网站是基于CodeIgniter 框架开发的,如安装,部署,或二次开发有问题,请参考[官网文档]( http://codeigniter.org.cn/user_guide/general/welcome.html)
- ### 启动爬虫
- 进入 `spider/`目录,修改`spider.py` 中数据库信息。
- __如果你是第一次部署,需运行下面命令,完成做种__
- ```
- python spider.py --seed-user
- ```
- 上面其实就是抓取百度云热门分享用户的相关信息,然后从他们开始入手爬取数据
- 然后运行
- ```
- python spider.py
- ```
- 此时爬虫已经开始工作了
- ### 安装xunsearch
- 目前使用__xunsearch__作为搜索引擎,后面会更换为`elasticsearch`。
- 安装过程请参考(不需要安装,PHP SDK,我已经整合到web里了)
- http://xunsearch.com/doc/php/guide/start.installation
- ### 索引数据
- 上面我们完成了爬虫的数据抓取,网站的搭建,但还不能搜索,下面开始最后一步,索引的建立。
- 进入 `indexer/`目录,在`indexer.php`中将$prefix,替换为你web的根路径
- ```
- require '$prefix/application/helpers/xs/lib/XS.php';
- ```
- 并修改数据库账号密码
- 然后运行
- ```
- python ./index.php
- ```
|