几种网站镜像的操作手法

in #cn7 years ago

什么是镜像

网站镜像就是网站的复制版本。因为网站是由很多网页组成的,将其中的一部分网页按原来的结构复制出来,就是一份镜像。比如,新浪在全国各地就有很多的镜像,他们和主站的版式,结构,功能都一样,只是在不同的服务器上而已。一般是个人网站的站长为自己的站做一个备份,
也就是说,一个站由于流量或其它原因访问不到时, 人们可以去其他一个一模一样的站看。

正规的镜像,有点类似CDN的说法,主站做后端,然后多个服务器进行镜像做前端,这样前端挂了,轮询,不影响后端的服务器。

那么外贸的镜像操作,就比较有点黑了,镜像竞争对手的网站,然后仿造对方的手法做优化,以获取排名,再对来路等进行判断跳转,达到对自己外贸网站的引流作用。

老农也做过这样的,不过我是比较彻底,直接对方网站站库打包走,然后SEMRUSH导出对应的排名的关键词,然后进行批量优化,达到窃取对方网站的效果。

镜像的手法有哪些

1 Nginx代理镜像

2 通过动态的脚本配合伪静态规则进行直接镜像

以上是我比较常用的,当然,肯定还有其他的镜像方法,不过我这里这是普及一下我最熟悉的操作手法。

Nginx镜像

1 安装nginx环境,也可以直接第三方的一键包,比如lnmp环境,AMH环境等。

AMH.sh的免费版本,或者收费版本,都有可视化的操作。

不过归于nginx代码来说,就是一句。


server
{
listen          80;
server_name     www.affadsense.com;
location / {
proxy_pass          http://bbs.aliyun.com/;
proxy_redirect      off;
proxy_set_header    X-Real-IP       $remote_addr;
proxy_set_header    X-Forwarded-For $proxy_add_x_forwarded_for;
}
}


这样的效果就是打开www.affadsense.com,显示的是bbs.affadsense.com的内容。

然后就是涉及到的一个缓存问题,因为不可能每一次访问,都重新再读取一下数据,缓存的话,可以提高我们的速度和效率。

因此。需要另外创建一些缓存的文件夹,和对应的缓存代码。

mkdir /home/cache/path -p #新建2个目录,放置缓存文件
mkdir /home/cache/temp -p

修改 /usr/local/nginx/conf/nginx.conf 新增以下代码,主要是缓存相关设置,请放置于 http{ ##这里 } 中,一般加在 log_format 上面或下面均可:

client_body_buffer_size  512k;
proxy_connect_timeout    5;
proxy_read_timeout       60;
proxy_send_timeout       5;
proxy_buffer_size        16k;
proxy_buffers            4 64k;
proxy_busy_buffers_size 128k;
proxy_temp_file_write_size 128k;
proxy_temp_path   /home/cache/temp;
proxy_cache_path  /home/cache/path levels=1:2 keys_zone=cache_one:500m inactive=7d max_size=30g;
#500m是内存占用,7d是7天无访问删除,30g是缓存占具硬盘空间

以下为虚拟主机配置文件,可另存成 .conf 放置于lnmp vhost 下面:

server
{
listen          80;
server_name     www.affadsense.com; #主机名
location / {
proxy_cache cache_one;
proxy_cache_valid  200 304 3d; #正常状态缓存时间3天
proxy_cache_key $host$uri$is_args$args;
proxy_pass          http://bbs.affadsense.com/; #反代的网站
proxy_redirect      off;
proxy_set_header    X-Real-IP       $remote_addr;
proxy_set_header    X-Forwarded-For $proxy_add_x_forwarded_for;
expires 10d; #默认10天缓存
access_log  /home/wwwlogs/vpsmm.log  access; #日志文件
}
}


点击几下网站,df -sh 命令,查看 /home/cache 目录大小,即可测试是否缓存成功。此脚本为前端全缓存,后端动态更新后,前端不会自动修改。可手动清理cache目录下文件。这个方法,可以用纯静态的形式来防CC,如果你的动态博客,受到CC攻击,可以尝试一下。

以下,部分摘抄自网络。

Nginx 字符串的替换

镜像的话,还需要配上字符串替换,需要配上nginx的模块

一个是nginx_substitutions_filter ,一个是nginx-subfilter-module

相关可以参考

http://www.361way.com/nginx-httpsubsmodule/2928.html

面板的镜像操作

这里简单点,我以amh.sh为例,安装过程见官网,我就不举例。

镜像

安装lngx的模块

然后创建一个环境。

镜像

最后进行镜像的操作。

然后直接进入模块,添加镜像的网站即可,并且本身已经搭配好了关键词替换模块,直接对着面板干就行了。

镜像

镜像

头部代码 可以插入你自己的判断来源跳转代码,底部可以放入统计代码等。

脚本上进行克隆

这样的脚本有一大堆,有开源的也有收费的,我自己用的比较频繁的是国外的几个PHP代码。

我会提供到论坛公开板块中,解压后,解压到网站的根目录即可。

然后直接浏览器打开 install目录 安装即可。

镜像

安装成功后,直接进入网站的后台。

镜像

然后add new site

输入我们要镜像的域名

镜像

然后选择Clones即可。

镜像

然后选择对应的域名,进行开始克隆的创建。

这种属于抓取到本地,所以比较耗时。

镜像

创建完毕后,就有一个Clone Link

我们对应打开就可以看到克隆的效果。

镜像

由于比较耗时,我就不等了,稍后这个脚本会分享到论坛公开版块。

脚本上进行镜像-sitecopy

SityCopy 4.1

这里是老毛子的,反正我看不懂,谷歌翻译一下就懂了。翻译后页面如下

镜像

我们对应填入网站和管理密码

然后点击开始 即可。

效果如图

镜像

脚本上进行镜像 - 曾经服务器上偷盗的一款别人卖的镜像脚本

这个安装比较复杂,好在有安装教程。

镜像

这里就不做细说,感兴趣的可以下载一看。

好像是之前对方卖的是上万元,所以拿到的时候压缩包也是这么命名的,时间比较久远,就不拿来示范了。

脚本上进行镜像 my1.4 镜像系统

来自广告中国的一个脚本高手分享。

使用很简单。

程序比较简陋,后台比较简.......洁(是的,非常的。。。。)

先建立管理员表(admin.sql),然后创建账号名和密码.

你可以在include/config.php中设置你的网站基本信息(网站后台也可以).
在include/config.inc.php中设置数据库信息

如果程序出现了排版问题,去目标站下载他们站的css文件,然后将css文件放到指定的文件夹里面.

效果还是不错。

镜像

就到这里了

还有一款更方便的PHP脚本镜像,印象里是入侵他们的demo站,打包走了源码,后来年前也有一位黑客大牛找我一起继续那个网站,不过网站漏洞也补了。

不过不知道存在硬盘哪里了,找不出来。

关于镜像,我是建议大家多熟悉nginx,用nginx最镜像,最简单。

不懂nginx,觉的麻烦的话,就安装下amh.sh,然后根据后面的面板提示,去安装。

就到这里了,不是什么很干货的的内容,主要普及一些我知道的简单的镜像方法。

image

码字不易,您的转发和赞赏是我的一大动力之一。

欢迎关注我的公众号,请爱护我,不要抄袭我。

image

欢迎加入我的论坛,与我们一起交流。

下面是加入小密圈/获取论坛邀请码购买渠道:

小密圈(入圈后私信圈主,看到会私信邀请码):

image

其他获取方式:

支付宝:image

微信支付:

image