当前,定时任务对于一个网站来说,是一个必要的需求,比如米扑博客的定时发布文章、定时清理垃圾信息、米扑代理的定时发送邮件、发送短信提醒等。

现在的网站大多数都是采用PHP动态语言开发的,而对于PHP没有Java和.Net这种AppServer的概念,而http协议是一个无状态的协议,PHP只能被用户触发,被调用,调用后会自动退出内存,没有常驻内存,一般是无法实现长连接的定时任务。

那么,如果非要PHP去实现定时任务, 有哪些方法呢?米扑博客本文整理总结了几种解决方案。

 

一、  简单直接不顾后果型

<?php
	ignore_user_abort();				// 关掉浏览器,PHP脚本也可以继续执行.
	set_time_limit(0);					// 通过set_time_limit(0)可以让程序无限制的执行下去
	ini_set('memory_limit','1024M'); 	// 设置内存限制
	$interval = 60*30;					// 每隔半小时运行
	do{
	  // ToDo mimvp task
	  sleep($interval);					// 等待5分钟
	}
	while(true);
?>

缺点:启动之后,便无法控制,除非终止 PHP 宿主,一般不推荐采用这样方法,除非你是黑客。

 

二、  简单可控型

config.php
 
<?php
	return 1;
?>


cron.php
   
ignore_user_abort();	// 关掉浏览器,PHP脚本也可以继续执行.
set_time_limit(0);		// 通过set_time_limit(0)可以让程序无限制的执行下去
$interval = 60*30;		// 每隔半小时运行
do{
  $run = include 'config.php';		// 通过配置文件,来实现停止程序
  if(!$run) die('process abort');
   
  //ToDo mimvp task
  sleep($interval);		// 等待5分钟
}
while(true);

通过改变config.php 的 return 0 , 来实现停止程序,一个可行的办法是config.php文件和某个特殊表单交互,通过HTML页面设置一些变量来进行配置

缺点:占系统资源, 长时间运行,会有一些意想不到的隐患。比如内存管理、有人恶意更改配置文件等

 

 

三、 简单改进型

<?php
	$time = 15;
	$url = "http://".$_SERVER['HTTP_HOST'].$_SERVER['REQUEST_URI'];

	//  ToDo mimvp task

	sleep($time);
	file_get_contents($url);
?>

php脚本sleep 一段时间之后通过访问自身的方式继续执行,就好像接力赛跑一样..

这样就能保证每个PHP脚本执行时间不会太长,也就不受time_out的限制了.

因为,每一次一次循环php文件都是独立执行,所以这种方法避免了time_out的限制. 但是最好和上边一样加上控制代码. cofig.php , 以便能够终止进程.

 

四、 服务器定时任务

Unix平台

如果您使用 Unix 系统,您需要在您的 PHP 脚本的最前面加上一行特殊的代码,使得它能够被执行,这样系统就能知道用什么样的程序要运行该脚本。

为 Unix 系统增加的第一行代码不会影响该脚本在 Windows 下的运行,因此您也可以用该方法编写跨平台的脚本程序。

1、在Crontab中使用PHP执行脚本

就像在Crontab中调用普通的shell脚本一样(具体Crontab用法),使用PHP程序来调用PHP脚本,每一小时执行 myscript.php 如下:

# crontab -e
00 * * * * /usr/local/bin/php /home/john/myscript.php

/usr/local/bin/php为PHP程序的php命令路径。

 

2、在Crontab中使用URL执行脚本

如果你的PHP脚本可以通过URL触发,你可以使用 lynx 或 curl 或 wget 来配置你的Crontab。

下面的例子是使用Lynx文本浏览器访问URL来每小时执行PHP脚本,Lynx文本浏览器默认使用对话方式打开URL。

但是,像下面的,我们在lynx命令行中使用-dump选项来把URL的输出转换来标准输出。

00 * * * * lynx -dump http://www.sf.net/myscript.php

 

下面的例子是使用 CURL 访问URL来每5分执行PHP脚本,Curl默认在标准输出显示输出。

使用 "curl -o" 选项,你也可以把脚本的输出转储到临时文件 temp_log.txt。

*/5 * * * * /usr/bin/curl -o temp_log.txt http://www.sf.net/myscript.php

 

下面的例子是使用WGET访问URL来每10分执行PHP脚本。

-q 选项表示安静模式

"-O temp_log.txt" 表示输出会发送到临时文件。

*/10 * * * * /usr/bin/wget -q -O temp_log.txt http://www.sf.net/myscript.php

 

五、 ini_set函数用法详解

PHP ini_set用来设置php.ini的值,在函数执行的时候生效,脚本结束后,设置失效。

无需打开php.ini文件,就能修改配置,对于虚拟空间来说,很方便。

函数格式:string ini_set(string $varname, string $newvalue)

不是所有的参数都可以配置,可以查看手册中的列表。

 

常见的设置:

@ini_set('memory_limit', '64M');

menory_limit:设定一个脚本所能够申请到的最大内存字节数,这有利于写的不好的脚本消耗服务器上的可用内存。@符号代表不输出错误

 

@ini_set('display_errors', 1);

display_errors:设置错误信息的类别。

 

@ini_set('session.auto_start', 0);

session.auto_start:是否自动开session处理,设置为1时,程序中不用session_start()来手动开启session也可使用session,如果参数为0,又没手动开启session,则会报错。

 

@ini_set('session.cache_expire', 180);

session.cache_expire:指定会话页面在客户端cache中的有限期(分钟)缺省下为180分钟。

如果设置了session.cache_limiter=nocache时,此处设置无效。

 

@ini_set('session.use_cookies', 1);

session.use_cookies:是否使用cookie在客户端保存会话ID;

 

@ini_set('session.use_trans_sid', 0);

session.use_trans_sid:是否使用明码在URL中显示SID(会话ID)

默认是禁止的,因为它会给你用户带来安全危险:

    用户可能将包含有效的sid的URL通过email/irc/QQ/MSN等途径告诉其他人。

    包含有效sid的URL可能会保存在公用电脑上。

    用户可能保存带有固定不变的SID的URL在他们的收藏夹或者浏览历史记录里。

基于URL的会话管理总是比基于Cookie的会话管理有更多的风险,所以应当禁用。

 

PHP定时任务是一个非常有意思的东西,以上就是本文提供的一些解决方案

你也可以通过本文的思路,开发出自己的一种解决方案。

 

最后,定时任务大多时候,需要跟异步后台处理相结合

在此,米扑博客推荐一篇:PHP 异步后台处理

 

 

参考推荐

WordPress 改进定时任务(wp-cron.php)

PHP 多线程的应用实例

PHP 异步后台处理