php不带数据库的采集 php不带数据库的采集方式

php采集大数据的方案

1、建议你读写数据和下载图片分开,各用不同的进程完成。

创新互联主要从事成都网站设计、做网站、网页设计、企业做网站、公司建网站等业务。立足成都服务长洲,10余年网站建设经验,价格优惠、服务专业,欢迎来电咨询建站服务:18980820575

比如说,取数据用get-data.php,下载图片用get-image.php。

2、多进程的话,php可以简单的用pcntl_fork()。这样可以并发多个子进程。

但是我不建议你用fork,我建议你安装一个gearman worker。这样你要并发几个,就启几个worker,写代码简单,根本不用在代码里考虑thread啊,process等等。

3、综上,解决方案这样:

(1)安装gearman worker。

(2)写一个get-data.php,在crontab里设置它每5分钟执行一次,只负责读数据,然后把读回来的数据一条一条的扔到 gearman worker的队列里;

然后再写一个处理数据的脚本作为worker,例如叫process-data.php,这个脚本常驻内存。它作为worker从geraman 队列里读出一条一条的数据,然后跟你的数据库老数据比较,进行你的业务逻辑。如果你要10个并发,那就启动10个process-data.php好了。处理完后,如果图片地址有变动需要下载图片,就把图片地址扔到 gearman worker的另一个队列里。

(3)再写一个download-data.php,作为下载图片的worker,同样,你启动10个20个并发随便你。这个进程也常驻内存运行,从gearman worker的图片数据队列里取数据出来,下载图片

4、常驻进程的话,就是在代码里写个while(true)死循环,让它一直运行好了。如果怕内存泄露啥的,你可以每循环10万次退出一下。然后在crontab里设置,每分钟检查一下进程有没有启动,比如说这样启动3个process-data worker进程:

* * * * * flock -xn /tmp/process-data.1.lock -c '/usr/bin/php /process-data.php /dev/null 21'

* * * * * flock -xn /tmp/process-data.2.lock -c '/usr/bin/php /process-data.php /dev/null 21'

* * * * * flock -xn /tmp/process-data.3.lock -c '/usr/bin/php /process-data.php /dev/null 21'

不知道你明白了没有

用HTML PHP提交表单 如何不用数据库存储并查看数据

将表单内容以post方式传递到服务器上找个地方,用时间戳来命名文件,以.txt文件存储,定义自己需要的格式,就行啦,要查看数据的时候,直接遍历读取文件就可以查看了

php不使用数据库

信息终究是要存储的,最终都需要存储在文件中,数据库在这个事情上可以让为是帮你管理一大堆的“文件”,其他的如csv、excel,也算是变相的一种数据库了;

如果非不要数据库,建议直接生成静态html吧,可以用markdown之类的工具。修改不方便。

网页名称:php不带数据库的采集 php不带数据库的采集方式
本文地址:https://www.cdcxhl.com/article34/ddijope.html

成都网站建设公司_创新互联,为您提供定制网站云服务器标签优化网站导航网站改版搜索引擎优化

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

成都定制网站建设