博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
用js采集网页数据并插入数据库最快的方法
阅读量:4594 次
发布时间:2019-06-09

本文共 1335 字,大约阅读时间需要 4 分钟。

今天教大家一个快速采集网站数据的方法,因为太晚了,直接上例子,这里以采集易车网的产品数据为例。

思路:利用js获取网页数据并生成sql命令,执行sql命令把采集的数据插入数据库。

1.用谷歌浏览器或者火狐浏览器打开网站:http://car.bitauto.com/(品牌大全),http://car.bitauto.com/audi/(车型大全)

2.按F12进入调试模式,选择console并敲入以下代码

// JavaScript Document(function() {  var hm = document.createElement("script");  hm.src = "http://apps.bdimg.com/libs/jquery/2.1.4/jquery.min.js";  var s = document.getElementsByTagName("script")[0];   s.parentNode.insertBefore(hm, s);})();setTimeout(function(){    $.ajaxSettings.async = false;    //var data = [];    var sql = '';$(".list_pic li").each(function(index, element) {    var brand ={url: $(this).find("a:eq(1)").attr('href'),name:$(this).find("a:eq(1)").text(),cars:[]};    sql += "INSERT INTO `dp_jgcrm_brand`(pid,title) VALUES('0', '"+$(this).find("a:eq(1)").text()+"');\r\n\    set @pid = LAST_INSERT_ID();\r\n";    $.get(brand.url,function(html){        $(html).find(".cartype-section .p-list .name a").each(function(index, element) {            sql += "INSERT INTO `dp_jgcrm_brand`(pid,title) VALUES(@pid, '"+$(this).text()+"');\r\n";            brand.cars.push($(this).text());        });    });        //data.push(brand);});//console.log(data);console.log(sql)},2000)

3.复制sql命令,剩下的你们都应该知道了吧

学程序的难点是思路和方法,语言只是工具,如果你愿意与我一同学习,可以加我的微信:fafa2088

 for SE:汽车数据词典、汽车数据采集

转载于:https://www.cnblogs.com/godok/p/9446545.html

你可能感兴趣的文章
linux touch和vi建立的文件是什么文件类型的
查看>>
3-9
查看>>
导航右侧添加按钮、隐藏导航条和状态栏
查看>>
第二阶段冲刺6
查看>>
Java中final关键字的用法
查看>>
URL重写
查看>>
快速超越Chrome 微软IE9最新功能详解
查看>>
今天写一注册机时遇到猥亵的cookie设置。
查看>>
22万个木箱!TWaver 3D极限压榨
查看>>
NPOI使用手册
查看>>
GIT 常用命令
查看>>
php接收二进制文件转换成图片
查看>>
C++虚函数原理(转)
查看>>
InnoDB存储引擎介绍-(6) 一. Innodb Antelope 和Barracuda区别
查看>>
字典树的动态与静态模板
查看>>
sscanf的最基础用法(非原创)
查看>>
A new start
查看>>
GIt-恢复进度
查看>>
[转载]几个有趣的Linux命令
查看>>
[原]openstack-kilo--issue(十六) instance can't get ip 虚拟机不能得到ip(1)
查看>>