Matlab-爬取论文数据
家电修理 2023-07-16 19:16www.caominkang.com电器维修
现在网上的爬虫程序很多,但大多不实用!今天,我们以爬取论文数据为例了解Matlab爬虫!
,明确我们要爬取什么数据!如下图,第一张图片表示年积日,第二张图片表示第一天里有哪些数据,我们打算爬取一年的ionPrf数据!
1.构造网址,分别是
‘https://data.cosmic.ucar.edu/gnss-ro/cosmic1/postProc/level2/2016/001/’
…
‘https://data.cosmic.ucar.edu/gnss-ro/cosmic1/postProc/level2/2016/365/’
the_url='https://data.cosmic.ucar.edu/gnss-ro/cosmic1/postProc/level2/2016/'; for i=1:365 doy=sprintf('%03d',i); url=[the_url,doy,'/']; end
2.读取页面源代码
contents=ebread(url);
3.解析页面源代码
hT=htmlTree(contents);
4.从hT中寻找...
A_label=findElement(hT,'a');
5.获取链接
url_donload=getAttribute(A_label,'href');
6.找到ionPrf文件在数组里的位置,然后提取出来
flag=cellfun(@isempty,regexp(url_donload,'ionPrf')); url_donload=url_donload(~flag);
7.组合网页链接
url_donload=url+url_donload;
结果示例https://data.cosmic.ucar.edu/gnss-ro/cosmic1/postProc/level2/2016/001/ionPrf_postProc_2016_001.tar.gz
8.下载数据
% filename自己设置,这里不展开 ebsave(filename,url_donload);
完整代码见面包多
上一篇:android 11 修改系统语言为中文
下一篇:操作系统面试题
空调维修
- 温岭冰箱全国统一服务热线-全国统一人工【7X2
- 荆州速热热水器维修(荆州热水器维修)
- 昆山热水器故障码5ER-昆山热水器故障码26
- 温岭洗衣机24小时服务电话—(7X24小时)登记报
- 统帅热水器售后维修服务电话—— (7X24小时)登
- 阳江中央空调统一电话热线-阳江空调官方售后电
- 乌鲁木齐阳春燃气灶厂家服务热线
- 珠海许昌集成灶售后服务电话-全国统一人工【
- 乌鲁木齐中央空调维修服务专线-乌鲁木齐中央空
- 新沂热水器故障电话码维修-新沂热水器常见故障
- 诸城壁挂炉24小时服务热线电话
- 靖江空调24小时服务电话-——售后维修中心电话
- 空调室外滴水管维修(空调室外排水管维修)
- 九江壁挂炉400全国服务电话-(7X24小时)登记报修
- 热水器故障码f.22怎么解决-热水器f0故障解决方法
- 营口热水器售后维修服务电话—— 全国统一人工