可以用来写爬虫的轮子nipper是怎样的

这篇文章将为大家详细讲解有关可以用来写爬虫的轮子nipper是怎样的,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

成都创新互联是一家专业从事成都网站设计、成都网站建设、网页设计的品牌网络公司。如今是成都地区具影响力的网站设计公司,作为专业的成都网站建设公司,成都创新互联依托强大的技术实力、以及多年的网站运营经验,为您提供专业的成都网站建设、营销型网站建设及网站设计开发服务!

写了一个轮子nipper  ,顾名思义就是用来像镊子一样操作HTML的。  
可以使用css选择器的语法在给定的html里查询需要的元素,甚至是修改这些元素。
  
    
use nipper::Document;           let html = include_str!("../test-pages/hacker_news.html");                   let document = Document::from(html);                  
                  document.select("tr.athing").iter().for_each(|athing| {                      let title = athing.select(".title a");                      let source = title.select(".sitestr");                      // The next sibling.                      let meta = athing.next();                      let score = meta.select("span.score");                      let hnuser = meta.select("a.hnuser");                      let age = meta.select("span.age");                      // The last matched element.                      let comment = meta.select("a").last();                  
                     println!("Title: {}", title.text());                      if source.exists() {                          println!("> from: {}", source.text());                      }                      if score.exists() {                          println!("> {}", score.text());                      }                      if hnuser.exists() {                          println!("> by {}", hnuser.text());                      }                      println!("> {}", age.text());                      println!("> {}", comment.text());                      println!();                   });
 
其实rust早就有了类似的crate,但是这些轮子语法都有点繁琐,而且基本都只能查询,不能修改元素,

关于可以用来写爬虫的轮子nipper是怎样的就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

文章题目:可以用来写爬虫的轮子nipper是怎样的
标题来源:https://www.cdcxhl.com/article34/pjejpe.html

成都网站建设公司_创新互联,为您提供面包屑导航定制开发ChatGPT小程序开发网站排名关键词优化

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

绵阳服务器托管