Node.js 利用cheerio制作简单的网页爬虫示例 - 教程之家

本文介绍了Node.js 利用cheerio制作简单的网页爬虫示例，分享给大家，具有如下：

1. 目标

完成对网站的标题信息获取将获取到的信息输出在一个新文件工具: cheerio，使用npm下载npm install cheerio cheerio的API使用方法和jQuery的使用方法基本一致如果熟练使用jQuery，那么cheerio将会很快上手

2. 代码部分

介绍: 获取segment fault页面的列表标题，将获取到的标题列表编号，最终输出到pageTitle.txt文件里

const https = require('https');
const fs = require('fs');
const cheerio = require('cheerio');
const url = 'https://segmentfault.com/';

https.get(url, (res) => {
  let html = '';
  res.on('data', (data) => {
    html += data;
  });
  res.on('end', () => {
    getPageTitle(html);
  });
}).on('error', () => {
  console.log('获取网页信息错误');
});

function getPageTitle(html) {
  const $ = cheerio.load(html);
  let chapters = $('.news__item-title');
  let data = [];
  let index = 0;
  let fileName = 'pageTitle.txt';
  for (let i = 0; i < chapters.length; i++) {
    let chapterTitle = $(chapters[i]).find('a').text().trim();
    index++;
    data.push(`\n${index}, ${chapterTitle}`);
  }
  fs.writeFile(fileName, data, 'utf8', (err) => {
    if (err) {
      console.log('fs文件系统创建新文件失败', err);
    }
    console.log(`已成功将获取到的标题放入新文件${fileName}文件中`)
  })
}

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

觉得上面的内容有用吗？快来点个赞吧！

点赞() 我要打赏

温馨提示 : 本站内容来自会员投稿以及互联网，所有源码及教程均为作者总结编辑，请大家在使用过程中提前做好备份，以免发生无法预知的错误，源码类教程请勿直接用于生产环境！

可能感兴趣的文章

目录一.nvm介绍二.安装nvm 三.nvm的配置四.nvm的使用五.nvm的常用命令一.nvm介绍nvm 全称为 node.js version management，顾名思义是用于管理多个 nodejs 的版本控制工具...

我们是袋鼠云数栈 UED 团队，致力于打造优秀的一站式数据中台产品。我们始终保持工匠精神，探索前端道路，为社区积累并传播经验价值。本文作者：佳岚可编辑表格在数栈产品中是一种...

前言最近在做安全方面的项目，有个需求是在用户访问页面和关闭页面的时候，发送对应的数据。刚拿到需求的时候，觉得没啥东西，init 的时候发送一次，页面 unload 的时候发送一次就行...

Vue 3 简介1. Vue 3 的新特性Vue 3引入了许多新的特性，以提高框架的性能和可维护性。下面是一些主要的新特性： Composition API：这是Vue 3中最大的变化之一，它提供了一种更灵活...

Piniavue3 状态管理这里选择 pinia。虽然 vuex4 已支持 Vue 3 的 Composition API，但是 vue3 官网推荐新的应用使用 pinia —— vue3 pinia集中式状态管理redux、m...

一、代码分割一个大型前端应用，如果所有代码都放在单一文件，体积会特别大，下载时间长，白屏时间久，用户体验差。代码分割是一种有效的优化方式。提前把代码切分为多个小块，只下载当...

vue3 快速入门系列 - 组件通信组件通信在开发中非常重要，通信就是你给我一点东西，我给你一点东西。本篇将分析 vue3 中组件间的通信方式。Tip：下文提到的绝大多数通信方式在 vu...

在前端代码中很经常看到使用 setTimeout(fn, 0)，如下面代码所示，乍一看很多余，但是移除了可能会出现一些奇奇怪怪的问题。要解释这个就需要理解事件循环（Event Loop），下面会通过...

随着人工智能技术的不断进步，JavaScript 也迎来了自己的 AI 时代。JS-Torch 是一个全新的深度学习库，专为 JavaScript 设计，其语法习惯与广受欢迎的 PyTorch 框架高度相似。这...

前言我们每天都在用v-model，并且大家都知道在vue3中v-model是:modelValue和@update:modelValue的语法糖。那你知道v-model指令是如何变成组件上的modelValue属性和@update:mo...

可能感兴趣的文章

热门文章