• Babel 插件通关秘籍
  • Git 原理详解及实用指南
  • Nest 通关秘籍
  • React 通关秘籍
  • TypeScript 全面进阶指南
  • TypeScript 类型体操通关秘籍
  • 现代CSS
  • Babel 插件通关秘籍
  • Git 原理详解及实用指南
  • Nest 通关秘籍
  • React 通关秘籍
  • TypeScript 全面进阶指南
  • TypeScript 类型体操通关秘籍
  • 现代CSS
  • Nest 通关秘籍

    • 1.开篇词
    • 2.给你 5 个学习 Nest 的理由,你会心动么
    • 3.Nest 基础概念扫盲
    • 4.快速掌握 Nest CLI
    • 5.五种HTTP数据传输方式
    • 6.IoC 解决了什么痛点问题?
    • 7.如何调试 Nest 项目
    • 8.使用多种 Provider,灵活注入对象
    • 9.全局模块和生命周期
    • 10.AOP 架构有什么好处?
    • 11.一网打尽 Nest 全部装饰器
    • 12.Nest 如何自定义装饰器
    • 13.Metadata 和 Reflector
    • 14.ExecutionContext:切换不同上下文
    • 15.Module 和 Provider 的循环依赖怎么处理?
    • 16.如何创建动态模块
    • 17.Nest 和 Express 的关系,如何切到 fastify
    • 18.Nest 的 Middleware
    • 19.RxJS 和 Interceptor
    • 20.内置 Pipe 和自定义 Pipe
    • 21.如何使用 ValidationPipe 验证 post 请求参数
    • 22.如何自定义 Exception Filter
    • 23.图解串一串 Nest 核心概念
    • 24.接口如何实现多版本共存
    • 25.Express 如何使用 multer 实现文件上传
    • 26.Nest 如何使用 multer 实现文件上传
    • 27.图书管理系统:需求分析和原型图
    • 28.图书管理系统:用户模块后端开发
    • 29.图书管理系统:图书模块后端开发
    • 30.图书管理系统:用户模块前端开发
    • 31.图书管理系统:图书模块前端开发--图书搜索
    • 32.图书管理系统:图书模块前端开发--图书增删改
    • 33.图书管理系统:项目总结
    • 34.大文件分片上传
    • 35.最完美的 OSS 上传方案
    • 36.Nest 里如何打印日志?
    • 37.为什么 Node 里要用 Winston 打印日志?
    • 38.Nest 集成日志框架 Winston
    • 39.通过 Desktop 学 Docker 也太简单了
    • 40.你的第一个 Dockerfile
    • 41.Nest 项目如何编写 Dockerfile
    • 42.提升 Dockerfile 水平的 5 个技巧
    • 43.Docker 是怎么实现的?
    • 44.为什么 Node 应用要用 PM2 来跑?
    • 45.快速入门 MySQL
    • 46.SQL 查询语句的所有语法和函数
    • 47.一对一、join 查询、级联方式
    • 48.一对多、多对多关系的表设计
    • 49.子查询和 EXISTS
    • 50.SQL 综合练习
    • 51.MySQL 的事务和隔离级别
    • 52.MySQL 的视图、存储过程和函数
    • 53.使用 Node 操作 MySQL 的两种方式
    • 54.快速掌握 TypeORM
    • 55.TypeORM 一对一的映射和关联 CRUD
    • 56.TypeORM 一对多的映射和关联 CRUD
    • 57.TypeORM 多对多的映射和关联 CRUD
    • 58.在 Nest 里集成 TypeORM
    • 59.TypeORM 如何保存任意层级的关系?
    • 60.为什么生产环境要用 TypeORM 的 migration 迁移功能?
    • 61.Nest 项目里如何使用 TypeORM 迁移
    • 62.如何动态读取不同环境的配置?
    • 63.快速入门 Redis
    • 64.在 Nest 里操作 Redis
    • 65.为什么不用 cache-manager 操作 Redis?
    • 66.两种登录状态保存方式:JWT、Session
    • 67.Nest 里实现 Session 和 JWT
    • 68.MySQL + TypeORM + JWT 实现登录注册
    • 69.基于 ACL 实现权限控制
    • 70.基于 RBAC 实现权限控制
    • 71.基于 access_token 和 refresh_token 实现登录状态无感刷新
    • 72.单 token 无限续期,实现登录状态无感刷新
    • 73.使用 passport 做身份认证
    • 74.passport 实现 GitHub 三方账号登录
    • 75.passport 实现 Google 三方账号登录
    • 76.为什么要使用 Docker Compose ?
    • 77.Docker 容器通信的最简单方式:桥接网络
    • 78.Docker 支持重启策略,是否还需要 PM2
    • 79.快速掌握 Nginx 的 2 大核心用法
    • 80.基于 Nginx 实现灰度系统
    • 81.基于 Redis 实现分布式 session
    • 82.Redis + 高德地图,实现附近的充电宝
    • 83.用 Swagger 自动生成 api 文档
    • 84.如何灵活创建 DTO
    • 85.class-validator 的内置装饰器,如何自定义装饰器
    • 86.序列化 Entity,你不需要 VO 对象
    • 87.手写序列化 Entity 的拦截器
    • 88.使用 compodoc 生成文档
    • 89.Node 如何发邮件?
    • 90.实现基于邮箱验证码的登录
    • 91.定时任务 + Redis 实现阅读量计数
    • 92.Nest 的 3 种定时任务
    • 93.Nest 里如何实现事件通信?
    • 94.HttpModule + pinyin 实现天气预报查询服务
    • 95.如何记录请求日志
    • 96.短链服务?自己写一个
    • 97.Nest 实现 Server Sent Event 数据推送
    • 98.用 minio 自己搭一个 OSS 服务
    • 99.前端如何直传文件到 Minio
    • 100.基于 sharp 实现 gif 压缩工具
    • 101.大文件如何实现流式下载?
    • 102.Puppeteer 实现爬虫,爬取 BOSS 直聘全部前端岗位
    • 103.实现扫二维码登录
    • 104.Nest 的 REPL 模式
    • 105.实现 Excel 导入导出
    • 106.如何用代码动态生成 PPT
    • 107.如何拿到服务器 CPU、内存、磁盘状态
    • 108.Nest 如何实现国际化?
    • 109.会议室预订系统:需求分析和原型图
    • 110.会议室预订系统:技术方案和数据库设计
    • 111.会议室预订系统:用户管理模块-用户注册
    • 112.会议室预订系统:用户管理模块-配置抽离、登录认证鉴权
    • 113.会议室预订系统:用户管理模块-interceptor、修改信息接口
    • 114.会议室预订系统:用户管理模块-用户列表和分页查询
    • 115.会议室预订系统:用户管理模块-swagger 接口文档
    • 116.会议室预订系统:用户管理模块-用户端登录注册页面
    • 117.会议室预订系统:用户管理模块-用户端信息修改页面
    • 118.会议室预订系统:用户管理模块-头像上传
    • 119.会议室预订系统:用户管理模块-管理端用户列表页面
    • 120.会议室预订系统:用户管理模块-管理端信息修改页面
    • 121.会议室预订系统:会议室管理模块-后端开发
    • 122.会议室预订系统:会议室管理模块-管理端前端开发
    • 123.会议室预订系统:会议室管理模块-用户端前端开发
    • 124.会议室预订系统:预定管理模块-后端开发
    • 125.会议室预订系统:预定管理模块-管理端前端开发
    • 126.会议室预订系统:预定管理模块-用户端前端开发
    • 127.会议室预订系统:统计管理模块-后端开发
    • 128.会议室预订系统:统计管理模块-前端开发
    • 129.会议室预订系统:后端项目部署到阿里云
    • 130.会议室预订系统:前端项目部署到阿里云
    • 131.会议室预定系统:用 migration 初始化表和数据
    • 132.会议室预定系统:文件上传 OSS
    • 133.会议室预定系统:Google 账号登录后端开发
    • 134.会议室预定系统:Google 账号登录前端开发
    • 135.会议室预定系统:后端代码优化
    • 136.会议室预定系统:集成日志框架 winston
    • 137.会议室预定系统:前端代码优化
    • 138.会议室预定系统:全部功能测试
    • 139.会议室预定系统:项目总结
    • 140.Nest 如何创建微服务?
    • 141.Nest 的 Monorepo 和 Library
    • 142.用 Etcd 实现微服务配置中心和注册中心
    • 143.Nest 集成 Etcd 做注册中心、配置中心
    • 144.用 Nacos 实现微服务配置中心和注册中心
    • 145.基于 gRPC 实现跨语言的微服务通信
    • 146.快速入门 ORM 框架 Prisma
    • 147.Prisma 的全部命令
    • 148.Prisma 的全部 schema 语法
    • 149.Primsa Client 单表 CRUD 的全部 api
    • 150.Prisma Client 多表 CRUD 的全部 api
    • 151.在 Nest 里集成 Prisma
    • 152.为什么前端监控系统要用 RabbitMQ?
    • 153.基于 Redis 实现关注关系
    • 154.基于 Redis 实现各种排行榜(周榜、月榜、年榜)
    • 155.考试系统:需求分析
    • 156.考试系统:技术方案和数据库设计
    • 157.考试系统:微服务、Lib 拆分
    • 158.考试系统;用户注册
    • 159.考试系统:用户登录、修改密码
    • 160.考试系统:考试微服务
    • 161.考试系统:登录、注册页面
    • 162.考试系统:修改密码、试卷列表页面
    • 163.考试系统:新增试卷、回收站
    • 164.考试系统:试卷编辑器
    • 165.考试系统:试卷回显、预览、保存
    • 166.考试系统:答卷微服务
    • 167.考试系统:答题页面
    • 168.考试系统:自动判卷
    • 169.考试系统:分析微服务、排行榜页面
    • 170.考试系统:整体测试
    • 171.考试系统:项目总结
    • 172.用 Node.js 手写 WebSocket 协议
    • 173.Nest 开发 WebSocket 服务
    • 174.基于 Socket.io 的 room 实现群聊
    • 175.聊天室:需求分析和原型图
    • 176.聊天室:技术选型和数据库设计
    • 177.聊天室:用户注册
    • 178.聊天室:用户登录
    • 179.聊天室:修改密码、修改信息
    • 180.聊天室:好友列表、发送好友申请
    • 181.聊天室:创建聊天室、加入群聊
    • 182.聊天室:登录、注册页面开发
    • 183.聊天室:修改密码、信息页面开发
    • 184.聊天室:头像上传
    • 185.聊天室:好友∕群聊列表页面
    • 186.聊天室:添加好友弹窗、通知页面
    • 187.聊天室:聊天功能后端开发
    • 188.聊天室:聊天功能前端开发
    • 189.聊天室:一对一聊天
    • 190.聊天室:创建群聊、进入群聊
    • 191.聊天室:发送表情、图片、文件
    • 192.聊天室:收藏
    • 193.聊天室:全部功能测试
    • 194.聊天室:项目总结
    • 195.MongoDB 快速入门
    • 196.使用 mongoose 操作 MongoDB 数据库
    • 197.GraphQL 快速入门
    • 198.Nest 开发 GraphQL 服务:实现 CRUD
    • 199.GraphQL + Primsa + React 实现 TodoList
    • 200.如何调试 Nest 源码?

假设有一天,你需要整理一份中国所有大学信息的 ppt。

大学的信息是能搜到的,但是一份份整理到 ppt 里也太麻烦了。

能不能用代码自动生成 PPT呢?

自然是可以的。

这里大学的信息可以从中国大学 MOOC这里抓取:

我们用 puppeteer 来爬取大学的校徽、名字、介绍,然后用这些信息来生成 pdf 等。

创建个 Nest 项目:

nest new ppt-generate

安装 puppeteer:

npm install --save puppeteer

然后在 AppService 里引入下:

import { Injectable } from "@nestjs/common";
import puppeteer from "puppeteer";

let cache = null;

@Injectable()
export class AppService {
    getHello(): string {
        return "Hello World!";
    }

    async getUniversityData() {
        if (cache) {
            return cache;
        }

        const browser = await puppeteer.launch({
            headless: true,
            defaultViewport: {
                width: 0,
                height: 0,
            },
        });

        const page = await browser.newPage();

        await page.goto("https://www.icourse163.org/university/view/all.htm");

        await page.waitForSelector(".u-usitys");

        const universityList = await page.$eval(".u-usitys", (el) => {
            return [...el.querySelectorAll(".u-usity")].map((item) => {
                return {
                    name: item.querySelector("img").alt,
                    img: item.querySelector("img").src,
                    link: item.getAttribute("href"),
                };
            });
        });

        await browser.close();

        cache = universityList;

        return universityList;
    }
}

这里用 puppeteer 抓取中国大学 mooc 的学校列表的信息。

headless 指定 true,不用看界面了。

然后简单在内存做了下 cache,没用 redis。

在 AppController 里加个路由:

@Get('list')
async universityList() {
    return this.appService.getUniversityData();
}

把服务跑起来:

npm run start:dev

试一下:

然后继续点进详情页,拿到学校的描述:

抓取每个学校数据的时间太长,我们用 SSE(server sent event) 的方式返回数据。

Sever Sent Event 就是服务端返回的 Content-Type 是 text/event-stream,这是一个流,可以多次返回内容,通过这种方式来随时推送数据。

SSE 类似这样用:

改下 AppController

@Sse('list')
async universityList() {
    return this.appService.getUniversityData();
}

还有 AppService

import { Injectable } from "@nestjs/common";
import puppeteer from "puppeteer";
import { Observable, Subscriber } from "rxjs";

let cache = null;

@Injectable()
export class AppService {
    getHello(): string {
        return "Hello World!";
    }

    async getUniversityData() {
        if (cache) {
            return cache;
        }

        async function getData(observer: Subscriber<Record<string, any>>) {
            const browser = await puppeteer.launch({
                headless: true,
                defaultViewport: {
                    width: 0,
                    height: 0,
                },
            });

            const page = await browser.newPage();

            await page.goto(
                "https://www.icourse163.org/university/view/all.htm"
            );

            await page.waitForSelector(".u-usitys");

            const universityList: Array<Record<string, any>> = await page.$eval(
                ".u-usitys",
                (el) => {
                    return [...el.querySelectorAll(".u-usity")].map((item) => {
                        return {
                            name: item.querySelector("img").alt,
                            img: item.querySelector("img").src,
                            link: item.getAttribute("href"),
                        };
                    });
                }
            );

            for (let i = 0; i < universityList.length; i++) {
                const item = universityList[i];
                await page.goto("https://www.icourse163.org" + item.link);

                await page.waitForSelector(".m-cnt");

                const content = await page.$eval(
                    ".m-cnt p",
                    (el) => el.textContent
                );
                item.desc = content;

                observer.next({ data: item });
            }

            await browser.close();

            cache = universityList;
        }

        return new Observable((observer) => {
            getData(observer);
        });
    }
}

主要是返回一个 rxjs 的 Observable 然后不断用 observer.next 返回数据。

试一下:

SSE 和爬虫简直是绝配!

接下来生成 ppt,用 pptxgenjs 这个包。

用法很简单:

new 一个实例,添加一个 Slide,然后添加 text image 等内容,最后写入文件。

我们先测试下:

npm install --save pptxgenjs

新建 test.js

const pptxgen = require("pptxgenjs");

const ppt = new pptxgen();

const slide = ppt.addSlide();

slide.addText("北京大学", {
    x: "10%",
    y: "10%",
    color: "#ff0000",
    fontSize: 30,
    align: ppt.AlignH.center,
});

slide.addImage({
    path: "https://nos.netease.com/edu-image/F78C41FA9703708FB193137A688F7195.png?imageView&thumbnail=150y150&quality=100",
    x: "42%",
    y: "25%",
});

slide.addText(
    `北京大学创办于1898年,初名京师大学堂,是中国第一所国立综合性大学,也是当时中国最高教育行政机关。辛亥革命后,于1912年改为现名。 学校为教育部直属全国重点大学,国家“211工程”、“985工程”建设大学、C9联盟,以及东亚研究型大学协会、国际研究型大学联盟、环太平洋大学联盟、东亚四大学论坛的重要成员。`,
    { x: "10%", y: "60%", color: "#000000", fontSize: 14 }
);

ppt.writeFile({
    fileName: "中国所有大学.pptx",
});

分别指定文字和图片的 x、y,对齐方式 align。

跑一下:

node ./test.js

image.png

打开看一下:

image.png

没问题。

然后我们在 list 接口里加一下这个:

顺便替换下校徽图片,之前取的这个:

换成这里的:

import { Injectable } from "@nestjs/common";
import puppeteer from "puppeteer";
import { Observable, Subscriber } from "rxjs";
const pptxgen = require("pptxgenjs");

let cache = null;

@Injectable()
export class AppService {
    getHello(): string {
        return "Hello World!";
    }

    async getUniversityData() {
        if (cache) {
            return cache;
        }

        async function getData(observer: Subscriber<Record<string, any>>) {
            const browser = await puppeteer.launch({
                headless: true,
                defaultViewport: {
                    width: 0,
                    height: 0,
                },
            });

            const page = await browser.newPage();

            await page.goto(
                "https://www.icourse163.org/university/view/all.htm"
            );

            await page.waitForSelector(".u-usitys");

            const universityList: Array<Record<string, any>> = await page.$eval(
                ".u-usitys",
                (el) => {
                    return [...el.querySelectorAll(".u-usity")].map((item) => {
                        return {
                            name: item.querySelector("img").alt,
                            link: item.getAttribute("href"),
                        };
                    });
                }
            );

            const ppt = new pptxgen();

            for (let i = 0; i < universityList.length; i++) {
                const item = universityList[i];
                await page.goto("https://www.icourse163.org" + item.link);

                await page.waitForSelector(".m-cnt");

                const content = await page.$eval(
                    ".m-cnt p",
                    (el) => el.textContent
                );
                item.desc = content;

                item.img = await page.$eval(".g-doc img", (el) =>
                    el.getAttribute("src")
                );

                observer.next({ data: item });

                const slide = ppt.addSlide();

                slide.addText(item.name, {
                    x: "10%",
                    y: "10%",
                    color: "#ff0000",
                    fontSize: 30,
                    align: ppt.AlignH.center,
                });

                slide.addImage({
                    path: item.img,
                    x: "42%",
                    y: "25%",
                });

                slide.addText(item.desc, {
                    x: "10%",
                    y: "60%",
                    color: "#000000",
                    fontSize: 14,
                });
            }

            await browser.close();

            await ppt.writeFile({
                fileName: "中国所有大学.pptx",
            });

            cache = universityList;
        }

        return new Observable((observer) => {
            getData(observer);
        });
    }
}

跑一下:

跑完之后可以看到,动态生成了 400 多张 ppt:

案例代码上传了 github:https://github.com/QuarkGluonPlasma/nestjs-course-code/tree/main/ppt-generate

总结

我们使用 puppeteer 抓取了大学的信息,用 SSE 的方式创建了接口,不断返回爬取到的数据。

然后用 pptxgenjs 来生成了 ppt。

这样,400 多张 PPT 瞬间就生成了,不用自己手动搞。

上次更新: 6/21/25, 9:42 AM
贡献者: YNight
Prev
105.实现 Excel 导入导出
Next
107.如何拿到服务器 CPU、内存、磁盘状态