编写serverless云函数实践-抓取网页后转发(基于val.town)

智码追光说
• 阅读 613

目标

能定时抓取网站内容,并发送到飞书群机器人接口。

介绍

https://www.val.town/ 是个云函数的运行环境。

示例demo可以教会你如何给自己的邮箱发送笑话(console.email只能发给自己的注册邮箱)

支持动态引入npm包,但调试不大方便,最开始想引用node-fetch来完成fetch,但总是报错,报错信息不明确。后来直接用fetch替代了。

val.town 提供定时任务的模式,只需要写好自己的函数,再选择添加schedule,设定一下cron,就可以完成定时运行函数的功能。(定时有一定的限制)

实践

拿echojs网站为例,需要fetch网页内容,通过cheerio等库解析一下html,选择器找到对应的内容,提取即可。

抓取部分

如下fetchEchojs函数完成抓取网站网页的文章标题和链接,并返回

async function fetchEchojs() {
  const url = "https://www.echojs.com/";
  // 动态引入npm包的方式 await import('npm:xxx')
  const cheerio = await import("npm:cheerio");
  try {
    const res = await fetch(url);
    const data = await res.text();
    const $ = cheerio.load(data);
    const result = [];
    $("#newslist article").each((i, elem) => {
      const $article = $(elem).find("h2");
      const title = $(elem).find("h2").text();
      const url = $article.find("a").attr("href");
      result.push({
        title,
        url,
      });
    });
    return result;
  }
  catch (err) {
    console.error(err);
  }
}

下一步编写val并设置

抓取完成后,获得了一个存储文章的数组,正好飞书群机器人提供api接受请求内容,转发到飞书群消息。

发送请求用fetch完成即可,这里就不介绍。

如下函数,完成了整个任务的主要逻辑。

async function workdayMorningNews4Js() {
  // @my.fetchEchojs即上面的函数
  const news = await @my.fetchEchojs();
  // larkTweet是我发送飞书机器人的val
  await @my.larkTweet({
    "msg_type": "post",
    "content": {
      "post": {
        "zh_cn": {
          "title": "过来看,过来挑,走过路过,不要错过",
          "content": [
            ...news.slice(0, 10).map((item) => [{
              "tag": "a",
              "text": item.title,
              "href": item.url,
            }]),
          ],
        },
      },
    },
  });
}

然后就是设置定时cron,注意用的是UTC,所以国内的话时间早其8小时。

编写serverless云函数实践-抓取网页后转发(基于val.town)

如图,设置每周一到周五,每天早上9点半执行val。

第一次保存时,会触发一次运行,后面就到点执行了。

总体来说,编写难度不大,可以完成一些简单的需求,比如每天给自己发个笑话,或者收集一下知识文章推送,也稍微注意一下安全咯,val可以编写私有和公开,注册用户私有有数量限制。

点赞
收藏
评论区
推荐文章
blmius blmius
4年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
美凌格栋栋酱 美凌格栋栋酱
10个月前
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
Wesley13 Wesley13
4年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
1年前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Peter20 Peter20
4年前
mysql中like用法
like的通配符有两种%(百分号):代表零个、一个或者多个字符。\(下划线):代表一个数字或者字符。1\.name以"李"开头wherenamelike'李%'2\.name中包含"云",“云”可以在任何位置wherenamelike'%云%'3\.第二个和第三个字符是0的值wheresalarylike'\00%'4\
Wesley13 Wesley13
4年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Stella981 Stella981
4年前
HIVE 时间操作函数
日期函数UNIX时间戳转日期函数: from\_unixtime语法:   from\_unixtime(bigint unixtime\, string format\)返回值: string说明: 转化UNIX时间戳(从19700101 00:00:00 UTC到指定时间的秒数)到当前时区的时间格式举例:hive   selec
Wesley13 Wesley13
4年前
PHP创建多级树型结构
<!lang:php<?php$areaarray(array('id'1,'pid'0,'name''中国'),array('id'5,'pid'0,'name''美国'),array('id'2,'pid'1,'name''吉林'),array('id'4,'pid'2,'n
Wesley13 Wesley13
4年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Python进阶者 Python进阶者
1年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这