飞书API(4):筛选数据的三种思路

截止到上一篇,终于通过飞书 API 完整获取到飞书多维表的数据。
但是,有些场景,比如数据源会出现脏数据,毕竟如果是运营过程多人协作维护的数据,要想保持数据完美简直是天方夜谭!再比如我们不需要完整的数据,只需要某个类别的数据即可,这个时候,就需要我们对数据进行筛选处理。

本文探讨三种处理思路:

  • 思路一:先读取所有数据,再处理;
  • 思路二:调接口读取时直接处理;
  • 思路三:新建视图进行筛选。

思路一:先读取所有数据,再处理

这种思路比较简单,就是在上一篇的基础上,使用 Python 进行数据处理。
上一篇,获取到的数据都以列表feishu_datas的形式返回了,采用 pandas 库来进行处理,把列表 feishu_datas 转为 DataFrame 之后。对对应的列进行筛选处理即可。
比如说只筛选出支付平台是“淘宝”的数据。
为了便于维护和对比查看,这里直接新增一个函数,该函数传入两个参数,一个是飞书的列表数据feishu_datas,一个是需要筛选的平台名称,然后在main()函数中调用它即可。

def filter_platform(feishu_datas, platform):
    df = pd.DataFrame(feishu_datas)
    df_platform = df[df.fields.apply(lambda x: x.get('支付平台')) == platform]
    filter_feishu_datas = df_platform.to_dict(orient='records')
    return filter_feishu_datas

在这里插入图片描述

如果是其他的筛选条件可以参考类似的方法执行筛选。

思路二:调接口读取时直接处理

前面在调用飞书接口的时候都是使用默认方式读取,即直接读取所有的数据,未使用非必须参数。
在非必须参数中,有一个 filter 参数,它就可以实现筛选,本思路就是使用它在调接口的时候对数据进行筛选。
官方文档如下:

  • 从文档中可以看到,filter 参数需要给:conjunction(条件之间的关系)和 conditions(条件)。
    • conjunction:当有多个条件的时候,是否同时满足所有条件(值:and)才返回数据还是满足任一个条件(值:or)即可。注意:不支持二者嵌套使用,比如 条件A and (条件B or 条件C)。
    • conditions:支持多个条件,每个条件使用大括号{}包裹,每个条件给定三个键值对,键分别是:field_name、operator 和 value,值根据需求给即可。

image.png

还是拿上面的例子,筛选支付平台是“淘宝”的数据。
该思路只需要在get_bitable_datas()函数中,将payload赋值内容改为以下代码即可。

payload = json.dumps(
    {
        "filter":{
            "conjunction":"and",
            "conditions":[
                {
                    "field_name":"支付平台",
                    "operator":"is",
                    "value":[
                        "淘宝"
                    ]
                }
            ]
        }
    })

改动图示如下:

image.png

该示例的代码是硬代码,为了更好维护,可以将变量payload的值改为参数进行传递,从函数外部传递payload_data值。

image.png

补充:观察每一页打印的数据,可以发现,接口数据也是按照所有数据进行分页,然后按页筛选数据。而不是将所有符合的数据筛选完再分页返回。

思路三:新建多维表视图进行筛选

该方法的原理和前面两种有点不同,前面两种都是通过 API 对所有数据进行筛选。该方法是先在飞书上新建视图进行筛选数据,然后通过 API 访问对应视图数据,读取时仅读取筛选后的结果。
还是以筛选支付平台是“淘宝”的数据。
先在多维表上新建一个视图,命名为“淘宝”,筛选:“支付平台=淘宝”。

image.png

然后在非必选参数中,需要指定对应的视图id(view_id),参数说明如下图:

在这里插入图片描述

view_id 的值在链接上直接获取即可:选择对应的视图,然后复制“view=”后面的字符串。

image.png

取思路二的代码,将payload_data修改为下面的值即可。

payload_data = {"view_id":"vewUjtcfIX"}

改完执行结果如下:

image.png

小结

本文探讨了三种处理多维表筛选数据的思路:

  • 思路一:获取所有数据,使用 pandas 进行数据筛选;
  • 思路二:调查询记录接口时,传递 filter 参数进行数据筛选;
  • 思路三:在多维表新建视图进行筛选,然后指定视图,读取所有数据。

附录

注:使用上一篇的 while 循环代码进行修改。
思路一完整代码:

import requests
import json
import pandas as pd

def get_tenant_access_token(app_id, app_secret):
    url = "https://open.feishu.cn/open-apis/auth/v3/tenant_access_token/internal"
    payload = json.dumps({
        "app_id": app_id,
        "app_secret": app_secret
    })
    headers = {'Content-Type': 'application/json'}
    response = requests.request("POST", url, headers=headers, data=payload)
    # print(response.text)
    return response.json()['tenant_access_token']

def get_bitable_datas(tenant_access_token, app_token, table_id, page_token='', page_size=20):

    url = f"https://open.feishu.cn/open-apis/bitable/v1/apps/{app_token}/tables/{table_id}/records/search?page_size={page_size}&page_token={page_token}&user_id_type=user_id"
    payload = json.dumps({})
    headers = {
        'Content-Type': 'application/json',
        'Authorization': f'Bearer {tenant_access_token}'
    }
    response = requests.request("POST", url, headers=headers, data=payload)
    # print(response.text)
    return response.json()

def filter_platform(feishu_datas, platform):
    df = pd.DataFrame(feishu_datas)
    df_platform = df[df.fields.apply(lambda x: x.get('支付平台')) == platform]
    filter_feishu_datas = df_platform.to_dict(orient='records')
    return filter_feishu_datas

def main():
    app_id = 'your_app_id'
    app_secret = 'your_app_secret'
    tenant_access_token = get_tenant_access_token(app_id, app_secret)
    app_token = 'your_app_token'
    table_id = 'your_table_id'

    page_token = ''
    page_size = 5
    has_more = True
    feishu_datas = []
    while has_more:
        response = get_bitable_datas(tenant_access_token, app_token, table_id, page_token, page_size)
        if response['code'] == 0:
            page_token = response['data'].get('page_token')
            has_more = response['data'].get('has_more')
            # print(response['data'].get('items'))
            # print('\n--------------------------------------------------------------------\n')
            feishu_datas.extend(response['data'].get('items'))
        else:
            raise Exception(response['msg'])
    filter_feishu_datas = filter_platform(feishu_datas, '淘宝')
    return filter_feishu_datas

if __name__ == '__main__':
    feishu_datas = main()
    print(feishu_datas)

思路二完整代码:

import requests
import json

def get_tenant_access_token(app_id, app_secret):
    url = "https://open.feishu.cn/open-apis/auth/v3/tenant_access_token/internal"
    payload = json.dumps({
        "app_id": app_id,
        "app_secret": app_secret
    })
    headers = {'Content-Type': 'application/json'}
    response = requests.request("POST", url, headers=headers, data=payload)
    # print(response.text)
    return response.json()['tenant_access_token']

def get_bitable_datas(tenant_access_token, app_token, table_id, page_token='', page_size=20, payload_data={}):

    url = f"https://open.feishu.cn/open-apis/bitable/v1/apps/{app_token}/tables/{table_id}/records/search?page_size={page_size}&page_token={page_token}&user_id_type=user_id"
    payload = json.dumps(payload_data)
    headers = {
        'Content-Type': 'application/json',
        'Authorization': f'Bearer {tenant_access_token}'
    }
    response = requests.request("POST", url, headers=headers, data=payload)
    # print(response.text)
    return response.json()

def main():
    app_id = 'your_app_id'
    app_secret = 'your_app_secret'
    tenant_access_token = get_tenant_access_token(app_id, app_secret)
    app_token = 'your_app_token'
    table_id = 'your_table_id'

    page_token = ''
    page_size = 5
    has_more = True
    feishu_datas = []
    
    payload_data = {
            "filter":{
                "conjunction":"and",
                "conditions":[
                    {
                        "field_name":"支付平台",
                        "operator":"is",
                        "value":[
                            "淘宝"
                        ]
                    }
                ]
            }
        }
    while has_more:
        response = get_bitable_datas(tenant_access_token, app_token, table_id, page_token, page_size, payload_data)
        if response['code'] == 0:
            page_token = response['data'].get('page_token')
            has_more = response['data'].get('has_more')
            # print(response['data'].get('items'))
            # print('\n--------------------------------------------------------------------\n')
            feishu_datas.extend(response['data'].get('items'))
        else:
            raise Exception(response['msg'])
        
    return feishu_datas

if __name__ == '__main__':
    feishu_datas = main()
    print(feishu_datas)

思路三完整代码:

import requests
import json

def get_tenant_access_token(app_id, app_secret):
    url = "https://open.feishu.cn/open-apis/auth/v3/tenant_access_token/internal"
    payload = json.dumps({
        "app_id": app_id,
        "app_secret": app_secret
    })
    headers = {'Content-Type': 'application/json'}
    response = requests.request("POST", url, headers=headers, data=payload)
    # print(response.text)
    return response.json()['tenant_access_token']

def get_bitable_datas(tenant_access_token, app_token, table_id, page_token='', page_size=20, payload_data={}):

    url = f"https://open.feishu.cn/open-apis/bitable/v1/apps/{app_token}/tables/{table_id}/records/search?page_size={page_size}&page_token={page_token}&user_id_type=user_id"
    payload = json.dumps(payload_data)
    headers = {
        'Content-Type': 'application/json',
        'Authorization': f'Bearer {tenant_access_token}'
    }
    response = requests.request("POST", url, headers=headers, data=payload)
    # print(response.text)
    return response.json()

def main():
    app_id = 'your_app_id'
    app_secret = 'your_app_secret'
    tenant_access_token = get_tenant_access_token(app_id, app_secret)
    app_token = 'your_app_token'
    table_id = 'your_table_id'

    page_token = ''
    page_size = 5
    has_more = True
    feishu_datas = []
    
    payload_data = {"view_id":"vewUjtcfIX"}
    while has_more:
        response = get_bitable_datas(tenant_access_token, app_token, table_id, page_token, page_size, payload_data)
        if response['code'] == 0:
            page_token = response['data'].get('page_token')
            has_more = response['data'].get('has_more')
            # print(response['data'].get('items'))
            # print('\n--------------------------------------------------------------------\n')
            feishu_datas.extend(response['data'].get('items'))
        else:
            raise Exception(response['msg'])
        
    return feishu_datas

if __name__ == '__main__':
    feishu_datas = main()
    print(feishu_datas)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/549184.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

JavaFX项目环境配置

Java版本 JDK15 JavaFX版本 JavaFX SDK 17 sdk下载地址https://gluonhq.com/products/javafx/ https://gluonhq.com/products/javafx/ Java FX sdk 版本不要选择22版本 与 jdk15版本不合 编辑器 配置Eclipse JDK15环境 点击Add 第二步新建一个javafx项目 点击next 勾选Ja…

Aurora 协议学习理解与应用——Aurora 8B10B协议学习

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 Aurora 8B10B协议学习之一,理解协议 概述8B10B数据发送和接收Symbol-Pairs传输调度用户PDU传输过程用户PDU接收过程 流控自然流量控制操作自然流量控制延迟自然流…

微信人脉扩张!多号批量自动加好友,你get到了吗?

微信是我们在拓展社交圈和寻找商业机会时,与更多的人建立联系的重要渠道。但是,手动一个个添加好友显然费时费力,这时候,微信管理系统的批量自动加好友功能就成为了微信人脉扩张的神器。 通过微信管理系统,我们可以轻…

JavaScript 高性能编程 —— 加载和运行

JavaScript 在浏览器中的性能,可认为是开发者所要面对的最重要的可用性问题。此问题因 JavaScript 的阻塞特征而复杂,也就是说,当 JavaScript 运行时其他的事情不能被浏览器处理。 事实上,大多数浏览 器使用单进程处理 UI 更新和 JavaScript 运行等多个任务,而同一时间只能…

C++笔记:类和对象

类和对象 认识类和对象 先来回忆一下C语言中的类型和变量,类型就像是定义了数据的规则,而变量则是根据这些规则来实际存储数据的容器。类是我们自己定义的一种数据类型,而对象则是这种数据类型的一个具体实例。类就可以理解为类型&#xff0c…

配置优先级标记和队列调度示例

配置优先级标记和队列调度示例 组网图形 图1 优先级标记和队列调度示例组网图 优先级标记和队列调度简介配置注意事项组网需求配置思路操作步骤配置文件 优先级标记和队列调度简介 报文进入设备之后,设备会根据相应的规则分配或修改报文各种优先级的值&#xff…

【鸿蒙开发】饿了么页面练习

0. 整体结构 整体划分3部分。店铺部分,购物车部分,金额统计部分。使用 Stack 把3部分堆叠 0.1 整体页面 Index.ets 修改 Index.ets ,使用堆叠布局,并居底部对齐 import { ElShop } from ../components/ElShop import { ElShopp…

slRegisterDistribution failed with error: 0x8000000d Error: 0x8000000d ?

powershell用管理员打开,输入Enable-WindowsOptionalFeature -Online -FeatureName Microsoft-Windows-Subsystem-Linux 怎么用管理员权限打开powershell?

告别传统开发,轻松套用模板,低代码平台助你快速构建商城与网站

随着人工智能时代的到来,很多复杂的工作再日益变得简单。比如20年前开发一个在线商城完成支付交易,那是一个不得了的事情,现在的零售巨头淘宝和京东就是在那个时代崛起的。新时代涌现出了许多新的工具,比如使用低代码平台搭建的自…

【STL详解 —— priority_queue的使用与模拟实现】

STL详解 —— priority_queue的使用与模拟实现 priority_queue的使用priority_queue的介绍priority_queue的定义方式priority_queue各个接口的使用 priority_queue的模拟实现仿函数priority_queue的模拟实现 priority_queue的使用 priority_queue的介绍 std::priority_queue 是…

排序1——C语言

排序 1. 复杂度2. 插入排序2.1 直接插入排序2.2 希尔排序 3. 选择排序3.1 直接选择排序3.2 堆排序 排序在生活中很常见,比如在网购时,按价格排序,按好评数排序,点餐时,按评分排序等等。而排序有快和慢,快的…

IIC和OLED再认识

IIC介绍 51是由于芯片功能不齐全,以至于需要软件编写IIC 而STM32芯片足够将IIC配置在硬件当中以至于直接读写即可 忘记了可回顾51的16.IIC 协议 和 OLED_oled,iic通信波特率-CSDN博客 在STM32中使用IIC可以直接调用HAL库的库函数: HAL_StatusTypeDe…

Appium Desktop + Appium Inspector + 模拟器连接

一、环境预备 1.你需要安装好配置好adb,确保可以在命令行直接运行adb指令 2.安装Appium Desktop、Appium Inspector 、 模拟器 二、启动appium 服务 启动后,画面如下: 三、启动模拟器 此时,启动模拟器,打开电脑cmd窗口&#x…

研发岗-统信UOS系统配置npm git等前端常用配置

第一步 获取root权限 配置环境等都需要用到root权限,所以我们先获取到root权限,方便下面的操作 下载软件 在UOS应用商店下载的所需应用 版本都比较低 安装node 官网下载了【arm64】的包,解压到指定文件夹,设置链接&#xff0…

揭秘AI精准输出:如何构建完美的AIGC提示词?

揭秘AI精准输出:如何构建完美的AIGC提示词?🤖 文章目录 揭秘AI精准输出:如何构建完美的AIGC提示词?🤖摘要引言正文📘 提示词的基本概念1. 什么是提示词?2. 提示词的作用 &#x1f4d…

JAVA云HIS与LIS想知道区别在哪里吗?一分钟带你快速了解

JAVA云HIS与LIS想知道区别在哪里吗?一分钟带你快速了解 HIS系统与LIS系统使用各自独立的服务器,数据库不同,HIS系统、LIS系统服务器分别使用ORACLE数据库和SQLSERVER数据库,彼此数据信息不能共真,要解决HIS系统与LIS系…

vue iview table实现全选

之前我们在文章《iview Table实现跨页勾选记忆功能以及利用ES6的Map数据结构实现根据id进行对象数组的去重》里实现过全选功能,不过那有一个弊端就是需要调接口一次性获取全部的数据,这会造成请求数据响应超时或报错,因为数据量大的话这样体验也不好,于是我们改了一下,因为…

aosp13/14命令行进入分屏相关实战

背景: 分屏一般在手机上都是都是从桌面的最近任务卡片进入的,一般来说手机用户都是这样操作的,但是有一些场景或者情况就不一定可以顺利用上这个桌面的多任务卡片进入。 比如以下场景: 1、可能不是桌面的多任务的场景&#xff0c…

【Altium Designer 20 笔记】PCB铺铜过程

PCB铺铜步骤 切换到Keep-Out Layer(禁止布线层) 使用shifts键切换单层显示 画禁止布线范围(防止铺铜过大) 切换到需要铺铜的层 选择铺铜网络,通常是地(GND)或某个电源网络 隐藏覆铜:…

一.吊打面试官系列-数据库优化-认识MySql索引

1.什么是索引 索引(Index)是帮助DBMS(数据库)高效获取数据的数据结构,索引是为了加速对表中数据行的检索而创建的一种分散的存储结构。如果数据库没有索引就会走表进行全表扫描,一旦数据量上来&#xff0c…