简介
数据可视化是数据分析和机器学习的关键方面。Gradio DataFrame
组件是一种流行的方式,在网络应用程序中显示表格数据(特别是以 pandas
DataFrame
对象的形式)。
本文将探讨 Gradio 的最新增强功能,这些功能允许用户整合 pandas 的样式选项,例如为 DataFrame 组件添加颜色,或设置数字的显示精度。
让我们开始吧!
先决条件:我们将在示例中使用 gradio.Blocks
类。如果您还不熟悉它,可以先阅读 Blocks 指南。另外,请确保您使用的是 Gradio 的最新版本: pip install --upgrade gradio
。
概览
Gradio DataFrame
组件现在支持来自 pandas
类的 Styler
类型的值。这使我们能够重用 Styler
类的丰富现有 API 和文档,而不是自己发明一种新的样式格式。以下是一个完整示例的外观:
# 导入pandas和gradio库
import pandas as pd
import gradio as gr
# 创建一个样本数据框
df = pd.DataFrame({
"A" : [14, 4, 5, 4, 1],
"B" : [5, 2, 54, 3, 2],
"C" : [20, 20, 7, 3, 8],
"D" : [14, 3, 6, 2, 6],
"E" : [23, 45, 64, 32, 23]
})
# 使用样式对数据框进行处理,高亮每列的最大值,高亮颜色为浅绿色
styler = df.style.highlight_max(color = 'lightgreen', axis = 0)
# 在Gradio交互界面上展示经过样式处理的数据框
with gr.Blocks() as demo:
gr.DataFrame(styler)
# 启动Gradio界面
demo.launch()
Styler 类可以用来对数据框应用条件格式和样式,使它们更具视觉吸引力和可解释性。您可以突出显示某些值,应用渐变,甚至使用自定义 CSS 来样式化 DataFrame。Styler 对象应用于 DataFrame,并返回一个具有相关样式属性的新对象,然后可以直接预览,或在 Gradio 界面中动态渲染。
要了解更多关于 Styler 对象的信息,请阅读官方文档:https://pandas.pydata.org/docs/user_guide/style.html
字体颜色
除了突出显示单元格,您可能还想为单元格内的特定文本上色。以下是如何更改某些列的文本颜色:
# 导入pandas和gradio库
import pandas as pd
import gradio as gr
# 创建一个样本数据框
df = pd.DataFrame({
"A" : [14, 4, 5, 4, 1],
"B" : [5, 2, 54, 3, 2],
"C" : [20, 20, 7, 3, 8],
"D" : [14, 3, 6, 2, 6],
"E" : [23, 45, 64, 32, 23]
})
# 写一个函数来修改文本颜色
def highlight_cols(x):
# 首先复制输入的数据框
df = x.copy()
# 将所有元素的颜色设为紫色
df.loc[:, :] = 'color: purple'
# 将'B', 'C', 'E'列的元素颜色设为绿色
df[['B', 'C', 'E']] = 'color: green'
# 返回被修改颜色的数据框
return df
# 应用上述颜色修改函数
s = df.style.apply(highlight_cols, axis = None)
# 在Gradio交互界面上展示上述处理过的数据框
with gr.Blocks() as demo:
gr.DataFrame(s)
# 启动Gradio界面
demo.launch()
这段代码使用Gradio UI创建了一个可交互界面,将一个处理过的Pandas DataFrame展示出来。这个处理过的DataFrame改变了列'B', 'C', 'E'的文本颜色,对于数据分析和展示来说,这种突出显示关键列的方式可以帮助分析者更好地关注和理解数据。
在这个脚本中,我们定义了一个自定义函数 highlight_cols,它将所有单元格的文本颜色更改为紫色,但对 B、C 和 E 列使用绿色进行了覆盖。它看起来是这样的:
显示精度
有时候,你处理的数据可能会有很长的浮点数,你可能只想显示固定数量的小数位数以简化显示。pandas 的 Styler 对象允许你格式化显示的数字精度。以下是如何做到这一点的方法:
# 导入pandas和gradio库
import pandas as pd
import gradio as gr
# 创建一个包含浮点数的样本数据框
df = pd.DataFrame({
"A" : [14.12345, 4.23456, 5.34567, 4.45678, 1.56789],
"B" : [5.67891, 2.78912, 54.89123, 3.91234, 2.12345],
# ... 其他列
})
# 将数字的精度设置为2位小数
s = df.style.format("{:.2f}")
# 在Gradio交互界面中展示这个处理过的数据框
with gr.Blocks() as demo:
gr.DataFrame(s)
# 启动Gradio界面
demo.launch()
在这个脚本中,Styler 对象的 format 方法被用来将数字的精度设置为两位小数。现在看起来清爽多了:
关于交互性的注意事项
需要记住的一点是,gradio DataFrame
组件在非交互式(即“静态”模式)时只接受 Styler
对象。如果 DataFrame
组件是交互式的,那么样式信息将被忽略,相反会显示原始表格值。
DataFrame
组件默认是非交互式的,除非它被用作事件的输入。在这种情况下,您可以通过设置 interactive
属性来强制组件为非交互式,如下所示:
c = gr.DataFrame(styler, interactive=False)
结论 🎉
这只是使用 gradio.DataFrame
组件与 Styler
类来自 pandas
的可能性的一点体验。尝试一下,告诉我们你的想法!