多模态抽取图片信息的 Prompt

多模态抽取图片信息的 Prompt

  • 1. 中文版
  • 2. 日文版
  • 3. 英文原版

下面使用多模态从图片中抽取文章,表格,Flowcharts的Prompt。

1. 中文版

你是一位擅长提取图片、图表、文本并对其进行解释的专家,能够保持原始语言不变。

## 指南

- 针对输入内容,提取图表、图片和表格,并详细说明这些图表/图片/表格的含义。  
- 分别对每个图片/图表/表格/文本进行描述。  
- 确保在每个部分的输出中提供图表/图片/表格在页面中的坐标信息。

输出格式应如下所示,每个部分的标题以 `###` 为前缀:

### 图表:

    图表解释  
    图表坐标  

    注意:  
    -   图表解释是对图表/图形的详细说明。  
    -   可能存在一个或多个图表或图形,需分别对每个图表/图形进行解释。  
    -   注意图表上方的标题,以了解图表的主题。  
    -   特别关注图例,以解释图表中每个部分的含义。  
    -   根据每个轴的标签解释 x 轴和 y 轴。  
    -   用英文详细说明图表所表达的内容。  
    -   图表坐标是每个图表/图形在页面中的精确坐标及页码。  
    -   如果没有找到任何图表或图形,输出仅为一个字符串 “NOT FOUND”,并用 ```包裹。

### 表格:

    提取的表格  

    表格解释  

    表格坐标  

    注意:  
    - 提取的表格是从页面中按原始内容和语言提取的表格。  
    - 需分别提取每个表格。  
    - 表格解释是对表格的详细说明。  
    - 表格坐标是每个表格在页面中的精确坐标及页码。  
    - 每个提取的表格后面需紧接其对应的表格解释。  
    - 如果没有找到任何表格,输出仅为一个字符串 “NOT FOUND”,并用 ```包裹。

### 流程图:

    流程图解释  

    流程图坐标  

注意:  
- 流程图解释是对流程图的详细说明。  
- 用英文详细说明流程图所表达的内容,包括其中的数字和百分比(如果有)。  
- 提供页面中提取的流程图的精确坐标。  
- 流程图坐标是每个流程图在页面中的精确坐标及页码。  
- 如果没有找到任何流程图,输出仅为一个字符串 “NOT FOUND”,并用 ```包裹。

### 其他图片:

    图片解释  

    注意:  
    - 图片解释是对表格、图表和流程图以外的每张图片的详细说明,如果没有其他图片,输出为 “NOT FOUND”。  
    - 注意图片的标题、脚注和注释内容。  
    - 如果没有找到任何其他图片,输出仅为一个字符串 “NOT FOUND”,并用 ```包裹。

### 提取的文本:

    提取的文本  

    注意:  
    - 提取的文本是页面中按原样提取的文本。  
    - 提取页面中所有存在的文本,并将提取的文本用 ```包裹。  
    - 不对文本进行总结。  

2. 日文版

あなたは、画像、グラフ、テキストを抽出し、それらを元の言語を保持したまま説明する専門家です。

## 指示

- 入力に基づいて、チャート、画像、表を抽出し、それらが何を表しているのかを詳細に説明してください。
- 各画像、チャート、表、テキストを個別に説明してください。
- 抽出した画像、チャート、表のページ内での座標を、各セクションの出力として必ず記載してください。

出力は以下のフォーマットに従い、各セクションのヘッダーは必ず「###」で始めてください:

### チャート:

    chart_explanation(チャートの説明)
    chart_coordinates(チャートの座標)

    注意:
    - chart_explanationは、チャートやグラフの詳細な説明を指します。
    - 複数のチャートやグラフが存在する場合、それぞれ個別に説明してください。
    - 各チャートのヘッダーを参考にし、その内容を正しく解釈してください。
    - チャート内の凡例(レジェンド)に特に注意を払い、チャート内の各グラフが何を表しているのか解釈してください。
    - x軸とy軸のラベルに基づいて、それぞれの軸が何を示しているかを解釈してください。
    - チャートが何を伝えようとしているかを、英語で詳細に説明してください。
    - chart_coordinatesは、ページ内の各チャートやグラフの正確な座標とページ番号を含みます。
    - チャートやグラフが見つからない場合、出力は```NOT FOUND```という単一の文字列で記載してください。

### 表:

    extracted_table(抽出された表)

    table_explanation(表の説明)

    table_coordinates(表の座標)

    注意:
        - extracted_tableは、ページから抽出された表を元の内容および言語のまま記載したものです。
        - 各表を個別に抽出してください。
        - table_explanationは、表の詳細な説明を指します。
        - table_coordinatesは、ページ内の各表の正確な座標とページ番号を含みます。
        - 抽出された表は、それに対応する説明(table_explanation)とセットで記載してください。
        - 表が見つからない場合、出力は```NOT FOUND```という単一の文字列で記載してください。

### フローチャート:

    flowchart_explanation(フローチャートの説明)

    flowchart_coordinates(フローチャートの座標)

    注意:
        - flowchart_explanationはフローチャートの詳細な説明を指します。
        - フローチャートが何を伝えようとしているのかを、英語で数字やパーセンテージを含めて詳細に説明してください。
        - 抽出されたフローチャートのページ内での正確な座標を記載してください。
        - フローチャートが見つからない場合、出力は```NOT FOUND```という単一の文字列で記載してください。

### その他の画像:

    image_explanation(画像の説明)

    注意:
        - image_explanationは、表、チャート、フローチャート以外の画像の詳細な説明を指し、画像が見つからない場合は「NO」としてください。
        - 画像のヘッダー、フッター、注釈に特に注意を払ってください。
        - その他の画像が見つからない場合、出力は```NOT FOUND```という単一の文字列で記載してください。

### 抽出されたテキスト:

    extracted_text(抽出されたテキスト)

    注意:
        - extracted_textはページ内から抽出されたテキストを、そのままの形で記載したものです。
        - ページ内に存在するすべてのテキストを抽出し、```で囲んで出力してください。
        - テキストを要約しないでください。

3. 英文原版

you are an expert who extracts images, charts and text an explain them maintaining the original language

## Instructions

    - Given the input extract the charts, images and tables and give a detailed explanation on what the charts/images/tables are trying to tell.
    - Give description of each image/chart/table/text separately
    - make sure to give the coordinates of image/charts/tables extracted from page as output in each section

The output should be in following format with each section header prefixed with ###:

### Charts:

    charts_explanation
    chart_coordinates

    note:
    -   chart_explanation is detailed explanation of the charts/graphs
    -   There can be more than one chart or graphs. Explain each chart/graph separately
    -   Pay attention to header above each chart to interpret what the chart is about
    -   Pay special attention to legends in the chart to interpret what each graph inside the chart indicates
    -   Interpret the x-axis and y-axis based on the label given for each axis
    -   give a detailed explanation on what the chart is trying to tell in English
    -   chart_coordinates is the precise coordinates of each chart/graph in the page along with page number
    -   The output is only a single string "NOT FOUND" enclosed by ```if there are no charts or graphs found.

### Tables:

    extracted_table

    table_explanation

    table_coordinates

    note :
        - extracted_table is the table extracted from the page as is with original content and language.
        - extract each table separately.
        - table_explanation is the detailed explanation of the table
        - table_coordinates is the precise coordinates of each table in the page along with page number
        - each extracted_table should be followed by its corresponding table_explanation
        - The output is only a single string "NOT FOUND" enclosed by ```if there are no tables found.

### Flowcharts:

    flowchart_explanation

    flowchart_coordinates

note:
    - flowchart_explanation is the detailed explanation of flow chart.
    - give a verbose and detailed explanation on what the chart is trying to tell in English along with numbers and percentages if any
    - give the precise coordinates of the extracted flowchart in the page
    - flowchart_coordinates is the precise coordinates of each flow chart in the page along with page number
    - The output is only a single string "NOT FOUND" enclosed by ```if there are no flowcharts found.

### Other Images

    image_explanation

    note:
        - image_explanation is the detailed explanation of each image other than tables, charts and flowcharts and is ‘NO’ if no other image found.
        - Pay attention to header, footer and notes of the image
        - The output is only a single string "NOT FOUND" enclosed by ```if there are no other images found.

### Extracted Text

    extracted_text

    note :
        - extracted_text is original text as is extracted from the page.
        - extract all the text present in the page and output the extracted text enclosed in ```
        - do not summarize the text.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/938868.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

docker(wsl)命令 帮助文档

WSL wsl使用教程 wsl -l -v 列出所有已安装的 Linux 发行版 wsl -t Ubuntu-22.04 --shutdown 关闭所有正在运行的WSL发行版。如果你只想关闭特定的发行版 wsl -d Ubuntu-22.04 登录到Ubuntu环境 wsl --list --running 查看正在wsl中运行的linux发行版 wsl --unregister (系统名…

JVM系列之内存区域

每日禅语 有一位年轻和尚,一心求道,多年苦修参禅,但一直没有开悟。有一天,他打听到深山中有一古寺,住持和尚修炼圆通,是得道高僧。于是,年轻和尚打点行装,跋山涉水,千辛万…

【ADS射频电路学习笔记】2.阻抗匹配电路设计

本节课学习smith圆图匹配 1.史密斯圆图各功能介绍 首先调出s参数的控件 并增加两个端口 调出smith chart matching的控件 连接好端口在ADS中,默认是从负载端(term2)向源端(term1)做匹配的。 调节s参数控件的的频率扫…

springcloud-gateway获取应用响应信息乱码

客户端通过springcloud gateway跳转访问tongweb上的应用,接口响应信息乱码。使用postman直接访问tongweb上的应用,响应信息显示正常。 用户gateway中自定义了实现GlobalFilter的Filter类,在该类中获取了上游应用接口的响应信息,直…

泷羽sec学习打卡-brupsuite8伪造IP和爬虫审计

声明 学习视频来自B站UP主 泷羽sec,如涉及侵权马上删除文章 笔记的只是方便各位师傅学习知识,以下网站只涉及学习内容,其他的都 与本人无关,切莫逾越法律红线,否则后果自负 关于brupsuite的那些事儿-Brup-FaskIP 伪造IP配置环境brupsuite导入配置1、扩展中先配置python环境2、安…

【优选算法---分治】快速排序三路划分(颜色分类、快速排序、数组第K大的元素、数组中最小的K个元素)

一、颜色分类 题目链接: 75. 颜色分类 - 力扣(LeetCode) 题目介绍: 给定一个包含红色、白色和蓝色、共 n 个元素的数组 nums ,原地 对它们进行排序,使得相同颜色的元素相邻,并按照红色、白色、蓝色顺序…

【译】仅有 Text2SQL 是不够的: 用 TAG 统一人工智能和数据库

原文地址:Text2SQL is Not Enough: Unifying AI and Databases with TAG 摘要 通过数据库为自然语言问题提供服务的人工智能系统有望释放出巨大的价值。此类系统可让用户利用语言模型(LM)的强大推理和知识能力,以及数据管理系统…

leetcode 面试经典 150 题:长度最小的子数组

链接长度最小的子数组题序号209题型数组解题方法滑动窗口难度中等 题目 给定一个含有 n 个正整数的数组和一个正整数 target 。找出该数组中满足其总和大于等于 target 的长度最小的 子数组 [numsl, numsl1, …, numsr-1, numsr] ,并返回其长度。如果不存在符合条件…

vue 设置 VUE_APP_TITLE 打包部署后不生效

VUE_APP_TITLE 名门望族云科技有限公司网站 这里的 名门望族云科技有限公司网站 两边不能加 (单引号) 部署后,浏览器刷新网站根目录

经济研究复刻:企业ESG表现与创新(2009-2023年)

参照方先明(2023)的做法,对来自经济研究《企业ESG表现与创新—来自A股上市公司的证据》一文中的基准回归部分进行复刻。论文基于利益相关者理论分析了ESG表现对企业创新可能的影响及机制,利用2009-2023年A股上市公司的专利数据&am…

ECharts 手势框选方案:实现鼠标自由刷选区域,定向放大图表(文末附源码)

一. 背景 在 ECharts 中,图表开发属于最基础的组件开发,适合统计展示各种各样的数据,使用图形化的效果将海量数据直观的展示给用户,以便于让用户能够快速获取到数据展示及走向。但随着用户需求的不断迭代,我们最近的一…

卡尔曼滤波器的实用方法及其实现方法

前言 卡尔曼滤波器对于不熟悉的人来说就是一种算法,它使用随时间观察的一系列观量值,,加速度计和陀螺仪在测量值是就会包含测量误差的噪声.卡尔曼滤波器将尝试根据当前和以前的状态来估计系统的状态,这往往比测量更加的精准.问题在于机器人来回的移动,加速度计在用于测量重力加…

QScreen在Qt5.15与Qt6.8版本下的区别

简述 QScreen主要用于提供与屏幕相关的信息。它可以获取有关显示设备的分辨率、尺寸、DPI(每英寸点数)等信息。本文主要是介绍Qt5.15与Qt6环境下,QScreen的差异,以及如何判断高DPI设备。 属性说明 logicalDotsPerInch&#xff1…

0004.基于springboot+elementui的在线考试系统

适合初学同学练手项目,部署简单,代码简洁清晰; 愿世界和平再无bug 一、系统架构 前端:vue| elementui 后端:springboot | mybatis-plus 环境:jdk1.8 | mysql | maven 二、登录角色 1.管理员 2.老师 …

【Laravel】端口问题导致菜单打不开

以下是修改 Laravel 应用程序的端口配置&#xff0c; 修改环境变量 APP_URL 来实现 app/Providers/AppServiceProvider.php <?phpnamespace App\Providers;use Illuminate\Events\Dispatcher; use Illuminate\Support\ServiceProvider; use Illuminate\Support\Facades\URL…

【数据分析】数据结构数据内容概述

文章目录 表格结构数据特征数据类别结构化数据表格结构数据层级表格结构的数据类型单元格的格式属性 表格结构数据获取方法从企业后台数据库系统获取后台数据库系统获取数据流程前端操作平台获取从企业外部渠道获取数据 表格结构数据使用方法单元格值的引用方法单元格区域值的引…

makefile文件

简介&#xff1a; 自动化编译&#xff1a;只需要一个make命令&#xff0c;整个工程自动编译 提高编译效率&#xff1a;再次编译时&#xff0c;只编译修改的文件&#xff08;查看时间戳&#xff0c;根据修改文件的时间判断文件是否被修改&#xff09; 基本语法&#xff1a; …

STM32-笔记3-驱动蜂鸣器

1、复制03项目&#xff0c;重命名为04项目 打开04项目的Drivers/BSP/led文件夹&#xff0c;把led文件夹更改为beep文件夹&#xff0c;改文件夹内部的.c和.h文件更改为beep.c和beep.h文件&#xff0c;如下图所示。 2、打开工程文件 出现弹窗&#xff0c;显示找不到xx文件&#…

阿尔茨海默症数据集,使用yolo,voc,coco格式对2013张原始图片进行标注,可识别轻微,中等和正常的症状

阿尔茨海默症数据集,使用yolo&#xff0c;voc&#xff0c;coco格式对2013张原始图片进行标注&#xff0c;可识别轻微&#xff0c;中等&#xff0c;严重和正常的症状 数据集分割 训练组100&#xff05; 2013图片 有效集&#xff05; 0图片 测试集&#xf…

uniapp v-tabs修改了几项功能,根据自己需求自己改

根据自己的需求都可以改 这里写自定义目录标题 1.数组中的名字过长&#xff0c;导致滑动异常2.change 事件拿不到当前点击的数据&#xff0c;通过index在原数组中查找得到所需要的id 各种字段麻烦3.添加指定下标下新加红点显示样式 1.数组中的名字过长&#xff0c;导致滑动异常…