支持GPT-3.5-Turbo, GPT-4o, GPT-4-Turbo
import json
import openai
from pathlib import Path
import os
client = openai.OpenAI(base_url=base_url, api_key=api_key)
file = client.files.create(
file=open("H3.pdf", "rb"),
purpose='assistants'
)
assistant = client.beta.assistants.create(
name="问答生成",
instructions="你是一个问答生成助手,可以帮助用户去生成问答对。",
model="gpt-4-1106-preview",
tools=[{"type":"retrieval"}],
file_ids= [file.id]
)
print(assistant.id)
thread = client.beta.threads.create(
messages=[
{
"role": "user",
"content": """
这个文档可以分为多个部分,分别输出。针对每个部分生成3个问答对,合并后以中文JSON格式输出。
"""
}
]
)
print(thread.id)
run = client.beta.threads.runs.create(
thread_id=thread.id,
assistant_id=assistant.id
)
print(run.id)
import time
def wait_on_run(run, thread):
while run.status == "queued" or run.status == "in_progress":
run = client.beta.threads.runs.retrieve(
thread_id=thread.id,
run_id=run.id,
)
time.sleep(1)
print("等待响应中...")
return run
run = wait_on_run(run, thread)
print(run.id)
messages = client.beta.threads.messages.list(thread_id=thread.id)
messages = json.loads(messages.model_dump_json())
messages['data'][0]['content'][0]['text']['value']
'接下来,根据您的文档,我将对每个部分生成问答对,并以中文JSON格式输出。\n\n### 第一部分(发展历程、主营业务、财务分析、公司治理)\n\n1. 福昕软件成立于哪一年?\n A: 福昕软件成立于2001年。\n\n2. 福昕软件的主营业务是什么?\n A: 福昕软件的主营业务是聚焦PDF相关解决方案。\n\n3. 福昕软件在员工利益方面采取了哪些措施?\n A: 福昕软件制定了长期持股计划以绑定员工利益。【13†source】\n\n### 第二部分(所处行业分析)\n\n1. 福昕软件公司的产品在哪些方面具有竞争力?\n A: 福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。\n\n2. 福昕软件未来的市场发展潜力如何?\n A: 福昕软件公司后续有望抢占更多市场份额。【14†source】\n\n### 第三部分(订阅+渠道双转型)\n\n1. “订阅+渠道”双转型的核心策略是什么?\n A: 福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。\n\n2. 福昕软件订阅模式为客户提供了哪些增值服务?\n A: 福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。【15†source】\n\n### 第四部分(境外收入占比、境内市场拓展)\n\n1. 福昕软件在境内市场拓展方面的策略是什么?\n A: 福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。【16†source】\n\n### 第五部分(AIGC赋能、产品竞争力)\n\n1. 福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?\n A: 福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。【17†source】\n\n2. 接入ChatGPT后的产品变化有哪些?\n A: 接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。\n\n### 第六部分(盈利预测、估值与投资评级)\n\n1. 福昕软件的投资评级如何?\n A: 福昕软件的投资评级为“买入”。【18†source】\n\n2. 根据估值模型,福昕软件的目标市值是多少?\n A: 根据估值模型,福昕软件的目标市值为117.0亿元。\n\n将以上问答对合并并转换为JSON格式如下:\n```json\n[\n {\n "part": "第一部分",\n "qa_pairs": [\n {\n "question": "福昕软件成立于哪一年?",\n "answer": "福昕软件成立于2001年。"\n },\n {\n "question": "福昕软件的主营业务是什么?",\n "answer": "福昕软件的主营业务是聚焦PDF相关解决方案。"\n },\n {\n "question": "福昕软件在员工利益方面采取了哪些措施?",\n "answer": "福昕软件制定了长期持股计划以绑定员工利益。"\n }\n ]\n },\n {\n "part": "第二部分",\n "qa_pairs": [\n {\n "question": "福昕软件公司的产品在哪些方面具有竞争力?",\n "answer": "福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。"\n },\n {\n "question": "福昕软件未来的市场发展潜力如何?",\n "answer": "福昕软件公司后续有望抢占更多市场份额。"\n }\n ]\n },\n {\n "part": "第三部分",\n "qa_pairs": [\n {\n "question": "“订阅+渠道”双转型的核心策略是什么?",\n "answer": "福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。"\n },\n {\n "question": "福昕软件订阅模式为客户提供了哪些增值服务?",\n "answer": "福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。"\n }\n ]\n },\n {\n "part": "第四部分",\n "qa_pairs": [\n {\n "question": "福昕软件在境内市场拓展方面的策略是什么?",\n "answer": "福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。"\n }\n ]\n },\n {\n "part": "第五部分",\n "qa_pairs": [\n {\n "question": "福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?",\n "answer": "福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。"\n },\n {\n "question": "接入ChatGPT后的产品变化有哪些?",\n "answer": "接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。"\n }\n ]\n },\n {\n "part": "第六部分",\n "qa_pairs": [\n {\n "question": "福昕软件的投资评级如何?",\n "answer": "福昕软件的投资评级为“买入”。"\n },\n {\n "question": "根据估值模型,福昕软件的目标市值是多少?",\n "answer": "根据估值模型,福昕软件的目标市值为117.0亿元。"\n }\n ]\n }\n]\n```'
print(messages['data'][0]['content'][0]['text']['value'])
接下来,根据您的文档,我将对每个部分生成问答对,并以中文JSON格式输出。 ### 第一部分(发展历程、主营业务、财务分析、公司治理) 1. 福昕软件成立于哪一年? A: 福昕软件成立于2001年。 2. 福昕软件的主营业务是什么? A: 福昕软件的主营业务是聚焦PDF相关解决方案。 3. 福昕软件在员工利益方面采取了哪些措施? A: 福昕软件制定了长期持股计划以绑定员工利益。【13†source】 ### 第二部分(所处行业分析) 1. 福昕软件公司的产品在哪些方面具有竞争力? A: 福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。 2. 福昕软件未来的市场发展潜力如何? A: 福昕软件公司后续有望抢占更多市场份额。【14†source】 ### 第三部分(订阅+渠道双转型)
1. “订阅+渠道”双转型的核心策略是什么? A: 福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。 2. 福昕软件订阅模式为客户提供了哪些增值服务? A: 福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。【15†source】 ### 第四部分(境外收入占比、境内市场拓展) 1. 福昕软件在境内市场拓展方面的策略是什么? A: 福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。【16†source】 ### 第五部分(AIGC赋能、产品竞争力) 1. 福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能? A: 福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。【17†source】 2. 接入ChatGPT后的产品变化有哪些? A: 接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。 ### 第六部分(盈利预测、估值与投资评级) 1. 福昕软件的投资评级如何? A: 福昕软件的投资评级为“买入”。【18†source】 2. 根据估值模型,福昕软件的目标市值是多少? A: 根据估值模型,福昕软件的目标市值为117.0亿元。
将以上问答对合并并转换为JSON格式如下: ```json [ { "part": "第一部分", "qa_pairs": [ { "question": "福昕软件成立于哪一年?", "answer": "福昕软件成立于2001年。" }, { "question": "福昕软件的主营业务是什么?", "answer": "福昕软件的主营业务是聚焦PDF相关解决方案。" }, { "question": "福昕软件在员工利益方面采取了哪些措施?", "answer": "福昕软件制定了长期持股计划以绑定员工利益。" } ] }, { "part": "第二部分", "qa_pairs": [ { "question": "福昕软件公司的产品在哪些方面具有竞争力?", "answer": "福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。" }, { "question": "福昕软件未来的市场发展潜力如何?", "answer": "福昕软件公司后续有望抢占更多市场份额。" } ] }, { "part": "第三部分", "qa_pairs": [ { "question": "“订阅+渠道”双转型的核心策略是什么?", "answer": "福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。" }, { "question": "福昕软件订阅模式为客户提供了哪些增值服务?", "answer": "福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。" } ] }, { "part": "第四部分", "qa_pairs": [ { "question": "福昕软件在境内市场拓展方面的策略是什么?", "answer": "福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。" } ] }, { "part": "第五部分", "qa_pairs": [ { "question": "福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?", "answer": "福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。" }, { "question": "接入ChatGPT后的产品变化有哪些?", "answer": "接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。" } ] }, { "part": "第六部分", "qa_pairs": [ { "question": "福昕软件的投资评级如何?", "answer": "福昕软件的投资评级为“买入”。" }, { "question": "根据估值模型,福昕软件的目标市值是多少?", "answer": "根据估值模型,福昕软件的目标市值为117.0亿元。" } ] } ] ```
res = messages['data'][0]['content'][0]['text']['value']
json_start = res.find("```json\n")
json_end = res.find("```\n")
if json_start>=0:
if json_end > json_start:
res = res[json_start+8:json_end]
elif json_end ==-1:
res = res[json_start+8:len(res)-3]
data = json.loads(res)
data
[{'part': '第一部分', 'qa_pairs': [{'question': '福昕软件成立于哪一年?', 'answer': '福昕软件成立于2001年。'}, {'question': '福昕软件的主营业务是什么?', 'answer': '福昕软件的主营业务是聚焦PDF相关解决方案。'}, {'question': '福昕软件在员工利益方面采取了哪些措施?', 'answer': '福昕软件制定了长期持股计划以绑定员工利益。'}]}, {'part': '第二部分', 'qa_pairs': [{'question': '福昕软件公司的产品在哪些方面具有竞争力?', 'answer': '福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。'}, {'question': '福昕软件未来的市场发展潜力如何?', 'answer': '福昕软件公司后续有望抢占更多市场份额。'}]}, {'part': '第三部分', 'qa_pairs': [{'question': '“订阅+渠道”双转型的核心策略是什么?', 'answer': '福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。'}, {'question': '福昕软件订阅模式为客户提供了哪些增值服务?', 'answer': '福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。'}]}, {'part': '第四部分', 'qa_pairs': [{'question': '福昕软件在境内市场拓展方面的策略是什么?', 'answer': '福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。'}]}, {'part': '第五部分', 'qa_pairs': [{'question': '福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?', 'answer': '福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。'}, {'question': '接入ChatGPT后的产品变化有哪些?', 'answer': '接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。'}]}, {'part': '第六部分', 'qa_pairs': [{'question': '福昕软件的投资评级如何?', 'answer': '福昕软件的投资评级为“买入”。'}, {'question': '根据估值模型,福昕软件的目标市值是多少?', 'answer': '根据估值模型,福昕软件的目标市值为117.0亿元。'}]}]
rows = []
for x in data:
for y in x['qa_pairs']:
rows.append(y)
rows
[{'question': '福昕软件成立于哪一年?', 'answer': '福昕软件成立于2001年。'}, {'question': '福昕软件的主营业务是什么?', 'answer': '福昕软件的主营业务是聚焦PDF相关解决方案。'}, {'question': '福昕软件在员工利益方面采取了哪些措施?', 'answer': '福昕软件制定了长期持股计划以绑定员工利益。'}, {'question': '福昕软件公司的产品在哪些方面具有竞争力?', 'answer': '福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。'}, {'question': '福昕软件未来的市场发展潜力如何?', 'answer': '福昕软件公司后续有望抢占更多市场份额。'}, {'question': '“订阅+渠道”双转型的核心策略是什么?', 'answer': '福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。'}, {'question': '福昕软件订阅模式为客户提供了哪些增值服务?', 'answer': '福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。'}, {'question': '福昕软件在境内市场拓展方面的策略是什么?', 'answer': '福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。'}, {'question': '福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?', 'answer': '福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。'}, {'question': '接入ChatGPT后的产品变化有哪些?', 'answer': '接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。'}, {'question': '福昕软件的投资评级如何?', 'answer': '福昕软件的投资评级为“买入”。'}, {'question': '根据估值模型,福昕软件的目标市值是多少?', 'answer': '根据估值模型,福昕软件的目标市值为117.0亿元。'}]
import pandas as pd
df = pd.DataFrame(rows)
df
thread_message = client.beta.threads.messages.create(
thread_id=thread.id,
role="user",
content="每个部分可以拆分为几个子部分,分别输出。"
)
print(thread_message)
run = client.beta.threads.runs.create(
thread_id=thread.id,
assistant_id=assistant.id,
model = "gpt-3.5-turbo"
)
print(run)
run = wait_on_run(run, thread)
print(run.id)
messages = client.beta.threads.messages.list(thread_id=thread.id)
messages = json.loads(messages.model_dump_json())
print(messages['data'][0]['content'][0]['text']['value'])
根据文档内容,可以将文档分为以下子部分并逐个输出: ### 第一部分(发展历程、主营业务、财务分析、公司治理) 1.1 发展历程:公司成立时间较早,聚焦海外市场开拓 - 福昕软件成立于2001年。 1.2 主营业务:聚焦PDF相关解决方案 - 福昕软件的主营业务是聚焦PDF相关解决方案。 1.3 财务分析:依托优秀的成长性和稳固的行业地位,公司长期财务数据表现亮眼 - 公司长期财务数据表现亮眼,依托优秀的成长性和稳固的行业地位。 1.4 公司治理:股权清晰且稳定,长期持股计划绑定员工利益 - 公司股权清晰且稳定,采取长期持股计划绑定员工利益。 ### 第二部分(所处行业分析) 2.1 行业空间:无纸化、电子化办公已成趋势,PDF赛道规模剑指千亿 - 行业天花板高,公司竞争力强。 2.2 公司竞争力分析:公司产品在功能、价格、用户评价三个维度均有一定竞争力,后续有望抢占更多市场份额 - 公司产品在功能、价格、用户评价三个维度均有一定竞争力。 ### 第三部分(订阅+渠道双转型) 3.1 订阅转型:订阅模式下可为客户提供丰富的增值服务,并提升客户终生价值 - “订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。 3.2 渠道转型:核心在于通过渠道触达海量客户资源,进而抢占更多市场份额 - 通过渠道触达海量客户资源,抢占更多市场份额。 ### 第四部分(境外收入占比、境内市场拓展) 4.1 福昕家装解决方案 - 谈及福昕家装解决方案。 4.2 福昕船舶图纸管理系统 - 谈及福昕船舶图纸管理系统。 4.3 电子签名解决方案 - 谈及电子签名解决方案。 ### 第五部分(AIGC赋能、产品竞争力) 5.1 AIGC赋能正在进行时,产品竞争力日益凸显 - 福昕的产品具备AIGC赋能,竞争力日益突出。 ### 第六部分(盈利预测、估值与投资评级) 6.1 盈利预测及假设 - 公司的盈利预测及假设。 6.2 估值与投资评级 - 估值模型与投资评级。 这样,每个部分都被细分并输出了各自的子部分内容。