前言
首先是安装python,更新pip源到清华源。安装transformer
pip install transformer
安装jupyter lab,也简单一行
pip install jupyterlab
现在不想用anaconda了,因为国内没有源了,国外的又慢。直接用pip吧。
然后开始体验之旅吧:
打开终端,输入:
jupyter lab
会弹出一个web页面,代开后输入python代码:
from transformers import pipeline
cf \= pipeline("sentiment-analysis")
cf(
\["hello world.",
"This place is too dirty.",
\]
)
输出下面的内容:
No model was supplied, defaulted to distilbert-base-uncased-finetuned-sst-2-english and revision af0f99b (https://huggingface.co/distilbert-base-uncased-finetuned-sst-2-english).
Using a pipeline without specifying a model name and revision in production is not recommended.(这里是一个警告,没关系)
\[{'label': 'POSITIVE', 'score': 0.9997791647911072},
{'label': 'NEGATIVE', 'score': 0.999772846698761}\]
输出包含了这两句话的正面还是负面情绪的判断。可以自己写两句看看哦。
注意:代码最后一段的是调用cf,所以没有“=”号,要注意,我一开始就是多添加一个“=”,半天看不出哪里错了。
再来一段:
from transformers import AutoTokenizer
ck \= "distilbert-base-uncased-finetuned-sst-2-english"
tokenizer \= AutoTokenizer.from\_pretrained(ck)
a \= \[
"hello world.",
"This place is too dirty.",
\]
inputs \= tokenizer(a,padding=True,truncation=True,return\_tensors="pt")
print(inputs)
输出:
{'input\_ids': tensor(\[\[ 101, 7592, 2088, 1012, 102, 0, 0, 0\],
\[ 101, 2023, 2173, 2003, 2205, 6530, 1012, 102\]\]), 'attention\_mask': tensor(\[\[1, 1, 1, 1, 1, 0, 0, 0\],
\[1, 1, 1, 1, 1, 1, 1, 1\]\])}
解释:
AutoTokenizer是自动分词工具。它的作用是根据你选择的模型,自动选择和该模型匹配的分词器(tokenizer),本例我选择 distilbert-base-uncased-finetuned-sst-2-english 模型,AutoTokenizer会自动选择和该模型匹配的分词器。
from_pretrained是加载预训练模型的方法,这里加载了 distilbert-base-uncased-finetuned-sst-2-english 模型。
tokenizer 作为一个函数别名指代了预训练模型。
该模型加载了要分析的句子 a ,以及一些参数的指定,最后输出。
最后的最后
感谢你们的阅读和喜欢,我收藏了很多技术干货,可以共享给喜欢我文章的朋友们,如果你肯花时间沉下心去学习,它们一定能帮到你。
因为这个行业不同于其他行业,知识体系实在是过于庞大,知识更新也非常快。作为一个普通人,无法全部学完,所以我们在提升技术的时候,首先需要明确一个目标,然后制定好完整的计划,同时找到好的学习方法,这样才能更快的提升自己。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
一、全套AGI大模型学习路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
四、AI大模型商业化落地方案
五、面试资料
我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】