文章目录
- DeepSeek是什么
- DeepSeek平台使用
- DeepSeek的使用场景
- DeepSeek的本地部署
DeepSeek是什么
DeepSeek是一家2023/7月年成立的人工智能公司,致力于开发高效、高性能的生成式AI模型,在短短一年多的时间里推出了多款强大的开源模型,包括DeepSeek Coder,DeepSeek LLM, DeepSeek-V2, DeepSeek-V3, DeepSeek-R1
和多模态模型Janus(用于图像理解、图像生成)
DeepSeek平台使用
平台网址
平台注册
DeepSeek-V3 性能对标GPT-4o;
DeepSeek-R1 性能对标GPT-o1闭源版本,并且DeepSeek-R1是开源的,MIT许可,允许‘模型蒸馏’进一步提取自己的大模型;
DeepSeek API文档
DeepSeek网页版
DeepSeek的使用场景
- 代码改写,实现纠错、注释、调优等;
- 代码生成,根据功能需求实现一段代码;
- 代码解释,帮助理解;
- 结构化输出,如输出json
- 内容分类、翻译、场景对话等;
DeepSeek的本地部署
实现本地化使用,无需联网;
-
ollama的下载、安装
下载地址
ollama是一个开源框架,便于在本地机器部署、运行LLM;
-
选择DeepSeek的模型,可以在ollama的搜索框中输入对应的模型,如deepseek-r1
-
安装模型