之前我独自开发了一个名为“心情追忆”的小程序,旨在帮助用户记录日常的心情变化及重要时刻。
项目需求来源->设计->前端(小程序)->后端->部署均由我一人完成. 上线一个月. 通过群聊分享等. 用户量也有了100多人. 我希望持续发展.
然后今天又产生了一个新的想法. 就是做一个食物热量分析. 这也是在逛论坛的时候看到的. 然后我觉得现在年轻人注重健康, 注重饮食. 这也是保持良好情绪的一种, 符合我的小程序的方向. 于是决定做一下.
其实这个需求抽象来说就是 用户上传食物图片->程序分析其中食物的热量(当让要判断一些其他情况)->返回结果给用户. 其中关键点就是分析图片, 在AI层面来说就是需要一个图片理解大模型
于是我去调研了一下发现市场上有很多图片理解大模型提供api. 但是都是要收费. 分析1张图片的内容2分钱. 还是为了成本考虑. 部署在自己的PC上吧.
最终找测试成功dify+ollama
ollama是一个一键部署大模型的工具, 很简单
dify是一个AI服务编排的开源工具, 也很简单. 并且服务搭建好后, 还自动提供api调用. 很方便
最终要选择一个本地能跑的最大的一个模型(当然跟服务厂商比不了). 性价比最高的就是llava-llama3
然后去dify官网下载部署, docker一键部署, 很简单.
然后把ollama集成到dify, 很简单
最终要创建一个工作流, 这个就要稍微学习一下了, 其实也不难
最终先得到了图片理解的大致功能, 成功分析出国外的汉堡和国内的辣子鸡
后续继续微调一下, 然后就可以放到小程序作为一个新功能了