CDSN 2024博客之星总评选-主题文章创作,我的AI之路-起手篇
- 一. 回顾自己的机器学习之路
- 二. 2024年的大模型学习
- 三. 对自己的期望
一. 回顾自己的机器学习之路
自2019年起,我开始涉足机器学习领域,最初接触的是通过模型实现自动化的任务,如验证码识别、票据解析以及合同比对等应用。这些初体验不仅让我认识到机器学习在解决特定问题上的强大能力,也激发了我对这一技术的热情。随着兴趣的增长和工作内容的变化,我有机会着手构建用于生产的结构化数据的机器学习模型,涵盖了业务分析、特征工程(包括特征抽取和分析)、模型训练及超参数调整等关键步骤。随后,我开始利用开源模型涉足自然语言处理(NLP)领域,实践了命名实体识别(NER)、情感分析等一系列文本处理任务。
到了2020年,我有幸主导了AI中台的研发工作,这使我对数据标注流程、训练工艺、AI平台架构等及其在企业级应用中的重要性有了更加深刻的理解。AI中台不仅仅是一个工具集合,它为各类AI项目提供了统一的数据管理和模型开发环境,极大地促进了团队间的协作效率和技术资源的有效利用。
2022年11月,ChatGPT的发布标志着自然语言处理领域的一个重大转折点。这一创新迅速吸引了全球范围内的广泛关注,预示着自然语言大模型时代的到来。自此之后,语言模型不再局限于单一的语言理解或生成任务,而是逐渐演进成为多模态大语言模型(Multimodal Large Language Models, MLLMs)。这类模型能够整合来自不同来源的信息——无论是文本、图像还是音频,都成为了它们理解和表达的对象。这种转变不仅拓宽了语言模型的应用场景,也使其变得更加智能,成为了连接多种信息形式的桥梁,为未来的人工智能发展开辟了新的可能性。
通过这段旅程,我见证了从基础机器学习到复杂AI系统的演变过程,每一个阶段的进步都离不开持续的学习和技术积累。如今,面对多模态大语言模型带来的机遇与挑战,我们正站在一个新的起点上,准备迎接更加激动人心的技术变革。
二. 2024年的大模型学习
2024年,我有幸参加了书生·浦语的某期训练营,并获得优秀学员。在训练营中,我深入研究并实践了书生浦语这一强大的自然语言处理(NLP)平台及其配套的工具链。作为一名数据科学领域进入到AI细分领域的开发者,这段经历不仅加深了我对NLP的理解,也让我在实际项目中积累了宝贵的经验。
除了核心的大模型外,书生浦语还配备了一整套完善的工具链,涵盖了从模型部署、模型推理优化、模型量化、模型评测、Agent、多模态支持等的各个环节。这些工具极大地简化了大模型开发、应用的工作流程,使我们可以更专注于业务逻辑的设计与实现。
回顾过去一年的学习历程,可以说书生浦语及其工具链为我的成长带来了巨大助力。然而,AI技术日新月异,前方还有更多未知等待着我去探索。展望未来,我希望能够在保持现有优势的基础上,继续深入挖掘书生浦语的各项潜力,尤其是在多模态融合、工业研发、生产、运营等领域取得突破。同时,也期待与更多志同道合的朋友交流合作,共同推动自然语言处理技术向着更高层次迈进。
三. 对自己的期望
总之,2024这一年在学习和探索AI大模型的日子既充实又充满乐趣。相信只要保持好奇心和探索精神,每个人都能在这片广阔的天地间找到属于自己的舞台。希望我的经历能给同样热爱AI的朋友们带来些许启发,让我们携手共进,在追逐梦想的路上越走越远。
2025,梦虽远,且行则达。