CDSN 2024博客之星总评选-主题文章创作，我的AI之路-起手篇

一. 回顾自己的机器学习之路
二. 2024年的大模型学习
三. 对自己的期望

一. 回顾自己的机器学习之路

自2019年起，我开始涉足机器学习领域，最初接触的是通过模型实现自动化的任务，如验证码识别、票据解析以及合同比对等应用。这些初体验不仅让我认识到机器学习在解决特定问题上的强大能力，也激发了我对这一技术的热情。随着兴趣的增长和工作内容的变化，我有机会着手构建用于生产的结构化数据的机器学习模型，涵盖了业务分析、特征工程（包括特征抽取和分析）、模型训练及超参数调整等关键步骤。随后，我开始利用开源模型涉足自然语言处理（NLP）领域，实践了命名实体识别（NER）、情感分析等一系列文本处理任务。

到了2020年，我有幸主导了AI中台的研发工作，这使我对数据标注流程、训练工艺、AI平台架构等及其在企业级应用中的重要性有了更加深刻的理解。AI中台不仅仅是一个工具集合，它为各类AI项目提供了统一的数据管理和模型开发环境，极大地促进了团队间的协作效率和技术资源的有效利用。

2022年11月，ChatGPT的发布标志着自然语言处理领域的一个重大转折点。这一创新迅速吸引了全球范围内的广泛关注，预示着自然语言大模型时代的到来。自此之后，语言模型不再局限于单一的语言理解或生成任务，而是逐渐演进成为多模态大语言模型（Multimodal Large Language Models, MLLMs）。这类模型能够整合来自不同来源的信息——无论是文本、图像还是音频，都成为了它们理解和表达的对象。这种转变不仅拓宽了语言模型的应用场景，也使其变得更加智能，成为了连接多种信息形式的桥梁，为未来的人工智能发展开辟了新的可能性。
通过这段旅程，我见证了从基础机器学习到复杂AI系统的演变过程，每一个阶段的进步都离不开持续的学习和技术积累。如今，面对多模态大语言模型带来的机遇与挑战，我们正站在一个新的起点上，准备迎接更加激动人心的技术变革。

二. 2024年的大模型学习

2024年，我有幸参加了书生·浦语的某期训练营，并获得优秀学员。在训练营中，我深入研究并实践了书生浦语这一强大的自然语言处理（NLP）平台及其配套的工具链。作为一名数据科学领域进入到AI细分领域的开发者，这段经历不仅加深了我对NLP的理解，也让我在实际项目中积累了宝贵的经验。
除了核心的大模型外，书生浦语还配备了一整套完善的工具链，涵盖了从模型部署、模型推理优化、模型量化、模型评测、Agent、多模态支持等的各个环节。这些工具极大地简化了大模型开发、应用的工作流程，使我们可以更专注于业务逻辑的设计与实现。

回顾过去一年的学习历程，可以说书生浦语及其工具链为我的成长带来了巨大助力。然而，AI技术日新月异，前方还有更多未知等待着我去探索。展望未来，我希望能够在保持现有优势的基础上，继续深入挖掘书生浦语的各项潜力，尤其是在多模态融合、工业研发、生产、运营等领域取得突破。同时，也期待与更多志同道合的朋友交流合作，共同推动自然语言处理技术向着更高层次迈进。