5月22日,和鲸科技成功举办“101数智领航计划”系列直播活动,以“经管科研范式变革下的工具与实践”为主题,探讨数智时代人工智能技术对于经管领域学术研究与实践应用的影响。
活动特邀同济大学经济与管理学院助理研究员胡维老师担任主讲嘉宾。以信息系统领域为例,胡维老师分享了其对于经管研究范式演变的洞察,并通过案例直观地展示了新范式下的研究方法和科研工具。活动吸引了来自全国 30 多所高校经管专业的老师,更有 200 多名同学通过视频号在线参与。
胡维老师首先回顾了经管领域常用的研究方法,通过期刊论文中的数据展示了研究范式的演变情况。
在过去 20 年,实证研究(Empirical research)的数量大幅增加,他将这一趋势归因于三个方面:二手数据(Secondary data or web scraping)越来越易得;机器学习、数据挖掘、文本分析等技术发展得越来越快;以及企业对与学术界合作进行现场实验(Field experiment)的意愿不断增强。
他表示,尽管目前数据驱动的研究(Data-driven research)在数量上尚未超过实验调查(Experiment survey),但未来十年必定会引起越来越多的关注,相关研究也会更加丰富和多元。
与此同时,数据可得性的增强使得复杂的数据处理需求越来越多,相较于过往使用 SPSS、Stata 就能完成处理的结构化数据, 经管研究者现在将需要越来越多地使用 Python/R 等编程语言来处理文本、图片、视频等多模态的数据。胡维老师建议还没有接触过相关编程语言的老师同学,可以尝试上手学习此类编程语言。
复杂科研数据的处理也对计算资源提出了更高要求,个人笔记本电脑已无法满足,高性能计算往往需要借助云服务,或在课题组的服务器上执行。
为了帮助大家更好地理解和感受新研究范式,胡老师进一步分享了他近期的三个研究案例。
首先是 Node2vec 在网络分析中的应用分析。胡老师通过分析社交媒体上 S&P500 指数涵盖的股票之间的共同提及(co-mention)关系,构造共同提及网络(Co-mention network)。然后基于节点嵌入(Node embedding)算法得到的节点嵌入向量,通过 cosine 相似度计算得到不同股票之间的相似度,为投资决策和市场分析提供支持。
其次是 FinBERT 在金融文本分析中的应用。胡老师利用基于金融预训练语言模型 FinBERT 对金融类文本进行词嵌入(Word embedding),然后基于逻辑回归算法对文本情感倾向进行监督学习。该模型有助于对股票市场的情感倾向进行更加有效的评估。
最后一个案例关于微调 GPT 在文本生成中的应用,胡老师展示了如何在专利文本这一特定场景下将对大语言模型(例如 GPT2 )进行微调。
过程中,胡老师对研究所使用的和鲸平台给予了高度评价。“除了环境管理、计算资源管理外,对于需要长时间运行的计算任务,我可以发布离线任务,然后就能去忙别的事了,这样相当于不仅解决了我计算资源的需求,也能帮助我并行处理多项科研工作。”
胡维老师展示在ModelWhale平台使用不同的计算资源运行
篇幅原因,本文仅对胡维老师的分享内容进行了简要概述。
若您需要获取完整视频实录学习,可以点此链接(请备注“经管直播”)。
本次活动属于和鲸发起的和鲸社区“101数智领航计划”系列活动,旨在积极贯彻教育部基础学科系列“101计划”工作。2024 年,和鲸社区结合近十年在数据科学人工智能的开源资源积累和专业共建经验积累,将与 20 个头部高校共创共建高质量课程、高质量数据集、高质量实践项目以及学科大模型等,同时开放 1000 个学院名额,助力建立 AI 创新虚拟实验室。