我是如何带团队从0到1做了AI中台

经历心得

我从18年初就开始带这小团队开始做项目,比如最初的数字广东的协同办公项目,以及粤信签小程序等,所以,在团队管理,人员安排,工作分工,项目拆解等方面都有一定的经验。

19年中旬,中心总监找到我说,我们要成立一个数据项目,做政府行业的大数据平台。虽然我当时已经有七年+的工作经验,但是在数据这方面的经验,几乎为0。当时听到这些东西也是有点蒙,不知道我要做的工作内容是什么。但是领导安排下来的任务,不管怎么样,也都要扛下来,于是我就欣然的答应了。

首先,要跟项目的项目负责人以及产品同学进行了初步的接触,拿到了立项的ppt以及文档以后。看了里边的内容,尤其重点关注了AI中台的内容,什么标签,模型,多维分析,深度学习等等概念,虽然我都听过,但是如何去做,我真的是很是胆怯,不知道能不能搞出来,按照当时的一个从未在数据领域做过项目的同学,真的是感受到了巨大压力,但是很快转变思维,鼓励自己,虽然在做业务后台已经做了七八年,转型做数据类型的项目,可以让自己涉及到自己的未知领域,所以,确定的目标就是:

面对困难,不断学习,将困难分解,逐一破解。

但是,我要如何做项目呢?

第一步,技术预研,确定主要技术栈,开发语言。我拿到立项书,确定我们的主要是做大数据,数据分析,机器学习深度学习的工程类的项目,其主流的技术栈偏java,python等语言,但是,我对java基本上零经验,那我应该选择什么语言开发呢,最后还是决定使用java主要开发语言

第二步,招人,必须有人,才会推动项目进展下去。因为这个项目是经费立项的形式,腾讯侧会以每半年投入百万经费的形式到项目组,因为部门也是成立不就,编制人员紧缺,只有核心岗位为腾讯的正式员工,也就是说,我们需要自己招外包同学来建立自己的团队,鉴于之前做粤省事成立开发团队的经验,如何快速的打造一直技术团队,只能招市场上多人会的语言,因此,果断我们选择了java作为开发语言,虽然我之前的java开发经验非常之少。所以,总结一句话,做项目是一个团队,首先必须要有人做事情,才能往前开展。

在项目成立之初,到能够交付给用户使用的一年时间里,我面试了外包同学不下几百份简历,形形色色的人员真的是太多了,各种培训班出身,简历包装的很漂亮,但是一面试就啥也不知道,最开始的项目一定找到比较合适的人选进入到项目团队,才会不会写出烂代码。随着各种事情的发生,想法逐渐改变,聊的稍微不错的,先让他进来做一下,如果不错就留下来。不行就在换人。

第三步,确定核心需求。项目伊始,作为技术负责人,一定要和项目的总负责人进行深度的沟通和交流。两人进行深度的意见交换,达成一致,才会凝聚整个团队的成员。

所以,经过一番的讨论,我们把项目初步分成五期功能来实现:

1、实现基本的多数据源管理能力,并选择基于腾讯内部的TBDS的大数据套件的能力

2、实现核心的自动化机器学习核心流程,数据预处理,特征工程,automl,部署,预测等能力

3、实现基于spark的的数据算子能力

4、实现深度学习模型训练能力

5、实现模型管理能力。

等等

讲完以上,我们就开始动工开始项目动工了。虽然第一行代码是我开始写的,但是当我们进来第一个程序员的时候,我就开始了我们指定研发的基本规范了,因此规范包括如下:

1、研发流程规范,包括从需求阅读,到需求分解,tapd需求录入与跟进,概要设计,库表,接口设计,内部评审,研发周期确认等等一些列流程规范

2、代码规范,做项目,最终项目能够跑起来就是我们的生产力代码了。其中包括分支规范,代码分层结构,命名规范等等。

3、其他规范,不一一介绍

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/596112.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于TL431和CSA的恒压与负压输出

Hello uu们,51去那里玩了呀?该收心回来上班了,嘿嘿! 为什么会有这个命题,因为我的手头只有这些东西如何去实现呢?让我们一起来看电路图吧.电路图如下图1所示 图1:CSA恒压输出电路 图1中,R1给U2提供偏置,Q1给R1提供电流,当U1-VOUT输出大于2.5V时候,U2内部的三极管CE导通,使得…

Kalign 3:大型数据集的多序列比对

之前一直用的是muscle,看到一个文章使用了Kalign,尝试一下吧 安装 wget -c https://github.com/TimoLassmann/kalign/archive/refs/tags/v3.4.0.tar.gz tar -zxvf v3.4.0.tar.gz cd kalign-3.4.0 mkdir build cd build cmake .. make make test su…

JVM之内存分配的详细解析

内存分配 两种方式 不分配内存的对象无法进行其他操作,JVM 为对象分配内存的过程:首先计算对象占用空间大小,接着在堆中划分一块内存给新对象 如果内存规整,使用指针碰撞(Bump The Pointer)。所有用过的内…

图片四张的时候两个一排 图片三张 五张的时候三个一排 css 如何实现

实现的效果如下图 1、html <view v-if"item.photo_list && item.photo_list.length ! 0" :class"getImageClass(item.photo_list.length)"><view v-for"(j,ind) in item.photo_list" :key"photoind" class"imag…

[python]texthero安装后测试代码

测试环境&#xff1a; anaconda3python3.8 texthero1.1.0 测试代码来自官方&#xff1a;https://github.com/jbesomi/texthero 代码&#xff1a; import texthero as hero import pandas as pddf pd.read_csv("https://gitee.com/FIRC/texthero/raw/master/dataset/…

自动化运维管理工具-------------Ansible

目录 一、自动化运维工具有哪些&#xff1f; 1.1Chef 1.2puppet 1.3Saltstack 二、Ansible介绍 2.1Ansible简介 2.2Ansible特点 2.3Ansible工作原理及流程 2.3.1内部流程 2.3.2外部流程 三、Ansible部署 3.1环境准备 3.2管理端安装 ansible 3.3Ansible相关文件 …

Hibernate 元数据模型(MetaModel)提示类没有找到错误

在进行一次编译的时候&#xff0c;提示下面的错误信息&#xff1a; java: java.lang.ClassNotFoundException: org.hibernate.jpamodelgen.JPAMetaModelEntityProcessor 问题和解决 如果你对 Hibernate 的元数据还是不非常了解的话&#xff0c;请参考文章&#xff1a; JPA 的…

保研面试408复习 3——操作系统

文章目录 1、操作系统一、进程有哪几种状态&#xff0c;状态之间的转换、二、调度策略a.处理机调度分为三级&#xff1a;b.调度算法 标记文字记忆&#xff0c;加粗文字注意&#xff0c;普通文字理解。 为什么越写越少&#xff1f; 问就是在打瓦。(bushi) 1、操作系统 一、进程…

深度学习中的不确定性量化:技术、应用和挑战综述(一)

不确定性量化(UQ)在减少优化和决策过程中的不确定性方面起着关键作用&#xff0c;应用于解决各种现实世界的科学和工程应用。贝叶斯近似和集成学习技术是文献中使用最广泛的两种UQ方法。在这方面&#xff0c;研究人员提出了不同的UQ方法&#xff0c;并测试了它们在各种应用中的…

JAVA学习14——异常

目录 异常&#xff1a; 1.异常基本介绍&#xff1a; 2.异常体系图&#xff1a; 3.五大运行时异常&#xff1a; &#xff08;1&#xff09;NullPointerException空指针异常&#xff1a; &#xff08;2&#xff09;AirthmetiException数字运算异常&#xff1a; &#xff0…

翻译《The Old New Thing》 - Thread messages are eaten by modal loops

Raymond Chen 2005年4月26日 模态消息循环吃掉了线程消息 简要 文章提出了一个常见但也容易被忽视的问题&#xff1a; 线程消息&#xff08;由 PostThreadMessage 创建&#xff09;在模态循环中会被 DispatchMessage 丢弃&#xff0c;因为它们没有关联的窗口句柄。建议在创建窗…

2024年好用的几款数据库管理工具

本文主要介绍几款市面上好用的几款支持多种数据库、跨平台的数据库管理工具&#xff0c;包括开源/免费/收费不同的形式。 1. Chat2DB Chat2DB 是一款自2022年9月起开源的AI驱动的数据库管理工具&#xff0c;现如今已经超过了13k的Star。由EasyExcel&#xff08;31K Star&#…

Linux网络编程---Libevent库

一、简介 Libevent库的特点&#xff1a;开源。精简。跨平台&#xff08;Windows、Linux、maxos、unix&#xff09;。专注于网络通信。 二、安装 进入官网下载安装包后拖入虚拟机&#xff0c;压缩包名为 libevent-2.1.11-stable.tar.gz解压&#xff1a;使用命令tar -zxvf libe…

Sy9-dhcp/dns服务配置

前言、 课程需要&#xff08;进入服务器综合配置使用阶段了&#xff09;&#xff0c;这里还是沿用桌面版的ubuntu来配置dhcp和dns&#xff0c;这里updated了新的版本。2024.5 server端环境&#xff1a; Win11VMS&#xff1a;192.168.105.1192.168.105.128 &#xff08;ubuntu…

SEED-X:多模态智能助手

SEED-X&#xff1a;多模态智能助手 SEED-X 是一个多模态智能助手&#xff0c;已经将所有的模型和代码开源了&#xff01;它是一个统一且多用途的多模态基础模型&#xff0c;最新开放了图像编辑模型。 相较于传统的多模态交互框架&#xff0c;SEED-X 具有以下优点&#xff1a;…

OpenHarmony实战开发-如何使用Web组件加载页面

页面加载是Web组件的基本功能。根据页面加载数据来源可以分为三种常用场景&#xff0c;包括加载网络页面、加载本地页面、加载HTML格式的富文本数据。 页面加载过程中&#xff0c;若涉及网络资源获取&#xff0c;需要配置ohos.permission.INTERNET网络访问权限。 加载网络页面…

bugku-mathEnglish

拿到题目得到一串数学题&#xff0c;解出答案得 发现答案全都是1-5的数字&#xff0c;联想到英语中的元音密码解码字典 参照表中字母和前面解出的对应数字&#xff0c;得到flagyuanyinpwd&#xff0c;按格式提交解出题目答案

大模型_基于医疗领域用lora微调ChatDoctor模型

文章目录 ChatDoctor目标方法结果结论收集和准备医患对话数据集创建外部知识数据库具有知识大脑的自主聊天医生的开发模型培训结果数据和模型&#xff1a; 微调推理 ChatDoctor 目标 这项研究的主要目的是通过创建一个在医学建议中具有更高准确性的专业语言模型&#xff0c;来…

创新指南|非凡时代的变革型领导力——五个领导力差异化优势将使高管能够重塑他们的组织

大多数商界领袖现在都明白&#xff0c;我们正在经历一场“伟大的重构”&#xff0c;整个行业、经济和社会都在重塑的时期。然而&#xff0c;考虑到他们面临的短期压力&#xff0c;很少有高管发现自己能够真正应对这些变化&#xff0c;这些变化对他们的组织所需的转型意味着什么…

【Mac】 DSync for mac(文件比较同步工具) v2.7安装教程

软件介绍 DSync是一款文件比较同步工具&#xff0c;通过简便的三步即可完成繁琐的比较、同步操作&#xff0c;您甚至可以通过跳过、删除或反转您选择的文件的复制方向来微调您的同步。这是在Mac上同步文件的最简单方法。 安装教程 1.打开安装包&#xff0c;将「DSync」拖到右…