十年数据分析经验分享

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

在过去的十年里,作者在多个公司担任分析角色,从德国的小型金融科技初创公司到高增长的预IPO企业(如Rippling)和大型科技公司(如Uber和Meta)。每家公司都有其独特的数据文化,每个职位都有其挑战和经验。以下是作者过去十年里积累的十大关键经验,这些经验在不同公司阶段、产品或商业模式下都适用:

  1. 用数据讲故事
    想想你的受众是谁。如果在研究型组织工作,或主要向技术利益相关者(如工程团队)展示,学术风格的分析可能是合适的。但如果受众是非技术业务团队或高管,则需重点关注关键见解,而不是技术细节,并将工作与所影响的业务决策联系起来。沟通不是分享自己觉得有趣的内容,而是分享受众需要听到的内容。最知名的这种洞察导向、由上而下的沟通方法是由麦肯锡顾问Barbara Minto开发的金字塔原理。
  2. 商业敏锐度是优秀与卓越数据科学家的最大区别
    在一家要求很高的公司,如果你是高级数据科学家,可以预期所有同事都具备很强的技术能力。你不会通过逐步改进技术技能脱颖而出,而是通过确保你的工作为利益相关者(如产品、工程、业务团队)带来最大影响力。商业敏锐度在此发挥作用:为了最大化影响力,你需要深入了解业务的优先事项和利益相关者面临的问题,制定直接帮助这些优先事项的分析解决方案,并以受众理解的方式传达见解和建议。
  3. 做一个客观的真理追寻者
    许多人会选择性地挑选数据以适应他们的叙述。这是有道理的:大多数组织奖励人们实现目标,而不是最客观的表现。作为数据科学家,有奢侈的条件推翻这种做法。数据科学团队通常不直接掌握业务指标,因此比销售等团队面临的短期目标压力小。利益相关者有时会迫使你找到支持他们预先创建的叙述的数据。虽然迎合这种做法在短期内可能会赢得一些分数,但从长远来看,坚持真理的态度会使你脱颖而出,并成为高管们在需要无过滤和无偏见观点时的首选对象。
  4. 数据与初级研究的结合
    数据人员通常对“轶事证据”不屑一顾,但它是严格定量分析的必要补充。进行实验和分析大数据集可以提供统计上显著的见解,但往往会错过一些信号。深入研究关闭交易的笔记、与客户交谈、阅读支持票据等有时是揭示某些问题或真正理解根本原因的唯一途径。例如,在B2B SaaS业务中,可能会在数据中看到企业交易的获胜率下降,甚至可以缩小到某种类型的客户。但要真正理解发生了什么,必须与销售代表交谈,深入研究他们的交易笔记,甚至与潜在客户交谈。
  5. 如果数据看起来好得令人难以置信,那通常是有问题的
    当人们看到指标急剧上升时,他们往往会兴奋,并将这一变化归因于自己做的某件事。不幸的是,当指标变化看起来异常积极时,往往是因为数据问题或一次性影响。例如,最近时期的数据不完整,指标会在所有数据点进入后平稳下来;或者一次性顺风不会持续(如1月初销售激增,这只是节假日积压的订单清理)。需要保持怀疑态度、好奇心和经验,以避免陷阱并生成可靠的见解。
  6. 愿意改变主意
    如果你从事数据工作,经常改变观点是很自然的。例如,你向高管推荐了一个行动方案,但在获得更多数据后失去了对其的信心;或者你以某种方式解释了指标变化,但进行了额外分析后认为另有原因。然而,大多数分析人员由于害怕看起来不称职或惹恼利益相关者,往往不愿意收回过去的声明。尽管这可以理解,但不应仅仅因为害怕失面子而坚持先前的建议。
  7. 务实
    在分析领域工作时,很容易形成完美主义。尽管科学方法训练了我们理想的分析或实验方法,但商业现实常常带来严重的限制。作为数据人员,需要帮助业务团队完成任务,而不是坚持完美的方法。与其追求完美,不如优先完成任务。
  8. 避免数据科学家因临时请求而精疲力竭
    雇用全能数据科学家来主要构建仪表板或执行临时数据提取和调查是一条通向精疲力竭和团队流失的捷径。许多公司,尤其是高增长初创公司,不愿意专门雇用数据分析师或BI人员进行指标调查和仪表板构建,因为他们希望团队具备灵活性。然而,这种做法往往导致数据科学家花费大量时间在这些任务上,从而难以在大型战略项目上取得进展。
  9. 并非所有情况都需要复杂的仪表板
    公司往往认为从电子表格转向BI解决方案是成熟强大的数据文化的标志。尽管关键决策的仪表板应该放在受管控的BI工具中,但许多情况下,Google Sheets能更快速地提供所需结果。团队总会利用日常使用的软件(如Salesforce)和电子表格的分析功能,因为他们需要快速行动。鼓励这种灵活的、分散的分析方法,而不是强制所有分析都通过BI工具进行,可以节省数据科学团队的资源,并为团队提供成功所需的工具(如基本SQL培训、数据建模和可视化最佳实践)。
  10. 实现全公司范围内的指标标准化是不现实的
    在快速增长的初创公司中,强制执行完美的治理是不可能的。尽管数据科学家对不匹配的指标定义感到困扰,但实际上这并不是世界末日。只要关键报告得到严格处理并遵循标准化定义,公司的数据稍微混乱是可以接受的。团队总会通过在BI工具外进行黑客式分析来解锁自己,从而难以强制执行共享数据模型。

这些经验将帮助数据科学家在分析领域脱颖而出,成为真正的思维伙伴。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/686631.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

企业研发数据泄露损失严重,研发数据保护到底怎么才能有效落地?

数据已成为企业毋庸置疑的核心资产,而企业众多数据中,研发数据则占据着重要的角色,近年来,发生了多起企业研发数据被窃取或泄露的事件,给企业带来严重的名誉、经济损失: 小米公司:2023年1月&am…

java学习笔记(持续更新中...)

Java 中的基本数据类型主要包括以下7种: byte:字节型,占用 1 字节,范围-128 到 127。char:字符型,占用 2 字节,范围 0 到 65535。short:短整型,占用 2 字节,…

针对多智能体协作框架的元编程——METAGPT

M ETA GPT: M ETA P ROGRAMMING FOR M ULTI -A GENT COLLABORATIVE F RAMEWORK 1.概述 现有的多智能体系统主要面临以下问题: 复杂性处理不足:传统的多智能体系统主要关注简单任务,对于复杂任务的处理能力有限,缺乏深入探索和…

Dvws靶场

文章目录 一、XXE外部实体注入二、No-SQL注入三、Insecure Direct Object Reference四、Mass Assignment五、Information Disclosure六、Command Injection七、SQL注入 一、XXE外部实体注入 访问http://192.168.92.6/dvwsuserservice?wsdl,发现一个SOAP服务。在SO…

vite项目启动后用局域网不能访问

今天来解决一个问题:基于Vite构建的Vue项目在启动后只能通过localhost这种形式访问 如果把localhost换成本主机的局域网ip地址之后页面无法访问了。 就连用127.0.0.1都无法访问。尝试多次之后,最后证明只有使用localhost这种形式才可以 原因&#xff1…

解锁机器学习的无限可能:深入探究scikit-learn的强大功能

解锁机器学习的无限可能:深入探究scikit-learn的强大功能 第一部分:背景和功能介绍 在数据科学和机器学习领域,scikit-learn(简称sklearn)是一个广泛使用的Python库。它提供了简单高效的工具用于数据挖掘和数据分析&a…

德勤报告:税务合规与转型过程中的技术应用

在当前数据驱动的时代,税务管理已不再是简单的合规问题,而是涉及到企业战略和运营的各个层面。德勤最新发布的《2023年税务转型趋势调研》详细探讨了全球企业在面对日益复杂的税务环境时,如何通过技术手段实现税务合规、税务转型和税务运营的…

乙二醇水溶液物性参数

1.1 乙二醇水溶液的冰点、沸点 乙二醇水溶液作为重要的载冷剂,其物理性质对设备和系统的设计都十分重要,下面是乙二醇水溶液的冰点沸点和其浓度的关系。(数据来源 ASHRAE 手册 2005) 1.2 乙二醇水溶液粘度 乙二醇水溶液作为重要…

【debug】vscode配置c/c++环境及查看调试信息m1 mac

之前用的一直是clion 但是经过反复调整,发现始终查看不了vector里面的数值(只有指针地址),改用常用的vscode后调试成功 安装 安装vscode 以及vscode中的扩展安装 c/c,c/c extension pack,cmake,cmake tools,code runner,codeLLD…

深度学习笔记: 最详尽LinkedIn Feed 排名系统设计

欢迎收藏Star我的Machine Learning Blog:https://github.com/purepisces/Wenqing-Machine_Learning_Blog。如果收藏star, 有问题可以随时与我交流, 谢谢大家! LinkedIn Feed 排名 1. 问题陈述 设计一个个性化的LinkedIn Feed,以最大化用户的长期参与度…

2.2 窗口的创建

本书使用C语言编写Windows程序,因此需要搭建C语言开发环境,使用Visual Studio作为C语言的开发工具。 本节必须掌握的知识点: 第8练:Windows程序模型 第9练:注册窗口类 第10练:创建、显示和更新窗口 第11练…

【控制实践——二轮平衡车】【五】转动运动模型及控制方法

传送门 系列博客前言运动模型控制方法控制器设计 结论 系列博客 【控制实践——二轮平衡车】【一】运动分析及动力学建模 【控制实践——二轮平衡车】【二】实物设计和开源结构&代码 【控制实践——二轮平衡车】【三】基于PID的直立控制 【控制实践——二轮平衡车】【四】…

27 ssh+scp+nfs+yum进阶

ssh远程管理 ssh是一种安全通道协议,用来实现字符界面的远程登录。远程复制,远程文本传输。 ssh对通信双方的数据进行了加密。 用户名和密码登录 密钥对认证方式(可以实现免密登录) ssh 22 网络层 传输层 数据传输的过程中是…

Matlab 2024a 建模基础知识全面指南

一、Matlab简介 1. Matlab是什么? Matlab(Matrix Laboratory)是由MathWorks公司开发的一个高性能的数值计算环境和编程语言。它以其强大的矩阵运算能力、丰富的工具箱和便捷的数据可视化功能而闻名,广泛应用于科学研究、工程模拟…

【面试干货】什么是索引?

【面试干货】什么是索引? 1、索引的定义2、索引的工作原理3、索引在数据库管理系统中的作用 💖The Begin💖点点关注,收藏不迷路💖 1、索引的定义 数据库索引是一个存储在磁盘上的数据结构,它以某种方式引用…

2024年全国青少信息素养大赛图形化编程挑战赛集训第一天编程题分享

大家如果不想阅读前边的比赛内容介绍,可以直接跳过:拉到底部看集训第一天题目 (一)比赛内容: 【小学低年级组】 1、图形化编程软件的使用:熟悉图形化编程软件中舞台区、角色列表区、功能区、脚本编 -3- 辑区的功能及使用。 2、基础功能模块的使用: a.运动模块:角…

ARM64汇编0A - thumb模式与IT块

本文主要讨论一下 32 位程序下的 thumb 模式相关东西,属于选读内容。 thumb模式 ARM模式的指令集宽度是32位而Thumb是16位宽度(但也可以是32位)。 Thumb也有很多不同的版本。不过不同的名字仅仅是为了区分不同版本的Thumb指令集而已(也就是对于处理器来说&#x…

10款必备软件,每款都是神器,赶快用起来吧!

AI视频生成:小说文案智能分镜智能识别角色和场景批量Ai绘图自动配音添加音乐一键合成视频https://aitools.jurilu.com/最近有很多小伙伴在咨询,我也抓紧时间整理了一些不错的软件和我陆续收到的,希望对大家有所帮助。 1. 全球鼠标——MouseI…

15_Vue3核心概念与实践

文章目录 Vue31. Vite2.使用Vite创建前端工程3.目录介绍4.SFC入门5.2.35.ViteVue样式导入方式6.响应式入门&&setup函数6.1 响应式数据6.2 省略setup(){} 省略default{},return{}6.3 案例开发功能概述 7. 插值表达式8.文本渲染v-text/v-html9. 属性渲染v-bin…