携手共进
创造美好未来

敏捷项目管理体系(敏捷项目管理流程包括)

编辑导语:数据集市应该如何构建才能提高可用性,具有更强的市场适应性?也许,你可以结合产品敏捷方法来建立一个数据集市。在本文中,作者通过一个案例分析了如何使用Scrum敏捷方法来构建数据集市。让我们看一看。

scrum敏捷项目管理流程图(scrum敏捷项目管理方法)

数据仓库于1988年首次提出,至今已经发展了几十年。从数据仓库1.0到数据仓库4.0,从关系数据库到大数据仓库。目前,数据集市、数据湖和数据仓库的集成是RD和行业发展的一个重要方向。

数据仓库的构建在业界有一套成熟的方法论,但如何构建数据集市却众说纷纭。作为数据产品经理,他对数据仓库、数据集市等技术领域并不陌生。在建立数据集市的过程中,过程和项目管理的问题经常导致数据集市的低可用性和低商业价值。

如何更高效地构建业务应用场景的数据集市?产品敏捷方法能够快速有效地应用于数据集市的构建吗?

一、基本概念1。数据仓库和数据集市

数据仓库是面向主题的、集成的、相对稳定的反映历史变化的数据集,用于支持管理层和业务层的业务分析和业务决策。数据仓库用于支持决策,面向分析数据处理。为了实现OLAP,将分散的、独立的数据库孤岛集成到一个数据结构中,称为数据仓库。

有了数据仓库,为什么还需要数据集市?让我们看看数据集市旨在解决什么问题。

数据集市可以理解为一种“小型数据仓库”,只包含单个主题,关注范围不是全局的。数据集市可以分为两种类型:

一种是独立数据集市,这类数据集市有自己的源数据库和ETL架构;另一种是非独立数据集市,这种数据集市没有自己的源系统,它的数据来自数据仓库。

数据集市是一个结构化的概念。它是企业级数据仓库的子集,主要面向部门业务,只面向一个特定的主题。

数据集市是数据仓库之上更为聚焦的业务主题的集合,更倾向于满足业务数据快速高效应用的需求。它通常用于商业智能系统中的探索性和交互式数据分析应用程序。

2.产品敏捷方法

现在大部分互联网公司都在用敏捷开发,最流行最成熟的敏捷开发框架是Scrum。以下是Scrum的三个重要角色和三个重要概念。

Scrum中的人分为三个重要角色:产品负责人)、Scrum Master (scrum master)和开发团队(Dev Team)。

三个重要概念:Sprint,产品Backlog,Sprint Backlog。

Sprint:一个冲刺或迭代周期,一般2~4周,是一个可以交付验收的产品需求功能集合;Product Backlog:产品需求集合,是产品规划中所有的需求点;Sprint Backlog:每个Sprint的功能需求点,来自于Product Backlog。

一般的Scrum开发过程如下:

scrum敏捷项目管理流程图(scrum敏捷项目管理方法)

为什么数据集市项目特别适合使用Scrum方法进行迭代:

数据集市需求划分明确。集市的业务域和主题域正好对应Scrum的Story和Sprint。做出来的集市宽表是否有用,可以在某个业务域内先做一张,快速验证效果。每个宽表的产出时间周期相对好评估,整体项目风险可控。

看看我们对主题领域的数据集市的计划和安排:

PO(Product Owner):数据产品经理。SM(Scrum Master):数据研发主管。Team(Dev Team):数据架构师,数据研发工程师,数据测试工程师。Story:每个Story可以根据业务域来划分,比如我们划分了资金域,用户域,模型域,市场域,营销域,信审域,风控域,财务域,征信域。Sprint:每个Sprint可以规划一到两张宽表,比如资金域我们规划了借款宽表,还款宽表,其他类似。

2.Scrum敏捷方法解决了哪些问题?1.效率

过去,在一个主题领域中开发一个数据集市需要自顶向下的建模设计、维度表设计、事实表设计、架构设计、数据表开发、表验证和表测试。一个完整的瀑布落下来,几个月过去了,一个庞大完整的数据集市出来了,交付给分析师和业务。

分析师大呼看不懂,但还是查的慢。很多表还是需要我加入,商家也大呼为什么一个数据要这么久,为什么一个分析要一个星期?

基于敏捷方法的数据集市的构建提高了整个生产过程的效率。根据具体的业务场景和分析师的需求,分步骤构建一个或几个宽表,先输出给分析师,然后不断调整数据字段,大大缩短了生产建设周期。

2.MVP验证问题

通过小步快跑的模式,每个Sprint用两周时间构建1~2个张宽表,解决一些核心的分析和检索场景,然后交付和验证价值,然后迭代,添加新的字段,不断验证MVP闭环。

3.商业价值问题

基于业务分析场景和分析师使用场景,基于如何设计宽表,快速验证并生成直接分析价值和业务价值。与传统的自顶向下的瀑布式构建流程相比,它不追求一个大而全的数据集市和数据字段,紧密结合业务场景进行设计。

三。案例分享1。项目介绍

在数据集市项目推出之前,已经有了一套数据仓库。在初始阶段,只有两层,一个ODS层和一个DWD层。

Dw级别的表很少,几乎可以忽略不计。在业务分析过程中,我们发现很多分析仍然依赖于ODS层表,有的可以使用DWD层表,说明数据仓库层次结构不清晰,违背了数据仓库和数据集市建设中跨层访问的原则(一般分析师不需要访问ODS层表)。

为了进一步打破数据孤岛,提高数据使用链中工作人员的工作效率,进一步快速支持分析决策,我们拟在现有基础仓库的基础上建立一套数据集市层系列主题宽表。

2.计划图编制

我们使用Scrum敏捷方法来规划每个Sprint的迭代节奏。主题和应用场景的广泛列表计划如下:

scrum敏捷项目管理流程图(scrum敏捷项目管理方法)

3.项目执行

团队建设,除了常规的SCRUM核心团队,我们还加入了需求源团队和用户团队。

源团队的数据产品经理收集需求和痛点的主要受访用户,用户团队都是数据用户。其他PO、SM和开发、测试团队是敏捷开发角色。具体项目小组分配分工如下:

scrum敏捷项目管理流程图(scrum敏捷项目管理方法)

4.效果评估

Sprint1在借款的主题领域推出了两个宽表(贷款偿还和偿还宽表)。我们没有快速进入下一个迭代,而是根据收集到的在线表格的使用价值和评估成本降低和效率提高的指标,编制了以下表格:

scrum敏捷项目管理流程图(scrum敏捷项目管理方法)

4.总结数据仓库和数据集市的建设。市场上有成熟的方法论;传统的建设流程存在流程冗长、人员繁杂、脱离商业场景、价值评估偏差等问题。敏捷Scrum方法框架可以优化数据集市构建流程,降低成本提高效率,紧密贴合业务;Scrum本质上是一套项目管理过程和敏捷迭代过程。需要收集具体项目的具体分析,吸收Scrum的精华为我所用。本文由@成穗行冯原创发布。每个人都是产品经理。未经许可,禁止复制。

来自Unsplash的图像,基于CC0协议。

版权声明:本站资源及文章图片来自互联网及其他公众平台,版权归原作者,如有侵权请联系我们删除!
文章链接:http://www.rujiaoqi1.com/152134.html