张飞的猪编程工作室

  • 首页
  • Web3.0
  • 大数据
  • 技术书籍
  • 拾记
  • 关于
Hello World
大数据、数据仓库、Web3.0编程技术文章与资料分享,欢迎关注微信公众号:张飞的猪大数据分享
大数据

数据仓库(11)什么是大数据治理,数据治理的范围是哪些

什么是数据治理,数据治理包含哪些方面?大数据时代的到来,给了我们很多的机遇,也有很多的挑战。最基础的调整也是大数据的计算和管理,数据治理是一个特别重要的大数据基础,他保证着数据能否被最好的应用,保证着数据的安全,治理等。那么数据治理到底能治什么,怎么治? 数据治理主要包含七个方面。 ####主数据管理 即数据本身的管理,对于数据本身,基于数据仓库,我们做了数据的分层、数据域的划分、基于维度建模的架构、命名规范、对需要共享的数据建立统一视图和集中管理等,这些都是属于这个主数据管理的范围。 ####元数据管理 元数据,…

2023年 2月 7日 0条评论 453点热度 1人点赞 张飞的猪 阅读全文
技术书籍

精益数据分析PDF下载

精益数据分析PDF下载 书籍下载 大数据资料分享,失效可留言处理 链接:https://pan.baidu.com/s/1HUvJzxp5W33GjFlGUDjn7A?pwd=wq71 提取码:wq71

2023年 2月 7日 0条评论 999点热度 1人点赞 张飞的猪 阅读全文
大数据

数据仓库(10)数仓拉链表开发实例

拉链表是数据仓库中特别重要的一种方式,它可以保留数据历史变化的过程,这里分享一下拉链表具体的开发过程。 维护历史状态,以及最新状态数据的一种表,拉链表根据拉链粒度的不同,实际上相当于快照,只不过做了优化,去除了一部分不变的记录,通过拉链表可以很方便的还原出拉链时点的客户记录。 这里用商品价格的变化作为例子,具体的开发过程要按实际的来,不能照搬代码,编程重要的是了解背后的思路和原理,而不是ctrl+c和ctrl+v。那对我们学习提升的帮助有限,虽然可能对完成工作的效率帮助很大。 在开始介绍之前,这里的数据仓库的环境是…

2023年 2月 7日 0条评论 300点热度 2人点赞 张飞的猪 阅读全文
技术书籍

大数据Spark企业级实战版PDF下载

大数据Spark企业级实战版PDF下载 书籍下载 大数据资料分享,失效可留言处理 链接:https://pan.baidu.com/s/1DSWRkewJddGO7mx-d114bA?pwd=khz0 提取码:khz0

2023年 2月 6日 0条评论 316点热度 1人点赞 张飞的猪 阅读全文
技术书籍

Flink CDC 新一代数据集成框架-技术原理、入门与生产实践PDF下载

Flink CDC 新一代数据集成框架-技术原理、入门与生产实践PDF下载 书籍下载 数据仓库资料分享,失效可留言处理 链接:https://pan.baidu.com/s/1sqeUR6oL0aRCOUpVR6fqdg?pwd=rgt9 提取码:rgt9

2023年 2月 6日 0条评论 479点热度 1人点赞 张飞的猪 阅读全文
技术书籍

大数据数仓经典最值得阅读书籍推荐资料分享pdf下载

书籍下载 数据仓库资料分享,失效可留言处理 链接:https://pan.baidu.com/s/12K8FUFTeUDNpQq_sNfc2Kg 提取码:ZFDZ 分享的资料截图如下,共11本。 书籍推荐 从事数仓工作,在工作学习过程也看了很多数据仓库方面的数据,此处整理了数仓中经典的,或者值得阅读的书籍,推荐给大家一下,希望能帮助到大家。建议收藏起来,后续有新的书籍清单会更新到这里。 《数据仓库工具箱(第3版)——维度建模权威指南》 本书会介绍基本知识,然后逐个讨论具体实例内容,最后进行综合总体分析,在内容的结构…

2023年 2月 6日 0条评论 438点热度 1人点赞 张飞的猪 阅读全文
大数据

数据仓库(09)数仓缓慢变化维度数据的处理

  数据仓库的重要特点之一是反映历史变化,所以如何处理维度的变化是维度设计的重要工作之一。缓慢变化维的提出是因为在现实世界中,维度的属性并不是静态的,它会随着时间的流逝发生缓慢的变化,与数据增长较为快速的事实表相比,维度变化相对缓慢。阴齿这个就叫做缓慢变化维。   这里介绍的就是这些维度变化的处理,这边整理了一下目前主流的缓慢变化维的处理方式。 原样保留或者重写,这种方式理论上都是取最新的值作为维度的最终的取值,每个维度保留一条数据。这种处理方式是最简单的,直接将原系统的维度同步过来使用就可以,不用做过多的处理。 …

2023年 2月 6日 0条评论 278点热度 0人点赞 张飞的猪 阅读全文

张飞的猪

选择远方,风雨兼程,专注于web3.0及其前沿的技术。

标签聚合
Web3.0 大数据 书籍 区块链 Flink 数据仓库 spark 网站搭建 网站运营
归档
  • 2023年3月 / 2篇
  • 2023年2月 / 7篇
  • 2023年1月 / 4篇
  • 2022年12月 / 6篇
最新 热点 随机
最新 热点 随机
数据仓库(13)大数据数仓经典最值得阅读书籍推荐 数据仓库(12)数据治理之数仓数据管理实践心得 数据仓库(11)什么是大数据治理,数据治理的范围是哪些 精益数据分析PDF下载 数据仓库(10)数仓拉链表开发实例 大数据Spark企业级实战版PDF下载 Flink CDC 新一代数据集成框架-技术原理、入门与生产实践PDF下载 大数据数仓经典最值得阅读书籍推荐资料分享pdf下载
WEB3.0的现状以及未来的发展,其会颠覆我们的知识结构? Flink CDC 新一代数据集成框架-技术原理、入门与生产实践PDF下载 数据仓库(09)数仓缓慢变化维度数据的处理 数据仓库(03)数仓建模之星型模型与维度建模 数据仓库(13)大数据数仓经典最值得阅读书籍推荐 数据仓库(04)基于维度建模的数仓KimBall架构 精益数据分析PDF下载 利用WordPress搭建属于自己的网站

COPYRIGHT © 2022 张飞的猪技术博客分享. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

粤ICP备2022149594号