首页  ·  知识库 ·  大数据
网格模式   列表模式
  • 在软件工程中良好的设计具有不可比拟的意义,它胜于需求、编码、维护等环节,秉承设计优先的原则会让软件开发变得简单高效,可以尽量避免掉因设计失误而导致的缺陷,一个健壮的程序必然有良好的
  • 有结构地分类组织和存储是我们面临的一个挑战。数据模型强调从业务、数据存取和使用角度合理存储数据。数据模型方法,以便在性能、成本、效率之间取得最佳平衡
  • 2021年12月31号,全国信息安全标准化技术委员会秘书处发布了《网络安全标准实践指南——网络数据分类分级指引》,给出了数据分类分级的原则、框架和方法。
  • 好的数据治理体系可以盘活整条数据链路,最大化保障企业数据的采集、存储、计算和使用过程的可控和可追溯。
  • MLOps寻求提高自动化程度并改善生产模型的质量,同时还要关注业务和法规要求。虽然MLOps是从一组最佳实践开始的,但它正逐渐演变成一种独立的ML生命周期管理方法。
  • 随着数据量、速度和种类的增加,选择合适的数据平台来管理数据从未像现在这样重要。它应该是迄今为止满足我们需求的古老数据仓库,还是应该是承诺支持任何类型工作负载的任何类型数据的数据湖?
  • 作为一名数据的规划者,我们肯定希望自己的数据能够有秩序地流转,数据的整个生命周期能够清晰明确被设计者和使用者感知到。直观来讲就是如图这般层次清晰、依赖关系直观。
  • 在过去的十年间,混合云、人工智能、物联网(IoT)和边缘计算造成大数据呈指数级增长,提高了企业数据管理的复杂程度。
  • 数据湖是为了应对数据仓库的局限性而开发的。虽然数据仓库为企业提供高性能和可扩展的分析,但它们昂贵、专有,不能处理大多数公司正在寻求解决的现代用例场景。
  • 常见大数据技术名词解释
  • 不管在哪一重,在日常工作场景,或面试的时候,分析某指标上升/下跌的原因,其实核心考察2个要素:业务理解和逻辑。
  • 数据倾斜就是我们在计算数据的时候,数据的分散度不够,导致大量的数据集中到了一台或者几台机器上计算,这些数据的计算速度远远低于平均计算速度,导致整个计算过程过慢。