-
【大数据】OLAP架构及技术实现的演进简介
文章目录一、架构分类二、技术演进1、传统关系型数据库时期2、大数据技术时期一、架构分类OLAP名为联机分析,又称多维分析,什么是多维分析,指的是多种不同的维度审视数据,进行深层次分析。进行分析必不可少对数据进行下钻、上卷、切片、切块、旋转等操作,为了更加直观,我们可以使用立方体来表示。下钻:从高层次向低层次明细数据穿透。例如从“省”下钻到“市”,从“浙江省”穿透到“杭州市”和“台州市”。上卷:和下钻相反,从低层次向高层次聚合。例如从“市”汇聚成“省”,将“杭州市”、“台州市”聚合成“湖北
-
pandas使用idxmin函数获取dataframe每个数据行中最小值对应的列名称(column label of min value in each row in dataframe)
pandas使用idxmin函数获取dataframe每个数据行中最小值对应的列名称(column label of minvalue in each row in dataframe)
-
基于疫情实时大数据报告数据,我用 Pyecharts 库制作了省位地图和轮播图
前几天有个学生娃子找我帮忙做点可视化的作业,其实倒是也不难,觉得挺有意思,这里拿出来给大家分享,主要是完成了轮播图的制作,显得作业高大上一些。需要技术交流,文末提供。数据来源首先是数据来源,来自百度疫情实时大数据报告,如下图所示。实现过程新增感染病例这里直接上代码和效果图,如下所示:from pyecharts.charts import Map, Timelinefrom pyecharts import options as opts# 准数据shanxi_city = ["西安市
-
三天学会网络爬虫之Day03
三天学会网络爬虫之Day03第一章 课程计划第二章 案例扩展2.1.定时任务。2.1.1.Cron表达式2.1.2.Cron测试2.2.网页去重2.2.1.去重方案介绍2.2.2. SimHash2.2.2.1.流程介绍2.2.2.2.签名距离计算2.2.2.3.导入simhash 工程2.3.代理的使思2.3.1.代理服务器2.3.1.使用代理第三章 ElasticSearch环境准备3.1.安装ElasticSearch服务3.2.安装ES的图形化界面插件.3.3.安装IK分词器第一章 课程计划1
-
RocketMQ源码解析-Broker部分之Broker启动过程
启动入口BrokerStartup
-
【 RocketMQ 专栏】基于 Linux 环境安装部署 RocketMQ 教程(一步一步跟着安装就对了)
这里是 RocketMQ 系列的第一篇文章,工欲善其事,必先利其器,先不讲理论,也不具体介绍 RocketMQ,我们先把 RocketMQ先安装上,让你们实地感受下 RocketMQ 整个安装流程,安装完后我们再后续文章对 RocketMQ 手术刀式一层一层进行剖析。下载安装包直接从 RocketMQ 官网下载最新的安装包下载地址:https://www.apache.org/dyn/closer.cgi?path=rocketmq/4.9.2/rocketmq-all-4.9.2-bin-relea
-
深入浅出Apache DolphinScheduler
Apache DolphinScheduler 是一个大数据调度任务框架。从当前的CSDN GitCode热度来看,在二月份排名第6位。那是相当的热门。Apache DolphinScheduler 是Apache旗下的开源项目,目前已经被Fork了2700次,Star了7.3k;这还是相当厉害了!其是一个云原生的可视化的大数据工作流调度系统,其使命就是致力于解决复杂大数据任务依赖,默认就支持多个大数据任务之间的数据操作的编排。相对于其他的大数据调度框架:azkaban ,Airflo, XxJob强大很多
-
RocketMQ源码解析-Namesrv启动过程
NameServer通常也是集群的方式部署,各实例间相互不进行信息通讯。Broker是向每一台NameServer注册自己的路由信息,所以每一个NameServer实例上面都保存一份完整的路由信息。当某个NameServer因某种原因下线了,Broker仍然可以向其它NameServer同步其路由信息,Producer,Consumer仍然可以动态感知Broker的路由的信息。
-
数据备份和容灾技术
数据备份和容灾基础知识点
