• 三天学会网络爬虫之Day03

    三天学会网络爬虫之Day03第一章 课程计划第二章 案例扩展2.1.定时任务。2.1.1.Cron表达式2.1.2.Cron测试2.2.网页去重2.2.1.去重方案介绍2.2.2. SimHash2.2.2.1.流程介绍2.2.2.2.签名距离计算2.2.2.3.导入simhash 工程2.3.代理的使思2.3.1.代理服务器2.3.1.使用代理第三章 ElasticSearch环境准备3.1.安装ElasticSearch服务3.2.安装ES的图形化界面插件.3.3.安装IK分词器第一章 课程计划1

    IT资讯, 数码, 软件 2022年2月5日
  • 【 RocketMQ 专栏】基于 Linux 环境安装部署 RocketMQ 教程(一步一步跟着安装就对了)

    这里是 RocketMQ 系列的第一篇文章,工欲善其事,必先利其器,先不讲理论,也不具体介绍 RocketMQ,我们先把 RocketMQ先安装上,让你们实地感受下 RocketMQ 整个安装流程,安装完后我们再后续文章对 RocketMQ 手术刀式一层一层进行剖析。下载安装包直接从 RocketMQ 官网下载最新的安装包下载地址:https://www.apache.org/dyn/closer.cgi?path=rocketmq/4.9.2/rocketmq-all-4.9.2-bin-relea

    IT资讯, 数码, 软件 2022年2月5日
  • 深入浅出Apache DolphinScheduler

    Apache DolphinScheduler 是一个大数据调度任务框架。从当前的CSDN GitCode热度来看,在二月份排名第6位。那是相当的热门。Apache DolphinScheduler 是Apache旗下的开源项目,目前已经被Fork了2700次,Star了7.3k;这还是相当厉害了!其是一个云原生的可视化的大数据工作流调度系统,其使命就是致力于解决复杂大数据任务依赖,默认就支持多个大数据任务之间的数据操作的编排。相对于其他的大数据调度框架:azkaban ,Airflo, XxJob强大很多

    IT资讯, 数码, 软件 2022年2月5日
  • DataX 简介及架构原理

    DataX 简介及架构原理概述DataX是阿里巴巴使用 Java 和 Python 开发的一个异构数据源离线同步工具异构数据源:不同存储结构的数据源致力于实现包括关系型数据库 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS等各种异结构数据源之间稳定高效的数据同步功能 – Sqoop 是用于在与 RDBMS 之间数据迁移工具 – DataX 是阿里开

    IT资讯, 数码, 软件 2022年2月5日
  • RocketMQ源码解析-Namesrv启动过程

    NameServer通常也是集群的方式部署,各实例间相互不进行信息通讯。Broker是向每一台NameServer注册自己的路由信息,所以每一个NameServer实例上面都保存一份完整的路由信息。当某个NameServer因某种原因下线了,Broker仍然可以向其它NameServer同步其路由信息,Producer,Consumer仍然可以动态感知Broker的路由的信息。

    IT资讯, 数码, 软件 2022年2月5日
  • 数据备份和容灾技术

    数据备份和容灾基础知识点

    IT资讯, 数码, 软件 2022年2月5日
  • Dubbo-admin

    Dubbo的管理控制台-dubbo-admin启动方法

    IT资讯, 数码, 软件 2022年2月5日
  • 一个新用户注册活动你怎么去设计?

    想想有一个需求,新用户注册赠送10元券的功能。我们会怎么去实现?用户注册public class UserService { // 用户注册 public void register(User user){ // …… System.out.println(“用户注册完成”); }}活动赠送public class ActivityService { // 赠送活动券 public void give

    IT资讯, 数码, 软件 2022年2月5日