Java项目设为系统服务进行管理大数据开发Linux中启动SpringBoot分为前台启动和后台启动。 • 前台启动是指通过命令直接运行SpringBoot项目JAR包,并且运行打印日志直接显示在我们所看到的前台,页面一旦关闭就会停止或改变; • 而后台启动则是通过命令或脚本启动SpringBoot项目,是项目能够独立的在后台运行,不会打扰我们其他操作。 这里介绍的是以服务的形式后台启动Java项目。2024-6-3 Java Linux
Apache DolphinScheduler中ZK与CDH不兼容问题的解决方案大数据开发针对ZK与CDH不兼容问题不兼容的问题,需要自己重新编译一个新包。 原因是DS默认是使用zk-3.8的配置,所以会出现不兼容问题。因此,使用zk-3.4配置编译一个DS新包即可适配zk-3.4.x。2024-5-23 ZooKeeper Dolphinscheduler CDH
CDH Kafka 安装配置大数据开发本文以在CDH安装过组件后需要重新安装的情况为场景,以Kafka为例。 其实在CDH安装组件的时候出错,大多数原因都是由于之前安装或者使用过组件,删除时只时在CM上删除了,但实际上组件的文件仍在节点机器上存在,再次在CM上傻瓜式安装就会出错。2024-4-1 CDH Kafka
ChatGPT生成Hive建表语句大数据开发• 搭建数据仓库需要完成将业务数据从MySQL生产库每日导入Hive的ods层的数据迁移任务 ◦ 由于Hive建表和MySQL存在语法差异,建表需要人工介入 ◦ 这里尝试使用ChatGPT完成MySQL的DDL到Hive建表语句的转换2023-8-31 Hive AI MySQL
数据同步工具 - NiFi大数据开发NiFi是一个易于使用,功能强大,可靠的处理和分发数据框架。主要用于数据的同步传输,支持灵活的数据格式转换,同时可以设置定时调度任务。2023-4-27 HDFS ZooKeeper
数据可视化的历史大数据开发科学数据表明,人类获取的信息83%来自视觉,通过可视化的手段,可以把数据中的价值,以及潜在的信息更直观地表达出来,目前数据可视化已经发展成为一门学科,文本介绍了数据可视化的历史发展沿袭,有助于大家扩展数据管理的专业视野。 可视化发展史与测量、绘画、人类现代文明的启蒙和科技的发展一脉相承。在地图、科学与工程制图、统计图表中,可视化理念与技术已经应用和发展了数百年。2023-3-31 其他
CDH集群配置目录汇总大数据开发Cloudera Manager是一种集中化的管理软件,用于管理和监控Hadoop集群。它提供了一个易于使用的Web界面,使管理员能够轻松地管理Hadoop环境,从而节省时间和精力。2023-3-2 CDH
DataX - 异构数据源离线同步工具大数据开发DataX是阿里巴巴开源的一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。 源码地址:https://github.com/alibaba/DataX2023-1-17 DataX ETL
Dolphinscheduler 3.1.4 部署大数据开发部署 dolphinscheduler 进行大数据调度,以三台主机的集群为例。2023-1-13 Dolphinscheduler MySQL