CDH 6.3.2 升级 Spark 3大数据开发由于 CDH6.3.2版本以上已不开源,目前常用组件只能自编译升级,比如 Spark 。 看网上的资料,有人说 Spark3 的 SQL 运行性能比 Spark2 可提升 20%,本人未验证,但是 Spark3 的 AE 功能的确很香,能自适应解决 Spark SQL 的数据倾斜。2023-1-10 CDH Spark
CDH 6.3.2 升级 Hive 2.3.9大数据开发CDH 6.3.2 初始的 Hive版本为2.1.1,在不对开源版souce源码包进行重新编译的前提下试着去升级Hive3(3.1.2、3.1.3),结果均失败,最终选择先升级Hive2(2.3.9),这种升级方式的好处是不需要对source源码tar包进行重新编译。 由于CDH6.3.2版本中默认的Spark组件版本为2.4.0,参考Compatibility with Apache Hive - Spark 2.4.0 Documentation官网,Spark2.4.0版本支持的Hive Metastore版本最高至2.3.3,也就是说理论上如果想获得CDH6.3.2中的默认Spark支持,升级的Hive版本最高为2.3.3。2023-1-8 CDH Hive
CDH6.3.2升级Zookeeper3.4.14大数据开发CDH 6.3.2 版本默认安装的 Apache ZooKeeper为3.4.5,使用Apache DolphinScheduler,依照DS文档说明,需要zookeeper的版本为3.4.6+。2023-1-6 ZooKeeper
DataX报错解决办法 - 单个channel的bps值报错大数据开发运行DataX时可能会出现报错:在有总bps限速条件下,单个channel的bps值不能为空,也不能为非正数。2023-1-5 DataX 报错
CDH 6.3.2 Hive on Spark 报错Required executor memory大数据开发CDH 6.3.2 Hive on Spark 报错Required executor memory2023-1-4 Spark Hive CDH 报错
Hadoop Yarn - 高可用服务主备状态查询大数据开发在使用HDFS NameNode和Yarn ResourceManager等具有高可用性的服务时,通常会遇到的一个问题是:判断哪个是主节点(active),哪个是备用节点(standby)。2023-1-3 HDFS YARN
CDH 6.3.2 Hue 报错Could not connect to xx:10000大数据开发CDH 6.3.2 Hue 报错Could not connect to xx:10000 (code THRIFTTRANSPORT): TTransportException2023-1-2 CDH Hue 报错
CDH 6.3.2 Hue 报错 1366大数据开发CDH 6.3.2 Hue 报错(1366, “Incorrect string value: ‘\xE3\x80\x81\xE6\x8C\x89…’ for column ‘search’ at row 1”)2022-12-31 CDH Hue 报错
CDH - 请求 Service Monitor 超时大数据开发CDH运行一段时间就提示 • 请求 Service Monitor 超时 ◦ 这可能会导致页面响应缓慢,请查看 Service Monitor 的状态 ◦ 有时候服务器宕机重启后CMS未成功启动,也会出现这种问题2022-12-29 CDH 报错