Spark常用算子(保姆级) Spark

Spark常用算子(保姆级)

SparkRDD的算子分为转换算子(Transformation)和行动算子(Action)。转换算子分为:Value类型、双Value类型和K-V类型。将处理的数据逐条进行映射转换,这里的转换可以是类型的转换,也可以是值的转换...............
阅读全文
JVM 性能调优(结合可视化工具) Java

JVM 性能调优(结合可视化工具)

1. Heap内存(老年代)持续上涨达到设置的最大内存值;2. Full GC 次数频繁;3.GC 停顿时间过长(超过1秒);4.应用出现OutOfMemory 等内存异常;内存溢出:申请内存时,没有足够的内存使用、内存泄露:无法释放已经申请的内存空间,一次性内存危害库忽略,但堆积,无论多少内存迟早被吃光
阅读全文

使用not exists提升性能

not exists是sql中的一个语法,常用在子查询和主查询之间,用于条件判断,根据一个条件返回一个布尔值,从而来确定下一步操作如何进行。
阅读全文
红黑树(基于2-3树等价) 数据结构

红黑树(基于2-3树等价)

(1).每一个节点或者是黑色,或者是红色 (2).根节点是黑色 (3).每一个叶子节点是黑色 (4).若是一个节点是红色的,则它的子节点必须是黑色的 (5).从任意一个节点到叶子节点,通过的黑色节点是同样多的
阅读全文
深入浅出ConcurrentHashMap详解 Java

深入浅出ConcurrentHashMap详解

避免 HashMap 的线程安全问题,有多个解决方法,比如改用 HashTable 或者 Collections.synchronizedMap() 方法。 ConcurrentHashMap的优势在于兼顾性能和线程安全,一个线程进行写操作时,它会锁住一小部分,其他部分的读写不受影响,其他线程访问没上锁的地方不会被阻塞。
阅读全文
2-3查找树 数据结构

2-3查找树

2-结点,含有一个键(及其对应的值)和两条链接,左链接指向的2-3树中的键都小于该结点,右链接指向的2-3树中的键都大于该结点。3-结点,含有两个键(及其对应的值)和三条链接,左链接指向的2-3树中的键都小于该结点,中链接指向的2-3树中的键都位于该结点的两个键之间,右链接指向的2-3树中的键都大于该结点。...
阅读全文
AVL平衡二叉搜索树 数据结构

AVL平衡二叉搜索树

AVL树定义如下:是平衡二叉树或者是一棵空树,或者是具有以下性质的二叉排序树:1.每个节点的平衡因子只可能是1、0、-1(绝对值≤1,如果超过1,称之为“失衡”)2.每个节点的左右子树高度差不超过13.因为每个结点的高度差不超过1,AVL树搜索、添加、删除的时间复杂度是O(logn)......
阅读全文
本文目录
    Loading...