java | StringTable 性能调优

StringTable 底层是一个 Hash 表。

读取大批量文件

文件下载

代码

package com.redisc;

import lombok.extern.slf4j.Slf4j;

import java.io.BufferedReader;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStreamReader;


@Slf4j(topic = "c.Run")
public class Run {

    public static void main(String[] args) throws IOException {
        try (BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream("src/main/resources/words"), "utf-8"))) {
            String line = null;
            long start = System.nanoTime();
            while (true) {
                line = reader.readLine();
                if (line == null) {
                    break;
                }
            }
            System.out.println("cost:" + ((System.nanoTime() - start) / 1000000));
        }
    }

}

输出

cost:27

调整 StringTable 大小

VM 增加 -XX:StringTableSize=20000 -XX:+PrintStringTableStatistics

输出

cost:20
SymbolTable statistics:
Number of buckets       :     20011 =    160088 bytes, avg   8.000
Number of entries       :     18968 =    455232 bytes, avg  24.000
Number of literals      :     18968 =    717080 bytes, avg  37.805
Total footprint         :           =   1332400 bytes
Average bucket size     :     0.948
Variance of bucket size :     0.944
Std. dev. of bucket size:     0.971
Maximum bucket size     :         7
StringTable statistics:
Number of buckets       :     20000 =    160000 bytes, avg   8.000
Number of entries       :      2069 =     49656 bytes, avg  24.000
Number of literals      :      2069 =    135320 bytes, avg  65.404
Total footprint         :           =    344976 bytes
Average bucket size     :     0.103
Variance of bucket size :     0.103
Std. dev. of bucket size:     0.321
Maximum bucket size     :         4