que bom que o caso foi resolvido lendo código, as vezes não da pra encontrar e tem que usar ferramentas como jdk flight recorder.
Concordo com o que o Pilati disse: "observabilidade". Instrumentar observabilidade no sistema fica bem mais facil de enxergar esses gargalos. Em empresas grandes vi o Dynatrace ou Data Dog que ajudam muito para encontrar esses problemas.