Meus 2 cents,
Atualmente utilizo o LMStudio e o AnythingLLM como wrappers (em docker) para acesso aos modelos (com a vantagem de manter minhas chaves privadas, sem precisar compartilha-las com terceiros)
Qual seria o diferencial da tua ferramenta quando comparado com os casos acima ?