Tem como explicar melhor por que não é possível usar Selenium ou playright? Se é web tem objeto dom, se é muito antigo, provavelmente tem tag form e os inputs tem nome, da pra chegar nos objetos dom. Se o sistema não tem mudanças de frontend, da pra chegar em qualquer objeto dom da interface web, nem que seja por array depois.
Outra abordagem, é ver as requisições que o navegador faz e fazer tudo via curl ou alguma chamada http em sua linguagem favorita.
Mas se insistir em posicionamento de tela, como por exemplo um app desktop, sugiro mudar o foco de ferramentas para algo parecido com macros de jogos MMO que automatizam cliques em tela.