O que estou sugerindo nao eh um webscrapping de todo o site ou semelhante.
Eh pegar uma pagina da empresa que forneca dados de uma carga baseado em uma consulta (p.ex. CNPJ).
Estes dados sao entao examinados (p.ex. via XML ou DOM) e extraidos/convertidos para JSON e entao inseridos na sua aplicacao.
Como eh algo pontual (conforme consulta) eh improvavel que seja bloqueado.
O maior problema eh que se encontrar alguma pagina que tenha a consulta via CAPTCHA, e contornar isso as vezes pode ser chato.