Executando verificação de segurança...
4

[PITCH] Criei uma API para remoção de background que custa 1/3 do valor do remove.bg

Contextualização

O I Hate Background (IHB) é uma plataforma para remoção de background que roda inteiramente no seu navegador, sem precisar enviar imagens para servidores externos, respeitando a privacidade.

O IHB utiliza tecnologia da Hugging Face para rodar modelos localmente no navegador. Desta forma o projeto é construído desde o inicio com foco na privacidade e no uso de IA.

Dito isso:

  1. Não precisa submeter imagens a servidores de terceiros, respeitando a privacidade.
  2. Consegue fazer remoção de imagens em lote, sem limites de quantidade.
  3. Qualidade original de ponta-a-ponta, sem distorções ou redução de tamanho.
  4. Fácil de usar e com foco na experiência do usuário.

Criação da API

No escopo original não estava a ideia de lançar uma API. Mas, na verdade, isso era meio que inevitável. Como eu quero o quanto antes buscar forma de monetizar através de entrega de valor, isso, mais cedo ou mais tarde, iria acontecer. Revolvi seguir a mesma proposta de qualidade e robustez do webapp, então utilizei a biblioteca Transformers da Hugging Face para o Python. Como interface REST API utilizei o FastAPI.

Como escolha de modelo eu fiquei dividido em vários disponíveis. Testei até abordagem híbrida utilizando SAM 2 com RMBG 2.0, mas a sensação que ficou é o modelo da Meta é meio inútil. Por hora, fiquei com o modelo BiRefNet com o treinamento de ultra-detalhes. Essas e outras informações você consegue ver no repositório: https://github.com/LuSrodri/canva-copy-api.

Por utilizar um modelo relativamente pesado, resolvi utlizar a infra do Google Cloud Run com Nvidia L4. Isso garante uma média de 4 segundos de processamento para uma imagem 1024x1024. Para acesso, optei pelo Rapid API, pela facilidade de configuração, alta disponibilidade, e divulgação. Caso queira testar a API, utilize o link presente na fonte desse artigo.

Posso dizer que, como diferencial, a API do I Hate Backgrond possuí uma alta disponibilidade, robustez, e consistência nos resultados das imagens. Mas como principal, custa 1/3 por imagem processada em relação ao concorrente principal.


Quero ouvir a opinião da comunidade. O que vocês acham da abordagem? Quais melhorias sugerem?

Carregando publicação patrocinada...