Executando verificação de segurança...
14

Pitch: Passei 1 ano construindo meu próprio “Google” e finalmente coloquei no ar

Eu sempre tive curiosidade sobre como os motores de busca realmente funcionam por trás. Aquela coisa de digitar algo e, em segundos, ter milhares de resultados organizados nunca deixou de me chamar atenção.

Há cerca de um ano, comecei um projeto pessoal sem muita pretensão, mais por aprendizado mesmo. A ideia era simples: criar uma ferramenta de análise de SEO sem depender dessas plataformas que cobram caro por algo que, no fundo, eu queria entender como construir.

Foi aí que nasceu o Pimgle.

No começo, era só um crawler bem básico. Eu deixava rodando nos momentos, na minha própria máquina, coletando dados, errando bastante, ajustando, quebrando e reconstruindo. Nessa época, eu ainda não estava usando IA como uso hoje, então foi muito na base de tentativa e erro mesmo.

Lembro de um momento específico que ficou marcado. Eu estava voltando de uma viagem, dentro do avião, sem muita distração. Resolvi abrir o notebook e comecei a montar a home e as páginas de resultado. Foi ali que o projeto começou a tomar uma forma mais real.

Depois de alguns meses com o crawler rodando, o banco já tinha milhões de registros. Parecia muito, e de certa forma era mesmo, mas quando você compara com o tamanho da internet, percebe que é só um grão de areia. Ainda assim, já dava para sentir que estava crescendo além do que eu tinha imaginado no início.

Foi nesse ponto que percebi que precisava de algo mais robusto para busca. Acabei escolhendo o Meilisearch pela simplicidade e velocidade de implementação, e isso destravou bastante coisa.

Recentemente, coloquei o projeto no ar.

Além do buscador, o Pimgle tem um recurso chamado Webtrack, que faz uma análise básica de um site. Ele mostra dados como quantidade de links internos e externos, além dos domínios externos que o próprio Pimgle encontrou apontando para aquele domínio, entre outras informações úteis.

Está longe de ser um Google, e nem é essa a ideia. Tem várias limitações, principalmente de infraestrutura e processamento, mas ver algo que saiu praticamente do zero, rodando, indexando mais de 1 milhão de páginas e com mais de 10 milhões de links associados no banco, é uma sensação difícil de explicar.

Você vai perceber que nem todos os sites aparecem nas buscas ainda. Isso é esperado. É um projeto pessoal, com praticamente zero investimento e recursos bem limitados. O crawler está evoluindo aos poucos, aprendendo e expandindo o alcance. Então é questão de tempo até o pimglebot chegar em cada canto que ainda não foi explorado.

Ainda tem muito para evoluir, mas já é algo real e publicado e isso para mim é o mais satisfatório.

Se alguém quiser dar uma olhada:
Pimgle: https://pimgle.com/
Exemplo do webtrack: https://pimgle.com/webtrack/oliveiraweb.com.br

Carregando publicação patrocinada...
3

Don't be evil.
Essa frase marcou um tempo e foi mote na vida do Google.
Ocorre que empresas são organismos vivos e não foi possível defender por muito tempo essa postura. Como você, no passado o Google também tinha link dos resultados que apontavam diretamente para o site. Clicou, chegou no site.
Com o tempo, veio a idéia de um "jênio": porquê não monitorar os cliques nos links de resultado, assim ficamos sabendo para onde o usuário foi!
Pois é, uma idéia que gerou N consequências...
Você será tentado a fazer o mesmo.

Sobre seu projeto, parabéns.
Você não precisa competir com o Google, pode ser um search engine de nicho. Como o shodan é. Como o DuckDuckGo é. E tá tudo bem em ser nichado, significa que você se especializou em atender um certo público, procurando oferecer uma melhor experiência do que o Google que quer agradar todo mundo, poderia oferecer.

Num tempo onde os layoffs estão a todo vapor, eu talvez se fosse você, tornaria o pimgle, um search engine de emprego. Mas não um qualquer, "O" search engine.
Sabemos que uma mesma vaga está publicada em sites diferentes, a idéia seria condensar esses resultados em uma única resposta (link) para o usuário.

Isso ajudaria a ele perder menos tempo, além de fazer um "pega ratão" verificando que em um site a vaga oferece R 5.000 e na outra oferece R 4.000. Isso já ajuda como um alerta ao candidato.

Outra coisa útil é mostrar vagas antigas, claramente são vagas suspeitas.
Enfim, tem tanta coisa que pode fazer para ajudar esse pessoal, a p* do Linkedin não consegue fazer um trabalho descente. A Microsoft comprou eles e não melhorou em nada a experiência!

O tráfego para o pimgle seria muito, você podendo monetizar com publicidade (Ads ou paga direta a você), mas JAMAIS cobrar do usuário que está procurando, JAMAIS !
Implante um Captcha pra te proteger de robos, rate-limit, hammering, etc.

Vejo uma necessidade enorme de um site assim.

Os sites de emprego que existem não são suficientes, precisamos de algo novo e desruptivo.

Fica a dica.

Agora deixa eu ir ali escrever todas as features que pensei e dar um git init aqui...

1
1

Olá, existem muitas possibilidades para o futuro, muito obrigado por tirar um tempo para testar o Pimgle e pelas recomentadações! Boa sorte com seu novo projeto, fico feliz de ter te incentivado de alguma forma a começar, e ficaria ainda mais em ver o resultado! Grande abraço.

3
2
1
2
2
1
1