Contratamos professores para escrever as aulas e pessoas para trabalhar na extração das questões dos pdfs das provas.
Já temos 100 aulas escritas e a ideia é chegar a 250 aulas nos próximos meses. Por enquanto, as aulas são apenas em texto, mas pretendemos começar a gravar vídeos dessas aulas.
Baixamos os pdfs das provas passadas, fazemos a extração, classificamos as questões e depois usamos LLM par gerar um comentário. Esses gabaritos comentados são revisados antes de serem exibidos no site.
Tem se mostrado um processo caro para extrair questões. Mas não conseguimos automatizar muito dele porque os pdfs das provas são dados não estruturados e cada banca segue um padrão. A meta é conseguir uma forma de ler os pdfs com as bibliotecas python e já conseguir separar enunciado das alternativas, etc. Mas, por enquanto, é um processo muito manual feito por humanos.