OpenAI lança modelos de raciocínio abertos
O gpt-oss-120b, mais poderoso, pode ser executado localmente em GPUs com pelo menos 80 GB de memória, e o gpt-oss-20b, funciona em dispositivos com apenas 16 GB de memória.
Segundo a empresa, esses modelos poderão ser integrados a sistemas mais amplos e, caso não consigam realizar determinada tarefa — como processar uma imagem, por exemplo —, poderão encaminhar a solicitação para modelos proprietários mais potentes hospedados na nuvem.
Eles também são capazes de utilizar ferramentas externas como buscas na web ou execução de código em Python. No entanto, ao contrário dos modelos multimodais da OpenAI, os modelos abertos são restritos a tarefas baseadas apenas em texto — não processam nem geram imagens ou áudio.
No teste de programação Codeforces (com uso de ferramentas), o gpt-oss-120b alcançou 2622 pontos e o gpt-oss-20b, 2516 pontos, abaixo do o3 (2706) e do o4-mini (2719). Já no Humanity’s Last Exam, o gpt-oss-120b atingiu 19% de acerto e o gpt-oss-20b, 17,3%, também inferiores ao o3, que alcançou 24,9%.
Ambos os modelos estão disponíveis gratuitamente para download na plataforma Hugging Face, sob a licença Apache 2.0. A empresa afirma que não divulgará os dados de treinamento utilizados na criação desses modelos.
Informações adicionais: OpenAI