by Carlos Costa
“Modelos de linguagem de larga escala (LLMs) têm mostrado potencial na demonstração de teoremas formais usando assistentes de prova como o Lean. Entretanto, os métodos existentes são difíceis de reproduzir ou de expandir, devido a código e dados privados, bem como a grandes exigências de computação” (tradução do autor).
“uma visão alternativa de como a IA pode dominar o raciocínio matemático enxerga a matemática pela lente dos jogos, observando que as regras do ‘jogo da matemática’ podem ser codificadas [...] a partir de um pequeno conjunto de axiomas” (POESIA et al., 2024, p. 2, tradução do autor).
““Descrevemos MINIMO (Mathematics via Intrinsic Motivation): um agente que aprende, de forma conjunta, a propor problemas desafiadores para si mesmo (conjecturar) e a resolvê-los (provar teoremas).” (Poesia et al., 2024, p. 1, tradução do autor).

“Tais abordagens são usualmente baseadas em heurísticas míopes (por exemplo, probabilidades log ou funções de valor) que frequentemente levam a subobjetivos subótimos ou até mesmo distratores, impedindo a descoberta de provas mais longas.” (tradução do autor).
“observamos um aumento substancial no comprimento máximo das provas encontradas pelo POETRY, de 10 para 26” (WANG et al., 2024, p. 1, tradução do autor).
“Propomos novos métodos de re-rotulagem retrospectiva em árvores de busca de provas para melhorar significativamente a eficiência amostral do agente em ambas as tarefas.” (Poesia et al., 2024, p. 1, tradução do autor).

“Ele contém anotações detalhadas de premissas em provas, fornecendo dados valiosos para a seleção de premissas — um gargalo-chave na demonstração de teoremas. Usando esses dados, desenvolvemos o ReProver (Retrieval-Augmented Prover): um provador baseado em LLM, aprimorado com recuperação para selecionar premissas de uma vasta biblioteca matemática.” (Yang et al., 2023, p. 1, tradução do autor).