mlxha
/

Llama-3.1-8B-Instruct-GRPO-medmcqa

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Llama-3.1-8B-Instruct-GRPO-medmcqa

16.1 GB

1 contributor

History: 36 commits

mlxha's picture

End of training

8e48b0e verified 6 months ago