Prakamya Mishra's picture

14 5 4

Prakamya Mishra

Prakamya

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 11 hours ago

On the Interplay of Pre-Training, Mid-Training, and RL on Reasoning Language Models

updated a collection 4 days ago

updated a model 4 days ago

amd/SAND-Math-Qwen2.5-32B

View all activity

Organizations

upvoted a paper about 11 hours ago

On the Interplay of Pre-Training, Mid-Training, and RL on Reasoning Language Models

Paper • 2512.07783 • Published 1 day ago • 22

updated a collection 4 days ago

SAND

5 items • Updated 4 days ago

updated 2 models 4 days ago

amd/SAND-Math-Qwen2.5-32B

Text Generation • 33B • Updated 4 days ago • 37 • 2

amd/SAND-MathScience-DeepSeek-Qwen32B

Text Generation • 33B • Updated 4 days ago • 36 • 1

updated a dataset 4 days ago

amd/SAND-Post-Training-Dataset

Viewer • Updated 4 days ago • 27.9k • 85 • 2

published a dataset 4 days ago

amd/SAND-Post-Training-Dataset

Viewer • Updated 4 days ago • 27.9k • 85 • 2

published 2 models 4 days ago

amd/SAND-MathScience-DeepSeek-Qwen32B

Text Generation • 33B • Updated 4 days ago • 36 • 1

amd/SAND-Math-Qwen2.5-32B

Text Generation • 33B • Updated 4 days ago • 37 • 2

updated a collection 4 days ago

SAND

5 items • Updated 4 days ago

updated 2 collections 7 days ago

SAND

5 items • Updated 4 days ago

Quark Quantized PTPC FP8 Models

PTPC model quantized by quark • 7 items • Updated about 3 hours ago

updated a collection 22 days ago

Instella ✨

Announcing Instella, a series of 3 billion parameter language models developed by AMD, trained from scratch on 128 Instinct MI300X GPUs. • 13 items • Updated 5 days ago • 10

commented a paper 22 days ago

Instella: Fully Open Language Models with Stellar Performance

Paper • 2511.10628 • Published 27 days ago • 4 •

updated 4 models 23 days ago

amd/AMD-OLMo-1B-SFT-DPO

Text Generation • 1B • Updated 23 days ago • 392 • 23

amd/AMD-OLMo-1B-SFT

Text Generation • 1B • Updated 23 days ago • 333 • 20

amd/AMD-OLMo-1B

Text Generation • 1B • Updated 23 days ago • 339 • 25

amd/AMD-OLMo

Text Generation • Updated 23 days ago • 82

updated a model 26 days ago

amd/Instella-3B-Math-SFT

Text Generation • 3B • Updated 26 days ago • 131