4 15 4

XinghaoWang

Singhoo

xinghaow99

AI & ML interests

LLMs

Recent Activity

liked a model 4 days ago

OpenMOSS-Team/MOVA-360p

liked a model 4 days ago

OpenMOSS-Team/MOSS-TTS

upvoted a paper 5 days ago

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

View all activity

Organizations

liked 2 models 4 days ago

OpenMOSS-Team/MOVA-360p

Image-to-Video • Updated 3 days ago • 11.2k • 186

OpenMOSS-Team/MOSS-TTS

Text-to-Speech • 8B • Updated 4 days ago • 16k • 220

upvoted a paper 5 days ago

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

Paper • 2602.10934 • Published 6 days ago • 48

authored 3 papers 6 days ago

commented a paper 6 days ago

Prism: Spectral-Aware Block-Sparse Attention

Paper • 2602.08426 • Published 8 days ago • 35 •

upvoted a paper 7 days ago

Prism: Spectral-Aware Block-Sparse Attention

Paper • 2602.08426 • Published 8 days ago • 35

submitted a paper to Daily Papers 7 days ago

Prism: Spectral-Aware Block-Sparse Attention

Paper • 2602.08426 • Published 8 days ago • 35

upvoted a paper 7 days ago

MOVA: Towards Scalable and Synchronized Video-Audio Generation

Paper • 2602.08794 • Published 8 days ago • 150

upvoted a paper 15 days ago

FourierSampler: Unlocking Non-Autoregressive Potential in Diffusion Language Models via Frequency-Guided Generation

Paper • 2601.23182 • Published 18 days ago • 20

upvoted 2 papers 25 days ago

HERMES: KV Cache as Hierarchical Memory for Efficient Streaming Video Understanding

Paper • 2601.14724 • Published 27 days ago • 74

EvoCUA: Evolving Computer Use Agents via Learning from Scalable Synthetic Experience

Paper • 2601.15876 • Published 26 days ago • 90

upvoted a paper 2 months ago

Beyond Real: Imaginary Extension of Rotary Position Embeddings for Long-Context LLMs

Paper • 2512.07525 • Published Dec 8, 2025 • 59

upvoted a paper 3 months ago

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

Paper • 2511.04570 • Published Nov 6, 2025 • 239

upvoted 3 papers 4 months ago

JanusCoder: Towards a Foundational Visual-Programmatic Interface for Code Intelligence

Paper • 2510.23538 • Published Oct 27, 2025 • 97

RoboOmni: Proactive Robot Manipulation in Omni-modal Context

Paper • 2510.23763 • Published Oct 27, 2025 • 56

Sparser Block-Sparse Attention via Token Permutation

Paper • 2510.21270 • Published Oct 24, 2025 • 25

commented a paper 4 months ago

Sparser Block-Sparse Attention via Token Permutation

Paper • 2510.21270 • Published Oct 24, 2025 • 25 •

upvoted a paper 4 months ago

LIBERO-Plus: In-depth Robustness Analysis of Vision-Language-Action Models

Paper • 2510.13626 • Published Oct 15, 2025 • 46

XinghaoWang

AI & ML interests

Recent Activity

Organizations

Singhoo's activity