19 42 57

xiangan

https://anxiangsir.github.io/

anxiangsir

AI & ML interests

None yet

Recent Activity

upvoted a collection 3 days ago

onevision-encoder

published a dataset 4 days ago

lmms-lab-encoder/60s_tem_grounding_ov2_codec_100k

published a dataset 4 days ago

lmms-lab-encoder/60s_20260215_154644_ov2_codec_1w

View all activity

Organizations

upvoted a collection 3 days ago

onevision-encoder

Collection

2 items • Updated 15 days ago • 5

published 2 datasets 4 days ago

lmms-lab-encoder/60s_tem_grounding_ov2_codec_100k

Updated 4 days ago • 14

lmms-lab-encoder/60s_20260215_154644_ov2_codec_1w

Updated 4 days ago • 3

upvoted a paper 6 days ago

UniT: Unified Multimodal Chain-of-Thought Test-time Scaling

Paper • 2602.12279 • Published 12 days ago • 19

authored a paper 7 days ago

OneVision-Encoder: Codec-Aligned Sparsity as a Foundational Principle for Multimodal Intelligence

Paper • 2602.08683 • Published 15 days ago • 47

upvoted a paper 8 days ago

CoPE-VideoLM: Codec Primitives For Efficient Video Language Models

Paper • 2602.13191 • Published 11 days ago • 29

updated a collection 9 days ago

OneVision-Encoder

Collection

2 items • Updated 9 days ago

upvoted a paper 9 days ago

OneVision-Encoder: Codec-Aligned Sparsity as a Foundational Principle for Multimodal Intelligence

Paper • 2602.08683 • Published 15 days ago • 47

updated a dataset 10 days ago

lmms-lab-encoder/wd_temporal_grounding_frames_max_64_max_448x448_pixels_with_fps

Updated 10 days ago • 49

published a dataset 10 days ago

lmms-lab-encoder/wd_temporal_grounding_frames_max_64_max_448x448_pixels_with_fps

Updated 10 days ago • 49

upvoted a paper 12 days ago

GigaBrain-0.5M*: a VLA That Learns From World Model-Based Reinforcement Learning

Paper • 2602.12099 • Published 12 days ago • 56

authored 2 papers 13 days ago

ProCLIP: Progressive Vision-Language Alignment via LLM-based Embedder

Paper • 2510.18795 • Published Oct 21, 2025 • 11

DanQing: An Up-to-Date Large-Scale Chinese Vision-Language Pre-training Dataset

Paper • 2601.10305 • Published Jan 15 • 36

updated a model 15 days ago

lmms-lab-encoder/onevision-encoder-large-lang

Updated 15 days ago • 88 • 8

updated a collection 15 days ago

OneVision-Encoder

Collection

HEVC-Style Vision Transformer • 2 items • Updated 15 days ago • 3

updated a model 19 days ago

lmms-lab-encoder/ov2-2b-2026-02-04-64frames-temporal_grounding

2B • Updated 19 days ago • 13

published a model 19 days ago

lmms-lab-encoder/ov2-2b-2026-02-04-64frames-temporal_grounding

2B • Updated 19 days ago • 13

liked a model 25 days ago

lmms-lab-encoder/onevision-encoder-large-lang

Updated 15 days ago • 88 • 8

updated a model 27 days ago

lmms-lab-encoder/onevision-encoder-large

0.3B • Updated 19 days ago • 366 • 14

upvoted a paper 27 days ago

Innovator-VL: A Multimodal Large Language Model for Scientific Discovery

Paper • 2601.19325 • Published 28 days ago • 79

xiangan

AI & ML interests

Recent Activity

Organizations

xiangan's activity