2 13 3

Guan

Guan123

guankaisi

AI & ML interests

None yet

Recent Activity

upvoted a collection 10 days ago

V-JEPA 2

upvoted a paper about 1 month ago

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

updated a model about 1 month ago

Guan123/baichuan_7b_ecommerce

View all activity

Organizations

upvoted a collection 10 days ago

V-JEPA 2

Collection

A frontier video understanding model developed by FAIR, Meta, which extends the pretraining objectives of https://ai.meta.com/blog/v-jepa-yann • 8 items • Updated Jun 13 • 173

upvoted a paper about 1 month ago

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

Paper • 2511.04570 • Published Nov 6 • 208

updated a model about 1 month ago

Guan123/baichuan_7b_ecommerce

Updated Nov 3 • 5

upvoted a paper 2 months ago

Ovi: Twin Backbone Cross-Modal Fusion for Audio-Video Generation

Paper • 2510.01284 • Published Sep 30 • 34

authored a paper 2 months ago

Taming Text-to-Sounding Video Generation via Advanced Modality Condition and Interaction

Paper • 2510.03117 • Published Oct 3 • 11

upvoted a paper 2 months ago

Taming Text-to-Sounding Video Generation via Advanced Modality Condition and Interaction

Paper • 2510.03117 • Published Oct 3 • 11

commented a paper 2 months ago

Taming Text-to-Sounding Video Generation via Advanced Modality Condition and Interaction

Paper • 2510.03117 • Published Oct 3 • 11 •

updated a dataset 2 months ago

Aimind-dataset-share/vgg-subdataset

Viewer • Updated Sep 30 • 9.37k • 31

updated a model 2 months ago

Aimind-dataset-share/ckpt

Updated Sep 30

published 2 models 2 months ago

Aimind-dataset-share/vgg-subdataset

Updated Sep 30

Aimind-dataset-share/ckpt

Updated Sep 30

published a dataset 2 months ago

Aimind-dataset-share/vgg-subdataset

Viewer • Updated Sep 30 • 9.37k • 31

Guan

AI & ML interests

Recent Activity

Organizations

V-JEPA 2

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

Guan123/baichuan_7b_ecommerce

Ovi: Twin Backbone Cross-Modal Fusion for Audio-Video Generation

Taming Text-to-Sounding Video Generation via Advanced Modality Condition and Interaction

Taming Text-to-Sounding Video Generation via Advanced Modality Condition and Interaction

Taming Text-to-Sounding Video Generation via Advanced Modality Condition and Interaction

Aimind-dataset-share/vgg-subdataset

Aimind-dataset-share/ckpt

Aimind-dataset-share/vgg-subdataset

Aimind-dataset-share/ckpt

Aimind-dataset-share/vgg-subdataset

Aimind-dataset-share/very-very-large

Aimind-dataset-share/very-very-large

Aimind-dataset-share/very-very-large

Guan

AI & ML interests

Recent Activity

Organizations

Guan123's activity