63 71 61

Ge Zhang

zhangysk

AI & ML interests

None yet

Recent Activity

authored a paper 1 day ago

IV-Bench: A Benchmark for Image-Grounded Video Perception and Reasoning in Multimodal LLMs

upvoted a paper 1 day ago

Efficient Pretraining Length Scaling

commented on a paper 1 day ago

IV-Bench: A Benchmark for Image-Grounded Video Perception and Reasoning in Multimodal LLMs

View all activity

Organizations

zhangysk's activity

authored a paper 1 day ago

IV-Bench: A Benchmark for Image-Grounded Video Perception and Reasoning in Multimodal LLMs

Paper • 2504.15415 • Published 3 days ago • 18

upvoted a paper 1 day ago

Efficient Pretraining Length Scaling

Paper • 2504.14992 • Published 3 days ago • 16

commented a paper 1 day ago

IV-Bench: A Benchmark for Image-Grounded Video Perception and Reasoning in Multimodal LLMs

Paper • 2504.15415 • Published 3 days ago • 18 •

upvoted a paper 1 day ago

IV-Bench: A Benchmark for Image-Grounded Video Perception and Reasoning in Multimodal LLMs

Paper • 2504.15415 • Published 3 days ago • 18

authored a paper 7 days ago

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

Paper • 2504.11536 • Published 9 days ago • 58

upvoted a paper 7 days ago

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

Paper • 2504.11536 • Published 9 days ago • 58

upvoted 3 papers 10 days ago

upvoted a paper 11 days ago

COIG-P: A High-Quality and Large-Scale Chinese Preference Dataset for Alignment with Human Values

Paper • 2504.05535 • Published 17 days ago • 44

authored a paper 15 days ago

COIG-P: A High-Quality and Large-Scale Chinese Preference Dataset for Alignment with Human Values

Paper • 2504.05535 • Published 17 days ago • 44

liked a dataset 15 days ago

m-a-p/COIG-P

Viewer • Updated 9 days ago • 1.01M • 672 • 16

upvoted 2 papers 23 days ago

MoCha: Towards Movie-Grade Talking Character Synthesis

Paper • 2503.23307 • Published 25 days ago • 129

Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback

Paper • 2503.22230 • Published 27 days ago • 43

liked a dataset 27 days ago

m-a-p/PIN-100M

Viewer • Updated about 15 hours ago • 68.1k • 68.6k • 10

upvoted a paper 27 days ago

Challenging the Boundaries of Reasoning: An Olympiad-Level Math Benchmark for Large Language Models

Paper • 2503.21380 • Published 28 days ago • 37

liked a dataset 27 days ago

RUC-AIBOX/OlymMATH

Viewer • Updated 27 days ago • 400 • 2.74k • 7

authored a paper about 1 month ago

Video SimpleQA: Towards Factuality Evaluation in Large Video Language Models

Paper • 2503.18923 • Published about 1 month ago • 12

upvoted a paper about 1 month ago

Video SimpleQA: Towards Factuality Evaluation in Large Video Language Models

Paper • 2503.18923 • Published about 1 month ago • 12

commented a paper about 1 month ago

Video SimpleQA: Towards Factuality Evaluation in Large Video Language Models

Paper • 2503.18923 • Published about 1 month ago • 12 •