GtZeng's picture

GtZeng PRO

chaoscodes

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 7 hours ago

Reinforcement Pre-Training

upvoted a paper about 7 hours ago

MiniCPM4: Ultra-Efficient LLMs on End Devices

upvoted a paper about 7 hours ago

Through the Valley: Path to Effective Long CoT Training for Small Language Models

View all activity

Organizations

chaoscodes's activity

upvoted 3 papers about 7 hours ago

Reinforcement Pre-Training

Paper • 2506.08007 • Published about 18 hours ago • 116

MiniCPM4: Ultra-Efficient LLMs on End Devices

Paper • 2506.07900 • Published about 19 hours ago • 45

Through the Valley: Path to Effective Long CoT Training for Small Language Models

Paper • 2506.07712 • Published about 23 hours ago • 10

upvoted a paper 11 days ago

Satori-SWE: Evolutionary Test-Time Scaling for Sample-Efficient Software Engineering

Paper • 2505.23604 • Published 12 days ago • 24

upvoted a paper 4 months ago

Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search

Paper • 2502.02508 • Published Feb 4 • 23

upvoted a paper 11 months ago

RegMix: Data Mixture as Regression for Language Model Pre-training

Paper • 2407.01492 • Published Jul 1, 2024 • 39

upvoted a paper 12 months ago

Long Context Transfer from Language to Vision

Paper • 2406.16852 • Published Jun 24, 2024 • 34

upvoted a paper about 1 year ago

Sailor: Open Language Models for South-East Asia

Paper • 2404.03608 • Published Apr 4, 2024 • 21

upvoted 2 papers over 1 year ago

TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4, 2024 • 95

On the Generation of Medical Dialogues for COVID-19

Paper • 2005.05442 • Published May 11, 2020 • 2